返回职位列表
实习 具身技术平台部 普通岗

具身智能精细操作(真机强化学习方向)实习生-北京

北京上海 招聘 1 人

岗位职责

你将参与的方向 精细操作 · Real-world RL(真机强化学习)· 闭环训练系统 面向真实环境与真实硬件,用强化学习/模仿学习等方法提升成功率、效率与泛化能力,并打通从数据到训练到部署的链路。

你会做什么?

  • 真机强化学习与闭环实验
  • 参与精细操作任务的 RL 训练、评测与迭代(抓取、放置、插入、对齐、整理等典型任务形态)
  • 设计 reward / curriculum / 安全约束 / 评测指标,提升收敛速度与稳定性
  • 处理真实世界的不确定性:噪声、延迟、标定误差、接触扰动等,推动效果在真机稳定复现
  • 模型与训练链路
  • 参与策略/表征学习模块的迭代(BC、offline RL、RL、hybrid 方案等)
  • 维护与优化训练 pipeline:数据读取、回放/采样、评测、实验管理与可复现
  • 与部署协作打通:训练 → 导出 → 推理 → 真机运行 的完整链路
  • 数据链路与数据质量
  • 参与真实数据采集与清洗:传感器同步、日志结构、数据质量诊断与修复
  • 构建/优化数据集与基准:任务定义、成功判定、指标体系与对照实验框架"

任职要求

我们希望你具备

  • 27届及之后毕业在校生,可实习3个月以上,每周至少投入实习4天,线下优先
  • 熟练使用 PyTorch(或同等框架),具备良好的工程习惯(可复现、版本管理、实验记录)
  • 至少具备以下任一项的扎实基础:
  • 强化学习 / offline RL / 模仿学习(PPO/SAC/TD3/BC/IQL/CQL 等任意)
  • 机器人控制 / 操作任务建模 / 运动学基础
  • 视觉或多模态表征学习(视觉为主亦可)

加分项:

  • 有真机经验(ROS/ROS2、硬件调试、部署、标定)
  • 做过 sim2real 或 real-world RL 的完整闭环项目(从训练到上线)
  • 有论文/开源/竞赛成果(请附链接)"

福利待遇

五险一金、带薪年假、年度体检

相关岗位

相关职位

RIMBOT logo

RIMBOT

感谢您关注我们的职位机会。我们重视每一位候选人的申请,并将认真审阅您的应聘材料。

© 2026 RIMBOT. 保留所有权利。

Powered by 初一HR