返回职位列表
实习 具身技术平台部 普通岗

具身多模态算法工程师实习生

北京 招聘 1 人

岗位职责

工作内容: 参与具身智能体的多模态大模型(VLM / LMM)的预训练与微调,支持视觉-语言联合理解与决策。 在公开大规模数据集(如 Ego4D、Egoscale 等)上进行模型预训练,提升基础感知与推理能力。 参与数据清洗、数据增强、多模态对齐等数据处理流程建设,支撑大规模预训练的高效进行。 参与具身智能体(机器人/仿真体)的强化学习训练框架搭建,结合大模型能力提升策略理解与泛化能力。 参与 Reward Model 的设计与迭代,构建符合具身任务目标的奖励函数

任职要求

硕士及以上学历,计算机、人工智能、自动化、电子信息等相关专业。 具有扎实的多模态大模型训练经验,熟悉 VLM 主流架构(如 LLaVA / BLIP / Flamingo / Qwen-VL 等)。 具备在大规模公开多模态数据集上进行预训练的实际经验,能够独立完成从数据准备到模型训练的全流程。 熟悉常见预训练任务(如对比学习、掩码建模、图像-文本匹配等)及训练技巧(动态数据加载、分布式训练、混合精度等)。 具备良好的问题分析与定位能力,能够诊断训练发散、损失异常、多模态对齐失效等问题。 具备优秀的沟通能力与团队协作精神,能够与感知、决策、部署等团队高效协作。 工作态度积极认真,责任心强,具有良好的工程与科研素养。

优先条件

  • 加分项:
  • 在公开多模态基准上有评测经验或榜单成绩。
  • 有具身 / 机器人领域数据(如 Open X-Embodiment、Ego4D、RT-1 数据集)的使用或微调经验。
  • 熟悉视觉主干网络(ViT / CLIP vision encoder)与 LLM 的融合设计。
  • 有大模型预训练的 Scaling Law、数据配比、课程学习等研究或实践经验。
  • 有完整的多模态预训练项目经历(附 GitHub 或论文链接)。
  • 积极拥抱 AI 辅助编程与研究,能高效完成模型实验与迭代。

相关岗位

相关职位

RIMBOT logo

RIMBOT

感谢您关注我们的职位机会。我们重视每一位候选人的申请,并将认真审阅您的应聘材料。

© 2026 RIMBOT. 保留所有权利。

Powered by 初一HR