混元多模态强化学习（RL）算法研究员（北京/上海）

Company

Tencent

Location

Shenzhen, China

Type

Full-time

            混元多模态强化学习（RL）算法研究员（北京/上海） 深圳 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月17日 岗位职责 1.针对多模态模型开展强化学习算法研究，包括面向图像、视频生成的扩散模型，面向多模态理解的自回归模型，以及前沿统一多模态框架；
2.设计并开发强化学习训练框架与奖励建模策略，实现高效的大规模训练，提升训练稳定性，并解决奖励作弊等相关问题；
3.探索下一代强化学习范式，使其能更直接、更高效地从环境反馈中学习。
 岗位要求 1.本科及以上学历，计算机科学或相关专业；
2.具备出色的科研能力，在ICML、NeurIPS、ICLR、CVPR、ICCV、ECCV、SIGGRAPH等顶级会议发表过论文；
3.扎实的工程与编程能力，具备深度学习系统实现、模型训练与推理优化、CPU/GPU 加速、分布式训练与推理经验；
4.有扩散模型、自回归模型、文生图 / 文生视频生成相关经验者优先；
5.有 ACM/NOIP（信息学竞赛）参赛经历者优先。

★ SearchEuropeanJobs.com

混元多模态强化学习（RL）算法研究员（北京/上海）

★ Ready to Start Your European Career?