SearchEuropeanJobs.com

混元大语言模型后训练算法工程师-模型合版方向(北京/深圳)

Company

Tencent

Location

Beijing, China

Type

Full-time

混元大语言模型后训练算法工程师-模型合版方向(北京/深圳) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年04月16日 岗位职责
  • 1.深度参与混元大模型后训练(包括 SFT、RL )及模型合版的研发和相关算法策略研究,提升模型泛化性、能力边界和上限;
    2.后训练策略和生产范式的研究,探索更加敏捷、普适和可扩展的训练范式,提升训练和生产效率;
    3.相关前沿后训练技术方向探索,包括但不限于 Reasoning/Agentic 能力增强和 Scaling, RL/OPD 等收敛性和可扩展性研究;
    4.将研究成果转化为实际的模型能力或生产效率,并撰写高水平技术报告或论文,提升技术影响力。
  • 岗位要求
  • 1.计算机科学、数学、人工智能等相关专业硕士及以上学历,具备良好的数理基础;
    2.具备良好的工程实现能力,熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架;
    3.具备良好的技术视野,深入理解大模型相关技术原理,熟悉大模型 SFT、RL 及 reward 建模等训练范式,对 RL/OPD 等有深入的实践和研究经验;
    4.具备良好的数据 sense 和问题分析能力,作风严谨细致,善于借助大模型及相关工具解决问题和提升效率;
    5.对大模型及相关前沿技术和产品具有极强的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
  • 加分项
  • 1.有主导或参与工业界大规模模型生产和合版经验;
    2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL 等论文。
  • ★ Ready to Start Your European Career?

    Take the next step and apply for this exciting opportunity

    Apply Now