SearchEuropeanJobs.com

微信语音-语音大模型算法研究员-语音合成/识别

Company

Tencent

Location

Beijing, China

Type

Full-time

微信语音-语音大模型算法研究员-语音合成/识别 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月18日 岗位职责
  • 1.负责研发具有多任务能力的语音合成(TTS)大模型;
    2.负责TTS大模型的预训练及后训练相关的数据和算法工作;
    3.推动TTS大模型在产品中应用落地(如朗读/对话/配音等场景),及针对这些场景进行模型优化;
    4.负责语音识别大模型研发,提高噪声/小声/远场/口音/方言等复杂声学条件下识别鲁棒性;
    5.负责语音识别语音-文本多模态大模型的研发,融合领域知识,用户行为与实时信息,提高大模型的上下文建模与逻辑推理能力;
    6.负责语音识别大模型预训练,后训练、强化学习相关的数据和算法工作。
  • 岗位要求
  • 1.硕士以上学历,机器学习、人工智能或相关领域的专业背景,在语音合成大模型方向有深入理解相关知识和丰富的实践经验;
    2.有很强的动手能力,熟练掌握Python或C/C++,熟悉Pytorch/DeepSpeed等模型训练框架;
    3.在TTS大模型任务上有取得SOTA成果者优先,在相关顶级会议或期刊(如NeurIPS、ICLR、ICML、ICASSP、INTERSPEECH)有发表高质量论文者优先;
    4.有强烈的自驱力和进取心,以及优秀的解决问题能力和团队合作精神;
    5.有语音识别、语音合成、语音文本多模态、大语言模型(预训练、微调、强化学习和推理优化)等相关经验者优先;
    6.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/DeepSpeed等模型训练框架;
    7.在相关顶级会议或期刊(如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等)有论文发表者优先;
    8.具备扎实的数学和信号处理基础,优秀的科研创新与问题拆解能力,逻辑严谨,执行力强,拥有良好的沟通协作能力,可独立推进前沿课题研究与实验验证。
  • ★ Ready to Start Your European Career?

    Take the next step and apply for this exciting opportunity

    Apply Now