微信语音-语音大模型算法研究员-语音合成/识别

Company

Tencent

Location

Beijing, China

Type

Full-time

            微信语音-语音大模型算法研究员-语音合成/识别 北京 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 WXG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月18日 岗位职责 1.负责研发具有多任务能力的语音合成（TTS）大模型；
2.负责TTS大模型的预训练及后训练相关的数据和算法工作；
3.推动TTS大模型在产品中应用落地（如朗读/对话/配音等场景），及针对这些场景进行模型优化；
4.负责语音识别大模型研发，提高噪声/小声/远场/口音/方言等复杂声学条件下识别鲁棒性；
5.负责语音识别语音-文本多模态大模型的研发，融合领域知识，用户行为与实时信息，提高大模型的上下文建模与逻辑推理能力；
6.负责语音识别大模型预训练，后训练、强化学习相关的数据和算法工作。
 岗位要求 1.硕士以上学历，机器学习、人工智能或相关领域的专业背景，在语音合成大模型方向有深入理解相关知识和丰富的实践经验；
2.有很强的动手能力，熟练掌握Python或C/C++，熟悉Pytorch/DeepSpeed等模型训练框架；
3.在TTS大模型任务上有取得SOTA成果者优先，在相关顶级会议或期刊（如NeurIPS、ICLR、ICML、ICASSP、INTERSPEECH）有发表高质量论文者优先；
4.有强烈的自驱力和进取心，以及优秀的解决问题能力和团队合作精神；
5.有语音识别、语音合成、语音文本多模态、大语言模型（预训练、微调、强化学习和推理优化）等相关经验者优先；
6.优秀的代码能力、数据结构和算法功底，熟练掌握Python或C/C++，熟悉Pytorch/DeepSpeed等模型训练框架；
7.在相关顶级会议或期刊（如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等）有论文发表者优先；
8.具备扎实的数学和信号处理基础，优秀的科研创新与问题拆解能力，逻辑严谨，执行力强，拥有良好的沟通协作能力，可独立推进前沿课题研究与实验验证。

★ SearchEuropeanJobs.com

微信语音-语音大模型算法研究员-语音合成/识别

★ Ready to Start Your European Career?