SearchEuropeanJobs.com

企业微信-多模态大模型算法工程师 -音频方向

Company

Tencent

Location

Chengdu, China

Type

Full-time

企业微信-多模态大模型算法工程师 -音频方向 成都 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月25日 岗位职责
  • 1.负责企业微信音频 AI 相关算法的研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、声纹识别、音色转换等方向;
    2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化;
    3.探索音频大模型在企业办公场景的创新应用,推动模型训练、微调及端侧部署落地;
    4.跟进语音/音频领域前沿技术进展(Whisper、SpeechGPT 等),持续提升核心指标与用户体验;
    5.与客户端、后台团队协作,完成算法从原型验证到工程化落地的全链路交付。
  • 岗位要求
  • 1.计算机科学、人工智能、计算机视觉或相关专业硕士及以上学历;
    2.扎实的编程基础,熟练掌握Python和PyTorch/TensorFlow;
    3.在计算机视觉(CV)和自然语言处理(NLP)其中一个领域有深厚积累,并有多模态学习项目经验;
    4.熟悉主流的多模态模型架构(如Transformer-based VL models),有相关模型的训练、微调或部署经验;
    5.对技术创新有强烈兴趣,具备优秀的工程实现能力,能将算法模型应用于大规模实际场景。
  • 加分项

  • 1.计算机、信号处理、电子工程等相关专业,硕士及以上学历,3年以上语音/音频算法开发经验;
    2.熟悉 ASR、TTS、声纹识别、说话人分离等至少一个方向的核心算法原理与工程实现;
    3.熟练使用 PyTorch/TensorFlow 等深度学习框架,具备模型训练、微调(SFT)、强化学习(RLHF/DPO)等实践经验;
    4.具备音频信号处理基础,熟悉特征提取、降噪、回声消除等前处理技术;
    5.对音频/语音领域前沿技术保持高度关注,具备快速复现和改进论文方法的能力;
    6.有端侧音频模型部署与推理优化经验者优先;
    7.在 ICASSP、Interspeech 等...
  • ★ Ready to Start Your European Career?

    Take the next step and apply for this exciting opportunity

    Apply Now