SearchEuropeanJobs.com

微信-高性能 - 视觉 AIGC 大模型推理优化工程师

Company

Tencent

Location

Shenzhen, China

Type

Full-time

微信-高性能 - 视觉 AIGC 大模型推理优化工程师 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年04月14日
  • 渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
  • 岗位职责
  • 1. 针对 NPU、GPU 等异构硬件,探索 AIGC 大模型的最优推理方案,开发维护自研 AIGC 推理框架,将 XNet 推理引擎的优化能力赋能业务模型,支持微信视频号及其他业务的部署与持续优化
    2. 深入理解 AIGC 大模型,以算法-系统 Co-design 的思路,探索与应用 Cache、稀疏、量化等 Training-free 或需要 Finetune 的优化方案,在保证业务指标的前提下,探索推理优化的边界
    3. 持续跟进 AIGC 大模型的发展动态,探索并落地通用推理优化方案,支持新模型的高效上线,并提供模型优化的原子能力,支持算法侧与业务侧的高效接入与调试
  • 岗位要求
  • 1. 对 CPU/GPU/NPU 等硬件体系结构有实践层面的理解,将其落地于算子性能与模型部署优化中
    2. 对当前常见的开源 AIGC 模型和框架,如 HunyuanVideo、Wan、LTX、ComfyUI 等,有推理调优经验
    3. 熟悉 Linux 系统与分布式环境部署调试,熟悉 Python 开发
    4. 具有良好的沟通能力,能够与算法侧、业务侧顺畅协作
    5. 愿意探索和尝试新技术,对 AI 落地应用与提效有热情与愿景
  • 加分项
  • 1. 有国产 GPU / NPU 加速卡上 AIGC 大模型的部署优化经验,有 Triton、CUDA 等的算子开发与调优经验
    2. 了解 Sglang Diffusion、VLLM Omni、LightX2V 等 AIGC 推理框架
    3. 对自回归视频生成模型、扩...
  • ★ Ready to Start Your European Career?

    Take the next step and apply for this exciting opportunity

    Apply Now