微信-高性能 - 视觉 AIGC 大模型推理优化工程师 深圳 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年04月14日
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 岗位职责
1. 针对 NPU、GPU 等异构硬件,探索 AIGC 大模型的最优推理方案,开发维护自研 AIGC 推理框架,将 XNet 推理引擎的优化能力赋能业务模型,支持微信视频号及其他业务的部署与持续优化
2. 深入理解 AIGC 大模型,以算法-系统 Co-design 的思路,探索与应用 Cache、稀疏、量化等 Training-free 或需要 Finetune 的优化方案,在保证业务指标的前提下,探索推理优化的边界
3. 持续跟进 AIGC 大模型的发展动态,探索并落地通用推理优化方案,支持新模型的高效上线,并提供模型优化的原子能力,支持算法侧与业务侧的高效接入与调试 岗位要求
1. 对 CPU/GPU/NPU 等硬件体系结构有实践层面的理解,将其落地于算子性能与模型部署优化中
2. 对当前常见的开源 AIGC 模型和框架,如 HunyuanVideo、Wan、LTX、ComfyUI 等,有推理调优经验
3. 熟悉 Linux 系统与分布式环境部署调试,熟悉 Python 开发
4. 具有良好的沟通能力,能够与算法侧、业务侧顺畅协作
5. 愿意探索和尝试新技术,对 AI 落地应用与提效有热情与愿景 加分项
1. 有国产 GPU / NPU 加速卡上 AIGC 大模型的部署优化经验,有 Triton、CUDA 等的算子开发与调优经验
2. 了解 Sglang Diffusion、VLLM Omni、LightX2V 等 AIGC 推理框架
3. 对自回归视频生成模型、扩...