大模型推理引擎研发工程师(深圳/北京/上海/杭州) 北京 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月25日
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责
1.研发及优化大模型推理引擎、PD分离推理调度系统;
2.支持主流GPU和异构AI芯片,优化大模型推理性能,打造极致性能成本优势。 岗位要求
1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力;
2.熟悉GPU/AI芯片编程,如CUDA,OpenCL,Ascend C等,熟悉cutlass等加速库是加分项;
3.熟悉主流大模型推理框架,如vllm,sglang,tensorrt-llm,FasterFransformer等;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉并行策略,如模型并行、流水线并行等,了解NVLINK、GPU通信者优先;
6.具备GPU、AI芯片体系结构知识,熟悉芯片特性,具备系统性能分析和调优经验优先;
7.加分项:;
8.机器学习或者体系结构相关顶会论文;
9.参与vllm、sglang等开源项目贡献者;
10.熟悉推理服务框架,具备服务部署经验者优先,有超大模型分布式部署经验优先。