大模型推理引擎研发工程师（深圳/北京/上海/杭州）

Company

Tencent

Location

Beijing, China

Type

Full-time

            大模型推理引擎研发工程师（深圳/北京/上海/杭州） 北京 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月25日 在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
 岗位职责 1.研发及优化大模型推理引擎、PD分离推理调度系统；
2.支持主流GPU和异构AI芯片，优化大模型推理性能，打造极致性能成本优势。
 岗位要求 1.熟练掌握C/C++、Python编程语言，具备良好的coding和调试能力；
2.熟悉GPU/AI芯片编程，如CUDA，OpenCL，Ascend C等，熟悉cutlass等加速库是加分项；
3.熟悉主流大模型推理框架，如vllm，sglang，tensorrt-llm，FasterFransformer等；
4.熟悉各类深度学习网络和算子底层实现细节，训练和推理模型调试、调优有实操经验优先；
5.熟悉并行策略，如模型并行、流水线并行等，了解NVLINK、GPU通信者优先；
6.具备GPU、AI芯片体系结构知识，熟悉芯片特性，具备系统性能分析和调优经验优先；
7.加分项：；
8.机器学习或者体系结构相关顶会论文；
9.参与vllm、sglang等开源项目贡献者；
10.熟悉推理服务框架，具备服务部署经验者优先，有超大模型分布式部署经验优先。

★ SearchEuropeanJobs.com

大模型推理引擎研发工程师（深圳/北京/上海/杭州）

★ Ready to Start Your European Career?