异构加速框架工程师(深圳/北京/上海) 深圳 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月12日
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责
1.协同算法团队co-desgin,针对AI推理构建GPU/AI芯片底层性能优化与调优;
2.机器学习框架层架构创新,核心模块优化和扩展,提升计算效率与资源利用率;
3.深入分析GPU/AI芯片的硬件架构特性,设计并实现高性能算子、算法和特性使能组件;
4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化等)。 岗位要求
1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力;
2.熟悉GPU/AI芯片编程,如CUDA,Triton,Ascend C等;
3.熟悉Cublas,Cutlass,CK等高性能算子开发工具;
4.熟悉Torch-Compile等AI编译模块者优先;
5.熟悉主流开源模型或推荐模型,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等);
6.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术。 加分项
1.AI数据、搜广推等场景架构和加速经验;
2.相关领域开源项目贡献、顶会论文等。