在打车场景中,POI是用户目的地的数字化表达,是最基础的数据之一,直接影响用户能不能找到目的地、正确到达目的地。传统的数据更新依赖人工,现实的快速变化带来了更新成本剧增和更新速度降低。但这些在LLM时代迎来了转机,LLM更强的特征表达能力、更智能的规划能力让数据更新迎来了新的机会。在这你将迎来以下挑战:
1、紧跟LLM最新进展:迁移行业LLM最新能力,根据名称、图片、评论等信息,区分POI关键数据,提升属性正确率
2、追踪Agent的前沿技术:通过海量人工反馈资料,训练Agent替代人工,完成数据的自动化更新,降低成本、加快效率、提升数据质量
3、研究落地最新多模态对齐方案:在常见的图像、文本之外,我们场景中还包括位置信息(坐标),多模态对齐工作,对充分发挥数据价值,提升模型性能至关重要,是业内持续投入的重点&难点方向
任职要求
1、熟悉NLP算法,有大模型post-train 经验优先
2、熟悉PPO、GRPO等强化学习算法,有Agent训练经验优先
3、自驱、有技术热情,持续追踪LLM/Agent的前沿技术,提升数据更新效率
Take the next step and apply for this exciting opportunity
Apply Now