工作地点:
北京
工作职责:
负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚,比如智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地,提升内外部用户的服务效率和服务体验。
岗位职责包括但不限于:
- 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚
- 探索基于大模型技术的服务新形态,包括多个场景的大模型对话机器人,ChatUI服务形态升级,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆
- 深入阿里云服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云服务领域的大模型技术演进规划和落地
任职要求:
- 计算机科学、软件工程、数学、统计学等相关专业,硕士及以上学历
- 具备独立的从业务需求到算法工程转化和落地能力,在自然语言理解NLU/自然语言生成NLG、对话机器人、搜索推荐、知识图谱等一个或多个领域有大规模场景落地经验
- 在大模型LLM相关技术方向有实战经验者优先,比如LLM训练和优化、搜索增强生成RAG、大模型推理以及大模型评估等一个或多个方向有实际经验
- 熟悉掌握Python/Java/C++中至少一门语言,有大型系统的算法模型开发和优化经验,熟练掌握至少一种深度学习框架(PyTorch、TensorFlow、Caffe等)
- 有顶级会议、顶级期刊上发表学术论文,有相关算法比赛(Kaggle等)获奖经验的同学优先