Job Seekers

大模型算法工程师(数据方向)

Back
Information Technology
Job Ref. SPGSZ0303202503801
Location Shenzhen
Date posted 2025-03-03

公司描述:中国领先的本地生活服务平台

工作地点:北京、上海

工作职责

  • 构建端到端的网页文本内容提取系统,针对网络数据的复杂性,从系统效率和模型效果角度持续优化内容提取算法,迭代生产标准;
  • 设计预训练数据的全局质量优化和治理方案,优化全局采样策略、隐私保护和安全合规,提升基座模型训练效率和最终效果;
  • 建设多模态交错数据处理链路,通过数据分析和配比实验等手段优化多模态数据质量和多样性,支撑多模态大模型数据需求;
  • 跟进大模型数据领域前沿技术(如Data Selection、Data Influence、Curriculum Learning和合成数据等),推动数据驱动的模型性能突破;
  • 负责千亿级网页的大规模处理和万亿级token数据生产,通过分布式计算、模型量化及显存优化的方式提升数据处理和生产效率

任职要求

  • 计算机科学、数据科学、自然语言处理等相关专业硕士及以上学历;
  • 扎实的编程功底,熟练掌握TensorFlow/PyTorch/Megatron等深度学习框架,熟悉Java/C++等编程语言;
  • 熟练掌握大数据处理工具,如Spark、Flink、Ray等;了解GPU加速相关技术,具有良好的算法设计能力,能够从工程角度思考模型优化方案;
  • 熟悉大模型训练流程,熟悉Transformer模型结构,对GPT/LLAMA/MoE等模型架构有深入了解;
  • 责任心强,积极主动,能独立思考,具有好奇心和快速学习能力,有良好的沟通能力和团队合作能力。

 

Job Apply

Name*
Email*
Tel

File name:

File size:

(TXT, PDF, DOC, DOCX and RTF file only)

Looking To Hire? Send Us Your Vacancy Contact Us for Hiring