Job Seekers

大模型算法应用研究员

Back
Information Technology
Job Ref. SPGSZ2024062603
Location Shenzhen
Date posted 2024-06-26

公司描述:世界领先的超十亿级用户量互联网科技公司
工作地点:深圳
薪资范围:100万左右
工作职责

  • 设计和开发相关方法以增强大语言模型(llm)的逻辑推理能力并落地应用,包括数据设计、prompt优化、SFT等;
  • 熟悉常见NLP任务的研究和开发,针对垂直场景进行业务落地;
  • 跟进NLP中Chain-of-thought(COT)领域的最新前沿和进展,并将它们应用于大模型研发中,持续优化大模型逻辑推理能力并落地应用。

任职要求

  • 自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历;
  • 在大语言模型方面有一定研究基础或经验,熟悉常用大模型,如GPT系列、LLaMA、BLOOM等,熟悉大语言模型各阶段训练过程,有实际训练经验者优先;
  • 在NLP、深度学习等方面有一定研究基础,熟悉NLP中不同任务及相应的主流模型和算法,对领域现状及发展趋势有深入思考;熟练掌握深度学习基础知识,能根据具体问题做针对性优化,跟踪研究前沿并将有价值的方法应;
  • 较强的工程实现能力,熟练掌握C++,JAVA,Python等至少一种语言,熟悉DeepSpeed、Megatron等分布式训练框架,熟练使用至少一种深度学习框架(如Tensorflow,pytorch);
  • 有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)。

Job Apply

Name*
Email*
Tel

File name:

File size:

(TXT, PDF, DOC, DOCX and RTF file only)

Looking To Hire? Send Us Your Vacancy Contact Us for Hiring