Home
Job Seekers
Job Apply
Employers
Why Springer
Recruitment Process
Contact Us for Hiring
Resource & Advice
Resume Tips
Interview Skills
Company
About Springer
Our Services
Specialties
Contact us
Job Seekers
Job
Search
Specialized Sector
Banking & Finance
Information Technology
Insurance
Retail & General
Location
Hong Kong
Shenzhen
Sydney
文本/多模态高性能训练工程
Back
Information Technology
Job Ref.
SPGSZ2025082003801
Location
Shenzhen
Date posted
2025-08-20
公司描述:
互联网大厂
工作地点:
杭州、广州
工作职责:
参与大模型超大规模文本及多模态训练的效率和稳定性提升的工作;
支持百亿~万亿规模参数的 稠密(dense)/稀疏(moe)模型的预训练(pretrain/CPT)和后训练(SFT/RL)能力建设和优化工作
通过推理和训练加速,训推一体复用等技术,在前沿的异构设备上实现极致的强化学习
任职要求
有扎实的工程法基础,有中大规模集群的文本(语音/图像,视频大模型高性能训练代码实现(包括不限于Owen、LLama、BUP2.LaVA、MInIGPT.VISUAIGL.OWeDHV OwenAudioCosyVoice),以及实际训练经验
有大模型分布式训练经验,有大规模分布式训练集群性能&稳定性优化经验,精通GPU设备上的训练性能分析,以及GPU算子和通信开发。有FP8训练(权重、优化器)经验者优先。
款练学握megatron/depspeed/openRlHF/chatleam/veRL 等常用的大模型pretrain& post training 框架,并有框架二次开发的能力。有大规模分布式训练系统实现经验者优先
学习能力强,并保持关注训练领域的前沿技术,在训练领域有相关研究和成本发表者优先
Job Apply
Name
*
Name*
Email
*
Email*
Tel
Tel
Remark
CV
File name:
File size:
(TXT, PDF, DOC, DOCX and RTF file only)
Validate Email
Share:
Apply
Who we are
Employers
Resource & Advice
Looking To Hire?
Send Us Your Vacancy
Contact Us for Hiring
© Copyright 2016 Springer Professional Group. All Rights Reserved.