主頁
求職者
工作申請
求職指導及資源
簡歷要點
面試技巧
招聘
與我們合作的理由
招聘流程
招聘人才
關於我們
公司簡介
我們的專業
招聘專長
聯繫我們
求職者
職位
搜索
行業類別
保險
資訊科技
銀行和金融業
零售和快速消費品
地點
悉尼
深圳
香港
文本/多模态高性能训练工程
Back
資訊科技
Job Ref.
SPGSZ2025082003801
地點
Shenzhen
發布日期
2025-08-20
公司描述:
互联网大厂
工作地点:
杭州、广州
工作职责:
参与大模型超大规模文本及多模态训练的效率和稳定性提升的工作;
支持百亿~万亿规模参数的 稠密(dense)/稀疏(moe)模型的预训练(pretrain/CPT)和后训练(SFT/RL)能力建设和优化工作
通过推理和训练加速,训推一体复用等技术,在前沿的异构设备上实现极致的强化学习
任职要求
有扎实的工程法基础,有中大规模集群的文本(语音/图像,视频大模型高性能训练代码实现(包括不限于Owen、LLama、BUP2.LaVA、MInIGPT.VISUAIGL.OWeDHV OwenAudioCosyVoice),以及实际训练经验
有大模型分布式训练经验,有大规模分布式训练集群性能&稳定性优化经验,精通GPU设备上的训练性能分析,以及GPU算子和通信开发。有FP8训练(权重、优化器)经验者优先。
款练学握megatron/depspeed/openRlHF/chatleam/veRL 等常用的大模型pretrain& post training 框架,并有框架二次开发的能力。有大规模分布式训练系统实现经验者优先
学习能力强,并保持关注训练领域的前沿技术,在训练领域有相关研究和成本发表者优先
Job Apply
Name
*
Name*
Email
*
Email*
Tel
Tel
Remark
CV
File name:
File size:
(TXT, PDF, DOC, DOCX and RTF file only)
Validate Email
分享:
申請
我們是誰
招聘
求職指導及資源
需要招聘?
發送我們你的空缺
招聘人才
© 版權所有2016 Springer Professional Group。保留所有權利。