公司描述:全球领先的大型全业务综合智能通信信息服务运营商
工作地点:成都
薪资范围:60万左右
工作职责:
描述:作为团队的一员,你将负责设计和实施大规模机器学习模型的训练和部署,以及优化 ModelOps 流程。
职责:
- 建设百亿级样本的高性能的大模型的AI工程平台,提供训练及微调等各环节的研发框架和工具;
- 持续提示训练性能,包括多机多卡优化,数据交换优化等,提升平台应用性,降低大模型应用门槛;
- 负责 ModelOps 流程的自动化,包括模型版本控制、追踪和部署等。
- 使用自动化工具和流程来管理模型,如 PyTorch、TensorFlow、MLOps 和 Argo 等。
- 监控和优化模型的性能,以确保其在生产环境中的稳定运行。
- 与团队成员紧密合作,共同解决大模型训练和部署过程中的技术难题。