自动驾驶分布式系统研发工程师
上海市不限学历应届
职位描述
【职位描述】:
建设高效的深度学习基础服务,为各类模型研发提供技术支撑,优化计算效率,支持算法团队业务需求落地。
【主要职责】:
1. 负责深度学习平台的系统架构设计和研发工作,提供端到端的模型交付能力;
2. 集成云原生能力,开发调度,训练,推理等相关功能,提升平台资源利用率和计算效率;
3. 负责调度系统的维护,监控,调优和故障定位;
4. 持续运营,改进平台性能、易用性和稳定性,优化用户体验。
【基本资格】:
5. 计算机科学,工程或相关领域的学士学位,或者具有等同经验;
6. 精通Golang、Python或其他系统级语言;
7. 熟悉云原生相关技术,如kubernetes、kubeflow、volcano等,具备二次开发经验;
8. 熟悉调度系统原理,有过kube-scheduler、GPU调度相关研发经验;
9. 强大的解决问题的能力和使用Git管理代码的证明能力。
【期望资格】:
10. 相关领域的硕士学位;
11. 大规模GPU集群的研发和实践经验;
12. 深入理解深度学习理论,熟悉主流深度学习框架(如tensorflow、pytorch),在CV、NLP等算法方向有相关项目经验;
13. 使用敏捷/Scrum方法的经验;
14. 在类似的基于云的,GPU密集型环境中的先前角色。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅