人工智能算力运营专家
1.5-2万广州市硕士不限经验
职位描述
岗位职责
1、负责AI算力资源的日常运营管理,确保资源的高效使用,构建高性能算力资源集群,整合算力资源调度平台算力;
2、对算力资源管理,负责AI算力资源的全生命周期管理,通过调度优化、成本控制及效能提升,支撑模型训练与推理需求;
3、设计GPU/TPU集群调度策略,优化资源利用率,实现算力资源的高效利用;
4、监控算力使用瓶颈,建立弹性伸缩机制,输出算力效能分析报告指导战略决策;
5、分析训练任务日志,识别低效代码段,推动混合精度训练等节能技术落地;
6、与算法团队协作预估算力需求;
7、建立运营指标,指导资源利用率及性能运营管理,制定算力使用规范与计费标准。
任职要求
1、计算机/电子工程硕士及以上学历;
2、3年以上云计算/AI基础设施运维经验;
3、熟悉Kubernetes/Docker容器化技术;
4、熟悉NVIDIA CUDA生态及主流AI框架;
5、对算力-模型匹配关系有深度认知;
6、具备量化分析能力(如ROI计算);
7、能平衡技术可行性与业务紧迫性。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅
