算力中心架构师
3-4万上海市硕士不限经验
职位描述
【岗位概述】
全面负责10EFlops算力的总体规划、架构设计、技术选型与建设实施,主导构建高性能、可扩展、绿色低碳的算力底座,以支撑AI大模型训练、科学计算、云服务等前沿业务需求,并确保算力资源的高效调度与全生命周期管理。
【岗位职责】
1.算力基础设施规划与架构设计
(1)主导10EFlops规模算力中心的总体规划,结合业务战略与技术演进趋势,进行技术架构设计与选型,打造高可用、可扩展的算力基础设施技术底座;
(2)负责异构算力资源池(包括GPU、ASIC、FPGA等AI芯片)的整合与虚拟化方案设计,推动远程调用、资源池化等技术的应用;
(3)设计低延迟、高带宽的网络互联架构(如InfiniBand、RoCE),优化集合通信库(如NCCL、MPI),以满足千卡乃至万卡级别大规模集群的通信需求。
2.系统构建与效能优化
(1)牵头算力集群的构建,负责硬件选型、集成测试与容量规划,确保算力产能按计划交付;
(2)建立完善的效能管理体系,主导资源效能提升方案的设计与实施,持续优化算力基础设施的资源配置,提高资源利用效率,并重点推进能耗(PUE)的降低与智能化提升;
(3)对算力基础设施的运营、容量及全生命周期进行管理,确保各基础设施稳定运行。
3.运维体系与前沿技术探索
(1)参与搭建并持续改进运维流程体系化、标准化、自动化,快速提高算力中心运维管理成熟度;
(2)负责探索、设计、优化和试点面向未来的算力基础设施运维体系架构,并追踪前沿技术,引入先进技术方案;
(3)参与与客户或业务部门的沟通,理解算力需求并转化为可落地的技术方案。
【任职要求】
1.计算机、信息技术、电子工程或通信等相关专业硕士及以上学历;
2.具备5年以上算力基础设施(如超算中心、智算中心、互联网公司计算平台)的规划、设计、建设或运维相关经验;拥有AI集群(千卡级别以上)或高性能计算(HPC)集群项目实战经验者优先,需在知名产品或项目上成功验证其方法论;
3.具有项目统筹管理经验,能够带领及指导团队有效开展技术支撑工作。
简历是否与目标岗位匹配?
为什么没有面试?我的简历有什么问题?
怎么优化?职业优势在哪里?

投递之前...
你的简历真的准备好了吗
80% 简历因职业定位模糊,表达无焦点
被快速跳过,立即诊断,提升面试机会!