液冷服务器运维工程师
9千-1.5万上海市本科不限经验
职位描述
一、岗位职责67
671、液冷IT系统全栈部署:6767
1)负责液冷服务器机柜的整柜上架、供电、布线及液冷管路连接。
2)与设施团队协同,完成液冷系统(CDU、管路、冷板式、浸没式)与服务器硬件的联调联试,包括压力测试、注液、排气等关键操作。
3)部署和配置操作系统(Linux为主)、集群管理软件及监控组件。
67
2、跨领域日常维护与监控:6767
1)执行7x24小时值班巡检,同时监控服务器硬件状态67(通过iDRAC/iLO/BMC)和液冷系统参数67(流量、压力、温度、泄漏告警)。
2)负责IT设备的硬件维护(如硬盘、GPU、内存更换)及液冷回路的日常检查、冷却液品质监测。
3)管理与维护集群基础服务,并行文件系统及作业调度系统(如Slurm)。
67
3、复杂故障诊断与处理:6767
1)能够快速判断并定位故障域,区分是服务器硬件问题、系统软件问题还是液冷系统问题。
2)独立处理服务器硬件故障,并协同或主导处理液冷系统故障(如轻微泄漏、泵异常、温差过大等)。
3)撰写详细的故障分析报告,推动问题根治。
67
4、优化与创新:6767
1)分析运行数据,协同优化服务器功耗与冷却效率,提升整体能效(PUE)。
2)编写脚本(Python/Shell)自动化日常运维任务,提升运维效率。
67
二、任职要求67
1、本科及以上学历,计算机、机械工程、暖通空调(HVAC)、能源与动力工程等相关专业。
672、3年以上67中大型数据中心服务器硬件运维经验,精通主流服务器硬件架构与故障排查。
673、具备以下任一领域经验者优先:6767
671)有液冷数据中心实际运维经验,熟悉冷板式液冷系统工作原理和维护流程。
672)有大型HPC/AI集群运维经验,熟悉高速网络(InfiniBand)和并行计算环境。
3)熟练掌握Linux操作系统,具备扎实的系统管理、网络基础及脚本编写能力。
4)具备极强的责任心、细心、主动性和跨团队协作能力,能适应数据中心工作环境及轮班制度。
674、我们强烈期待您具备以下技能(非必需,但会重点考虑):6767
1)熟悉液冷系统主要组件(CDU、快接头、冷板、浸没式)和冷却液特性。
2)持有高压电工证、制冷操作证等相关特种作业证书。
3)熟悉自动化运维工具(Ansible/SaltStack)和监控系统(Prometheus/Zabbix)。
三、福利待遇
1、上班时间 09:00-18:00(做五休二)
2、福利构成:该有的福利都有,另外附加医疗意外商险、公司长期开放的娱乐活动(比如:迪士尼快速畅游)…
3、公司氛围欢快,喝不完的免费咖啡,吃不完的水果,老板不倦,同事不内耗。
简历是否与目标岗位匹配?
为什么没有面试?我的简历有什么问题?
怎么优化?职业优势在哪里?

投递之前...
你的简历真的准备好了吗
80% 简历因职业定位模糊,表达无焦点
被快速跳过,立即诊断,提升面试机会!