AI智能简历诊断!

想知道你的简历存在什么问题吗?

从简历规范度、职业形象塑造、职场经历、核心能力、职场竞争力五个维度综合评估,为你的求职保驾护航!

立即诊断

达摩院-AI设备运维诊断工具研发工程师-计算技术

北京市硕士应届

岗位职责

•开发和实施工具,以支持容器化环境中的 GPU 资源管理和优化。
•创建和维护 Container Toolkit,以便在容器化应用程序中启用 GPU 访问
•实施监控解决方案,使用 DCGM 等工具跟踪 GPU 性能和使用情况。
•与 Kubernetes 集成,确保机器学习工作负载的无缝部署和调度 GPU 资源。
•构建和管理 Kubernetes 设备插件,确保有效地将 GPU 资源暴露给 Kubernetes Pod。
•与 Kubernetes 社区合作,确保符合标准和最佳实践。
•在各种应用程序中优化 GPU 资源分配和使用,注重性能和效率。
•进行性能测试和基准测试,以验证工具和框架的有效性。
•与数据工程师、软件工程师和 DevOps 团队密切合作,确保 AI 工作负载的平稳部署和运行。
•参与代码审查、设计讨论和架构规划。

任职要求

•计算机科学、软件工程、电气工程或相关领域的学士学位。硕士学位优先。
•8年以上软件开发经验,3年以上相关软件工具开发经验,专注于容器化和编排(Docker、Kubernetes)。
•在 AI 和机器学习工作负载的 GPU 管理和优化方面有实际经验。
•精通 C++、Python 或 Go 等编程语言。
•深入理解容器平台(Docker、container)和编排工具(Kubernetes)。
•有开发和管理 Kubernetes 设备插件的经验。
•了解分布式系统和云原生技术。
•出色的问题解决和分析能力,优秀的沟通能力和团队合作能力,能够独立工作并处理多项任务。
加分项
• 参与与容器化或 GPU 管理相关的开源项目。
• 熟悉 NVIDIA 或相关的工具,包括 Container Toolkit、DCGM 和 异构计算 架构。
• 具备运维工具设计,开发和优化经验的优先。
• 熟悉运维工具在CI/CD 管道和 DevOps 实践的经验。

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅