AI性能资深系统架构师
西安市不限学历应届
职位描述
1、 负责AIGC大模型训练和推理部署及算子加速优化
2. 负责AIGC大模型异构GPU芯片的软硬件技术平台的设计和算子加速优化
3. 负责AI大模型训推优化的前沿技术研究和产品落地 任职要求:
1、硕士研究生8年以上工作经验,本科10年以上工作经验
2、3年及以上NVIDIA GPU开发和性能优化经验,熟悉pytorch,tensorflow开发框架,并熟练掌握GPU性能分析工具(Nsight System/Compute)以及算子性能理论分析模型
3、熟悉英伟达AI 套件全栈软件(熟悉各种加速库,含CUDA,NCCL,Tools,及各种调优,部署工具)
4、满足以下至少2条设计和开发经验要求: ---CUDA和NCCL的优化工作 ---GPU集群部署的性能优化工作,了解GPU互联,IB网络 ---AI大模型相关的训推融合算子优化 ---AI编译器图层和算子层优化的设计
5、有大模型训推经验和架构性能优化经验优先; ---熟练掌握C/C++编程技能,有扎实的编程基础、良好的编程风格和工作习惯 ---在GPU、NPU上开发过高性能计算加速库经验者优先 ---熟悉OpenAI Triton或cutlass 者优先
简历是否与目标岗位匹配?
为什么没有面试?我的简历有什么问题?
怎么优化?职业优势在哪里?

投递之前...
你的简历真的准备好了吗
80% 简历因职业定位模糊,表达无焦点
被快速跳过,立即诊断,提升面试机会!