AI智能简历诊断!

想知道你的简历存在什么问题吗?

从简历规范度、职业形象塑造、职场经历、核心能力、职场竞争力五个维度综合评估,为你的求职保驾护航!

立即诊断

【26届实习】深度学习推理/训练引擎研发工程师

北京市不限学历应届

岗位职责

1、研发面向大语言/多模态/CV/NLP等类型模型的推理与训练框架;
2、参与推理框架研发优化,包括算子优化、推理架构优化、异构调度等多种技术研发落地等;
3、参与训练框架研发优化,包括数据读取、分布式训练及微调工具链等AI基础设施的建设等;
4、参与多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效;
5、与公司各算法部门深度合作,参与大语言模型、多模态大模型、计算机视觉、语音、自然语言处理等业务训推任务的优化提效;
6、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等。

任职要求

1、优秀的代码能力、数据结构和基础算法功底,熟悉C++/Python开发,熟悉 Linux 开发环境;
2、熟悉至少一种主流基础深度学习训练或推理框架(TensorFlow/PyTorch/PaddlePaddle/TensorRT等)的使用和实现;
3、熟悉主流LLM模型结构,熟悉至少一种主流LLM训练或推理框架(Megatron-LM/DeepSpeed/vLLM/TensorRT-LLM等)的使用和实现;
4、熟悉GPU硬件架构,了解GPU 软件栈(CUDA,cuDNN),具备 GPU 性能分析的能力;
5、有强烈的工作责任心,较好的学习能力、沟通协作能力和自驱力,能和团队一起探索新技术,推进技术进步。
加分项:
1、熟悉蒸馏、剪枝、量化等模型压缩方案,有大模型压缩或小型化经验、或有相关论文者优先;
2、熟悉CUDA编程,有TensorRT或其它AI加速库、高性能算子开发经验者优先;
3、熟悉至少一种AI编译加速组件者优先,包含但不限与TorchInductor/TVM/Triton/XLA等;
4、熟悉DP/TP/PP/ZeRO等分布式训练策略原理,有大模型训练调优分析经验者优先;
5、了解并行计算、网络通信、系统优化和集群硬件架构等相关知识者优先;
6、熟悉NCCL/RDMA/IB/RoCE相关知识者优先;
7、有优秀开源项目经历者优先。

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅