蚂蚁集团-NLP大模型算法工程师-北京
35-65k·16薪北京市硕士3-5年
职位描述
负责NLP大模型生成内容的可控可信方向的研发和落地。
工作内容包括大模型基座的训练,对比,基于公开数据集/业务数据集的微调, 生成知识的可控性,准确性方案研发,以及大模型小型化相关技术来保证模型的落地应用。
职位要求
1. 计算机相关专业获得硕士学位, 博士优先, 发表过大模型相关研究AI顶会论文优先;
2. 对NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
4. 熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
5. 有良好的代码开发能力,有开源项目开发经验优先。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅