大模型算法实习生
北京市不限学历应届
职位描述
岗位职责:
1、参与团队预训练大模型的研发,包括预训练,后训练,指令微调,对齐等方向;
2、负责以大语言模型为核心的对话感知与交互,根据业务需求优化模型,提升业务效果;
3、负责跟踪和探索大语言模型的前沿问题,结合实际场景,参与前沿算法和应用的研究和专利、论文撰写。
任职要求
1、计算机相关专业硕士及以上学历,熟练掌握自然语言处理、深度学习、强化学习的基础理论和方法。
2、具有扎实的的编程能力,熟练掌握至少一门编程语言(C/C++/Python/Java),熟悉TensorFlow/Pytorch/Keras等深度学习框架。
3、熟悉Transformer/GPT系列/LLaMA/GLM等预训练模型,对模型训练和应用有一定理解。
4、了解DeepSpeed、Megatron等分布式训练框架,有一定多机多卡分布式训练与debug经验。
5、较强的技术攻关能力,能够跟进领域内最新的技术研究成果,结合实际应用场景快速实验和落地。
6、有对话、多模态领域比赛或者ACL、EMNLP、AAAI等相关顶会论文者优先。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅