大模型算法工程师
25-50K合肥市硕士1-3年
职位描述
工作职责:
1.负责大型语言模型(LLM)的训练和效果优化工作,包括但不限于预训练、微调、对齐、数据工程、模板工程、解码优化等;
2.与数据工程、后端工程等其他团队密切合作,确保项目高质量落地。
3.跟踪NLP大模型的前沿探索,将研究成果转化为可落地的产品,推动模型效果达到业界领先水平。
任职资格:
1.计算机科学、信号处理、数学、软件工程、电子与通信、自动化或相关领域硕士及以上学历,具备1年以上研究生学历,且具有扎实的NLP、人机交互等领域的研究或开发经验,对于个别具备较强NLP/NN技术能力的应聘者不受专业限制。
2.对NLP主流预训练语言模型(如BERT、GPT、T5、PaLM、GLM、Bloom、LLaMA等)有深入了解。
3.熟练掌握Python、C++等至少一种编程语言,熟悉Linux下的编程开发环境,以及数据结构和常见算法。
4.熟悉深度学习框架TensorFlow或PyTorch,具有使用Megatron-LM、Deepspeed等大模型训练框架的经验者优先。
5.具备深度学习、强化学习、知识图谱等方面的研究经验和基础。
6.熟练掌握Linux基础命令和操作,能够独立完成集群运行环境的搭建。
7.具有良好的学习能力、沟通能力、团队协作精神和责任心。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅
