【北斗】大模型算法研究员(基座)
北京市不限学历应届
岗位职责
工作城市可选北京、上海1. 基座大模型预训练,包括但不限于不同规模、不同结构的语言模型和多模态模型的数据准备和优化、模型预训练、训练加速与框架优化等
2. 大模型对齐技术(SFT、RLHF等)链路整体优化,包括数据探索与增强、对齐流程探索、奖励模型优化、强化学习策略迭代等,持续提升对齐效果
3. 大模型训练和推理优化,包括但不限于高效训练技术和框架设计与实现、模型小型化技术(稀疏化、压缩、剪枝、蒸馏等)探索与落地、高效推理技术实现等
4. 大模型相关技术前沿探索,包括但不限于原生多模态、Scaling Law、模型架构探索(MoE、MAMBA等)、训练范式探索、长序列技术探索、高效训推框架探索等。
任职要求
1.扎实的算法功底,熟悉自然语言处理和机器学习技术,对技术开发及应用有热情
2.熟悉Python/Java等编程语言,有一定工程能力
3.熟悉PyTorch/Tensorflow/Megtron等深度学习分布式框架并有实际项目经验
4.熟悉Transformer/BERT/GPT等基础模型
5.在NLP相关领域顶级会议和期刊发表过论文、在权威评测中取得优秀名次者优先。岗位亮点:业界前列的NV GPU和非GPU算力规模,协同算法,AI框架,网络,计算,芯片等多个团队共同建设大模型软、硬件技术底座,接触最前沿的AI Infra基础设施,结合最前沿的AI平台软件栈,支撑最前沿的大模型不同领域的算法探索,从算法到算子,从芯片架构到互联集群,从POC到大规模场景,充满机遇与挑战,兼顾学习和成长,在垂直,水平等多个领域和维度,全面感受大模型带来的技术变革!
简历是否与目标岗位匹配?
为什么没有面试?我的简历有什么问题?
怎么优化?职业优势在哪里?

投递之前...
你的简历真的准备好了吗
80% 简历因职业定位模糊,表达无焦点
被快速跳过,立即诊断,提升面试机会!