大模型应用算法工程师
1.8-3万上海市本科不限经验
职位描述
职位描述
1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新应用场景;
2、负责大模型应用的构建过程,结合行业需求,设计Prompt Engineering、RAG(检索增强生成)、AI Agents等技术方案,提升模型效果与效率,确保应用的高效性与准确性;
3、对大模型应用的效果进行持续调优,模型评测及分布式训练优化(如使用Megatron、DeepSpeed框架),探索百亿至千亿参数大模型的训练加速、性能调优及推理部署,支持业务场景落地。通过数据分析与算法改进,提升模型的性能和用户体验;
4、与跨部门团队紧密合作,包括工程师、产品经理等,共同推动项目的顺利进行;
5、关注行业动态与技术趋势,及时引入新的算法技术和理念,为公司的技术发展提供前瞻性建议。
职位要求
1、本科及以上学历,计算机科学、人工智能、数学等相关专业,具有1年以上大模型相关工作经验;
2、熟练使用Python,掌握PyTorch/TensorFlow框架,熟悉分布式训练、模型量化及推理加速技术(如TensorRT)。;
3、熟悉大模型相关技术,对大模型核心技术有深入的理解,熟悉大模型全流程开发(数据构建→训练→部署→应用),包括但不限于模型架构、训练算法、优化策略等,有大模型SFT、RLHF等实操经验者优先;
4、熟悉大模型主流应用场景,如RAG、Graph-based RAG、Agent等,有实际落地经验者优先;
5、熟悉大模型应用开发框架,包括但不限于Langchain、LlamaIndex等,有实际应用开发和项目落地经验者优先;
6、具备优秀的编程能力,熟练使用Python、C++等编程语言。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅