AI智能简历诊断!

想知道你的简历存在什么问题吗?

从简历规范度、职业形象塑造、职场经历、核心能力、职场竞争力五个维度综合评估,为你的求职保驾护航!

立即诊断

AI全栈工程师

2.5-4万
深圳市硕士不限经验

职位描述

长文本生成领域算法开放工程师
工作内容
1.核心能力攻坚:深度参与小说、剧本等长文本全生命周期 NLP 技术体系建设,主导攻克长文本多轮续写连贯性建模、复杂剧情逻辑结构化分类、剧本角色关系动态 NER 等技术难题。基于 Transformer 架构创新设计长文本专用 Embedding 层与多模态 Attention 机制,实现百万字级文本语义理解与生成质量提升。
2.垂直模型定制:负责构建小说创作、剧本智能改编等垂直领域大模型训练体系,通过 RLHF(基于人类反馈的强化学习)与 In - context Learning 技术,优化模型在长文本叙事逻辑、戏剧冲突设计等场景的生成能力。推动行业专属模型在章节自动续写、剧本分镜转化等核心业务场景落地。
3.技术生态优化:跟踪 AIGC 领域前沿技术,针对长文本处理特有的显存优化、推理速度瓶颈,设计基于 Flash Attention、Quantization 的性能调优方案。搭建覆盖 Prompt 工程、模型评估、服务部署的全链路开发框架,提升长文本生成系统工程化水平。
职位要求
1.专业背景:计算机、人工智能、计算语言学等相关专业硕士及以上学历,拥有 3 年以上 AI 算法研发经验,其中 2 年以上长文本处理项目经验。若有突出的长文本处理项目成果、技术专利或开源贡献,学历和工作年限要求可进一步放宽。具备智能体在剧情生成场景的开发落地案例,熟练整合 LangChain 等框架实现多智能体协同创作流程。
2.技术深度:熟悉并能应用 Transformer 系列模型架构,具备 LLM 在长文本领域的训练优化经验,掌握 RoPE、ALiBi 等位置编码技术,能够参与或主导小说文本风格迁移、剧本对话生成等任务的技术方案设计,熟练完成长文本数据清洗、段落切分、连贯性评估等工作。
3.工程能力:具备扎实的软件工程实践能力,熟悉算法开发全流程,包括需求分析、设计、开发、测试与部署。能够使用 Git 进行高效的版本控制与团队协作开发;熟练运用 Linux 操作系统进行环境搭建、任务调度与系统监控;擅长使用 Docker 容器化技术实现模型服务的高效部署与迁移;熟悉 Prometheus、Grafana 等工具进行系统性能监控与数据分析,保障长文本生成系统的稳定运行。
4.编程能力:精通 Python 编程语言,熟练掌握 NumPy、Pandas、Scikit - learn 等数据处理与分析库,能够高效处理长文本数据;熟悉 PyTorch 框架的高阶开发,具备自定义模型架构、编写复杂训练逻辑的能力;熟练使用 FastAPI、Flask 等 Web 框架实现 AI 模型的 API 化服务,具备高并发场景下的接口优化经验;能够运用 Python 进行自动化脚本编写,实现数据预处理、模型训练、结果评估等流程的自动化,提升开发效率。
5.创新能力:对 AIGC 叙事生成、多模态剧本创作等前沿方向有研究探索,具备长文本生成技术创新性解决方案设计能力,熟悉基于 BERTScore、ROUGE - L 等指标的自动化评估方案,有能力参与或搭建长文本生成评估体系。
技术栈要求
61AI 开发核心栈:
71模型训练:深度掌握 LLaMA、Falcon 等开源模型训练全流程,熟悉 LoRA、QLoRA 等高效微调技术在长文本场景的应用
71框架应用:基于 LangChain 构建交互式小说创作智能体,使用 LlamaIndex 实现百万字级剧本知识库快速检索,熟练整合 Hugging Face 生态完成模型端到端部署
71工程工具:精通 DeepSpeed、Horovod 分布式训练框架,熟练使用 DVC 进行长文本数据集版本管理
61长文本处理专项:
71内容理解:掌握长文本滑动窗口处理、层次化语义分析技术,熟悉 UMA、LongNet 等长序列建模方法
71生成优化:精通 Prompt Chaining、Prompt Ensembling 等高级提示工程技术,熟悉基于强化学习的生成结果优化方案
71评估体系:熟练使用 Evals 构建多维度长文本生成评估流水线,掌握基于人工标注与自动化指标结合的混合评估方法

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅