大数据工程师(应届管培生)
5千-1万北京市本科不限经验
职位描述
核心职责
一、数据平台建设与优化
1、设计并搭建高可用、高性能的大数据平台(如Hadoop、Spark、Flink等),支撑千万级数据的实时/离线处理。
2、优化数据管道(Data Pipeline),提升数据采集、清洗、存储和计算的效率。
二、数据仓库与建模
1、构建和维护企业级数据仓库(如Hive、ClickHouse),设计合理的分层模型(ODS/DWD/DWS/ADS)。
2、参与数据治理,确保数据质量、一致性和安全性。
三、数据分析与赋能
1、与算法团队协作,提供高质量数据支持智能推荐。
2、开发数据服务API,支持业务部门(如运营、产品)的数据分析需求。
四、新技术探索与落地
跟踪大数据领域前沿技术(如实时计算、数据湖、LLM数据工程),推动技术升级。
任职要求
1、专业背景:统计学、数据科学、计算机工程。
2、熟悉分布式系统原理和常用大数据技术栈。
3、精通至少一种大数据框架:Hadoop/Spark/Flink,并有调优经验。具备数据清洗、分布式计算能力
4、熟练使用SQL和至少一种编程语言:Java/Python/Scala。
5、熟悉数据仓库设计,了解维度建模、ETL流程及数据治理。
6、有云平台(AWS/Azure/阿里云)大数据服务使用经验。
加分项
1、熟悉实时计算(如Kafka、Flink)或图数据库(Neo4j/JanusGraph)。
2、了解机器学习数据工程(如特征工程、模型训练数据准备)。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅