Spark数据引擎高级研发专家

上海市不限学历应届

岗位职责

1、参与小红书Spark离线引擎的研发工作，支撑小红书云原生大规模离线数据处理场景，包括数据仓库、机器学习等场景，提升离线处理引擎的性能和稳定性

2、参与小红书Spark Native Engine 和 Serverless Spark 架构的研发工作，提升任务时效性，同时利用离在线混部降低资源成本

3、参与统一元数据工作，为小红书算法AI团队管理非结构化数据，提供统一访问方式，简化算法数据开发链路，并进行数据治理

1、至少熟悉一款主流大数据框架及源码，比如Spark、StarRocks、ClickHouse、Impala、Doris、MySQL等；

2、熟悉Spark生态系统，如RSS，Kuybbi, HMS等，有实际的Spark 代码编写、调优部署和问题排查经验

3、熟悉主流的OLAP引擎的技术优势，如向量化执行、SIMD编程、列式存储、并行编程、异步编程、查询编译等；

4、精通C++/Java编程语言，对K8S，元数据有一定的了解和使用经验。

加分项：a. 熟悉Velox、CK等任意一项向量化算子实现者可加分 b. 熟悉Spark on K8S 并有实际部署经验者可加分 c. 了解包括推广搜在内的算法数据工程链路，并有实际治理经验者可加分

简历是否与目标岗位匹配？

为什么没有面试？我的简历有什么问题？

怎么优化？职业优势在哪里？

投递之前...

你的简历真的准备好了吗

80% 简历因职业定位模糊，表达无焦点

被快速跳过，立即诊断，提升面试机会！