Spark数据引擎高级研发专家
上海市不限学历应届
岗位职责
1、参与小红书Spark离线引擎的研发工作,支撑小红书云原生大规模离线数据处理场景,包括数据仓库、机器学习等场景,提升离线处理引擎的性能和稳定性
2、参与小红书Spark Native Engine 和 Serverless Spark 架构的研发工作,提升任务时效性,同时利用离在线混部降低资源成本
3、参与统一元数据工作,为小红书算法AI团队管理非结构化数据,提供统一访问方式,简化算法数据开发链路,并进行数据治理
任职要求
1、至少熟悉一款主流大数据框架及源码,比如Spark、StarRocks、ClickHouse、Impala、Doris、MySQL等;
2、熟悉Spark生态系统,如RSS,Kuybbi, HMS等,有实际的Spark 代码编写、调优部署和问题排查经验
3、熟悉主流的OLAP引擎的技术优势,如向量化执行、SIMD编程、列式存储、并行编程、异步编程、查询编译等;
4、精通C++/Java编程语言,对K8S,元数据有一定的了解和使用经验。
加分项:a. 熟悉Velox、CK等任意一项向量化算子实现者可加分 b. 熟悉Spark on K8S 并有实际部署经验者可加分 c. 了解包括推广搜在内的算法数据工程链路,并有实际治理经验者可加分
简历是否与目标岗位匹配?
为什么没有面试?我的简历有什么问题?
怎么优化?职业优势在哪里?

投递之前...
你的简历真的准备好了吗
80% 简历因职业定位模糊,表达无焦点
被快速跳过,立即诊断,提升面试机会!