大数据运维专家
广州市本科>10年
职位描述
职位描述:
1. 负责唯品会大数据平台的运维工作,包括集群管理、性能优化、故障排查和处理等,确保平台的高可用性和稳定性。
2. 设计和实施监控系统,包括对大数据组件和产品的指标监控,及时发现和解决潜在的问题,保障数据平台的正常运行。
3. 负责制定全链路数据保障策略,确保数据的安全性和完整性,并进行存算分离的管理和优化。
4. 参与系统架构设计和容量规划,提供一线运维方面的建议和支持,确保大数据基础实施的可扩展性和性能。
5. 参与大数据运维平台的设计与研发工作,完成功能的迭代及变更的风险控制。
6. 管理和维护大数据平台的硬件设备和软件工具,包括安装、配置、更新升级和灰度策略,确保其正常运行。
7. 跟踪行业最新技术和趋势,提出改进和优化的建议,不断提升大数据平台的性能和效率,包括容量管理和性能优化。
职位要求:
1. 7年以上大数据平台开发和运维经验,了解分布式平台运行的原理,熟悉容器和分布式技术,熟练掌握Hadoop生态常用开源项目的部署升级、扩容缩容、性能和管理优化、问题排查等;
2. 熟悉大数据生态系统Flink、Spark、hive、Doris、Kafka、StarRocks、CDH、Hadoop、Docker等的架构底层原理和技术细节,并有丰富开发、调优、维护经验;
3. 熟悉Linux操作系统,熟练掌握Python/Java/Golang/Shell至少2种,掌握Druid/ClickHouse/Doris等一种或者多种OLAP工具。
4. 熟悉常见的大数据监控工具和系统,能够设计和实施有效的监控策略;具备良好的故障排查和解决能力,能够快速响应和处理紧急情况。
5. 有容量管理和性能优化的经验,能够进行系统容量规划和性能调优,能够提供相关的解决方案和落地实施优先。
6. 具备良好的团队合作和沟通能力,能够与开发团队紧密合作,共同解决问题;具备较强的学习能力和自我驱动力,能够持续关注行业最新技术和趋势。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅
