AI智能简历诊断!

想知道你的简历存在什么问题吗?

从简历规范度、职业形象塑造、职场经历、核心能力、职场竞争力五个维度综合评估,为你的求职保驾护航!

立即诊断

高级SRE工程师

15-20万/年
广州市本科不限经验

职位描述

岗位职责:
1.系统稳定性保障:负责核心业务系统的高可用架构设计、容灾方案及稳定性保障方案制定,参与重大故障应急响应与根因分析。
2.日常程序更新与维护:负责操作系统、中间件、数据库及第三方依赖库的版本升级、补丁更新与兼容性测试;制定标准化更新流程,通过自动化工具(如Ansible/Terraform)实现批量滚动更新,降低业务影响,及时修复安全补丁并验证更新后系统稳定性。
3.自动化运维平台建设:开发自动化部署、配置管理、日志采集等工具链,提升运维效率。
4.监控与告警体系:设计并实现多层次监控(基础设施/服务/业务指标),优化告警策略,减少误报漏报,推动故障快速定位。
5.容量规划与成本优化:分析系统资源使用率,制定弹性扩缩容策略,优化云资源成本(如阿里云、百度云实例调度)。
6.性能调优与瓶颈分析:通过链路追踪、压测工具识别系统瓶颈,提出优化方案并推动落地。
7.SLO/SLI管理:定义关键服务级别目标(SLO),监控达成率,推动开发团队优化技术。
8.安全与合规:参与基础设施安全加固,制定访问控制、漏洞修复等策略,确保符合GDPR/等保等合规要求。
9.技术协作与赋能:为开发团队提供可观测性工具(如Prometheus/Grafana)集成支持。
任职要求:
1.本科及以上学历,计算机相关专业,3年以上SRE/DevOps/运维开发经验;
2.精通Linux系统原理、网络协议及分布式系统设计;
3.熟悉Kubernetes、Docker等容器化技术及云平台(阿里云/百度云);
4.熟悉Prometheus、Grafana、ELK等监控与日志工具;
5.具备故障排查能力,熟悉APM、Tracing工具(如SkyWalking、Jaeger);
6.具备安全事件应急响应经验,熟悉日志溯源、取证分析及漏洞修复流程;
7.具备优秀的沟通能力,能高效协调开发、运维与业务团队达成共识;主动追踪行业技术动态,乐于分享经验并帮助团队成员成长。
9. 有软件开发经验者优先。

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅