AI智能简历诊断!

想知道你的简历存在什么问题吗?

从简历规范度、职业形象塑造、职场经历、核心能力、职场竞争力五个维度综合评估,为你的求职保驾护航!

立即诊断

乌鸫科技-监控运维工程师-TRE

杭州市本科应届

岗位职责

1.负责推动阿里6+N业务的监控覆盖,对接入预警平台的监控项质量进行优化,定期对监控项的保鲜度进行巡检。对于监控未发现的故障,从监控角度评估观测可行性,给出具体解决方案建议并推动落地。
2.负责阿里6+N线上业务7*24的风险、故障应急响应与协同,包括应急事件判断,故障应急启动,处理资源调度,故障进展同步和应急质量复盘等内容。
3.对业务运维保障有丰富的经验,负责监控、应急、定位、快恢的全生命周期管理,当线上出现重大故障时,通过执行通用的恢复方式如应用重启、版本回滚、服务降级、流量调度、扩容、限流、切流等应急预案对业务进行快速恢复,最大限度减少对用户影响。
4.负责负责集团核心产品如监控、K8s、中间件等产品的疑难解答,与产研团队合作提升产品体验,确保核心产品的稳定性。
5.负责阿里618、双11等大促活动保障,执行新建站点、容量评估、应用扩缩、快上快下、混部切流等相关操作,参与大促现场值班。
6.分析历史故障案例,设计故障注入方式,复现故障场景,定期执行演练,验证快恢预案的有效性,分析演练结果,提出改进措施,并持续优化演练流程,确保核心业务如交易、导购、搜推可以分钟级恢复。

任职要求

1.计算机相关本科以上学历,有1年以上互联网运维相关从业经验,对故障排查、定位、快恢最好具备一定经验。
2.熟悉Linux系统、虚拟化产品以及常见的系统问题排查手段和恢复措施。
3.具备责任心,负责事项有响应有反馈有跟进,具有跨团队沟通协调能力,具备良好的问题分析和解决能力,能够独立处理紧急运维事务。
4.可以适应7x24监控值班(包含每月少量的夜班)。
5.具备较强的学习和自我驱动能力,持续关注新技术的发展,拓展自己的能力边界。

20,861+ 岗位更新等你来订阅

一键订阅最新的岗位,每周送达

您可以在邮箱中随时取消订阅