研发专家-云内可观测平台-杭州/北京
2-4万元/月
投递简历
浙江-杭州
5-10年
Golang · C++ · ClickHouse · ELK · MySQL · Prometheus · OpenTelemetry · Spring · Python
2025-12-14 00:41:27 更新
被浏览:951 次
阿里云计算有限公司
最近在线时间:2025-12-14 00:41:27
电话:157********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
职位描述:
1、参与阿里云核心可观测平台(Metrics/Logs/Traces)的架构规划与技术突破,推进AIOPS在故障预测、根因定位、容量管理等场景的实际应用。
2、参与阿里云核心可观测平台运维自动化体系及工具链的构建与研发,提升SRE平台的运作效率与智能决策能力,确保生产环境7x24小时稳定运行。
3、主导全链路稳定性防护机制建设,通过主动式监控、容量管控与性能优化,识别并消除潜在隐患,增强系统承载力;牵头重大线上事件的应急处置与问题溯源。
4、以用户需求为导向,快速响应并协助解决用户问题;高效处理系统稳定性与性能瓶颈,推动改进措施实施,保障关键业务场景的可用性与服务体验。
职位要求:
1、本科及以上学历,计算机相关专业,5年以上SRE/运维开发/系统架构工作经验,具备大型分布式系统稳定性维护背景,有devops、效能平台建设经验者优先。
2、掌握主流可观测性技术体系(Prometheus、OpenTelemetry、ClickHouse、ELK等),具备大规模监控系统设计与开发实践经历。
3、熟练掌握至少一门编程语言如C++/Python/Go等,了解软件开发生命周期与运维流程,具备全栈开发能力者更佳。
4、具备扎实的计算机系统基础,熟悉操作系统机制、网络通信、高并发处理及性能调优方法,具有架构设计经验,有大流量、高可用、分布式系统开发背景者优先。
5、具备较强的系统问题诊断能力,善于主动沟通、归纳总结,对技术有持续热情,并关注行业前沿技术发展动态。
6、具备良好的协作沟通意识和团队精神,具备自我驱动力和自主学习能力者优先。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作