资深运维开发工程师(监控和日志方向) 30-50k
上海 5年以上 本科 招1人 4月21日更新
收藏
avator
黄女士 当前在线 已认证
资深项目顾问 · 乐班班(北京)科技有限公司
聊一聊
职位介绍
岗位职责: 1、监控系统设计与运维:负责平台的架构设计、搭建与迭代优化,选型适配Prometheus、Grafana、Zabbix等主流监控工具,覆盖硬件、系统、应用、接口等全维度监控。制定监控指标体系、告警策略与降噪方案,优化监控响应时效。 2、日志系统设计与运维:负责日志系统全链路规划与运维,搭建ELK/EFK(Elasticsearch、Logstash/Fluentd、Kibana)等日志收集、存储、分析平台,制定日志规范与治理策略。实现日志的集中采集、结构化解析、检索分析与可视化展示,支撑故障排查、系统分析与安全审计。 3、运维工具开发:负责运维自动化工具与平台搭建,基于Python/Go等语言开发适配监控告警、日志分析、故障处置、批量运维等场景的脚本与工具。推动自动化流程落地,降低人工运维成本,提升运维效率。 4、故障联动优化:负责建立监控、日志与故障处置的联动机制,根据监控数据与日志信息快速定位问题、制定解决方案。定期复盘故障案例,优化监控指标、日志采集规则与自动化处置逻辑,持续提升运维体系的稳定性与抗风险能力。 5、系统优化:负责监控平台升级、日志系统扩容、运维自动化工具迭代等项目,统筹需求调研、方案设计、开发落地及验收上线全流程。制定监控、日志及运维开发标准化规范,沉淀技术经验与工具文档,提升团队整体运维与开发能力。 职位要求: 1、本科及以上学历,计算机、软件工程、网络工程等相关专业;具备5年及以上运维开发经验,其中至少3年监控/日志系统运维与运维开发实战经验。 2、精通主流监控工具与技术,熟练运用Prometheus、Grafana、Zabbix等搭建全维度监控体系,具备监控指标设计、告警策略优化、监控平台性能调优经验;深入理解日志治理全流程,熟练运维ELK/EFK等日志平台,具备日志结构化解析、检索优化能力。 3、具备较好的开发能力,熟练掌握Python/Go至少一门编程语言,能独立开发运维脚本、自动化工具及轻量平台;熟悉Ansible等自动化与版本控制工具,具备自动化场景(如批量部署)落地实战经验。精通Linux/Unix操作系统,熟练编写Python、Shell脚本,具备系统环境配置、性能调优及故障排查能力;熟悉TCP/IP、HTTP等网络协议,了解数据库、中间件基础运维,能跨模块定位监控、日志与业务联动故障。 4、具备项目统筹能力,能独立主导监控、日志或运维自动化项目,有效协调跨部门资源,把控项目进度、质量与成本,推动技术方案落地。 5、具备较好的技术沉淀与文档撰写能力,能搭建标准化运维体系,规范监控、日志及开发流程,精准沉淀技术文档与工具手册。 6、具备AI运维、日志智能分析、监控告警降噪等智能化运维场景落地经验者优先。
其他信息
语言要求:不限
行业要求:游戏

猎聘温馨提示:

1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
  • · 扣押您的身份证件或者其他证件;
  • · 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
  • · 强迫您入股或者向您集资;
  • · 以招聘名义牟取不正当利益;
  • · 发布虚假招聘广告信息;
  • · 工作时长违反劳动法规定;
  • · 存在其他损害您的合法权益的行为。
2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
3. 本平台招聘方不向求职者提供任何收费服务。
查看全部
更新时间:2026-05-11