岗位职责:
1.负责各产品线服务的稳定、高效运行;
2.各产品线服务架构评审,并能提出设计,规划建议;
3.及时响应各种故障报警,能够快速解决问题恢复业务;
4.跟踪用户访问体验,并不断优化运维架构;
5.积累系系统及应用运维的最佳实践,制定运维规范和策略,并实现文档化;
6.通过技术手段进行成本控制及优化,通过工具平台及流程提升管理效率。
任职要求:
1.熟悉Linux系统,Linux系统管理经验,大型web平台运维经验优先考虑;
2.熟悉ELK、Prometheus、Grafana的使用及调优;
3.熟悉redis、kafka、LNMP等常用服务的集群架构、部署、配置调优;
4.熟悉虚拟化和容器技术,包括但不限于ESXi、Docker、Kubernetes。
5.了解其原理并能够熟练配置、使用;
6.熟悉ansible、puppet、saltstack等自动化运维工具;
7.掌握Shell、Python、Golang中的至少一门语言,能够编写运维脚本,参与过自动化运维平台研发者优先;
8.对kubernetes或ceph任何一项有深入了解者可重点优先;
9.具备较好的沟通能力,文档整理能力,较强的自我驱动能力,追求极致的责任心。