职位描述请注意,此岗位需出差香港。工作职责:1、 负责服务器的系统运维,保证系统的性能和可用性,解决业务遇到的操作系统环境疑难问题;2、 对网络故障进行快速响应和定位分析,优化。深入理解业务,对可能出现的各类网络攻击提供解决预案和实施,对业务的部署提供合理的网络架构设计指导;3、 负责公有云上各类数据库例如MySQL、Redis等常用产品的可用性和日常管理,负责相关问题单跟进并最终处理故障,保障性能,快速恢复业务;4.、负责平台的中间件维护nginx,MQ等;5、 及时响应并处理线上故障及报警事件;6、 负责K8s系统集群搭建、维护及相关服务的可用性;7、 提供IT基础架构相关的业务生产技术支持和突发问题协助,与研发和业务支持团队进行良好的合作,共同达到目标;8、 参与业务的部分IT基础架构技术选型,协助业务在生产上的IT资源合理使用。- 工作要求:1、3年以上的全职Linux系统运维相关经验,精通Linux系统运维和性能分析,能独立解决突发和疑难问题。有相关的RHCE或类似证书优先;2、熟悉云原生技术架构,熟悉Docker及K8S,有大规模容器化部署、运维及排障经验,具备CKA证书优先;3、精通高并发、大流量的业务系统的网络架构。有丰富的网络知识,熟悉 TCP/IP 协议栈; 能够使用各种网络工具进行网络问题定位和故障排查,具有较好的网络攻击应对能力,擅长Prometheus、Grafana、链路监控等;4、掌握python\shell\go中任一开发语言,有自动化运维工具、脚本的编写能力;5、熟悉公有云的相关概念,有常用云产品的操作、配置经验。具备互联网的技术背景优先,具有AWS运维经验者优先;6、具有常见数据库MySQL、Redis的一般管理维护能力,熟悉常用的例如nginx等中间件的配置管理;7、熟悉常用的监控、告警工具,并能根据监控数据及时发现、定位问题。熟悉区块链和分布式系统优先;8、具备良好的服务态度和沟通能力,积极主动,责任心强,安全意识好,有较好的抗压能力,有很好的技术敏感度和风险识别能力;9、英文读写能力良好,能够独立阅读和理解技术文档。