岗位职责1、负责公司各项目软件产品部署、上线、系统监控、日常运维工作和应急反应系统运维、服务监控分析、故障排查,以及紧急情况下的应急处理、确保现网系统能够7x24小时的持续运行,并编制汇总故障、问题,定期提交汇总报告;2、负责公司系统项目扩容需求与资源落实,软硬件的部署跟运维; 3、负责网络以及服务器的网络设置、维护和优化、网络的安全维护监控、系统性能管理和优化、网络性能管理和优化; 4、负责制定公司各项目的部署文档、维护文档手册,应用技术文档,并根据环境的变化及时更新各个相关文档; 5、参与研究系统架构,发现潜在问题,制定系统调整和优化方案,提高系统的健壮性和效率;6、负责设计测试方案,制定测试计划,建立并维护测试环境,按照测试流程对公司软件产品进行全面、规范的测试;7、参与需求评审,跟踪项目进度,编写测试用例、执行测试计划、发现和报告缺陷等;8、领导安排的其他工作。岗位要求:1、本科以上学历,5年以上Linux系统参数设置、性能调优、故障定位处理经验; 2、工作认真负责,具备良好的沟通能力、团队协作能力和书面报告能力;3、熟悉MySQL数据库、postgresql数据库、PolarDB查询分析及性能的优化能力;4、熟悉消息队列如RocketMQ,Cache组件如Redis,中间件如mango,熟悉其工作原理,应用场景及高级配置;5、熟悉docker技术及kubernetes容器编排工具;6、熟悉自动化运维常用工具ansbile/salttack/puppet(至少一种);7、精通TCP/IP协议,基础知识扎实,熟悉网络安全;熟悉各类常用网络设备的部署、使用和维护;8、熟练掌握Prometheus、Zabbix等监控工具,有自动化运维管理平台,云平台运维开发经验者优先。