一、岗位职责1、基础设施管理(1)负责服务器(物理机/虚拟机/云服务器)的部署、配置、维护及性能优化。(2)管理网络设备(交换机、路由器、负载均衡等)和存储系统,确保高可用性。(3)参与IDC(数据中心)或云平台(AWS/Azure/阿里云等)的资源规划与运维。2、系统监控与故障处理(1)搭建监控系统(如Zabbix、Prometheus、Grafana),实时监控服务器、网络、应用状态。(2)快速响应告警,定位并解决故障(如服务器宕机、网络中断、性能瓶颈等)。(3)制定应急预案,执行容灾演练,保障SLA(服务等级协议)。3、自动化与DevOps(1)编写脚本(Shell/Python/Ansible)自动化日常任务(部署、日志清理、备份等)。(2)配合开发团队实现CI/CD(持续集成/交付),熟悉Jenkins、GitLab CI等工具。(3)推动IaC(基础设施即代码),如使用Terraform管理云资源。4、安全与合规(1)实施安全加固(防火墙、漏洞修复、权限控制),防范DDoS、入侵等风险。(2)定期审计系统日志,确保符合行业合规要求(如等保、GDPR)。5、性能优化与容量规划(1)分析系统瓶颈(CPU、内存、磁盘I/O、网络带宽),提出优化方案。(2)预测业务增长需求,规划服务器、带宽等资源扩容。6、文档与协作(1)编写运维手册、故障处理文档,沉淀技术经验。(2)与开发、测试、产品团队协作,参与架构设计评审。任职要求:1、本科以上学历,理工科专业如机械或机电一体化2、精通Linux(CentOS/Ubuntu)及常见命令,熟悉Windows Server。3、网络基础:TCP/IP、HTTP/HTTPS、DNS、VPN、CDN等。4、中间件:Nginx/Apache、MySQL/Redis/Kafka、Docker/Kubernetes。5、云服务:熟悉AWS、阿里云、腾讯云等主流云平台。6、强大的问题排查能力,逻辑清晰,抗压性强。良好的沟通能力,能跨团队协作。