一、主要职责:日常运维与监控:负责VMware/KVM云环境的日常运维工作,包括性能监控、日志分析、备份与恢复策略的制定与执行。定期检查系统健康状况,及时发现并解决潜在问题,确保云环境的高可用性。管理VMware/KVM高可用性和容错配置,如HA、DRS等。故障排查与解决:快速响应并解决VMware/KVM云环境中的各类故障,包括硬件故障、软件错误、网络问题等。深入分析系统日志,运用VMware/KVM支持工具进行复杂问题的诊断。编写故障处理报告,总结经验教训,提升团队整体运维能力。安全与合规:确保VMware/KVM云环境符合公司安全策略及行业标准,如ISO 27001、HIPAA等。实施并维护安全控制措施,包括防火墙规则、访问控制列表、数据加密等。定期评估云环境的安全风险,提出并实施改进建议。性能优化与扩容:分析云环境性能瓶颈,提出并实施优化方案,提升系统性能。根据业务需求,规划并执行云资源扩容计划,确保业务平滑增长。文档编写与知识分享:编写并维护VMware/KVM云环境的运维文档、操作手册和应急预案。定期组织技术分享会,提升团队技术水平。二、任职要求:计算机科学、信息技术或相关专业本科及以上学历。至少3年以上VMware/KVM虚拟化技术运维经验,熟悉vSphere、vSAN、NSX等VMware/KVM主要产品。精通VMware/KVM虚拟化环境的部署、配置、管理和优化。具备良好的系统故障诊断和解决能力,能够独立处理复杂问题。熟悉Linux/Windows操作系统,了解网络基础知识。良好的沟通能力和团队合作精神,能够在快节奏的环境中工作。持有VMware相关认证(如VCP、VCAP、VCDX等)者优先。有python/go开发,日志系统运维经验者优先。