工作职责:1、部署和维护公有云或者私有云大数据平台,AI平台以及其他中间件等2、设计和实现平台监控系统,对服务器、中间件、数据库、GPU资源等进行实时监控3、对大数据和AI平台的性能进行调优,解决数据倾斜、计算延迟、GPU资源利用率低等问题4、跟踪大数据和AI领域的***趋势,评估并引入适合公司业务的技术栈5、其他大数据和ai相关事项任职资格:1、精通Linux操作系统和容器技术2、熟悉大数据平台技术栈及数据库技术3、熟悉GPU服务器的使用和管理,了解AI模型训练和推理的硬件需求4、具备平台监控和预警系统的搭建经验(如Prometheus、Grafana、Zabbix等5、熟悉至少一种编程语言(如Python、Java、Go),能够编写高效的运维脚本和工具6、有云平台(如AWS、Azure、阿里云)大数据和AI服务使用经验优先7、全日制本科及以上学历,计算机相关专