经验要求:8年以上生物信息学开发经验,5年以上云平台架构经验核心优势亮点1.高性能计算与云平台架构- 主导搭建国家基因库Hadoop/Spark大数据平台、天津天河超算集群等,支持PB级数据计算- 精通AWS/华为云等云平台生信环境部署,实现动态资源调度与成本优化2.算法工程化与极致优化- 具备极致的程序运行优化思想,并有相关的案例。3.独立云平台开发能力- 从0到1构建生信自动化分析平台。岗位职责4.云原生生信平台架构- 设计基于Kubernetes的分布式计算框架,支持AWS/Azure/GCP多云环境自动扩缩容- 优化Spark/Hadoop集群资源利用率,开发Serverless计算管道应对突发任务5.高性能算法开发- 主导基因组比对、变异检测等核心算法研发,要求TB级数据处理时效性达小时级- 实现Python/C++混合编程优化,关键模块响应延迟控制在毫秒级(需提供性能压测报告)6.工程化体系建设- 建立CI/CD自动化测试体系,要求万级QPS压力下系统可用性≥99.99%- 制定代码性能审查标准,将Big-O复杂度分析纳入开发规范7.技术攻坚与团队赋能- 解决EB级数据存储/计算瓶颈,主导GPU加速、近似算法等前沿技术预研- 培养3-5人技术团队,输出高性能计算***实践手册硬性要求8.技术栈深度- 语言:Python(Cython/Numba优化)- 大数据:Hadoop/Spark/Flink,HBase/Redis9.性能指标背书- 至少1个TB级数据优化案例(如计算耗时压缩50%+,单位成本下降40%+)- GitHub需展示性能攻坚代码(如开源工具加速模块)10.领域知识- 精通代谢组学,蛋白等多组学生信分析。