岗位职责:1、熟悉模仿学习方法训练决策智能体;2、解决基本强化学习在作战决策领域的样本稀缺、奖励设计以及决策层次抽象等问题;3、解决生成对抗模仿学习固有的生成样本利用效率低和模型坍塌风险给这种方法在实际中部署带来挑战:4、满足在复杂战役推演场景中能够应对一些未见情形的泛化能力。任职条件:1. 有成熟相关项目经验2. 本科及以上3. 工作地点可选择北京/成都/广州4. 善于与人沟通交流,工作勤奋,有自驱力,学习能力。5.可带团队优先