岗位职责1. 开发图像检测、分割、目标识别等视觉算法;2. 实现YOLO/SegmentAnything/BEV视觉表达与稠密估计;3. 支持多模态融合(图像+点云+语言);4. 对接VLA模块进行任务语义识别与目标对齐;5. 支持模型训练、部署优化、轻量化剪枝;6. 撰写算法报告、参与模型评审。7. 跟踪CV大模型应用前沿。 任职要求教育背景: 计算机视觉、模式识别、人工智能或相关领域的本科及以上学历。核心算法技能: 精通图像检测、分割、目标识别等视觉算法,具备相关项目经验。具备实现BEV(鸟瞰图)等高级视觉表示和密集估计的经验。多模态融合: 具备支持和实现多模态融合(图像+点云+语言)的能力。模型优化: 具备模型训练、部署优化和轻量化剪枝经验,以实现高效推理。工具与框架: 熟练掌握PyTorch、MMDetection、OpenCV等深度学习框架和工具。优先经验: 优先考虑在矿区或无人车视觉系统方面的经验,特别是能应对弱光、浓雾、反光表面和眩光等挑战。熟悉CV大模型及其应用前沿。能与VLA模块对接,实现任务语义识别与目标对齐。