Linux大棚 – 不忘初心的技术博客,浮躁时代的安静角落
  •  首页
  •  技术日记
  •  编程
  •  旅游
  •  数码
  •  登录
  1. 标签
  2. CoVLA
  • 读论文CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving

    研究背景:在自动驾驶领域,多模态大语言模型的应用多限于理解复杂环境或生成高级指令,而少有涉及端到端路径规划,主要因缺乏包含视觉、语言和行动的大规模注释数据集。为解决此问题,本文提出了CoVLA数据集,含80小时真实驾驶视频,通过自动数据处理
    论文 Comprehensive Vision Language CoVLA
    admin 3月前
    41 0
CopyRight © 2022 All Rights Reserved 豫ICP备2021025688号-21
Processed: 0.014 , SQL: 9