首页
技术日记
编程
旅游
数码
登录
标签
CoVLA
读论文CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving
研究背景:在自动驾驶领域,多模态大语言模型的应用多限于理解复杂环境或生成高级指令,而少有涉及端到端路径规划,主要因缺乏包含视觉、语言和行动的大规模注释数据集。为解决此问题,本文提出了CoVLA数据集,含80小时真实驾驶视频,通过自动数据处理
论文
Comprehensive
Vision
Language
CoVLA
admin
3月前
41
0