首页编程正文内容

读论文CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving

编程

更新时间：2026-04-03 10:58:37 40

admin 管理员组

文章数量: 1184232

研究背景：在自动驾驶领域，多模态大语言模型的应用多限于理解复杂环境或生成高级指令，而少有涉及端到端路径规划，主要因缺乏包含视觉、语言和行动的大规模注释数据集。为解决此问题，本文提出了CoVLA数据集，含80小时真实驾驶视频，通过自动数据处理技术，匹配精确轨迹与自然语言描述，超越了现有数据集。研究利用CoVLA数据集，探索了多模态大语言模型在自动驾驶中的视觉、语言和动作处理能力，证实了模型在生成连贯输出方面的强大性能，展现了视觉-语言-动作模型在自动驾驶领域的应用潜力。

主要贡献：

介绍了CoVLA数据集，这是一个大规模数据集，提供了多种驾驶场景的轨迹目标，以及详细的逐帧情境描述。

提出了一种可扩展的方法，通过传感器融合准确估计轨迹，并自动生成关键驾驶信息的逐帧文本描述。

开发了CoVLA-Agent，这是一种基于CoVLA数据集的新型VLA模型，用于可解释的端到端自动驾驶。本文的模型展示了持续生成驾驶场景描述和预测轨迹的能力，为更可靠的自动驾驶铺平了道路。

数据集生成 pipeline 概述。

1.自动标注视频帧和传感器信号以生成轨迹和其他标签。

2.对视频帧应用自动描述生成，以生成行为和推理的描述。

视频帧（Video frames）：行驶中的车辆前方摄像头捕捉到的视频帧，画面中标注了检测到的目标（如交通灯和前方的车辆）。这些视频帧是后续处理的基础数据。

传感器信号（Sensor signals）：来自车辆各种传感器（如IMU、GNSS、雷达等）的数据，这些传感器可以提供速度、油门/刹车、转向等信息。为了提高数据的准确性，使用了卡尔

本文标签：论文 Comprehensive Vision Language CoVLA

版权声明：本文标题：读论文CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1766497450a3463961.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

【知识】让AI帮你读懂论文的Prompt

编程

4月前

转载请注明出处：小锋学长生活大爆炸[xfxuezhagn] 如果本文帮助到了你，欢迎[点赞、收藏、关注]哦~ 可以直接用我创建的GPT： https:chatgptg

【论文解读】The Power of Scale for Parameter-Efficient Prompt Tuning

编程

4月前

一.介绍 1.1 promote tuning 和 prefix tuning 的关系 “前缀调优”的简化版 1.2 大致实现冻结了整个预训练模型，并且只允许每个下游任务附加k个可调令牌到输入文本。这种“软提

英文论文翻译成中文，怎样翻译更地道？

编程

4月前

我是娜姐迪娜学姐 ，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。最近学员群有同学问，英文论文翻译成中文的解决方案—“DeepL翻译出来的内容总是有点别扭&am

英文论文PDF全文翻译途径整理

编程

4月前

英文论文PDF全文翻译途径英文论文PDF全文翻译1 有道翻译2 翻译狗3 DocTranslator结语英文论文PDF全文翻译近期的毕业设计需要阅读英文论文，一般格式都是PDF的，感觉看起来有

论文翻译器：pdf 英文论文一键转换成中英文对照的文档

编程

4月前

受不了现有翻译工具的各种限制，于是自己写了个 pdf 翻译工具，接口来自百度翻译，翻译效果如图所示开源地址：https:githubflari

在线免费PDF英文论文全文翻译

编程

4月前

https:cloud.tencentdevelopernews110496

Comprehensive Rust - 全面的 Rust 课程

编程

3月前

文章目录一、关于 Comprehensive Rust 项目1、项目概览2、相关链接资源3、功能特性二、安装配置三、使用说明1、启动本地服务器2、构建静态版本四、媒体报道五、开发工具其它参考项目贡献指南一、关于 Comprehensive

【系统架构设计师】论文：论数据中心集中存储架构

编程

3月前

更多内容请见： 备考系统架构设计师-核心总结索引论文：论数据中心集中存储架构文章目录摘要正文总结摘要我2020年8月参与了某地级市市级机关电子政务系统的建设工作，该电

图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)

编程

3月前

这是我翻译这位大佬的第二篇文章了，翻译授权见最后。其他工作： 图解transformer | The Illustrated Transformer图解BERT、ELMo&#xff0

论文润色终极指南：30条DeepSeek顶级指令助你攻克学术表达难题

编程

3月前

写论文时，语言细节往往决定成败。职称评审或顶刊投稿中，逻辑混乱、术语不规范等问题常会让论文大打折扣。今天分享30条DeepSeek实操指令，覆盖语法修正、逻辑优化、学术表达升

【三维感知目标检测论文阅读】《3D Object Detection for Autonomous Driving: A Comprehensive Survey》

编程

3月前

最近在做自动驾驶三维感知方面的研究，阅读了大量文献，于是就想把自己的阅读笔记修改一下发上来和大家分享。今天，我分享的论文是 Jiageng Mao 等人发表的这篇非常全面的综述——《3D Object Detection for Auton

Re7:Difusion Models: A Comprehensive Survey of Methods and Applications

编程

3月前

扩散模型综述 1 概要扩散模型已经在图像生成、视频生成、自然语言处理、医学等领域有了广泛应用主要工作: 解释扩散模型，简要介绍三种主要框架 ddpm，离散SGMs，连续

分层强化学习综述：Hierarchical reinforcement learning: A comprehensive survey

编程

3月前

论文名称：Hierarchical reinforcement learning: A comprehensive survey 论文发表期刊：ACM Computing Surveys 期刊影响因子：10.282（2022年）论文作者：

Comprehensive Rust项目揭秘：打造安全高效系统级应用

编程

3月前

Comprehensive Rust项目揭秘：打造安全高效系统级应用【免费下载链接】comprehensive-rust 这是谷歌Android团队采用的Rust语言课程，它为你提供了快速学习R

Comprehensive Rust futures组合：join与select操作

编程

3月前

Comprehensive Rust futures组合：join与select操作【免费下载链接】comprehensive-rust 这是谷歌Android团队采用的Rust语言课程，它为你

Comprehensive Rust性能分析：基准测试与优化技巧

编程

3月前

Comprehensive Rust性能分析：基准测试与优化技巧【免费下载链接】comprehensive-rust 这是谷歌Android团队采用的Rust语言课程，它为你提供了快速学习Rus

论文阅读：ACM SIGIR 2025 Principles and Guidelines for the Use of LLM Judges

编程

3月前

总目录大模型相关研究：https:blog.csdnWhiffeYFarticledetails142132328 https:dl.acmdoiabs10.11453731120.3744588 https:

基于Android的安全知识学习APP的设计与实现(论文+源码)_kaic

编程

3月前

基于Android的安全知识学习APP的设计与实现摘要随着科技的进步，智能手机已经成为人们工作、学习和生活的必需品。基于Android系统的强大功能，使用Java语言、Linux操作系统

告别GPT初体验：深入剖析GPT2与GPT3的技术升级点

编程

1月前

内容整理自：大家有时间还是去看李沐大佬讲，才一个半小时，收获很多~~~总结 GPT、GPT2、GPT3的共同点是其结构都基于Transformer的Decoder层。区别在于：

走进GPT时代：GPT、GPT2与GPT-3的发展路径与核心特征解析

技术日记

1月前

内容整理自：大家有时间还是去看李沐大佬讲，才一个半小时，收获很多~~~总结 GPT、GPT2、GPT3的共同点是其结构都基于Transformer的Decoder层。区别在于：

发表评论

全部评论 0

暂无评论

推荐文章

DirectX修复工具使用技巧之一——解除被占用的文件，完整修复C++_dx修复工具

TIA Portal V20HMI仿真时数值无法写入虚拟plc解决教程_hmi数值无法写入plc怎么解决

关于显存位宽、显存带宽和显存容量的理解

电脑自动重启是什么原因？重启原因排查和解决办法！_电脑闪退重启是什么原因

移动硬盘无法访问的恢复方法_磁盘修复后无法访问

热门文章

最新文章