首页
技术日记
编程
旅游
数码
登录
标签
MVBench
论文阅读MVBench: A Comprehensive Multi-modal Video Understanding Benchmark
摘要(Abstract): 论文介绍了MVBench,这是一个全新的多模态视频理解基准测试,旨在评估多模态大型语言模型(MLLMs)在视频理解方面的能力。 目前许多基准测试主要集中在静态图像任务的空间理解上,而忽视了动态视频任务中的时间理
论文
Comprehensive
MVBench
Multi
Benchmark
admin
6月前
131
0