admin 管理员组

文章数量: 1184232

论文标题

GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI
GMAI-MMBench:面向通用医疗人工智能的综合多模态评估基准

论文链接

GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI论文下载

论文作者

Pengcheng Chen, Jin Ye, Guoan Wang, Yanjun Li, Zhongying Deng, Wei Li, Tianbin Li, Haodong Duan, Ziyan Huang, Yanzhou Su, Benyou Wang, Shaoting Zhang, Bin Fu, Jianfei Cai, Bohan Zhuang, Eric J. Seibel, Junjun He, Yu Qiao

内容简介

本文提出了GMAI-MMBench,这是一个全面的多模态评估基准,旨在评估大型视觉语言模型(LVLMs)在医疗领域的有效性。GMAI-MMBench由284个来自全球的临床相关数据集构成,涵盖38种模态,设计了18个临床视觉问答(VQA)任务和18个临床部门,采用词汇树结构进行良好分类。该基准的三个关键特征包括:全面的医学知识、良好分类的数据结构和多感知粒度的交互能力。通过对50个LVLMs的评估,结果显示即使是最先进的模型(如GPT-4o)也仅达到53.96%的准确率,表明当前LVLMs在满足临床需求方面仍有很大改进空间。GMAI-MMBench的设计旨在推动医疗AI的研究与应用,促进下一代LVLMs的开发。

本文标签: 生物制药 论文 MMBench GMAI AI