admin 管理员组文章数量: 1184232
论文标题
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI
GMAI-MMBench:面向通用医疗人工智能的综合多模态评估基准
论文链接
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI论文下载
论文作者
Pengcheng Chen, Jin Ye, Guoan Wang, Yanjun Li, Zhongying Deng, Wei Li, Tianbin Li, Haodong Duan, Ziyan Huang, Yanzhou Su, Benyou Wang, Shaoting Zhang, Bin Fu, Jianfei Cai, Bohan Zhuang, Eric J. Seibel, Junjun He, Yu Qiao
内容简介
本文提出了GMAI-MMBench,这是一个全面的多模态评估基准,旨在评估大型视觉语言模型(LVLMs)在医疗领域的有效性。GMAI-MMBench由284个来自全球的临床相关数据集构成,涵盖38种模态,设计了18个临床视觉问答(VQA)任务和18个临床部门,采用词汇树结构进行良好分类。该基准的三个关键特征包括:全面的医学知识、良好分类的数据结构和多感知粒度的交互能力。通过对50个LVLMs的评估,结果显示即使是最先进的模型(如GPT-4o)也仅达到53.96%的准确率,表明当前LVLMs在满足临床需求方面仍有很大改进空间。GMAI-MMBench的设计旨在推动医疗AI的研究与应用,促进下一代LVLMs的开发。
版权声明:本文标题:AI生物制药论文解析|GMAI-MMBench A Comprehensive Multimodal Evaluation Benchmark Towards General 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1758736521a3089864.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论