首页编程正文内容

论文阅读：ACM SIGIR 2025 Principles and Guidelines for the Use of LLM Judges

编程

更新时间：2026-04-03 10:11:16 45

admin 管理员组

文章数量: 1184232

总目录大模型相关研究：https://blog.csdn/WhiffeYF/article/details/142132328

https://dl.acm/doi/abs/10.1145/3731120.3744588

https://www.doubao/chat/21607625127801090

速览

这篇文档主要围绕“大语言模型（LLMs）能不能当‘裁判’给信息检索系统打分”展开，既讲了好处，更重点分析了风险、给出了避坑指南，核心是想让大家规范地用LLMs做评估，别踩坑。

一、背景：为啥现在想用LLMs当“裁判”？

以前评估信息检索（IR）系统（比如搜索引擎、问答系统）好不好，全靠人当“裁判”：给一个需求（比如“北京秋天去哪玩”）和一堆文档，人来判断每个文档和需求沾不沾边。但这有个大问题——太慢、太贵，面对海量

本文标签：论文 SIGIR ACM Judges LLM

版权声明：本文标题：论文阅读：ACM SIGIR 2025 Principles and Guidelines for the Use of LLM Judges 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1766532540a3467400.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

【论文阅读】Attributed Graph Clustering: A Deep Attentional Embedding Approach

编程

4月前

【原文】Chun Wang, Shirui Pan, Ruiqi Hu, Guodong Long, Jing Jiang, Chengqi Zhang. Attributed Graph Clustering: A Deep Attent

【论文阅读】CentralNet: a Multilayer Approach for Multimodal Fusion

编程

4月前

CentralNet相比于Concatenate的创新点 Concate的方法相当于在各自模态的特征分别独立抽取之后做融合，但是不干预特征抽取的过程。这显然会漏掉一些不同模态之间的相关性的信息，

【论文阅读】The Normal Distributions Transform: A New Approach to Laser Scan Matching

编程

4月前

这篇论文一共是十一个部分，第一部分和第二部分对应简介和前人的工作，第三四五主要是介绍了算法的实现细节，分别是正态分布的建立过程、点云的匹配和位姿的优化，之后第六和第七两部分介绍了算法的实际应用，在轨迹跟踪和SLAM中的具体应用，最后八至十一

论文笔记：A Robust Learning Approach to Domain Adaptive Object Detection

编程

4月前

论文地址：https:ieeexplore.ieeedocument9008383 源码地址：https:githubGabriel-Maciasrobust_frcnn 1 以前的方法在目标域中有

【论文笔记】A Unified Approach for Tracking UAVs in Infrared

编程

4月前

摘要本文设计了一个统一的框架来追踪无人机，包括局部追踪器、相机运动估计模块、边界框回归模块、重检测模块和更新模块。相机运动估计模块对局部追踪器运动做补偿，然后边界框回归模块来找到一个精准的边框。如果目标丢失了，我们用重检测模块来重新

论文阅读： Mobile Edge Intelligence for Large LanguageModels: A Contemporary Survey

编程

4月前

地址：Mobile Edge Intelligence for Large Language Models: A Contemporary Survey 摘要设备端大型语言模型（LLMs）指在边缘设备上运行 LLMs，与云端模式相比，

【论文解读】GPT Understands, Too

编程

4月前

一.论文 1.1 P-tuning 区别于之前的工作，这篇工作认为promote可以在句子中的任意位置起到作用，可以将它们插入上下文或目标中上图中，左图是不使用任何操作

LLM--提示词Propmt的概念、作用及如何设计提示词

编程

4月前

文章目录1. 什么是提示词？2. 提示词的作用3. 如何设计提示词？3.1. 提供详细的信息3.2. 指定角色3.3. 使用分隔符和特殊符号3.4. 提供示例3.5. 少量示例的思维链&#

【论文解读】The Power of Scale for Parameter-Efficient Prompt Tuning

编程

4月前

一.介绍 1.1 promote tuning 和 prefix tuning 的关系 “前缀调优”的简化版 1.2 大致实现冻结了整个预训练模型，并且只允许每个下游任务附加k个可调令牌到输入文本。这种“软提

【LLM第五篇】名词解释：prompt

编程

4月前

1.是什么提示工程（Prompt Engineering）是一门较新的学科，关注提示词开发和优化，帮助用户将大语言模型（Large Language Model, LLM）用于各场景和研究领域。掌握了提示工程相关技能将有助于用户更好地

英文论文专业词翻译技巧

编程

4月前

1. 进入中国知网，找到“翻译助手”2. 比如要查找“结构方程模型”的英文表达。软件可以自动推荐相关的表达以及英文论文。比如打开第一篇文献：就有关于该文献的介绍

在线免费PDF英文论文全文翻译

编程

4月前

https:cloud.tencentdevelopernews110496

《最强码农的水论文攻略》之水论文大法第三期--以IEEE access为例

编程

4月前

相信大家看了我的前几期教程以后，实验指定都是做的差不多了，看来大家也已经到了要水论文的阶段了吧，嘿嘿嘿~~~本期，俺就教大家如何无痛入门，水一篇论文~~~~我先随便写一篇毫无意义的论文在下面，尽量保证每个章节，每个地方都有数据，然后再教

ChatGPT 助力论文字数合理扩充：4步法则轻松达标

编程

3月前

添加图片注释，不超过 140 字（可选）朋友们，今天阿九要和大家分享如何利用ChatGPT来合理扩充论文字数。相信很多同学都有过为凑字数而苦恼的经历&a

LLM多轮对话设计模式：构建连贯上下文的对话系统

编程

3月前

LLM多轮对话设计模式：构建连贯上下文的对话系统【免费下载链接】llm Access large language models from the command-line 项目地址: https:gitco

科研论文引用增多：HunyuanVideo-Foley成为学术研究热点

编程

3月前

HunyuanVideo-Foley：当AI学会“听”画面，音效生成迎来智能革命 🎬🔊你有没有想过，一段没有声音的视频&am

【系统架构设计师】论文：论数据中心集中存储架构

编程

3月前

更多内容请见： 备考系统架构设计师-核心总结索引论文：论数据中心集中存储架构文章目录摘要正文总结摘要我2020年8月参与了某地级市市级机关电子政务系统的建设工作，该电

论文润色终极指南：30条DeepSeek顶级指令助你攻克学术表达难题

编程

3月前

写论文时，语言细节往往决定成败。职称评审或顶刊投稿中，逻辑混乱、术语不规范等问题常会让论文大打折扣。今天分享30条DeepSeek实操指令，覆盖语法修正、逻辑优化、学术表达升

【论文简介】Circle Loss: A Unified Perspective of Pair Similarity Optimization

编程

3月前

Circle Loss: A Unified Perspective of Pair Similarity Optimization 旷世cvpr2020的一篇文章，站在更高的视角，统一了deep feature learning的两大基

大模型LLM的Temperature

编程

3月前

Temperature 就像是控制大模型“想象力”和“保守度”的一个旋钮。可以把它想成炒菜的火候：温度低（Low Temperature，比如 0.0 - 0.3&

发表评论

全部评论 0

暂无评论

推荐文章

不再困惑：轻松搞定网络设备密码恢复

如何卸载360_360极速浏览器怎么卸载

电脑只有一个guest登录选项或者不小心点击了guest账户登录，并且登录以后电脑一直闪屏或者黑屏的解决办法_不小心点了guest账户了

EasyRecovery Pro：打造无忧的Flash体验，修复Flash Player问题

电脑Wi-Fi连接了，手机却消失？编程语言助你解开这个谜团！

热门文章

最新文章