首页
技术日记
编程
旅游
数码
登录
标签
KTO
KTO: Model Alignment as Prospect Theoretic Optimization
一、引言 本报告介绍了一种基于前景理论(Prospect Theory)的大型语言模型对齐方法 ——KTO(Kahneman-Tversky Optimization)。该方法通过设计人类感知损失函数(HALO),直接最大化模型生成的效用
ALIGNMENT
Model
KTO
Optimization
Theoretic
admin
4月前
56
0