首页
技术日记
编程
旅游
数码
登录
标签
SFT
全是细节|大模型SFT的100个关键点
作者:ybq 知乎链接:https:zhuanlan.zhihup809229182这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain &#x
模型
细节
关键
SFT
admin
3月前
41
0
【细节全解析】大模型SFT的100个关键点:深入剖析与应用指南
这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain ,sft 实在没有太多的技术细节和琐碎工作需要科普。因此,我会默认读者们都知道 sft 是做什么的以及如何去
模型
细节
关键
指南
SFT
admin
7月前
108
0
【全是细节】大模型SFT的100个关键点:深入解析与实践指南
这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain ,sft 实在没有太多的技术细节和琐碎工作需要科普。因此,我会默认读者们都知道 sft 是做什么的以及如何去
模型
细节
关键
指南
SFT
admin
7月前
120
0
【LLM】大模型SFT技术总结(数据|训练|评估)
note 文章目录 note 一、背景篇 1. Special Token 2. 耗时问题 3. 与 pretrain 的区别 4. 幻觉问题 二、数据篇 1. 数据多样性 2. 数据生产 (1)生产 prompt (2)生产 answer
模型
数据
技术
LLM
SFT
admin
7月前
116
0