首页
技术日记
编程
旅游
数码
登录
标签
InstructGPT
InstructGPT高效实践——【DeepSpeed-Chat】源码详解(33):RLHF Finetuning
目录 前言 3 phase-3: RLHF Finetuning 3.1 训练数据样例 3.1 基本数据 3.2 经验数据 3.2 训练过程 3.3 关键代码详解 3.3.1 读取数据集及Datacollator 3.3.1.1 promp
高效
详解
源码
deepspeed
InstructGPT
admin
7月前
49
0
InstructGPT高效实践——【DeepSpeed-Chat】源码详解(23):Supervised Finetuning、Reward Model Finetuning
目录 前言 1 phase-1: Supervised Finetuning 1.1 训练数据样例 1.2 训练过程 1.3 关键代码详解 1.3.1 基座模型结构 1.3.2 LoRA结构及其正向传播 1.3.3 phase1的指标评估
高效
详解
源码
Chat
InstructGPT
admin
7月前
97
0
InstructGPT 与 ChatGPT的学习与解读
最近ChatGPT大火,简单整理了一些文章和帖子。 ps.此时ChatGPT还没公布相应的论文,所有以下内容为官网发布内容,以及一些合理的推测。 InstructGPT
InstructGPT
ChatGpt
admin
2024-9-18
61
0
【ChatGPT技术应用分享】ChatGPTInstructGPT详解
[db:摘要]
详解
技术
ChatGpt
InstructGPT
admin
2024-9-14
60
0
【跟李牧学AI】 ChatGPT是什么?--先看看InstructGPT
[db:摘要]
AI
李牧学
InstructGPT
ChatGpt
admin
2024-8-25
63
0