首页
技术日记
编程
旅游
数码
登录
标签
多行到
从零实现Transformer的简易版与强大版:从300多行到3000多行
前言 最近一直在做类ChatGPT项目的部署 微调,关注比较多的是两个:一个LLaMA,一个ChatGLM,会发现有不少模型是基于这两个模型去做微调
强大
简易版
Transformer
多行
多行到
admin
7月前
80
0