Linux大棚 – 不忘初心的技术博客,浮躁时代的安静角落
  •  首页
  •  技术日记
  •  编程
  •  旅游
  •  数码
  •  登录
  1. 标签
  2. 多行
  • 从零实现Transformer的简易版与强大版:从300多行到3000多行

    前言  最近一直在做类ChatGPT项目的部署 微调,关注比较多的是两个:一个LLaMA,一个ChatGLM,会发现有不少模型是基于这两个模型去做微调
    强大 简易版 Transformer 多行 多行到
    admin 7月前
    80 0
CopyRight © 2022 All Rights Reserved 豫ICP备2021025688号-21
Processed: 0.017 , SQL: 10