Linux大棚 – 不忘初心的技术博客,浮躁时代的安静角落
  •  首页
  •  技术日记
  •  编程
  •  旅游
  •  数码
  •  登录
  1. 标签
  2. deepspeed
  • Windows安装DeepSpeed

    文章目录问题描述解决方案AssertionError: Unable to pre-compile async_io参考文献问题描述 DeepSpeed 是一款微软推出的深度学习优化库,它使分布式训练和推理变得简单高
    Windows deepspeed
    admin 3月前
    15 0
  • 大模型主流微调框架概述:LLaMA Factory和DeepSpeed

    大模型主流微调框架概述一、主流微调框架选择原因主流微调框架社区活跃,遇到问题便于查找解决方案。建议在了解基础框架原理的基础上,尝试大模型原生微调方式,加深理解。框架名称概
    框架 模型 主流 deepspeed LLaMA
    admin 4月前
    65 0
  • InstructGPT高效实践——【DeepSpeed-Chat】源码详解(33):RLHF Finetuning

    目录 前言 3 phase-3: RLHF Finetuning 3.1 训练数据样例 3.1 基本数据 3.2 经验数据 3.2 训练过程 3.3 关键代码详解 3.3.1 读取数据集及Datacollator 3.3.1.1 promp
    高效 详解 源码 deepspeed InstructGPT
    admin 7月前
    49 0
  • 从零实现带RLHF的类ChatGPT:逐行解析微软DeepSpeed Chat的源码

    写在最前面 本文最早写于2023年4月的这篇文章中《从零实现带RLHF的类ChatGPT:从TRLChatLLaMAColossalChat到DeepSpeed Chat》,后因要在「大模型
    微软 源码 ChatGpt RLHF deepspeed
    admin 2025-1-30
    92 0
  • win11环境下安装Ubuntu22双系统并在Ubuntu安装anaconda+pytorch2.4+cuda12.4+deepspeed

    近期对大模型的微调突然很感兴趣,便去下载了个通义千问的7B模型来玩,但由于window对一些环境的不支持(比如deepspeed,适配linux但是不适
    并在 双系统 环境 deepspeed Ubuntu
    admin 2025-1-29
    61 0
CopyRight © 2022 All Rights Reserved 豫ICP备2021025688号-21
Processed: 0.015 , SQL: 9