Linux大棚 – 不忘初心的技术博客,浮躁时代的安静角落
  •  首页
  •  技术日记
  •  编程
  •  旅游
  •  数码
  •  登录
  1. 标签
  2. RL
  • 论文理解【RL经典】 —— 【DQN】Human-level control through deep reinforcement learning

    标题:Human-level control through deep reinforcement learning文章链接:Human-level control through deep re
    经典 论文 DQN human RL
    admin 7月前
    123 0
  • ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

    写在最前面,为了彻底写清楚ChatGPT背后的所有关键细节,每个月不断深挖,从1月初写到6月底,后又修订半年多,除了本文之外&am
    算法 原理 技术 RL ChatGpt
    admin 2025-1-28
    90 0
  • rl

    RL
    admin 2023-11-19
    70 0
  • 【RL

    RL
    admin 2023-6-12
    67 0
CopyRight © 2022 All Rights Reserved 豫ICP备2021025688号-21
Processed: 0.017 , SQL: 9