首页编程正文内容

Pytorch笔记：STE（Straight Through Estimator）解决forward pass中的non-differentiable操作，以torch.round()为例

编程

更新时间：2026-04-03 09:34:19 48

admin 管理员组

文章数量: 1184232

问题提出

在图像、模型压缩算法中往往涉及量化的操作。即将无限、连续的变量映射到有限、离散的空间中，方便存储和进一步计算。比如round操作：

import torch
a = torch.randint(1, 100, (3,)).float()
a.requires_grad = True
print(a)	# tensor([19., 36., 46.], requires_grad=True)

# 添加随机噪声
noise = torch.rand(a.shape, requires_grad=True)
b = a + noise
print(b)	# tensor([19.2860, 36.9746, 46.6897], grad_fn=<AddBackward0>)

# 对b进行四舍五入得到r_hat
r_hat = torch.round(b)
print(r_hat)	# tensor([19., 37., 47.], grad_fn=<RoundBackward0>)

最后一步round()操作在反向传播的过程中是病态的，因为round()函数的导数除了在x.500为inf外处处为0（x为任意整数）

解决

STE梯度近似

既然r_hat的梯度不可求，那么不妨在反向传播的过程中找一个连续可导的函数，用它的梯度替代round()函数的梯度，而在forward pass中仍然输出四舍五入后的结果。在实际应用中这个替代函数通常选择r=b，以下为了直观，以r=2*b为例。

"""In Pytorch"""
r_diffable = 2*b + (torch.round(b) - 2*b).detach()
r_diffable.retain_grad
print(r_diffable) # =torch.round(b) tensor([19., 37., 47.], grad_fn=<AddBackward0>)

"""In tensorflow"""
r_diffable = 2*b + tf.stop_gradient(tf.round(b) - 2*b)

测试一下梯度是否替换成功

loss = r_diffable.sum()
loss.backward()
# dL/db = dL/dr_hat * dr_hat/db
#  dL/dr_hat = 1., dr_hat/db = dr_diffable/db = 2.
# dL/db = 2
print(b.grad)	# tensor([2., 2., 2.])

本文标签：为例操作笔记 straight STE

版权声明：本文标题：Pytorch笔记：STE（Straight Through Estimator）解决forward pass中的non-differentiable操作，以torch.round()为例内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1766361203a3452606.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

手机APP爬虫配置指南（以Windows系统为例）

编程

2月前

一份详细的手机APP爬虫配置指南（以Windows系统为例），从环境搭建到实际抓包全流程覆盖，适合新手操作：一、环境准备 1. 安装夜神安卓模拟器下载地址：https:www.yeshen 安装步骤：全程默认选项，安装后首次启动

DBeaver安装及连接mysql数据库（windows版本25.2.2为例）

编程

2月前

1. 下载安装包windows安装版本： 官网地址：下载地址2. 下载安装包后一路默认安装，可在过程中勾选所需设置，打开DBeaver&

win10系统下，KMSpico安装过程中出现“无法完成操作，因为文件包含病毒或潜在的垃圾软件”

编程

2月前

win10系统下，KMSpico安装过程中出现“无法完成操作，因为文件包含病毒或潜在的垃圾软件”问题解决方法问题 KMSpico是比较常用的windows激活软件，但是在w

'CPU 任务大观'：全面解析 'Wait' 和 'Idle' 状态下的电脑表现

编程

1月前

CPU各个具体的指标含义解释如下： ①CPU(监测到的master主机上的CPU使用情况) 从图中看出，一共有五个关于CPU的指标。分别如下： ⓐ User User表示：CPU一共花了多少比例的时间运

轻松掌握Linux操作：快速定位你的网络IP地址

技术日记

1月前

linux怎么查看IP地址，怎么使用命令来查看IP地址？如下图教您怎么操作。演示环境：centos7 方法一：首先打开linux操作系统在进入到界面。桌面右键打开终端在终端里输入命令后按

Flash游戏无法播放？只需几步，搞定IE兼容性难题！

编程

1月前

当IE浏览器出现问题以后，最简单有效的方法就是在IE设置中对IE进行操作，重置以后IE即可恢复到安装后的初始状态，这样便可解决IE各种疑难杂症。但是这几天电脑的出了问题，表现为IE无法打开网页，所有的菜单全部都变

360全家桶说拜拜！快速、干净卸载的秘诀在这里

技术日记

1月前

1）重启，断开网络（建议先断网） 2）通过控制面板先卸载能卸载的程序操作：打开“控制面板” → “程序和功能”。按“安装时间”排序（这样能看到最近安装的捆绑软件），找到与 360 有关

轻松驾驭WINHEX - 快速掌握查看与编辑BIN文件的技巧

编程

1月前

简介：本文介绍如何使用WINHEX这款高级十六进制编辑器来处理BIN格式的二进制文件。BIN文件通常用于存储设备固件或程序，如手机字库。WINHEX能够以十六进制和ASCII码显示文件内容，提供搜索、编辑、数据解析和校验等多种功能，特

超实用指南：2025年如何针对Server2025优化PC系统，加速启动不是梦！

技术日记

1月前

面对高配电脑却遭遇 “电脑启动太慢怎么解决”的性能玄学，很多技术爱好者的第一反应是修改注册表或禁用系统服务。虽然这种硬核操作能挤出一点性能，但往往伴随着系统不稳定的风险。其实，在2025年，实现高效

如何在MySQL中巧妙利用Recycle_bin？一文教你数据拯救大法！

技术日记

1月前

MySQL防误删插件Recycle_bin概览 1. Recycle_bin简介 recycle_bin是一款MySQL插件，可以在不修改任何MySQL代码的情况下，自动备份MySQL中被Drop的数据库表，在出现人

从入门到精通：学习MySQL Recycle_bin的使用技巧

编程

1月前

MySQL防误删插件Recycle_bin概览 1. Recycle_bin简介 recycle_bin是一款MySQL插件，可以在不修改任何MySQL代码的情况下，自动备份MySQL中被Drop的数据库表，在出现人

困扰你的VNC无图标问题：轻松解决右上角消失的快捷操作

编程

1月前

VNC 桌面没有图标解决办法 %安装 sudo apt-get install gnome-core xfce4 %打开xstartup文件（前提已安装VNC）命令：vim ~.vncxstart

无需复杂操作，BackupPC让备份变得简单有效！

编程

1月前

BackupPC 开源备份系统推荐项目基础介绍和主要编程语言 BackupPC 是一个高性能的企业级备份系统，专门用于将客户端数据备份到服务器磁盘。该项目主要使用 Perl 语言编写，Perl 是一种强大的脚本语言，

Windows 10右键菜单优化指南：剔除你不需要的功能

技术日记

1月前

第一步备份注册表方法是操作注册表完成，未操作过注册表者请慎重，操作前需导出备份第二步修改右键新建注册表快捷键 Win+R 打开输入 regedit 打开注册表输入如下

新手编程指南：利用JavaScript轻松管理与删除HTML5内容相关的浏览器缓存

技术日记

1月前

meta方法不缓存<META HTTP-EQUIV="pragma" CONTENT="no-cache"> <META HTTP-EQUIV="Cache-C

独家秘籍：通过编程手段穿透Adobe Flash Player中还原卡和软件的安全壁垒

技术日记

1月前

创建时间：2003-12-07 文章属性：原创文章提交：wind_men (tyhhyf_at_hotmail.com) 一种可以穿透还原卡和还原软件的代码 CVCGB 风般的男人还原卡和还原软件被广泛运用于各种公共场合的电

YimMenu指南：让GTA5辅助工具成为你的游戏助手

技术日记

29天前

YimMenu全功能指南：从入门到精通的GTA5辅助工具使用手册你是否曾在GTA5在线模式中遇到功能受限的困扰？作为一款备受欢迎的GTA5辅助工具，YimMenu不仅能帮助你突破游戏限制，更能全面优化游戏体验。本安全使用教程

Windows 初学者指南：快速返回文件夹上级的简单操作

技术日记

29天前

Windows文件夹操作快捷键快捷键操作Enter回车进入文件夹↑向上移动光标

不再受Adobe困扰，Mac上彻底卸载Flash Player的完整步骤

技术日记

17天前

Adobe mac系列软件可以说是装机必备,最近有使用adobe mac的用户发现Adobe怎么也卸载不干净,无法彻底清除。小编就以PS为例,告诉大家Adobe软件如何卸载! Adobe mac卸载教程其实每款Ado

低格硬盘详解

编程

16天前

不同的工具所做的低格对硬盘的作用各不一样。有些人觉得低格可以修复一部分硬盘，有些人则觉得低格十分危险，会严重损害硬盘。认为低格是修复硬盘的一个有效手段。下面总结一些关于低格的看法，与广大网友交流。大家关心的一个问题：“低格过程到

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

Pytorch笔记：STE（Straight Through Estimator）解决forward pass中的non-differentiable操作，以torch.round()为例

问题提出

解决

STE梯度近似

更多相关文章

手机APP爬虫配置指南（以Windows系统为例）

DBeaver安装及连接mysql数据库（windows版本25.2.2为例）

win10系统下，KMSpico安装过程中出现“无法完成操作，因为文件包含病毒或潜在的垃圾软件”

'CPU 任务大观'：全面解析 'Wait' 和 'Idle' 状态下的电脑表现

轻松掌握Linux操作：快速定位你的网络IP地址

Flash游戏无法播放？只需几步，搞定IE兼容性难题！

360全家桶说拜拜！快速、干净卸载的秘诀在这里

轻松驾驭WINHEX - 快速掌握查看与编辑BIN文件的技巧

超实用指南：2025年如何针对Server2025优化PC系统，加速启动不是梦！

如何在MySQL中巧妙利用Recycle_bin？一文教你数据拯救大法！

从入门到精通：学习MySQL Recycle_bin的使用技巧

困扰你的VNC无图标问题：轻松解决右上角消失的快捷操作

无需复杂操作，BackupPC让备份变得简单有效！

Windows 10右键菜单优化指南：剔除你不需要的功能

新手编程指南：利用JavaScript轻松管理与删除HTML5内容相关的浏览器缓存

独家秘籍：通过编程手段穿透Adobe Flash Player中还原卡和软件的安全壁垒

YimMenu指南：让GTA5辅助工具成为你的游戏助手

Windows 初学者指南：快速返回文件夹上级的简单操作

不再受Adobe困扰，Mac上彻底卸载Flash Player的完整步骤

低格硬盘详解

发表评论

推荐文章

Linux用户必学：简易脚本教你怎么建立自己的'回收站'

卡顿的电脑，高配CPU和内存也救不了？从软件到系统，全方位优化方案！

CPU占用100%的原因及解决办法_资源管理器占用cpu100%

C盘空间不足怎么办，如何让C盘获得更多空间

抖音发视频上热门技巧，抖音发什么视频会火_抖音发视频允许保存本地增加播放量吗

热门文章

华为交换机深度清理：彻底移除回收站中的Flash Player SWF文件

Adobe Flash Player内部的危险信号：可疑文件与进程追踪

一不小心就中招？防患于未然，电脑中毒的识别与预防全攻略

硬盘低格：对硬盘有影响吗？看这里分析！

怎么处理优盘上的System Volume Information？解决指南来啦！

笔记本电脑Linux声音系统的安装

QQ中之前自己上传到收藏的表情包_qq收藏表情包配置文件

惠普Win10系统还原详细步骤指南_惠普win10恢复预装系统

【系统IE浏览器打不开网页该怎么解决】_网页切换成ie内核就打不开了

A820联想手机崩溃了？这里有最全的刷机教程助你一臂之力

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑