首页编程正文内容

解决cuda out of memory

编程

更新时间：2026-04-03 11:06:55 30

admin 管理员组

文章数量: 1184232

问题：

pytorch默认使用第一块显卡 cuda o ,在运行bert代码时，因为长文本，我把padsize调到512。导致显存不足，会占用大量的显存。程序会反复报Runtime Error，cuda out of memory的错。

分析：

服务器有三块显卡0,1，2。为啥空间不足，原来pytorch在初始化的时候会默认在第0块显卡上进行，这就导致，在第0块显卡空闲内存不多时，反复报错

解决：

通过几行代码解决问题

开头添加：

import os
os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2"

主函数模型训练部分使用并行：

    # train
    model = x.Model(config).to(config.device)
    if torch.cuda.device_count() > 1:
        model = torch.nn.DataParallel(model,device_ids = [0, 1, 2])
    train(config, model, train_iter, dev_iter, test_iter)

使用nn.DataParallel函数来用多个GPU来加速训练。

代码成功运行。。。。。。

再来看一下显存效果：

watch -n 0.2 nvidia-smi

看起来都在跑

本文标签： CUDA memory

版权声明：本文标题：解决cuda out of memory 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1766204200a3444332.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

MySQL (1038, ‘Out of sort memory, consider increasing server sort buffer size‘)

编程

2025-1-31

查看sort_buffer_size show variables like %sort_buffer_size%; Variable_nameValueinnodb_sort_buffer_size104857

Out of sort memory, consider increasing server sort buffer size

编程

2025-1-31

mysql 报错 Out of sort memory, consider increasing server sort buffer size 解决办法: 调整sort_buffer_size大小终端或navicat输入以下命令

解决【mysql】 Out of sort memory, consider increasing server sort buffer size

编程

2025-1-31

三个命令： 1、进入mysql ： mysql -u root -p 2、查看buffersize： show variables like ‘%sort_buffer_si

1038 Out of sort memory, consider increasing sort buffer size

编程

2025-1-31

解决进入mysql SET GLOBAL sort_buffer_size2048*2048如果还是不行就把数值改大一些，而且可能电脑关机之后又需要修改

Ubuntu20.04双系统安装及CUDA，ROS等工具安装超完善版（持续更新中）

编程

12月前

基于本人电脑老是抽风，至今已重装十几次，遂写此文帮助自己快速完成重装，进入工作状态。目前包含星火商店，显卡驱动，编译器安装&

【问题】程序中已经设定了在cuda:6上面进行训练，但是一直显示For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

编程

7月前

问题：Traceback (most recent call last):File "2_generate_PM_CAM_bcss.py", line 47, in <module>mo

Langchain 的 Conversation buffer window memory

编程

7月前

Langchain 的 Conversation buffer window memoryConversationBufferWindowMemory 保存一段时间内对话交互的列表。它仅使用最后 K 个交互。这对于保持最近交互的滑动窗口非

重装vs后，cuda重新配置

编程

7月前

无cuda项目解决办法https:blog.csdnu010724874articledetails89578558看一下能否引入cuda依赖项。试了单独装cuda vs部分，没弄出来&#xf

较真：认真解读“NVIDA CUDA显卡计算能力表”

编程

7月前

博主在硬件设备方面还是个小白，近日想要知道深度学习应当选用哪些显卡，其性能如何？且网络上能搜到的GPU天梯图似乎都停留在以装机选配为目的的个人级别上，于是在本站试图搜索相关文章或者排行，看到有不少博主搬运了NVIDA发布的一系列表格，比如：

Windows10下CUDA与cuDNN的安装

编程

7月前

安装CUDA 了解自己电脑的CUDA版本，右击-NVIDIA控制面板-系统信息-组件。支持的CUDA版本与显卡驱动有关。通过下面网址进行下载对应CUDA版本，也不一定非要装最高版本。 CU

关于在英伟达官网下载 CUDA 10.0 win10版本失败原因探索

编程

7月前

关于在英伟达官网下载 CUDA 10.0 win10版本失败原因探索：1.尝试了比较多的途径去下载，一致以为是网速问题和下载软件的问题，但尝试许多改变皆无果&#

Windows电脑GPU配置CUDA和cuDNN

编程

5月前

前言：最近需要使用电脑的GPU进行并行计算，由于以前也配置过GPU的深度学习环境，但是并没有自己总结如何配置GPU的CUDA和CUDNN，因此趁着这次写

11.Identify the memory component from which memory may be allocated for:

编程

4月前

11.Identify the memory component from which memory may be allocated for:1.Session memory for the shared server2.Buffer

Memory allocation详解

编程

4月前

Memory allocation详解在C中，我们可以很方便的动态分配内存，那么动态分配后的初始化顺序和释放内存时候的析构顺序究竟是怎样的呢，我们来回顾一下首先我们想看一

笔记本电脑Ubuntu18.04安装PyTorch记录（Nidia显卡驱动+CUDA+Anaconda3+PyTorch）

编程

4月前

前言随着学习的知识越来越多，本人也需要接触更多的智能化平台和技术，本文将记录深度学习环境搭建的过程，意在为更多配置环境而发愁的学生以及初学者解决无法正常配置环境的问题。经过

重新安装GPU驱动, Cuda前的清理工作

编程

3月前

如果Ubuntu主机上已安装过GPU驱动和Cuda, 可以对照此表决定是否进行清理(建议都进行清理)清理Cuda进入usrlocalcudabin. 寻找uninstall相关的文件夹或者文件, 直接敲文件名运行卸载程序.清理

Windows11中卸载CUDA并安装新的版本

编程

3月前

Windows 环境搭建： Nvidia驱动CudaCudnn：https:zhuanlan.zhihup662087500?utm_id0 目录1.查看CUDA版本和驱动2.卸载CUDA

Linux 系统上安装 CUDA 和 cuDNN

编程

3月前

在 Linux 系统上安装 CUDA 和 cuDNN 是一个详细的过程，涉及多个步骤，包括下载合适的安装包、设置环境变量等。以下是一个基本的指导步骤，帮助您安装 CUDA 和

Windows10下NVIDA CUDA,cuDNN和TensorRT安装教程

编程

3月前

文章目录一. 查看自己的GPU版本是否支持cuda二 .安装CUDA三. 安装cuDNN四. TensorRT安装一. 查看自己的GPU版本是否支持cuda 打开显卡的控制面板，查看显卡是否支持cuda 二 .安

Linux系统中，多个CUDA版本切换

编程

3月前

1. 设置环境变量sudo vi ~.bashrc进入bashrc文件后，在文件末尾添加以下代码，用来设置cuda的环境变量：export CUDA_HOME$CUDA

发表评论

全部评论 0

暂无评论

推荐文章

静态IP地址配置：让你的设备网络连接更稳固

“任务管理器”不显示？别急，这里有两招帮你快速查看电脑内存频率，超实用！

电脑显卡怎么查看?查看电脑显卡方法_怎么查看电脑显卡

linux cpu使用率100%排查_socketinputstream.socketread0() 高cpu

192.168.1.1路由器管理页面轻松登陆教程，告别网络困扰

热门文章

NAT基础教程：源地址转换如何帮助你优化网络资源分配
17天前
Linux CPU 使用率_linuxcpu使用率
14天前
全面检测与优化：优盘参数检测软件
14天前
关于mscorsvw.exe
13天前
AI帮你一键还原Win11右键菜单：告别繁琐设置
13天前
THINKPAD USBTYPE C 接口不能使用_thinkpad typec接口没反应
10天前
Chrome 如何清除浏览器缓存_chrome清除缓存
9天前
EasyRecovery实战：破解数据丢失之谜，拯救你的Flash项目！
8天前
菜鸟也能学会！Windows 10系统还原轻松指南
8天前
解决RK3399设备上的USB设备问题：Log_fusb302 4-0022下的具体操作与优化技巧
7天前

最新文章