【CUDA】cuda安装 (windows版)_windows安装cuda-程序员宅基地

技术标签: cuda  tensorflow  深度学习  工具  windows  

本次安装参考了网上许多教程,结合自己的需求与理解,写下此篇博客,仅做本人总结使用。。

一、前言

windows10 版本安装 CUDA ,首先需要下载两个安装包

  • CUDA toolkit(toolkit就是指工具包)
  • cuDNN

注:cuDNN 是用于配置深度学习使用

官方教程

CUDA:https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html

cuDNN:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindows

二、安装工具的准备

1. CUDA toolkit Download

https://developer.nvidia.com/cuda-toolkit-archive

官网安装:

https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64

在这里插入图片描述

在这里插入图片描述

GA = General Availability,通用版本,指软件的通用版本。
RC=Release Candidate,含义 是"发布候选版",它不是最终的版本,而是最终版(RTM=Release To Manufacture)之前的最后一个版本
在这里插入图片描述
官网说明文档,
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

在这里插入图片描述

CUDA的版本是跟显卡型号有关还是驱动有关?

一般是驱动版本决定了能用的CUDA版本的上限,比如新版的显卡驱动可以支持老的CUDA runtime。但是老的显卡可能无法更新到最新的显卡驱动,比如Fermi显卡只能装到391驱动,因此只能用到CUDA9.1。除此之外,显卡硬件与CUDA compute capability相关,当然编译时也可以指定streaming multiprocessor。新的架构支持更多特性就是了。

最终本人下载的

在这里插入图片描述

2. cuDNN Download

cuDNN地址如下,不过要注意的是,我们需要注册一个账号,才可以进入到下载界面。大家可以放心注册的。

https://developer.nvidia.com/rdp/cudnn-download

在这里插入图片描述

注册成功后的下载界面

在这里插入图片描述

可以使用下面网址,查看适配的 cuDNN

https://developer.nvidia.com/rdp/cudnn-archive

在这里插入图片描述

在这里插入图片描述

本人下载的版本如下:

在这里插入图片描述

三、 CUDA 安装与配置过程

  1. 双击“exe文件”,选择下载路径(推荐默认路径)

在这里插入图片描述

  1. 安装选项

如果你是第一次安装,尽量全选
如果你是第n次安装,尽量只选择第一个,不然会出现错误

在这里插入图片描述

不要选Visual Studio Integration,即使选了也不能成功安装

在这里插入图片描述
如果本机的驱动版本(当前版本)小于cuda对应的版本(新版本),则选择,否则不选。如果当前版本小于新版本,并且不覆盖安装,之后电脑会频繁蓝屏或死机

  1. 记住安装位置,tensorflow要求配置环境

在这里插入图片描述

重点提醒:一定要记住这个路径,把这个路径保留下来,后面我们还会用到!!!

  1. 安装进行
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

  1. 安装完成

在这里插入图片描述

查看系统变量中是否添加了路径,如果没有需要自己添加

在这里插入图片描述

测试环境是否安装成功

运行cmd,输入nvcc --version 即可查看版本号;
set cuda,可以查看 CUDA 设置的环境变量。

nvcc --version
set cuda

在这里插入图片描述

在这里插入图片描述

四、cuDNN配置

1.解压

cuDNN叫配置更为准确,我们先把下载的 cuDNN 解压缩,会得到下面的文件:

  1. cuDNN 解压缩后的文件
    在这里插入图片描述

下载后发现其实cudnn不是一个exe文件,而是一个压缩包,解压后,有三个文件夹,把三个文件夹拷贝到cuda的安装目录下

CUDA 的安装路径在前面截图中有,或者打开电脑的环境变量查看,默认的安装路径如下:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1

后面那个v11.1是你自己的版本号

  1. CUDA 安装目录文件:
    在这里插入图片描述
    拷贝时看到,CUDA 的安装目录中,有和 cuDNN 解压缩后的同名文件夹,这里注意,不需要担心,直接复制即可。cuDNN 解压缩后的同名文件夹中的配置文件会添加到 CUDA安装目录中的同名文件夹中。

  2. 拷贝成功后的文件
    在这里插入图片描述

现在大家应该可以理解,cuDNN 其实就是 CUDA 的一个补丁而已,专为深度学习运算进行优化的。然后再参加环境变量

2.添加至系统变量
  1. 往系统环境变量中的 path 添加如下路径(根据自己的路径进行修改)
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\include

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\libnvvp
  1. 验证安装是否成功

配置完成后,我们可以验证是否配置成功,主要使用CUDA内置的deviceQuery.exe 和 bandwidthTest.exe:
首先win+R启动cmd,cd到安装目录下的 …\extras\demo_suite,然后分别执行bandwidthTest.exe和deviceQuery.exe,应该得到下图:

在这里插入图片描述

在这里插入图片描述

参考博客:

https://blog.csdn.net/mao_hui_fei/article/details/104246466

https://www.pianshen.com/article/8647746165/

https://blog.csdn.net/weixin_45494025/article/details/100746025

https://blog.csdn.net/u011473714/article/details/95042856

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43848614/article/details/117221384

智能推荐

Unity Shader学习:油画效果_unity 打开摄像头 油画风格-程序员宅基地

文章浏览阅读2.8k次。Unity Shader学习:油画效果油画效果在学习浅墨大神的文章时看到的比较有趣,但是原文中也没详细的算法介绍如何实现,这里就先直接拿来用吧,UI和屏幕后处理都可以用,算法也看的不是很明白,好像是ShaderToy上老外搞得。shader部分:Shader "Custom/OilPaintEffect" { Properties{ _MainTex("MainTex",2D)="..._unity 打开摄像头 油画风格

团队作业8----第二次项目冲刺(Beta阶段) 第三天-程序员宅基地

文章浏览阅读91次。冲刺第三天一、Daily Scrum Meeting照片二、每个人的工作1.昨天已完成的任务。昨天完成服务器上的数据库部署与Json数据传输2.今天计划完成的任务。今天计划完成安卓手机登入功能3.工作中遇到的困难。Json传输格式与数据库链接,进行了查询和学习。4.每个人的贡献比。余洋(201421123031):15%..._黄子敬 php

[ScreenOS] How to manually generate a new system self-signed certificate to replace the expired syst...-程序员宅基地

文章浏览阅读93次。SUMMARY:This article provides information on how to manually generate a new system self-signed certificate to replace the expired system self-signed certificate, without resetting the firewall...._the security key has expired, please generate a new key.是什么意思怎么解决

Python 利用matplotlib绘制热力图 correlation heatmap X,Y 坐标轴字体重叠显示问题,将字体进行旋转_热力图 x轴y轴字体显示-程序员宅基地

文章浏览阅读2.6w次,点赞18次,收藏51次。# 小白学习之路1.问题描述: 在学习kaggle经典学习项目Titanic,进行数据可视化处理时,对于每个特征进行相关性分析(也就是绘制pearson correlation heatmap )热力相关性矩阵时, plt.show() 图形绘制出来,字体会重叠.导致无法观察# Visualisations"""将数据进行可视化"""print(train.h..._热力图 x轴y轴字体显示

无迹卡尔曼滤波详细介绍及仿真-程序员宅基地

文章浏览阅读929次。无迹卡尔曼滤波UKF算法及源码_无迹卡尔曼滤波

DVWA——Brute force(low)_dvwa brute force一直都是impossible-程序员宅基地

文章浏览阅读527次。Brute force——暴力破解界面:源代码:<?phpif(isset($_GET['Login'])){//Getusername$user=$_GET['username'];//Getpassword$pass=$_GET['password'];$pass=md5($pass);//Checkthedatabase$query="SELECT*FROM`users`WHEREuser='$user'ANDpassword='$pass';";$result=_dvwa brute force一直都是impossible

随便推点

struts2标签-程序员宅基地

文章浏览阅读263次。If elseif else描述:执行基本的条件流转。参数:名称必需默认类型描述备注test是 boolean决定标志里的内容是否显示的表达式else标志没有这个参数id否

Linux的环境中如何生成srw-rw---- 的文件权限?-程序员宅基地

文章浏览阅读1.8k次。文件属性d 开头是: 目录文件。l 开头是: 符号链接(指向另一个文件,类似于瘟下的快捷方式)。s 开头是: 套接字文件(sock)。b 开头是: 块设备文件,二进制文件。c 开头是: 字符设备文件。p 开头是: 命名管道文件。创建套接字文件nc -Ul sock文件权限r = 4w = 2x = 1chmod 660 sock转载于:https://www.cnb..._linux srw

映美精相机软触发_c# 映美精相机-程序员宅基地

文章浏览阅读3.2k次。映美精 DFK 41BG02.H分辨率 1280X960最大帧率15采用C#编程,使用软件触发模式。触发1次,到ImageAvalible事件发生,记录其时间为96毫秒附近波动。手动计算时间如下: 像素个数:1280 * 960= 1,228,800RGB格式,1个像素3个Byte来表示,其字节数: 1,228,800 * 3 = 3686400相机处理后,读出时间1000 /_c# 映美精相机

蓝桥杯Python B组练习——斐波那契数列_python中b组蓝桥杯斐波那契与7代码及思路-程序员宅基地

文章浏览阅读539次,点赞9次,收藏7次。定义斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=1,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)定义来源于百度百科:斐波那契数列求100以内的斐波那契数列。_python中b组蓝桥杯斐波那契与7代码及思路

对PECompact加壳的DLL脱壳的一点分析_pecompact dll脱壳-程序员宅基地

文章浏览阅读2k次。目前,我对DLL的脱壳的了解也不多,相信有些地方会和对EXE的脱壳大致相同。现在我知道的主要不同是必须要在DLL的空间开始跟踪。否则从EXE开始跟踪,那还不把人累死。另外 ProcDump 和 PEditor 之类的工具好象还无法自动修复DLL的import table。唉,又是手动,什么时候有个DLL的脱壳机出现呢? ou,别看我!我编程的水平三流,写不出那些好东东。 样例文件: dlcsp_pecompact dll脱壳

算法实习准备之五:算法岗面试整理_算法岗实习准备-程序员宅基地

文章浏览阅读496次。算法实习准备之五算法岗面试整理CVFaster-RCNNCNN卷积池化全连接层反向传播LSTMAttentionTranformer机器学习算法线性回归LRSVM优化方法梯度下降法正则化NLPword2vecBert算法岗面试整理CVFaster-RCNNCNN卷积解释卷积层的最佳方法是想象有一束手电筒光正从图像的左上角照过。假设手电筒光可以覆盖 5 x 5 的区域,想象一下手电筒光照过输入图像的所有区域。在机器学习术语中,这束手电筒被叫做过滤器(filter,有时候也被称为神经元(neuron_算法岗实习准备