技术标签: cuda tensorflow 深度学习 工具 windows
本次安装参考了网上许多教程,结合自己的需求与理解,写下此篇博客,仅做本人总结使用。。
windows10 版本安装 CUDA ,首先需要下载两个安装包
注:cuDNN 是用于配置深度学习使用
CUDA:https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html
cuDNN:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindows
https://developer.nvidia.com/cuda-toolkit-archive
官网安装:
https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64
GA = General Availability,通用版本,指软件的通用版本。
RC=Release Candidate,含义 是"发布候选版",它不是最终的版本,而是最终版(RTM=Release To Manufacture)之前的最后一个版本
官网说明文档,
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
CUDA的版本是跟显卡型号有关还是驱动有关?
一般是驱动版本决定了能用的CUDA版本的上限,比如新版的显卡驱动可以支持老的CUDA runtime。但是老的显卡可能无法更新到最新的显卡驱动,比如Fermi显卡只能装到391驱动,因此只能用到CUDA9.1。除此之外,显卡硬件与CUDA compute capability相关,当然编译时也可以指定streaming multiprocessor。新的架构支持更多特性就是了。
最终本人下载的
cuDNN地址如下,不过要注意的是,我们需要注册一个账号,才可以进入到下载界面。大家可以放心注册的。
https://developer.nvidia.com/rdp/cudnn-download
注册成功后的下载界面
可以使用下面网址,查看适配的 cuDNN
https://developer.nvidia.com/rdp/cudnn-archive
本人下载的版本如下:
如果你是第一次安装,尽量全选
如果你是第n次安装,尽量只选择第一个,不然会出现错误
不要选Visual Studio Integration,即使选了也不能成功安装
如果本机的驱动版本(当前版本)小于cuda对应的版本(新版本),则选择,否则不选。如果当前版本小于新版本,并且不覆盖安装,之后电脑会频繁蓝屏或死机
重点提醒:一定要记住这个路径,把这个路径保留下来,后面我们还会用到!!!
查看系统变量中是否添加了路径,如果没有需要自己添加
运行cmd,输入nvcc --version 即可查看版本号;
set cuda,可以查看 CUDA 设置的环境变量。
nvcc --version
set cuda
cuDNN叫配置更为准确,我们先把下载的 cuDNN 解压缩,会得到下面的文件:
下载后发现其实cudnn不是一个exe文件,而是一个压缩包,解压后,有三个文件夹,把三个文件夹拷贝到cuda的安装目录下。
CUDA 的安装路径在前面截图中有,或者打开电脑的环境变量查看,默认的安装路径如下:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1
后面那个v11.1是你自己的版本号
CUDA 安装目录文件:
拷贝时看到,CUDA 的安装目录中,有和 cuDNN 解压缩后的同名文件夹,这里注意,不需要担心,直接复制即可。cuDNN 解压缩后的同名文件夹中的配置文件会添加到 CUDA安装目录中的同名文件夹中。
拷贝成功后的文件
现在大家应该可以理解,cuDNN 其实就是 CUDA 的一个补丁而已,专为深度学习运算进行优化的。然后再参加环境变量
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\libnvvp
配置完成后,我们可以验证是否配置成功,主要使用CUDA内置的deviceQuery.exe 和 bandwidthTest.exe:
首先win+R启动cmd,cd到安装目录下的 …\extras\demo_suite,然后分别执行bandwidthTest.exe和deviceQuery.exe,应该得到下图:
https://blog.csdn.net/mao_hui_fei/article/details/104246466
https://www.pianshen.com/article/8647746165/
https://blog.csdn.net/weixin_45494025/article/details/100746025
https://blog.csdn.net/u011473714/article/details/95042856
文章浏览阅读2.8k次。Unity Shader学习:油画效果油画效果在学习浅墨大神的文章时看到的比较有趣,但是原文中也没详细的算法介绍如何实现,这里就先直接拿来用吧,UI和屏幕后处理都可以用,算法也看的不是很明白,好像是ShaderToy上老外搞得。shader部分:Shader "Custom/OilPaintEffect" { Properties{ _MainTex("MainTex",2D)="..._unity 打开摄像头 油画风格
文章浏览阅读91次。冲刺第三天一、Daily Scrum Meeting照片二、每个人的工作1.昨天已完成的任务。昨天完成服务器上的数据库部署与Json数据传输2.今天计划完成的任务。今天计划完成安卓手机登入功能3.工作中遇到的困难。Json传输格式与数据库链接,进行了查询和学习。4.每个人的贡献比。余洋(201421123031):15%..._黄子敬 php
文章浏览阅读93次。SUMMARY:This article provides information on how to manually generate a new system self-signed certificate to replace the expired system self-signed certificate, without resetting the firewall...._the security key has expired, please generate a new key.是什么意思怎么解决
文章浏览阅读2.6w次,点赞18次,收藏51次。# 小白学习之路1.问题描述: 在学习kaggle经典学习项目Titanic,进行数据可视化处理时,对于每个特征进行相关性分析(也就是绘制pearson correlation heatmap )热力相关性矩阵时, plt.show() 图形绘制出来,字体会重叠.导致无法观察# Visualisations"""将数据进行可视化"""print(train.h..._热力图 x轴y轴字体显示
文章浏览阅读929次。无迹卡尔曼滤波UKF算法及源码_无迹卡尔曼滤波
文章浏览阅读527次。Brute force——暴力破解界面:源代码:<?phpif(isset($_GET['Login'])){//Getusername$user=$_GET['username'];//Getpassword$pass=$_GET['password'];$pass=md5($pass);//Checkthedatabase$query="SELECT*FROM`users`WHEREuser='$user'ANDpassword='$pass';";$result=_dvwa brute force一直都是impossible
文章浏览阅读263次。If elseif else描述:执行基本的条件流转。参数:名称必需默认类型描述备注test是 boolean决定标志里的内容是否显示的表达式else标志没有这个参数id否
文章浏览阅读1.8k次。文件属性d 开头是: 目录文件。l 开头是: 符号链接(指向另一个文件,类似于瘟下的快捷方式)。s 开头是: 套接字文件(sock)。b 开头是: 块设备文件,二进制文件。c 开头是: 字符设备文件。p 开头是: 命名管道文件。创建套接字文件nc -Ul sock文件权限r = 4w = 2x = 1chmod 660 sock转载于:https://www.cnb..._linux srw
文章浏览阅读3.2k次。映美精 DFK 41BG02.H分辨率 1280X960最大帧率15采用C#编程,使用软件触发模式。触发1次,到ImageAvalible事件发生,记录其时间为96毫秒附近波动。手动计算时间如下: 像素个数:1280 * 960= 1,228,800RGB格式,1个像素3个Byte来表示,其字节数: 1,228,800 * 3 = 3686400相机处理后,读出时间1000 /_c# 映美精相机
文章浏览阅读539次,点赞9次,收藏7次。定义斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=1,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)定义来源于百度百科:斐波那契数列求100以内的斐波那契数列。_python中b组蓝桥杯斐波那契与7代码及思路
文章浏览阅读2k次。目前,我对DLL的脱壳的了解也不多,相信有些地方会和对EXE的脱壳大致相同。现在我知道的主要不同是必须要在DLL的空间开始跟踪。否则从EXE开始跟踪,那还不把人累死。另外 ProcDump 和 PEditor 之类的工具好象还无法自动修复DLL的import table。唉,又是手动,什么时候有个DLL的脱壳机出现呢? ou,别看我!我编程的水平三流,写不出那些好东东。 样例文件: dlcsp_pecompact dll脱壳
文章浏览阅读496次。算法实习准备之五算法岗面试整理CVFaster-RCNNCNN卷积池化全连接层反向传播LSTMAttentionTranformer机器学习算法线性回归LRSVM优化方法梯度下降法正则化NLPword2vecBert算法岗面试整理CVFaster-RCNNCNN卷积解释卷积层的最佳方法是想象有一束手电筒光正从图像的左上角照过。假设手电筒光可以覆盖 5 x 5 的区域,想象一下手电筒光照过输入图像的所有区域。在机器学习术语中,这束手电筒被叫做过滤器(filter,有时候也被称为神经元(neuron_算法岗实习准备