CUDA C是NVIDIA实现GPU计算时对C语言进行的扩展以及应用程序编程接口。
官方网址:
https://developer.nvidia.com/cuda-toolkit-archive
可在如下图中的网页上选择自己需要的版本,本文使用的时CUDA 11.5,若使用其他版本,在本文的其他步骤需依次按版本修改。
双击exe格式的安装程序,点击OK。安装路径可以自由选择(建议默认),最好将路径记录下来在之后环境变量的配置时需要用到。
当进度到达100%是可以看到如下界面,点击“同意并继续”。
出现如下界面时点击“自定义”选项,点击“下一步”。
勾选下图界面中的所有选项(如果有其他需求可自由调节),点击“下一步”。
请将下图的安装位置记录,在环境变量配置和vs2017环境配置时需要用到。点击“下一步”。
点击“下一步”。
点击“关闭”,安装完成。
右击“此电脑”,左键选择“属性”,出现如下窗口,选择“高级系统设置”。
出现如下界面,点击“环境变量”。
出现如下界面。
首先在系统变量中新建如下几个变量:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.5
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
CUDA _PATH与CUDA _PATH_V11_5是CUDA安装时自动添加的。新建结束后如下图所示(图中的CUDA _PATH_V10_0是作者之前用的环境可忽略)
找到Path环境变量,点击“编辑”。
添加以下到系统变量Path中,然后点击“确认”。环境变量配置完成。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.5\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.5\libnvvp
创建一个空项目。
右击源文件→添加→新建项→CUDA C/C++ File;创建一个.cu文件
右击项目名称Project1→生成依赖项→生成自定义→选择CUDA11.5→确定
右击File.cu文件→属性→配置属性→常规→项类型→CUDA C/C++
右击Project1→属性
→VC++目录
在包含目录中添加
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.5\include
在库目录中添加
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.5\lib\x64
增加项目扩展名(可选)
点击上方菜单栏工具→选项→文本编辑器→文件扩展名,在扩展名栏中输入.cu,并选择编辑器为:Microsoft Visual C++。
工具→选项→项目和解决方案→VC++项目设置,添加要包括的扩展名".cu"
→链接器→输入→附加依赖项
再附加依赖项中按需要添加相应的.lib文件名称
(一般需要什么加什么,不需要可以不加,以下贴出lib文件所在位置)
以下列出添加方法:
在如图所示的方框中输入需要的.lib文件名(需要打后缀名),每一行打一个名字,最后点“确认”。
例如:
cublas.lib
cublasLt.lib
cuda.lib
配置成功
测试程序
这是一个简单的测试程序,用以确认安装好的CUDA工具包是否能够调用GPU的资源。
#include<stdio.h>
__global__ void kernel(void) {}
int main(void) {
kernel << <1, 1 >> > ();
printf("Hello, World!\n");
return 0;
}
如果你是第一次配置,建议按照本文中的默认路径安装,因为需要设置路径地方很多,如果你是自定义路径安装的CUDA,请在配置环境变量和vs2017的环境时一定要做好对应的修改。
在图中的路径(CUDA的安装路径)下可以看到.sln的项目文件,其文件名即为适配的版本,如图中CUDA 11.5适配 vs2017和vs2019(之后可能会有变化,但方法是不变的),一定要选择合适的版本才能够使程序正常运行。
图中的路径(如果安装路径不同,可能会有变动)为:
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.5
为什么CUDA编程一般都用visual studio
因为官网文档的说明都是使用vs的。
可在如下的网址查询到:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
以下贴出当前的适配信息(以后会变动):
图中标注了CUDA各版本所支持的显卡驱动版本,查询计算机使用的显卡驱动版本即可与图中比较即可得知其是否与CUDA某版本适配。
请安装C++的桌面开发(勾选就会自动安装),并且勾选右边的几个SDK,如图所示,CUDA的一些代码需要这些SDK,因此需要勾选。还有一些其他的组件可根据情况勾选。
本文总结了在CUDA编程环境配置方面的问题,希望对大家有所帮助,若文章中有什么问题、疏漏,或者对文章有一些建议,请在评论区提出。
文章浏览阅读1.6w次,点赞8次,收藏41次。生活中我们无时不刻不都要在网站搜索资源,但就是缺少一个趁手的资源搜索网站,如果有一个比较好的资源搜索网站可以帮助我们节省一大半时间!今天小编在这里为大家分享5款超厉害的资源搜索网站,每一款都可以让你的资源丰富精彩!网盘传奇一款最有效的网盘资源搜索网站你还在为找网站里面的资源而烦恼找不到什么合适的工具而烦恼吗?这款网站传奇网站汇聚了4853w个资源,并且它每一天都会持续更新资源;..._最全资源搜索引擎
文章浏览阅读4.5k次,点赞5次,收藏18次。阅读测试程序,设计一个Book类。函数接口定义:class Book{}该类有 四个私有属性 分别是 书籍名称、 价格、 作者、 出版年份,以及相应的set 与get方法;该类有一个含有四个参数的构造方法,这四个参数依次是 书籍名称、 价格、 作者、 出版年份 。裁判测试程序样例:import java.util.*;public class Main { public static void main(String[] args) { List <Book>_6-1 book类的设计java
文章浏览阅读613次,点赞28次,收藏27次。相比于以前的传统手工管理方式,智能化的管理方式可以大幅降低学校的运营人员成本,实现了校园导航的标准化、制度化、程序化的管理,有效地防止了校园导航的随意管理,提高了信息的处理速度和精确度,能够及时、准确地查询和修正建筑速看等信息。课题主要采用微信小程序、SpringBoot架构技术,前端以小程序页面呈现给学生,结合后台java语言使页面更加完善,后台使用MySQL数据库进行数据存储。微信小程序主要包括学生信息、校园简介、建筑速看、系统信息等功能,从而实现智能化的管理方式,提高工作效率。
传统上用户登陆状态会以 Session 的形式保存在服务器上,而 Session ID 则保存在前端的 Cookie 中;而使用 JWT 以后,用户的认证信息将会以 Token 的形式保存在前端,服务器不需要保存任何的用户状态,这也就是为什么 JWT 被称为无状态登陆的原因,无状态登陆最大的优势就是完美支持分布式部署,可以使用一个 Token 发送给不同的服务器,而所有的服务器都会返回同样的结果。有状态和无状态最大的区别就是服务端会不会保存客户端的信息。
文章浏览阅读784次。发表于10小时前| 2674次阅读| 来源TechCrunch| 19 条评论| 作者Jon EvansiOSAndroid应用开发产品编程语言JavaObjective-C摘要:即便Android市场份额已经超过80%,对于开发者来说,使用哪一个平台做开发仍然很难选择。本文从开发环境、配置、UX设计、语言、API、网络、分享、碎片化、发布等九个方面把Android和iOS_ios 开发角度
搜索引擎的发展历史可以追溯到20世纪90年代初,随着互联网的快速发展和信息量的急剧增加,人们开始感受到了获取和管理信息的挑战。这些阶段展示了搜索引擎在技术和商业模式上的不断演进,以满足用户对信息获取的不断增长的需求。
文章浏览阅读990次。对象特性是指控制对象的输出参数和输入参数之间的相互作用规律。放大系数K描述控制对象特性的静态特性参数。它的意义是:输出量的变化量和输入量的变化量之比。时间常数T当输入量发生变化后,所引起输出量变化的快慢。(动态参数) ..._控制对象特性
文章浏览阅读5.7w次,点赞50次,收藏276次。FRP搭建内网穿透1.概述:frp可以通过有公网IP的的服务器将内网的主机暴露给互联网,从而实现通过外网能直接访问到内网主机;frp有服务端和客户端,服务端需要装在有公网ip的服务器上,客户端装在内网主机上。2.简单的图解:3.准备工作:1.一个域名(www.test.xyz)2.一台有公网IP的服务器(阿里云、腾讯云等都行)3.一台内网主机4.下载frp,选择适合的版本下载解压如下:我这里服务器端和客户端都放在了/usr/local/frp/目录下4.执行命令# 服务器端给执_locyanfrp
文章浏览阅读687次。题目:http://acm.hust.edu.cn/vjudge/contest/view.action?cid=93745#problem/A题意:给出r*c的01矩阵,可以翻转格子使得0表成1,1变成0,求出最小的步数使得每一行中1的个数相等,每一列中1的个数相等。思路:网络流。容量可以保证每一行和每一列的1的个数相等,费用可以算出最小步数。行向列建边,如果该格子是_uva12534
文章浏览阅读504次。1、Let's Encrypt 90天,支持泛域名2、Buypass:https://www.buypass.com/ssl/resources/go-ssl-technical-specification6个月,单域名3、AlwaysOnSLL:https://alwaysonssl.com/ 1年,单域名 可参考蜗牛(wn789)4、TrustAsia5、Alpha..._csdn alphassl免费申请
文章浏览阅读1.6k次。测试算法的性能 很多时候我们需要对算法的性能进行测试,最简单的方式是看算法在特定的数据集上的执行时间,简单的测试算法性能的函数实现见testSort()。【思想】:用clock_t计算某排序算法所需的时间,(endTime - startTime)/ CLOCKS_PER_SEC来表示执行了多少秒。【关于宏CLOCKS_PER_SEC】:以下摘自百度百科,“CLOCKS_PE_算法性能测试
文章浏览阅读1.2k次。fromhttps://towardsdatascience.com/finding-lane-lines-simple-pipeline-for-lane-detection-d02b62e7572bIdentifying lanes of the road is very common task that human driver performs. This is important ..._lanedetectionlite