Quick-CUDA开发/移植工具介绍-程序员宅基地

技术标签: matlab  python  c/c++  

如果你想开发CUDA应用软件,你可以选择

1. 努力学习CUDA开发技巧, 以及相关的并行技巧

    深入掌握 SM/SPthread、内存/显存之间关系,以及数据交换各种深层技术

    针对不同状况进行 3~5 阶段的深度CUDA并行优化

    CUDA 版本更新、GPU架构改变时,需自行重新改写代码

2. 使用快速的 CUDA 开发、移植工具

    只需具备 CUDA 基本知识即可

    只需执行算法优化即可,无需花时间处理系统优化工作

    即便CUDAGPU底层架构改变,开发人员也无须更改代码 

 

Quick-CUDA开发/移植工具,让您轻松实现GPU加速

 1.Jacket for Matlab 快速开发/移植工具

2007年起,英伟达(NVIDIA)与AccelerEyes便一直开展合作,两家公司通过利用Jacket,从而将GPU的强大能力带给了广大MATLAB用户。 由于具有简单易用的特点、广泛的功能库以及强劲的GPU性能,Jacket编程在加速GPU平台MATLAB代码方面已经成为一种广受欢迎的方式。 

 

2. libJacket for C/C++ & Fortran 快速开发

LIBJACKET 使得C/C++拥有JACKET GPU函数和计算的库,其主要为加速C/C++开发,或者CUDA接口而设计的,LIBJACKET是一个简单的基于CUDA的库,可与任何C / C + +应用程序集成。

 

3. CULATools 线性函数库

CULAtoolsEM Photonics公司开发的在GPU上实现LAPACK数值线性代数库加速工具包,EM PhotonicsCULA工具系列产品包括CULA基本版、高级版以及商业版。LAPACK是线性代数中常用函数的一个集合,被科学与工程界数以百万计的开发人员所广泛使用。他们所解决的问题通常可以由线性模型来模拟,因此这些问题就可以用线性代数例程来解决。通过利用NVIDIACUDATM架构,CULA可以为用户提供性能卓越的线性代数函数功能

 

4. HMPP 快速移植工具

特别针对 C/C++ Fortran 开发之应用系统,快速移植到 GPU 平台

一个具有强大CUDA-OpenCL代码生成功能的混合编译器

使用HMPP目标代码生成功能,即时对需要硬件加速的重要函数进行建模和性能评估。

代码生成器专门用来摘取CFortran代码中的绝大多数并行数据,并将它们转换成CUDAOpenCL代码。

 

转载于:https://www.cnblogs.com/gpus/archive/2011/10/13/2209855.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/diaoruge5774/article/details/102208383

智能推荐

#####Docker私有仓库的搭建和加认证####_registry-cli-程序员宅基地

文章浏览阅读328次。1.下载registry镜像[root@server1 docker]# docker pull registry:2: Pulling from library/registryc87736221ed0: Pull complete 1cc8e0bb44df: Pull complete 54d33bcb37f5: Pull complete e8afc091c171: Pull c..._registry-cli

java nio系列教程(2)---channel(通道介绍)和使用_messageutil.bytebuffertoarray-程序员宅基地

文章浏览阅读2.3k次。大家推荐个靠谱的公众号程序员探索之路,公众号内点击网赚获取彩蛋,大家一起加油 ​package com.zzh.buffer;import com.google.common.collect.Lists;import org.junit.jupiter.api.Test;import java.io.FileInputStream;import java.io.FileOut..._messageutil.bytebuffertoarray

官宣 | Apache Flink 1.12.0 正式发布,流批一体真正统一运行!_cannot resolve org.apache.flink:flink-web-socket:1-程序员宅基地

文章浏览阅读5.7k次,点赞9次,收藏10次。‍‍翻译 | 付典Review |徐榜江、朱翥Apache Flink 社区很荣幸地宣布 Flink 1.12.0 版本正式发布!近 300 位贡献者参与了 Flink 1.12.0 ..._cannot resolve org.apache.flink:flink-web-socket:1.12.0

计算机硬件技术的应用毕业论文,计算机硬件技术论文-程序员宅基地

文章浏览阅读528次。为毕业生写计算机硬件技术论文提供计算机硬件技术论文范文参考,涵盖硕士、大学本科毕业论文范文和职称论文范文,包括论文选题、开题报告、文献综述、任务书、参考文献等,是优秀免费计算机硬件技术论文网站。计算机硬件组装及维护技术的探讨摘要:随着社会进步与科技的快速发展,计算机的应用已经成为我们生活工作中的一个重要组成部分。因此,我们需要掌握一些基本的计算机硬件组装。计算机硬件维护保养技术探讨摘要】随着计算机..._计算机硬件技术理解与应用论文

扫描线算法-程序员宅基地

文章浏览阅读2w次,点赞32次,收藏94次。背景之前看到洛谷管理员大佬发明了个二次分块,然后就想学学,发现扫描线是个前置知识,于是来肝这个算法了,发现其实不难。进入正题扫描线一个很经典的例题:在坐标轴上有若干个矩形,问他们覆盖的面积总和。因为他们覆盖的面积有重复,于是就用到了神奇的扫描线算法。假设有两个矩形,如图:先来看一道例题:题目大意,..._扫描线算法

OpenCV实现单目摄像头对图像目标测距_opencv三角测量法测距-程序员宅基地

文章浏览阅读3.8k次,点赞6次,收藏55次。使用opencv对单目摄像头中的目标实现测量距离1.方法介绍:根据相似三角形的方法:F = P×D / W , 其中W为物体的实际宽度,D为物体平面与相机平面的距离,照片上物体的像素宽度为P,相机焦距为FD = F×W / P ,这样知道相机的内参焦距就可以求得物体平面与相机平面的距离D2.代码:import cv2import imutilsimport numpy as npfrom imutils import paths# 获取目标的轮廓信息def find_marker_opencv三角测量法测距

随便推点

磁力连接是如何接入DHT网络并下载文件的_dht下载-程序员宅基地

文章浏览阅读6.8k次。你的bt客户端连接到的第一个ip(除DNS外)提供一个公网ip的列表,这些ip被用来当作DHT网络的入口。这个列表一般由制作bt客户端的人来提供。当你接入DHT网络之后,你会通过DHT查询找到更多的ip,这些ip一般会缓存再你的磁盘上以便于下次你不用再下载一次ip列表。磁力链接包含了一个hash值,就是一个唯一的id,用来识别你要查找的文件,它不包含任何ip,也不需要这么做。这个hash就是从..._dht下载

默认路由及静态路由配置_默认路由配置命令-程序员宅基地

文章浏览阅读1.2w次,点赞9次,收藏85次。提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档静态路由和默认路由的基础配置前言一、什么是路由、路由器、静态路由?二、基本配置这样就可以通过配置默认路由和静态路由实现互通啦![在这里插入图片描述](https://img-blog.csdnimg.cn/37a571981fa2499abdcb9c486d96a585.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAc3R1ZHlf._默认路由配置命令

黑马程序员 一、java 概述与基础知识_黑马java干嘛的-程序员宅基地

文章浏览阅读514次。一、黑马程序员—java 概述与基础知识1、何为编程?编程就是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到结果的过程。为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。这种人和计算机之间交流的过程就是编程。 2、Ja_黑马java干嘛的

python 手机测试_python脚本如何测试手机-程序员宅基地

文章浏览阅读484次。一、adb 相关命令:1、关闭adb服务:adb kill-server2、启动adb服务 adb start-server3、查询当前运行的所有设备 adb devices4、可能在adb中存在多个虚拟设备运行 可以指定虚拟设备运行 -s 虚拟设备名称5、重启设备 adb reboot --指定虚拟设备 adb -s 设备名称 reboot6、查看日志 adb logcat 清除..._手机mtbf测试python代码

maven 某项目时 error 提示:XXXX.java:[1,10] 需要class, interface或enum_maven 需要class interface-程序员宅基地

文章浏览阅读830次。manen install 某 project 时 出现上述错误,起初不解,几个类中都严格审查了一下,并没有语法错误。然后,报错的就是最强大的反驳,程序必须有错误!经过网上查询资料,得知真正原因:这个文件的格式为UTF-8-BOM编码,而程序编译时是按照UTF-8的格式来编译运行的,因此报错。如下图所示:解释一下BOM,即Byte Order Mark,就是字节序标记。它是用来判断文本文件是哪一种Unicode编码的标记,其本身是一个Unicode字符("\ufeff"),位.._maven 需要class interface

Windows xp Ms08067漏洞复现_利用ms08-067漏洞控制xp建立不了回话-程序员宅基地

文章浏览阅读4k次。准备工作:虚拟机kaliWindows xp sp3中文版先ping双方的ip,以确保双方的网络可以互通nmap扫描Windows命令:cd /usr/share/nmap/scriptsnmap --script=vuln 192.168.XXX.XXX扫描后有漏洞ms08067用mts进行攻击先找漏洞利用:search 08_067运用漏洞:use exploit/windowsexploit/windows/smb/ms08_067_netapi看参数:show op_利用ms08-067漏洞控制xp建立不了回话