cuda

如何查看和安装NVIDIA的CUDA版本

为了能在用Ultimate Vocal Remover GUI时使用GPU加速运算,N卡用户必须要安装CUDA核心。 URV官方最新版本是 Ultimate Vocal Remover GUI v5.5.1 官网地址:https://github.com/Anjok07/ultimatevocalr ......
版本 NVIDIA CUDA

ubuntu安装cuda及cudnn简明教程

前言 在上一篇文章https://www.cnblogs.com/tianyonglin/p/17285111.html中我们已经成功的安装了NVIDIA显卡驱动,本章给大家介绍一下如何安装cuda及cudnn,默认大家已经成功安装NVIDIA驱动。 安装cuda 1、查看自己的cuda_versi ......
简明教程 教程 ubuntu cudnn cuda

wsl安装显卡驱动和cuda

1、在 windows 主机上下载并安装 wsl 驱动,安装完成后在 powershell 上输入如下代码查看是否安装成功: nvidia-smi 2、安装完显卡驱动后即可安装 cuda,在 wsl 中输入如下代码: sudo apt install nvidia-cuda-toolkit 接着输入 ......
显卡驱动 显卡 cuda wsl

2-CUDA

1.环境搭建 NVIDIA于2006年推出CUDA(Compute Unified Devices Architecture),可以利用其推出的GPU进行通用计算,将并行计算从大型集群扩展到了普通显卡,使得用户只需要一台带有Geforce显卡的笔记本就能跑较大规模的并行处理程序。 使用显卡的好处是, ......
CUDA

win10+OpenCV4.7.0+cuda环境配置

需要先安装和下载好以下文件 vs2022 CMake3.24.2 opencv-4.7.0 GitHub - opencv/opencv: Open Source Computer Vision Library 有时github上不去多刷新几次,久等一会儿,因为后续需要手动下载一些cmake不能下载 ......
OpenCV4 环境 OpenCV cuda win

CUDA编程入门

一、CUDA编程模型 1.CUDA程序执行流程 2.CUDA核函数kernel 3.CUDA程序层次结构 kernel/Grid——>Block——>WARP——>Thread 上图中一个Kernel/Grid包含2×3个Block,一个Block包含3×5个线程 4.CUDA内置变量 二、向量加法 ......
CUDA

联想拯救者Y9000P 2023版 双系统ubuntu安装nvidia显卡驱动、cuda及cudnn简明教程

前言 对于从事机器学习、深度学习、图像处理、自然语言处理等科研与工作的小伙伴们,ubuntu系统是一个不错的选择,本人前几天入手拯救者y9000p 2023版本,配置为:RTX4060 16G 13代i9 13900HX,由于我从事智能驾驶工作,电脑到之后就安装了ubuntu双系统,本篇文章将为大家 ......

多个CUDA版本使用

显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?请先看这个帖子https://www.cnblogs.com/marsggbo/p/11838823.html 如何使用不同版本的CUDA! 假设使用CUDA 11.7版本,在你的当前环境,注入以下环境 ......
多个 版本 CUDA

【CUDA】 NVIDIA Nsight Systems user guide

本来想通过CLI来打开Nsight System,结果几度尝试打开都是闪退。 解决方法:打开VS :扩展-管理扩展-下载,搜索Nsight,下载以下扩展,再打开VS,就能在扩展-Nsight中找到Nsight System。点Trace 进入GUI。 2.2.从GUI分析Windows目标 选择我们 ......
Systems NVIDIA Nsight guide CUDA

CUDA和cuDNN各版本下载及版本对应关系

CUDA历史版本下载地址: https://developer.nvidia.com/cuda-toolkit-archive cuDNN历史版本下载地址: https://developer.nvidia.com/rdp/cudnn-archive 其中在cuDNN历史版本下载页面可以看到与CUD ......
版本 cuDNN CUDA

cuda原子操作进行直方图计算

首先在cpu上进行计算 #include <iostream> #include <chrono> #define DATA_LEN (100 * 1024 * 1024) inline int rnd(float x) { return static_cast<int>(x * rand() / ......
直方图 原子 cuda

cuda多版本共存

torch 一会要这个版本,一会要那个版本,还要和cuda对应上。避免不了要下载多个cuda 参考文档:https://blog.csdn.net/ytusdc/article/details/85173258 1. 下载cuda 2. 安装(失败,runfile) 一直按回车 说什么未知原因 3. ......
版本 cuda

小白也能搞定!Windows10上CUDA9.0+CUDNN7.0.5的完美安装教程

前言: 为什么要在本地电脑安装 CUDA,CUDA 是什么的,用来做什么?我想,点击标题进来的小伙伴,应该都清楚这些。不管你是用来做什么,或者跟我一样为了跑 Tensorflow 的 Object Detection (目标检测)。 但是我为什么要用 CUDA9,这里版本要特别注意。因为我使用的是 ......
Windows 教程 CUDNN7 CUDA9 CUDNN

使用cuda常量内存进行性能优化

常量内存是在变量前面加上 __constant__,常量内存用于保存核函数执行期间不会发生变化的数据,NVIDIA想硬件提供了 64KB 的常量内存,在通常情况下,使用常量内存代替全局内存能有效的缩减内存带宽 常量内存的赋值使用 cudaMemcpyToSymbol() 函数 示例代码中我创建了一个 ......
常量 内存 性能 cuda

Linux安装cuda,cudann,tensorRT

cuda官网链接 https://developer.nvidia.com/cuda-toolkit-archive 别人的链接链接 https://zhuanlan.zhihu.com/p/72298520 配置环境变量 export LD_LIBRARY_PATH=$LD_LIBRARY_PAT ......
tensorRT cudann Linux cuda

pytorch cuda gpu版本与detectron2、jupyter notebook安装

任意版本的pytorch、cuda的gpu版本与detectron2、jupyter notebook安装 1. 简介 本文主要介绍pytorch cuda gpu版本与detectron2、jupyter notebook安装, 主要是基于docker构建AI开发/预测用的环境. 优势与不足 优势 ......

显卡驱动+cuda+cudnn+深度学习框架

安装概览 安装显卡驱动、CUDA 和 cuDNN 可能因操作系统和 GPU 型号而异,下面是一般的步骤: 下载和安装适合你 GPU 型号的显卡驱动,可以从官方网站或者 GPU 制造商的网站下载。 下载和安装适合你 CUDA 版本的 CUDA 工具包,可以从官方网站下载。 下载和安装适合你 CUDA ......
显卡驱动 显卡 框架 深度 cudnn

win11+CUDA-11.7.1+cudnn-8.8.0

CUDA安装+vsstdio2022配置 先进行CUDA-11.7.1安装 https://developer.nvidia.com/cuda-11-7-1-download-archive 在NVIDIA-CUDA下载地址下载win.exe安装包 完成后,进行安装(注意:需要记住自定义安装目录,后 ......
cudnn 11 CUDA win

cuda、cudnn、zlib 深度学习必配三件套(Windows)

无论用tensorrt,还是onnxruntime部署。这三个都得下载配置,推荐都放到相应的cuda路径里(含dll的文件夹、含lib的文件夹)。 推荐先下载tensorrt或者onnxruntime,这样可以知道所需的cuda、cudnn版本。 1、cuda(以11.8为例) 下载地址:CUDA ......
件套 深度 Windows cudnn cuda

Red Hat CUDA安装

参考: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html ......
CUDA Red Hat

CUDA中的pagelocked memory

背景:在异步传输内存中,需要在HOST 端分配 pagelocked memory , 达到的效果一 CPU不会 将该内存分配到低速的虚拟内存当中,是提高传输速率, 二是异步传输需要Host端始终将该内存放在物理端,可以理解为内存地址双方约定俗成,不会再变了。 自己遇到的问题: cudaHostAl ......
pagelocked memory CUDA

闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。 Whisper 是一个开源的语音识别库,它是由Facebook AI ......
雅意 人工智能 人工 语音 Pytorch

windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路

因为工作业务需求的关系,需编译onnxruntime引入项目中使用,主项目exe是使用的vs2017+qt5.12。 onnxruntime就不用介绍是啥了撒,在优化和加速AI机器学习推理和训练这块赫赫有名就是了。 有现成的别人编译好的只有dll动态库,当然我们显然是不可能使用的,因为BOSS首先就 ......
共263篇  :9/9页 首页上一页9下一页尾页