
前言:为什么要升级 CUDA?
我在学习人工智能课程时,遇到了一个 GPU 计算环境的问题。
操作系统:Windows 10 64 位
Python 版本:3.13
显卡:NVIDIA RTX 2070 Super(驱动版本 512.78)
原 CUDA 版本:11.6
课程要求 CUDA 版本:11.8,但旧驱动不支持
因此,我需要升级驱动,并安装与之兼容的 CUDA 版本。过程中涉及驱动更新、旧版本清理和新版本安装,以下是完整的操作流程。
1. 查询当前驱动和 CUDA 版本
nvidia-smi
nvcc --version
如果 nvcc --version
显示 not recognized
,说明 CUDA 可能未正确安装或环境变量未配置。
2. 升级 NVIDIA 驱动
下载最新版驱动
选择 GeForce RTX 20 Series (Notebooks) → RTX 2070 SUPER → Windows 10 64-bit
下载并运行安装程序
选择 自定义安装 → 执行干净安装(清除旧驱动)
验证驱动更新
nvidia-smi
查看 Driver Version是否已更新,同时检查支持的 CUDA 版本。
3. 清理旧的 CUDA 11.6
方法 1:控制面板卸载(推荐)
按
Win + R
,输入appwiz.cpl
,回车在 "程序和功能"界面,找到
NVIDIA CUDA 11.6
并卸载
方法 2:手动清理(如果卸载失败)
删除文件夹
rmdir /s /q "C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.6"
运行清理脚本
创建 clean_cuda.bat
,粘贴以下代码并运行:
@echo off
echo 清理 CUDA 11.6 残留...
:: 删除环境变量中的 CUDA 11.6 相关路径
setx CUDA_PATH "" /M
setx CUDA_HOME "" /M
:: 获取系统环境变量 Path
for /f "tokens=2 delims==" %%a in ('wmic environment where "name='Path' and username='<System>'" get value /value') do set PATHVAR=%%a
:: 删除 Path 变量中包含 CUDA 11.6 的路径
set "NEWPATH="
for %%i in (%PATHVAR:;=" "%") do (
echo %%i | findstr /I "CUDA\\v11.6" >nul || set "NEWPATH=!NEWPATH!;%%i"
)
:: 更新 Path 变量
if not "%NEWPATH%"=="" (
setx Path "%NEWPATH:~1%" /M
)
:: 删除 CUDA 11.6 的注册表项
reg delete "HKEY_LOCAL_MACHINE\SOFTWARE\NVIDIA Corporation\CUDA" /f
reg delete "HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\NVIDIA Corporation\CUDA" /f
echo 清理完成,请重启电脑!
pause
4. 下载并安装 CUDA 12.8
访问 CUDA 官方下载页面,选择 Windows 10 64-bit,推荐 exe (network)
或 exe (local)
版本。
版本 | 优点 | 缺点 |
---|---|---|
exe (network) | 体积小,安装时自动下载最新组件 | 需要稳定的网络 |
exe (local) | 一次性下载完整安装包,离线可用 | 体积大(2GB+),占用更多存储空间 |
建议:
网络正常→ 选
exe (network)
网络不稳定→ 选
exe (local)
安装步骤
运行
CUDA_12.8.exe
选择 Express(默认)或 Custom(自定义)安装
安装完成后,重启系统
5. 验证 CUDA 安装是否成功
检查 CUDA 版本
nvcc --version
检查 NVIDIA 驱动和 CUDA 兼容性
nvidia-smi
如果显示 CUDA 12.8,则安装成功!
6. 测试 PyTorch / TensorFlow 是否支持 GPU
PyTorch 测试
import torch
print(torch.cuda.is_available()) # 如果返回 True,说明 GPU 可用
print(torch.cuda.get_device_name(0)) # 显示 GPU 名称
TensorFlow 测试
import tensorflow as tf
print(tf.config.list_physical_devices('GPU')) # 列出可用 GPU
如果以上测试 成功,说明 CUDA 12.8 已正确安装并可用!
总结
这次升级主要解决了 CUDA 版本不兼容的问题,完整流程如下:
查询旧版本信息
nvidia-smi
&nvcc --version
更新 NVIDIA 驱动
卸载 CUDA 11.6 并清理残留文件
下载并安装 CUDA 12.8
验证安装是否成功
测试Ai运行环境
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)