一、升级CUDA原因

目前GPU主机的CUDA版本是11.1,这个版本相对较老,且比较小众,目前网上很难找到正好匹配的torch版本。

image-20240507155959675

二、可升级版本的选择

官网推荐的版本有CUDA 11.8、CUDA 12.1

image-20240507152943135

GPU主机支持最高版本是CUDA 12.0,因此可以考虑升级为CUDA 11.8或者CUDA 12.0

image-20240507153121414

三、升级方案

  1. 以升级11.8为例,先去官网下载对应的安装包。GPU主机是Ubuntu18.04版本,这里选择相对应的版本
    image-20240507155126367
  2. CUDNN也可以从官网找到对应版本安装包
    image-20240507155521194
  3. 下载完成后,根据默认的步骤进行安装,安装完成后会在本机的/usr/local/目录下,出现对应的cuda-11.8目录。cuda软链接也会从指向cuda-11.1变成指向cuda-11.8。即完成升级
    image-20240507155934287
  4. 由于在~/.zshrc中已经配置过,如果需要切换回CUDA 11.1版本,只需切换软链接/usr/local/cuda的指向,指向需要的版本。所有步骤已经在本地进行过验证,能够保证可行性。
    image-20240507161830049