GPU服务器自动安装找不到nvcc

问题描述:

在参考文章“创建实例时自动安装 Tesla 驱动-Linux(推荐)”后,启动GPU实例时发现无法找到nvcc -V命令,但nvidia-smi命令可以正常使用。

问题原因:

自动安装过程仅安装了NVIDIA Tesla驱动,并未安装CUDA Toolkit和cuDNN库。nvcc是CUDA编译器驱动程序,属于CUDA Toolkit的一部分,因此未安装CUDA会导致nvcc -V命令不可用。

解决方案:

需要手动安装CUDA Toolkit。以下是手动进行安装的步骤:

安装cuda

网址:;target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=runfile_local

按照自己的系统选择即可:

执行下面的下载安装命令即可,例如cuda12.2.2

代码语言:javascript代码运行次数:0运行复制
wget .2.2/local_installers/cuda_12.2.2_535.104.05_linux.runsudo

再执行sh cuda_12.2.2_535.104.05_linux.run

腾讯云安装包地址

CUDA_URL=.4.0_550.54.14_linux.run

替换一下wget .4.0_550.54.14_linux.run

再执行sh cuda_12.2.2_535.104.05_linux.run

输入同意:

注意,当提醒你已经安装了driver的时候,按空格取消。当选择安装内容的时候,务必把driver前面的x取消掉,因为我们已经安装了驱动!!!

增加环境变量

CUDA安装完成后,需要配置变量环境才能正常使用。首先在终端输入sudo vi ~/.bashrc打开如下图所示的.bashrc文件。

然后,如下图所示在.bashrc文件的最后添加以下CUDA环境变量配置信息:

export PATH=/usr/local/cuda-12.2/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH

安装完成后再 nvcc -V 就可以了