Python으로 PyTorch, Tensorflow, Python, CUDA, cudnn 버전 확인

각 버전 확인 명령어


[Conda] Miniconda/Anaconda 자동시작 (base) 해제

가상환경 자동시작 해제


GPU 메모리 사용량 확인 하는법

watch -d -n 0.5  nvidia-smi # gpu 메모리 사용량 실시간 확인
nvidia-smi -l 1             # ubuntu에서 gpu 메모리가 어디에서 쓰이는지 확인 

GPU 캐시 지우기

python3
>> import torch
>> torch.cuda.empty_cache() # ctrl + d 로 나가기

cuda 를 toolkit으로 설치하고 각 가상환경마다 다른 cuda 불러오는 방법

우선 local에다가 cuda를 새로 설치해주자. 필자는 11.8이 깔려있고, 11.7을 새로 설치하겠다.

CUDA Toolkit 11.7 Downloads

여기서 runfile(local)을 선택하고 맞는 명령어를 입력해서 cuda를 설치해주자.

명령어 실행하고 나서 continue 누르고, driver는 선택해제 해주고 진행해주자.

다음으로 아래와 같은 과정을 통해 conda 를 activate 하면 그에 맞는 cuda version이 불러와지고, deactivate 하면 원래 local의 cuda 버전이 나오게끔 해주자.

# 생성한 가상환경 실행
conda activate {env_name}

# 가상환경 활성화 스크립트 생성
mkdir -p ~/anaconda3/envs/{생성한 가상환경 이름}/etc/conda/activate.d
nano ~/anaconda3/envs/{생성한 가상환경 이름}/etc/conda/activate.d/cuda_setup.sh

# 위에서 작성한 cuda_setup.sh 파일 안에 밑의 코드 복붙
#!/bin/sh
export CUDA_HOME=/usr/local/cuda-11.7
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

# 가상환경 비활성화 시 원래의 환경으로 복구하려면, deactivate.d 디렉토리 아래에 스크립트를 추가 
# 가상환경 비활성화 스크립트 생성
mkdir -p ~/anaconda3/envs/{생성한 가상환경 이름}/etc/conda/deactivate.d
nano ~/anaconda3/envs/{생성한 가상환경 이름}/etc/conda/deactivate.d/cuda_restore.sh

# 위에서 작성한 cuda_restore.sh 파일 안에 밑의 코드 복붙
#!/bin/sh
unset CUDA_HOME
export PATH=$(echo $PATH | sed -e 's|/usr/local/cuda-11.7/bin:||')
export LD_LIBRARY_PATH=$(echo $LD_LIBRARY_PATH | sed -e 's|/usr/local/cuda-11.7/lib64:||')

(보통 cuda 는/usr/local 에 설치되고, conda로 만든 환경은 .local/lib에 설치된다.