2019년 10월 17일 목요일

[Ubuntu] NVIDIA Driver 삭제 오류

python에서 tensorflow-gpu, keras-gpu가 import되지 않고 에러 발생
nvidia 드라이버에 문제가 있다고 추정되어 제거 후 재설치 하고자 함

*nvidia drive 제거
sudo apt-get remove --purge '^nvidia-.*

*CUDA 제거
sudo apt-get --purge remove 'cuda*'
sudo apt-get autoremove --purge 'cuda*'

sudo rm -rf /usr/local/cuda

cat /proc/driver/nvidia/version
실행 시

NVRM version: NVIDIA UNIX x86_64 Kernel Module  415 ...
.....

이런 버전이 확인 됨....(왜?)


문제:

1. nvidia 드라이버 (nvidia-415) 에 문제가 있어서 드라이버를 제거 하였으나 모두 제거되지 않고 찌꺼기가 남음

2. /usr/lib/nvidia 폴더에 nvidia-415 등의 폴더가 남아있음...

해결:

1. 우선 관련 폴더를 모두 삭제함... (/usr/lib/nvidia-415 등..)

2. nvidia driver를 재설치 함

3. nvidia-smi 를 실행 했을 때

Failed to initialize NVML: Driver/library version mismatch

오류 발생

https://medium.com/@jjeaby/nvml-driver-library-version-mismatch-%EB%AC%B8%EC%A0%9C-%ED%95%B4%EA%B2%B0-e84047a30a8c

링크에서 설명된 대로 수행

4. CUDA 드라이버 재설치

다시 https://medium.com/@jjeaby/nvml-driver-library-version-mismatch-%EB%AC%B8%EC%A0%9C-%ED%95%B4%EA%B2%B0-e84047a30a8c

링크에서 설명된 대로 수행

5. nvidia-smi 실행 시 문제 없음
python에서 import tensorflow as tf 도 문제 없음





참조: https://medium.com/@jjeaby/nvml-driver-library-version-mismatch-%EB%AC%B8%EC%A0%9C-%ED%95%B4%EA%B2%B0-e84047a30a8c
https://hwiyong.tistory.com/233


댓글 없음:

댓글 쓰기