nvidia 드라이버에 문제가 있다고 추정되어 제거 후 재설치 하고자 함
*nvidia drive 제거
sudo apt-get remove --purge '^nvidia-.*
*CUDA 제거
sudo apt-get --purge remove 'cuda*'
sudo apt-get autoremove --purge 'cuda*'
sudo rm -rf /usr/local/cuda
cat /proc/driver/nvidia/version
실행 시
NVRM version: NVIDIA UNIX x86_64 Kernel Module 415 ...
.....
이런 버전이 확인 됨....(왜?)
문제:
1. nvidia 드라이버 (nvidia-415) 에 문제가 있어서 드라이버를 제거 하였으나 모두 제거되지 않고 찌꺼기가 남음
2. /usr/lib/nvidia 폴더에 nvidia-415 등의 폴더가 남아있음...
해결:
1. 우선 관련 폴더를 모두 삭제함... (/usr/lib/nvidia-415 등..)
2. nvidia driver를 재설치 함
3. nvidia-smi 를 실행 했을 때
Failed to initialize NVML: Driver/library version mismatch
오류 발생
https://medium.com/@jjeaby/nvml-driver-library-version-mismatch-%EB%AC%B8%EC%A0%9C-%ED%95%B4%EA%B2%B0-e84047a30a8c
링크에서 설명된 대로 수행
4. CUDA 드라이버 재설치
다시 https://medium.com/@jjeaby/nvml-driver-library-version-mismatch-%EB%AC%B8%EC%A0%9C-%ED%95%B4%EA%B2%B0-e84047a30a8c
링크에서 설명된 대로 수행
5. nvidia-smi 실행 시 문제 없음
python에서 import tensorflow as tf 도 문제 없음
https://hwiyong.tistory.com/233

댓글 없음:
댓글 쓰기