2019년 12월 18일 수요일

[ubuntu] Ubuntu 무한 로그인 오류

* 워크스테이션 위치를 이동하기 위해 워크스테이션 종료 후 재부팅시 무한로그인 문제 발생
* ctrl+alt+f1~f6 중 아무거나를 누르면 터미널 화면 (tty) 으로 바뀌고 터미널 상에서는 로그인 되며 다른 컴퓨터를 이용하여 워크스테이션으로 접속도 가능 함
* 하지만 GPU를 이용하는 연산이 수행되지 않음...
* 로그인 후 nvidia-smi 실행시

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

라는 에러 메시지 나옴

(참고로 터미널 모드 종료하려면 ctrl+alt+f7 을 누르면 됨)


문제: 

* GUI상에서는 어떤 계정으로 로그인을 시도해도 다시 로그인 화면만 나오며 터미널을 이용해 로그인 해도 GPU를 전혀 쓸 수 없음
* lightdm 문제이거나 nvidia driver 버전 문제일 가능성이 있음


해결:

1. lightdm을 재설치

ctrl+alt+f1~f6 중 아무거나 눌러서 터미널 화면으로 접속 후 로그인

$ sudo apt-get remove --purge -y lightdm
$ sudo apt-get autoremove --purge -y

디스플레이를 lightdm으로 출력할지 다른 방식으로 할지 선택하라는 화면이 나오기도 함
이 때 lightdm으로 선택

$ sudo apt-get install lightdm -y
$ sudo systemctl start lightdm.service
$ sudo reboot

이렇게 수행하면 되는 경우도 있고 안되는 경우도 있음
내 경우는 이렇게해도 무한로그인 문제가 해결되지 않음


2. Nvidia 드라이버 재설치

ctrl+alt+f1~f6 중 아무거나 눌러서 터미널 화면으로 접속 후 로그인

$ sudo ubuntu-drivers list

실행하면 설치가능한 nvidia driver 목록이 나옴

$ sudo ubuntu-drivers autoinstall
$ sudo systemctl restart lightdm.service
$ sudo reboot

* 위 방법을 통해 문제를 해결
* GUI를 통해 로그인이 잘 되며 nvidia-smi 실행시 GPU가 상태가 잘 보임
* 단, 원래는 nvidia 410 버전이 설치되어있었으나 위 방법을 수행하니 nvidia 440 버전으로 업데이트 되었음
* 현재 Machine learning 코드들은 문제 없이 수행 됨

참조: https://brunch.co.kr/@laviande22/6

댓글 없음:

댓글 쓰기