티스토리 뷰
•아래의 모든 설치는 반드시 관리자 계정에서 수행할것!
• apt로 설치하는 경우는 원하지 않는 dependecies까지 딸려서 설치되므로 설치 파일을 다운받아 '직접' 세팅하는 것을 권장
1. 드라이버 셋업 순서
- 우분투 버전 확인 : $ cat /proc/driver/nvidia/version 또는 nvidia-smi
- 기존 설치된 드라이버 및 기타 dependencies가 있는 경우 클린 설치를 위해 모든 드라이버 언로드
- $lsmod | grep nvidia 로 현재 로드된 엔비디아 커널 확인
- 로딩된 엔비디아 커널들을 언로드
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia
• rmmod: ERROR: Module nvidia is in use 메시지가 나타난 경우 $sudo lsof /dev/nvidia*로 프로세스를 kill
(대개 도커때문에 발생)
2. 이전에 설치된 그래픽 드라이버 삭제 : $sudo apt-get remove nvidia* && sudo apt-get autoremove
(또는 $sudo apt-get purge nvidia-\*, $sudo apt-get purge 'nvidia-*' 권장)
3. Nouveau 정지 : $ echo options nouveau modeset=04
4. Lightdm 정지 : $ sudo service lightdm stop
5. 버전에 맞는 드라이버 다운로드 :
i. 설치 파일로 직접 설치할 경우(권장) :
1)(ex)440.46버전다운로드링크: http://us.download.nvidia.com/XFree86/Linux-x86_64/440.44/NVIDIA-Linux-x86_64-440.44.run
(다른 버전, 예컨대 440.36버전을 설치하고 싶은 경우 해당 다운로드 url을 알아낸 후 리눅스에서 wget으로 다운로드)
1)wget http://us.download.nvidia.com/XFree86/Linux-x86_64/440.36/NVIDIA-Linux-x86_64-440.36.run
1-1) 파일을 윈도우에서 다운로드후 직접 우분투안으로도 넣어줘도 된다(winscp이나 filezilla를 쓰는것이 좋다)
(wget이 설치안되어 있는 경우로 에러가 발생할수 있는데, 설치후에 작업을 할것)
2) 다운로드 받은 후 $chmod 755 Linux-x86_64/440.36/NVIDIA-Linux-x86_64-440.36.run로 실행권한 부여
(chmod로 권한을 주는것이다 755나 777로 많이 줌)
3) 슈퍼계정에서 .run 파일 실행
$sudo su
$sh NVIDIA-Linux-x86_64-440.36.run
4) $sudo apt-get install dkms nvidia-modprobe 패키지 추가
ii. apt-get으로 안전한 정식 릴리즈 버전을 설치할 경우 (원치 않는 dependency까지 딸려 오므로 권장하지 않음.)
1)$apt-cache search nvidia로 설치 가능한 드라이버 리스트 확인 후 install
7. apt-get install nvidia-container-runtime으로도커 런타임 설치
8. 상황에 따라 도커 run, start, exec 수행
i. 기존에 실행되었다가 exited상태인 컨테이너 restart : $docker start prj_car_train_test
ii. 기존이미지로 새로운 컨테이너를 run하고 싶은 경우 :
$docker run <옵션> <이미지 이름><컨테이너이름지정> <실행할 파일>
(e.g. $docker run -i -t --name car_train_test6e469a23a5a8/bin/bash)
iii. 실행 중인 컨테이너에 접속 : $docker exec -it prj_car_train_test /bin/bash
iv. $CUDA_VISIBLE_DEVICES=0,1 ./carTrain.sh 0,1로 GPU 0번과 1번 2대로 학습 시작 (1대만 사용할 경우 ./carTrain.sh뒤의 인자를 GPU 번호로 할당
CUDA 설치 참고 : https://hiseon.me/linux/ubuntu/cuda-install/
CUDA 10.0 버전 path 참고 : https://jangjy.tistory.com/195