티스토리 뷰

•아래의 모든 설치는 반드시 관리자 계정에서 수행할것!

• apt로 설치하는 경우는 원하지 않는 dependecies까지 딸려서 설치되므로 설치 파일을 다운받아 '직접' 세팅하는 것을 권장

 

1. 드라이버 셋업 순서

   - 우분투 버전 확인 : $ cat /proc/driver/nvidia/version 또는 nvidia-smi

   - 기존 설치된 드라이버 및 기타 dependencies가 있는 경우 클린 설치를 위해 모든 드라이버 언로드

   - $lsmod | grep nvidia 로 현재 로드된 엔비디아 커널 확인

   - 로딩된 엔비디아 커널들을 언로드

 

sudo rmmod nvidia_drm 

sudo rmmod nvidia_modeset 

sudo rmmod nvidia_uvm 

sudo rmmod nvidia

 

 rmmod: ERROR: Module nvidia is in use 메시지가 나타난 경우 $sudo lsof /dev/nvidia*로 프로세스를 kill 
                      (대개 도커때문에 발생)

 

2. 이전에 설치된 그래픽 드라이버 삭제 : $sudo apt-get remove nvidia* && sudo apt-get autoremove 

(또는 $sudo apt-get purge nvidia-\*, $sudo apt-get purge 'nvidia-*' 권장) 

3. Nouveau 정지 : $ echo options nouveau modeset=04

4. Lightdm 정지 : $ sudo service lightdm stop

5. 버전에 맞는 드라이버 다운로드 :

         i. 설치 파일로 직접 설치할 경우(권장) : 

            1)(ex)440.46버전다운로드링크: http://us.download.nvidia.com/XFree86/Linux-x86_64/440.44/NVIDIA-Linux-x86_64-440.44.run 

(다른 버전, 예컨대 440.36버전을 설치하고 싶은 경우 해당 다운로드 url을 알아낸 후 리눅스에서 wget으로 다운로드) 
          1)wget http://us.download.nvidia.com/XFree86/Linux-x86_64/440.36/NVIDIA-Linux-x86_64-440.36.run

     1-1) 파일을 윈도우에서 다운로드후 직접 우분투안으로도 넣어줘도 된다(winscp이나 filezilla를 쓰는것이 좋다)

     (wget이 설치안되어 있는 경우로 에러가 발생할수 있는데, 설치후에 작업을 할것) 

     2) 다운로드 받은 후 $chmod 755 Linux-x86_64/440.36/NVIDIA-Linux-x86_64-440.36.run로 실행권한 부여

      (chmod로 권한을 주는것이다 755나 777로 많이 줌)

     3) 슈퍼계정에서 .run 파일 실행

       $sudo su

       $sh NVIDIA-Linux-x86_64-440.36.run

   4) $sudo apt-get install dkms nvidia-modprobe 패키지 추가

     

ii. apt-get으로 안전한 정식 릴리즈 버전을 설치할 경우 (원치 않는 dependency까지 딸려 오므로 권장하지 않음.)

  1)$apt-cache search nvidia로 설치 가능한 드라이버 리스트 확인 후 install 

 

7. apt-get install nvidia-container-runtime으로도커 런타임 설치

8. 상황에 따라 도커 run, start, exec 수행

   i. 기존에 실행되었다가 exited상태인 컨테이너 restart : $docker start prj_car_train_test

   ii. 기존이미지로 새로운 컨테이너를 run하고 싶은 경우 : 

      $docker run <옵션> <이미지 이름><컨테이너이름지정> <실행할 파일> 
        (e.g. $docker run -i -t --name car_train_test6e469a23a5a8/bin/bash) 

  iii. 실행 중인 컨테이너에 접속 : $docker exec -it prj_car_train_test /bin/bash

  iv. $CUDA_VISIBLE_DEVICES=0,1 ./carTrain.sh 0,1로 GPU 0번과 1번 2대로 학습 시작 (1대만 사용할 경우 ./carTrain.sh뒤의 인자를 GPU 번호로 할당

 

 

CUDA 설치 참고 : https://hiseon.me/linux/ubuntu/cuda-install/

 

CUDA 10.0 버전 path  참고 : https://jangjy.tistory.com/195

 

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함