티스토리 뷰
* host 환경 셋업
- Driver version: 440.36, CUDA version 10.0, cuDNN version 7.6.4
- 설치 후 $nvidia-smi, $cat /usr/include/cudnn.h | grep -E "CUDNN_MAJOR|CUDNN_MINOR|CUDNN_PATCHLEVEL", $nvcc --version으로 올바르게 세팅되었는지 확인 후 NVIDIA docker 설치로 진행
* docker 설치(systemctl status를 통해 정상 설치되었는지 확인 가능)
$ sudo apt install docker-ce
$ sudo systemctl status docker
도커 설치 안내서 : https://docs.docker.com/install/linux/docker-ce/ubuntu/
ctrl+c로 돌아 올것.
* Add the package repositories for nvidia-docker
(Anaconda가 셋업되어 있을 경우 gpgkey 추가가 되지 않으므로 삭제)
rm -rf ~/anaconda3
$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
$ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
$ sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
$ sudo systemctl restart docker
* NVIDIA docker 설치 후 현재 유저에게 권한부여
$ sudo apt-get install nvidia-docker
$ sudo usermod -a -G docker $USER
$ sudo reboot
* nvidia-docker 정상작동 test
$ docker run --gpus all nvidia/cuda:10.0-base nvidia-smi
$ docker run --gpus 2 nvidia/cuda:10.0-base nvidia-smi
도커 Tensorflow 안내 : https://www.tensorflow.org/install/docker
* tensorflow-gpu 1.15 도커 이미지 pull
$ docker pull tensorflow/tensorflow:1.15.2-gpu-py3
$ docker images
* tensorflow-gpu 1.15 컨테이너 생성 (gpus 옵션이 부여되어야 GPU 사용가능)
$ nvidia-docker run -it \
-p 8891:8888 -p 6006:6006 \
--name DIVUS-Dubai-TF115 \
--gpus '"device=0,1"' \
-v /home/DIVUS_ailab/docker/dubai:/notebooks \
--restart always \
tensorflow/tensorflow:1.15.2-gpu-py3