한국 시간으로 2016년 11월 29일 저녁 아래 실험은 핵심 변경 사항 중 여러 방법이 있으나 필자는 Window TensorFlow는 모든 작업을 anaconda만 설치하면 환경변수등 자동으로 설정 되므로 다운로드: https://www.continuum.io/downloads 다운로드 https://developer.nvidia.com/cuda-downloads 필자의 Window환경 컴퓨터의 GPU 스팩이다. Deep Learning을 위해서 엔비디아에서 제공하는 추가 라이브러리 꾸러미이다. 다운받으면 그냥 압축 파일이므로 압축해제후 CUDA 설치 경로에 붙여넣기 해야한다. 윈도우 버전은 파이썬 3.5 에서 하다. 처음 설치 업데이트 방법 (추후에 새로운 버전이 나왔을 때) 최근에 설치확인 Jupyter Notebook에서의 실행결과 간단한 MNIST 셋의 CNN을 이용한 손글씨 인식을 학습해 본다. 자세한 코드는 이전 POST를 참조한다. 소스코드 위치: https://github.com/leejaymin/TensorFlowLecture/tree/master/5.CNN CNN으로 평가한 컴퓨터 환경들은 아래와 같다. 실험 예정윈도우 GPU tensorflow 설치 및 그래픽카드별 성능 비교
TensorFlow v0.12.0 RC0
가 업데이트 되었다.TF 1.4.0
에서 테스트 한것이다.
현재는 1.6
까지 나온듯 하다 (2018-03.27).Window
에서 GPU 버전의 TensorFlow
를 지원한다는 부분이 있다.
이제 Docker
를 쓰지 않고 CPU 버전을 설치 할 수 있는것은 물론 Ubuntu
에서만 가능하던 GPU 버전도 설치가 가능하다.
설치방법과 Window GPU
버전 텐서플로의 학습 속도를 분석해 본다.설치방법
Anaconda
를 이용한 방법으로 설치한다. 가장 간단한다. 추가로 딱히 Window에선 Python 다른 응용을 개발하지 않으므로 특별히 conda
또는 virtualenv
를 설정하지않고 global
에 직접 설치한다. 기존 시스템과의 충돌을 걱정한다면 가상환경을 만들고 설치하길 권장한다.
방법: https://www.tensorflow.org/versions/r0.12/get_started/os_setup.html#pip-installation-on-windows1. Anaconda 4.2.0 설치
NumPy
, SciPy
, Pandas
, Matplotlib
등의 과학연산에 필요한 Python package들을 통합했으며 Jupyter Notebook
을 제공하는 환경이다.Python 3.5
이상부터 동작하므로 해당 Anaconda
를 관리자 권한
으로 설치한다.pip
명령어를 이용해서 하나하나 설치하는것 보다 훨씬 효율적이다.2. CUDA 8.0.44 -win 10 설치
Tensorflow v0.12.0 RC0
는 CUDA 8.0이상을 권장하므로 이것을 설치한다.Network
버전은 설치가 오래걸리므로 local
버전 1.2GB 상당을 직접 다운받아서 설치한다.name: GeForce GTX 745
major: 5 minor: 0 memoryClockRate (GHz) 1.0325
3. CuDNN 5.1 설치
다운로드: https://developer.nvidia.com/cudnnCUDA 8.0
은 cuDNN 5.1
을 설치해야한다.
회원 가입을 하고 다운 받는다.
CUDA 설치 경로 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
4. TensorFlow-GPU 설치
0.12 RC0 버전 부터는 텐서플로우 패키지가 PyPI 에 업로드되어 있어 pip 명령으로 간단히 설치할 수 있게 되었다.pip install tensorflow-gpu
pip install --upgrade https://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-0.12.0rc1-cp35-cp35m-win_amd64.whl
RC0
에서 RC1
로 업데이트 되었다. 기존 RC0
사용자라면 버그가 고쳐진 새로운 버전으로 업데이트 할 때 위 명령어를 이용 한다.
Anaconda prompt를 관리자 권한으로 실행한다.
python을 실행하고 아래의 script를 실행해 본다.>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))
Hello, TensorFlow!
Anaconda
를 설치하면 자동으로 Jupyter Notebook
이 설치된다.Jupyter Notebook
을 실행해서 아래의 코드를 실행해보자.
정상적으로 수행되면 설치 성공이다.성능 테스트
CNN
구조는 아래와 같다.
해당 repo를 clone해서 그 안에 CNNforMNIST.py
를 실행 한다.
실행이 끝나면 경과된 시간이 출력 된다.10 GFLOPS
793 GFLOPS
, 메모리:4096 MB
상세스팩: https://www.techpowerup.com/gpudb/2561/geforce-gtx-745-oem2448 GFLOPS x2
3.5 TFLOPS
3.9 TFLOPS
보스몬스터 DX3 6708KSW
컴퓨터에서 수행한 것이다.i7, 10 GFLOPS
105분 31초
GTX 745, 793 GFLOPS
36분 30초
K520, 2448*2 GFLOPS
22분 4초
GTX 970, 3.4 TFLOPS
9분 10초
GTX 1060 3GB, 3.9TFLOPS
8분 5초
GTX 1080, 8.87 TFLOPS
5분 27초
Tesla P100, 9.3 TFlops
4분 57초
Tesla P100, 9.3 TFlops (8개)
RTX 2080ti, 13.4 TFLOPS
`4분 6초``결론
I7-CPU
(6331초)를 기준으로 비교했을 때 각각의 성능 향상은 아래와 같다.2.89x
4.78x
11.5x
13x
19.3x
21.3x
25.7x
'AI > TensorFlow, PyTorch, Keras, Scikit' 카테고리의 다른 글
20.04 우분투기반 NVIDIA GeForce RTX 3090에 CUDA, cuDNN Pytorch 설치 (1) | 2020.12.16 |
---|---|
TensorFlow GPU (RTX 2080ti)버전 우분투 18.04 설치 하기 (1) | 2019.05.03 |
Jupyter에 conda env. 추가하기 (0) | 2018.08.05 |
TensorFlow를 공용 GPU에서 사용 할 때 메모리 절약 방법 (0) | 2018.08.02 |
TensorFlow GPU 버전 우분투 16.04에 설치 하기 (10) | 2018.07.31 |