Windows 10にCUDA 8.0 RCとChainerをインストール

Windows10でCUDAとChainerをインストールしたので、その時の設定などをメモしておく。

環境

インストールしたOS、ビデオカードは以下の通り。

  • Windows 10 64bit
  • GeForce GTX 1060

インストールしたソフトウェア

  • Visual Studio Community 2015 with Update 1
  • CUDA Toolkit 8.0 RC (8.0.27)
  • Anaconda3 4.1.1 (Python 3.5)
  • Chainer 1.13.0

Visual Studio Community 2015 with Update 1のインストール

CUDA 8.0.27はVS2015 Update 3に対応していないらしく、CUDA Samplesがビルドできなかったので、Update 1をインストールした。ビルドエラーによるとCUDA SamplesがUpdate 2以上に対応していないらしい。

以下のVisual Studio Community 2015のISOファイルからCustomでインストールして、Update 3のチェックははずしておく。

http://download.microsoft.com/download/4/C/1/4C113E0D-8590-47AB-B7B8-E41E0AD7936D/vs2015.1.vsu.iso

CUDA Toolkit 8.0 RCのインストール

以下のURLからWindows 10用のCUDA Toolkit 8.0 RCをダウンロードする。

https://developer.nvidia.com/cuda-toolkit

Geforce GTX 1060はまだサポートされていないらしく、インストール時に警告が出るがそのままインストールを続行する。別途最新のドライバをインストールしておいたので、ドライバのインストールはチェックをはずしておいた。

cuDNN v5のインストール

以下のURLからCUDA 8.0RC用のcuDNNをダウンロードする。

https://developer.nvidia.com/cudnn

自分がインストールしたときはv5が最新だったが、先ほど確認したらv5.1も出ていた。

展開したらできたcudaフォルダを以下の場所にコピー。

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0

Anaconda3 4.1.1 (Python 3.5)のインストール

以下のURLからPython 3.5のAnaconda3 64bit用をダウンロードしてインストールする。

https://www.continuum.io/downloads#_windows

Chainer 1.13.0のインストール

Chainerをインストールする前に、環境変数を設定する。pipでインストールするさいに、コンパイラが必要になるので、環境変数PATHに以下のパスを追加する。

C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\bin

環境変数INCLUDEに以下のパスを追加する。

C:\Program Files (x86)\Windows Kits\10\Include\10.0.10240.0\ucrt

追加しないと、chainerからgpuを使用したときにcorecrt.hが見つからなくてエラーになる。C:\Program Files (x86)\Windows Kits\10\Includeの中にいくつかのバージョンがあるみたいなので一番新しそうなのを指定しておいた。

コマンドプロンプトからpipでchainerをインストールする。

pip install chainer

動作確認

chainerのMNISTのサンプルでGPUとCPUで動作確認してみた。コマンドプロンプトでエスケープが効かないらしく表示が乱れるがGPUありなしともに動作には問題なさそうだった。

実行時のログから、GPU(GTX 1060)の場合は161.74 iters/secで、CPU(Core i5 6600)の場合は21.541 iters/secだったので、GPUがCPUと比較して約7.5倍の計算速度だったことになる。

まとめ

これでWindows 10上でDeep Learningを実行できる環境が構築できたので、まずはいろいろなサンプルを動かしてみたいと思う。また、他のDeep Learning用のライブラリもWindows 10で動きそうなものがあれば試してみたいと思う。

Deep Learning用にGeForce GTX 1060を購入

前々から自宅に趣味用のDeep Learning学習環境を構築したかったので、ついにGeForce GTX 1060を買いました。Deep Learningというと、TeslaとかTITANだと思いますが、個人用には高くてなかなか手が出ません。GeForce GTX 1060なら35000円ぐらいで買えました。

GPUのスペックを比較するとこんな感じ。

GeForce GTX 1060 (PCIe) Tesla P100 (PCIe)
GPU Pascal Pascal GP100
FP32 CUDA Cores 1280 3584
ベースクロック 1506 MHz 1162 MHz
ブーストクロック 1708 MHz 1303 MHz
FP32 TFLOPs 3.8 TFLOPS 9.3 TFLOPS
メモリーバンド幅 192 GB/s 540 GB/s (12GB)
720 GB/s (16GB)
メモリ 6 GB 12 GB or 16 GB
TDP 120 W 250 W

Deep Learningとは関係ないけど、グラフィックカードを買ったらとりあえずベンチマークということで、3DMarkをやってみました。

3DMark GTX 1060
3DMark Result (GeForce GTX 1060)

上位には化け物のようなスコアがたくさんありますが、掛けたお金からしたらこんなもんでしょう。

次回はCUDA Toolkit、Python、Chainerなどをインストールして実際にDeep Learningのサンプルなどを動かしてみたいと思います。