TuringアーキテクチャのGPUが発表されました

NVIDIAが新しいGPUシリーズ、Turingシリーズを発表しました。

弊社にあるGPU、GeForce 1080TiはPascalアーキテクチャ、Tesla V100はVoltaアーキテクチャです。

VoltaもTuringもPascalの進化系ではあるのですが、VoltaはGPGPUなどのコンピューティング系、Turingはグラフィックス系です。

GPUの使われ方が二極化してきたので設計を分けたのでしょうか。

まずは性能を比較してみましょう

とりあえず、CPUメーカーの長たるIntelの最上位モデルとNVIDIAのゲーム向け、サーバー向けの現行最上位モデル、そしてTuringのゲーム向け最高峰の浮動小数点演算能力を比較してみましょう。

 Xeon Platinum 8180GeForce GTX 1080TiTesla V100GeForce RTX 2080Ti
倍精度(64bit)1.12 TFLOPS0.33TFLOPS6.38TFLOPS0.37TFLOPS
単精度(32bit)2.24 TFLOPS10.61TFLOPS12.75TFLOPS11.75TFLOPS
半精度(16bit)2.24 TFLOPS10.61TFLOPS25.5TFLOPS11.75TFLOPS
消費電力205W250W250W250W
お値段$10009$699$8000~$9000$999

* Turingは未発売のGPUであるため、実際のスペックは異なる可能性があります。
* 定格の能力で比較しています。実際には温度等の環境によって性能が上下します。

これだけを見ると、10~20%しか性能が向上していないのに、しれっと価格は40%増しになっています。

これしか違いがないかというと、さすがにそんな馬鹿なことはなくて、追加の機能としてレイトレーシング向けのRTコアとTensorコアの搭載があります。

逆に、この2つの新機能が必要ないのであれば、発売から時間もたって価格も手ごろなPascal系のGPUを買うのが正解ではないかと思います。

Tensorコアとは?

Tensor:テンソル、とは何でしょうか?Wikipedia先生に聞いてみたところ、

テンソル: tensor, : Tensor)とは、線形的なまたは線形的な幾何概念を一般化したもので、基底を選べば、多次元の配列として表現できるようなものである。

全くをもって意味不明ですね。

要は行列なんですが、行列演算は機械学習の学習/推論の両方で多用されます。

そこで、普通に演算器を大量に積むのではなく、行列演算用のアクセラレータを用意した、そのアクセラレータがTensorコアという感じです。

実はTensorコア自体はVoltaにも入っています。VoltaとTuringのTensorコアを比較してみます。

 Tesla V100GeForce RTX 2080Ti
半精度(16bit)101.99T Tensor FLOPS99.53T Tensor FLOPS
消費電力250W250W
お値段$8000~$9000$999

* Turingは未発売のGPUであるため、実際のスペックは異なる可能性があります。
* 定格の能力で比較しています。実際には温度等の環境によって性能が上下します。

何故半精度だけで比較しているかというと、どうもVoltaのTensorコアは学習よりで、TuringのTensorコアは推論寄りっぽいので、どちらでも使うFP16しか被らないっぽいのです。

自信がなくてすいません、間違っていたら弊社お問い合わせフォームよりご指摘くださいませ。

比較してみて

エンタープライズとゲーム向けという差はあれど、Turingのゲーム向けGPUの圧倒的なコスパの良さが光ります。

残念ながら利用規約によりデータセンターでは使えないものの、データセンター以外で使うならTuringでいいんじゃないかな。。。

単精度演算はVoltaのみのサポートのようですが、機械学習の学習もFP16でやってもそこまで問題があるわけではないですし・・・。

RTコアについて

一応紹介したので、今回初登場のRTコアについてご説明します。

RTコアとは一言で言うと「レイトレーシングアクセラレーター」です。

Nvidiaのデモを見ていただけるとよくわかると思うのですが、今まで難しかった光の反射のリアルタイム描画を可能にする光線処理のアクセラレーターになります。

機械学習に興味がなくても、これだけでも買い替える価値があるやもしれませんし、逆にこの機能にも興味がないとなると、大して性能が違わないので前世代のGeForceでもいいかもしれません。