Xeon PhiはGPUより速いとの主張にNVIDIAが真っ向から反論・・・最適化が重要
ちょっと前の記事で、気にはなっていたがずっと読みそびれていた。そして、今日読んで思ったことである。
結局どんなに最新のプロセッサでも、ソフトウェアプラットフォームが最新アーキテクチャに最適化されていないと、最大性能は発揮できないということだ。昔のように、古い資産でも徐々に性能が上がる時代はもうとうに終わっている訳だ。
<ハードを活かすも殺すもソフトウェア次第>
12年ぐらい前までは、クロック至上主義がまだ残っていたため、ソフトウェア性能の向上はプロセッサの進化とほぼ遂になっていた。要は、クロック周波数が上がれば、ソフトウェアの性能も上がる。30%上がれば、30%性能も上がった時代である。
しかし、クロック周波数は3.8GHz辺りを境に上がらなくなった。Tejsコアのキャンセルは、その頃に起きた。当初6GHzから10GHzを目指すとされたNetBurst microarchitectureが終焉を迎えるきっかけとなったのは、90nmプロセスでリーク電流を抑制できない事態に入ってからである。
その後は、Coreシリーズへと舵を切る。この頃まではクロックを追わないAMDも強かった。Intelが軌道修正を進める中で、今度はAPU戦略とクラスターコア戦略でAMDは失策をしてしまうが、それはまた別の話である。
ちなみに、ソフトウェアがハードに対応する時代に入ったのは、インテルがMMX Technologyを発表した頃である。96年から97年(製品が市場に登場)に掛けて登場したこれは、x86にSIMD命令セットを追加し、ソフトウェアの一部処理を、高速にそして、単純に実行する仕組みを備えた。ただし、これを使うにはソフトウェアが新命令に最適化されていなければならなかった。その後、AMDとIntelはSIMDのレベルを深化させ、浮動小数点演算に対応する3D Now!やStreaming SIMD Extensions(SSE)などを相次いで投入した。
今では、その技術はAVXに拡張され、これがブランドの違いと性能を押し上げるステータスとなっている。
このソフトウェアの最適化が必須になるきっかけは、Intelが最初にもたらし、AMDが強化し、再びインテルがSMT(HTT)において強化した。今では、AES-NIや、GPGPU、VT関連の仮想処理まで、ソフトウェアの対応がなければ機能しない。CPUがソフトウェアをリードする時代から、まさにソフトウェアがCPUに対応する時代へとシフトした。
<マイクロソフトが強気になれる理由もこれ>
マイクロソフトがWindows10のみをサポートしていく理由もまさにここにあると言われる。今では、プロセッサを活かすも殺すも、ソフトウェア側の対応が全てである。そのため、OSが対応しない限り、ハードウェアも使えない。使えたとしても、十分な性能は発揮できない。
そういう時代になった。その結果、ベンチマークテストも結局は最適化のレベルがどこまで進んでいるかで、評価が変わるようになった。
A社のテストは、X社に強く、B社のテストはI社に対して、有利になるという露骨な差が出ることもあるほどに・・・そう考えると、もうソフトウェアがどこまでハードと密接に連携できる性能を持っているかが全てになりつつあると言えよう。
そう考えてみると、Xeon PhiはGPUより速いのか?それとも、nVIDIAの製品が高速なのか?とても面白いネタだと考える。個人的には、Caffe AlexeNetの製品が18ヶ月も前の製品であるから、今は速いという場合、18ヶ月前にIntelのXeon Phiの最適化が終わっていたのかどうかが気になる。
もしもそうでなく、これから最適化が行われるか、その予定がない製品をテストに使ったなら、なかなか評価は難しいだろう。AVX-512が使えるXeon Phiだけにもし最適化が出来ていないとしたら、数字は変わりそうな気もする。
結局どんなに最新のプロセッサでも、ソフトウェアプラットフォームが最新アーキテクチャに最適化されていないと、最大性能は発揮できないということだ。昔のように、古い資産でも徐々に性能が上がる時代はもうとうに終わっている訳だ。
<ハードを活かすも殺すもソフトウェア次第>
12年ぐらい前までは、クロック至上主義がまだ残っていたため、ソフトウェア性能の向上はプロセッサの進化とほぼ遂になっていた。要は、クロック周波数が上がれば、ソフトウェアの性能も上がる。30%上がれば、30%性能も上がった時代である。
しかし、クロック周波数は3.8GHz辺りを境に上がらなくなった。Tejsコアのキャンセルは、その頃に起きた。当初6GHzから10GHzを目指すとされたNetBurst microarchitectureが終焉を迎えるきっかけとなったのは、90nmプロセスでリーク電流を抑制できない事態に入ってからである。
その後は、Coreシリーズへと舵を切る。この頃まではクロックを追わないAMDも強かった。Intelが軌道修正を進める中で、今度はAPU戦略とクラスターコア戦略でAMDは失策をしてしまうが、それはまた別の話である。
ちなみに、ソフトウェアがハードに対応する時代に入ったのは、インテルがMMX Technologyを発表した頃である。96年から97年(製品が市場に登場)に掛けて登場したこれは、x86にSIMD命令セットを追加し、ソフトウェアの一部処理を、高速にそして、単純に実行する仕組みを備えた。ただし、これを使うにはソフトウェアが新命令に最適化されていなければならなかった。その後、AMDとIntelはSIMDのレベルを深化させ、浮動小数点演算に対応する3D Now!やStreaming SIMD Extensions(SSE)などを相次いで投入した。
今では、その技術はAVXに拡張され、これがブランドの違いと性能を押し上げるステータスとなっている。
このソフトウェアの最適化が必須になるきっかけは、Intelが最初にもたらし、AMDが強化し、再びインテルがSMT(HTT)において強化した。今では、AES-NIや、GPGPU、VT関連の仮想処理まで、ソフトウェアの対応がなければ機能しない。CPUがソフトウェアをリードする時代から、まさにソフトウェアがCPUに対応する時代へとシフトした。
<マイクロソフトが強気になれる理由もこれ>
マイクロソフトがWindows10のみをサポートしていく理由もまさにここにあると言われる。今では、プロセッサを活かすも殺すも、ソフトウェア側の対応が全てである。そのため、OSが対応しない限り、ハードウェアも使えない。使えたとしても、十分な性能は発揮できない。
そういう時代になった。その結果、ベンチマークテストも結局は最適化のレベルがどこまで進んでいるかで、評価が変わるようになった。
A社のテストは、X社に強く、B社のテストはI社に対して、有利になるという露骨な差が出ることもあるほどに・・・そう考えると、もうソフトウェアがどこまでハードと密接に連携できる性能を持っているかが全てになりつつあると言えよう。
そう考えてみると、Xeon PhiはGPUより速いのか?それとも、nVIDIAの製品が高速なのか?とても面白いネタだと考える。個人的には、Caffe AlexeNetの製品が18ヶ月も前の製品であるから、今は速いという場合、18ヶ月前にIntelのXeon Phiの最適化が終わっていたのかどうかが気になる。
もしもそうでなく、これから最適化が行われるか、その予定がない製品をテストに使ったなら、なかなか評価は難しいだろう。AVX-512が使えるXeon Phiだけにもし最適化が出来ていないとしたら、数字は変わりそうな気もする。
この記事へのコメント