AmazonのAWSプロセッサーGraviton 2の性能は、Intel XeonやAMD EYPCの55~70%の実性能か!?~プロセッサー専業メーカーを揺さぶるIT大手~
ITmediaの一昨日の記事である。
Graviton(グラビトン:日本語では重力子という意味)はECビジネス大手のAmazonが開発しているサーバー向けのプロセッサーである。昨年最初の世代Gravitonが発表され大いに市場から注目され、Intelの市場支配が揺らぐのではと言われたが、実際に蓋を開けてみると、Intelはサーバー事業ではダメージを受けるどころかAMDと共に成長しているという状況にある。
逆にソフトバンクグループ率いるArm HoldingsはスマホやIoT市場の飽和に従い業績の伸びが鈍化している。これは、ソフトバンクグループが買収する頃から予想されていたことだが、Armの難しい点は、設計の大元は全てArmにしかないという点である。だから、全て総取りでライセンスから利益を得られるという利点があるように見えるが、逆に言えばArmの設計方針に一度狂いが生じると、ライバル2社が切磋琢磨して設計しているx86に引き離される危険がある。
そんな中でIntelはArmの省電力に挑戦すべくTremontコアとLakefieldの出荷準備を始めており、もしこれが来年潤沢に投入され、電力パフォーマンスがIntelがこれまでのAtomで培ったものと遜色ないかそれ以上のものなら、Armは厳しい状況に陥るかも知れない。
そんな、x86反抗前夜とも言える時期に出てきたのが、Graviton 2である。
Graviton 2のコアアーキテクチャは前の世代と同じArmのNeoverse N1 Hyperscale Processor(大規模なデータセンター、リレーショナルデータベースや仮想リソース向けとして作られたプロセッサー)であるようだ。ちなみに、Neoverse N1のリファレンスはCortex世代だとA72相当のベース技術を採用している。
それをカスタマイズしたものだ。セカンドキャッシュが1MB/Core(最初の世代は512KB、4コア2MB×4クラスターの16コア/8MB)となり64コアで64MB(クラスタが4コアなら4MB×16クラスタ)になったようだ。また、L3(三次キャッシュ/ラストレベルキャッシュ相当)が32MB(vCPU64コア共用)となり、2TB/sのバス幅(今回も前回と同じクラスタによるMCMコアと思われるのでL3の上に調停回路があるのだろうと思われる。そのため、バスボトルネックがあるのだろう)で接続されているようだ。
ちなみに、ファーストキャッシュ(L1)は、たぶん変わっていないと思われる。
L1D(データ)が32KB/Core
L1I(命令)が48KB/Core
だろう。
メモリーホストは、DDR4-3200×8chであると、以下のanandtechの記事などに書かれている。
尚、Amazonは現時点で全てのサーバープロセッサーをIntelからAmazonに置き換えているわけではないようだ。最終的に全て置き換えていけると考えて居るのかは、まだ分からない。比率は下げるかもしれないが、最終的に全部という方向で考えるかどうかは今後もう少し掛かるだろう。
それは、Armプロセッサーの特性が関係していると思われる。
<カスタマイズが容易なArm、高速で信頼性が高いx86>
このプロセッサーもそうだが、Armのプロセッサーは最新のCortex-A76(77はまだ数量が少ないので)でさえも、1コアとして見た時の純粋な性能は、同じクロックのx86より低い傾向がある。これは、x86がCISCベースの命令をRISC風に処理する仕組みで強化してきたことが影響しているのだろう。
CISCベースだと命令の処理解釈が複雑な分、1度のパスで処理出来る内容は多くなる。その分標準での電力消費が大きい。これをIntel(やAMD)は徐々に減らしてはいるが、Armの最小電力製品に追いつくことはまずないだろう。あくまで、実行性能比であれば、追いつける用途が増えるという程度だ。
一方で、Armはシンプルな命令構造をArm architecture発展の中で、増築してきたスタイルだ。だから、電力では一日の長がある。その分、性能がトレードオフとして存在した。だから、PCやサーバーでは弱かったわけだ。
そこで、命令を拡大させていくことにした。しかし、拡大させると徐々に使う電力は増えていく。だから、現在性能を上げるために、目的ごとによく使う命令を各社に最適化させて搭載させている段階にあると思われる。
GravitonやGraviton 2はまさに、それをよく示しているように見える。AES256、SHA-1、SHA-256、CRC-32などのアクセラレーション性能を強化し、ディープラーニングやセキュリティなどにおける必須要件を強化しているからだ。x86はIntelもAMDも基本的にオールラウンダーで、全てに高速であることを売りにしているが、Amazonのそれはあくまで、Amazonでよく使う処理に最適なものとなる。
このように考えると、今のところは全部の置き換えは難しいだろう。
まあ、将来的には分からない。ただ、将来的にその目処が立つほどなら、たぶん今回もサポートしていないであろうNUMA(Non-Uniform Memory Access)への対応も図られる可能性が高く、もっと広く外に売ってもいけるような汎用性能高い製品を出すだろう。
ちなみに、タイトルにも書いたように、この製品のプロセッサー性能は概ねXeonの5割強~7割ぐらいだと思われる。
即ち、コアあたりの性能はまだ大きく負けているということだ。
ただ、この手の大型サーバーの場合は、リソースの100%を使い切ることがまずない。だいたい3割(初期稼働時)~7割(末期)の性能で動くようにリソースノードを計算して設計する。いわゆるHPCではないデータセンターやECサーバーが8割を超えて稼働するようになれば、応答遅延や応答不能に陥る恐れがあるからだ。そのように考えると、Amazonがこれを自社で開発して採用していくことは、理に適っており、MicrosoftやGoogleも同様に進むのは当然と言える。
まあ、ARMが本当に好ましいのかはまだ分からないが、Googleなどはライセンスフリーの市場での研究や費用投入を始めているのは、プログラミング環境さえあるなら、Armにライセンス料を払うこと自体が既に煩わしいからだろう。nVIDIAがアクセラレーター事業(GPU)で成功してきたのは、まさにそこだが、IT大手のArmへの移行はあくまでその一つの架け橋みたないなもので、Armに簡単に移行できた部分は、オープンにも早い段階で移行できる可能性を持つのだろう。このあたりは、時代の変化や景気で大きく方向性が変わることもあるので、予測はしにくいが、すぐにIntelが弱るとかそういう流れでも無く、Armが勝者として今後も大きく伸びるとも言い難い。可能性はあるが、数量ベースで考えると今のArmが全てを取ることはないだろう。
<専業メーカーを揺さぶるIT企業>
Amazonの内部でこれが採用され始め、本当に効率などが上がっているのかというと、実際には分からない。それは、あくまで内部の話であり、外に向けて売り出して沢山売れたとかそういう話ではないからだ。どれほどの台数が入っていたとしても、インドアの設備内で従業員だけが知っていることなら、1000台自社のサーバーを入れても、1万台他社サーバーを入れれば、実質リプレースは新規全体の10%未満に過ぎないからだ。
これに上記を重ねると、Amazonに限ったことでは無いが、大手のITソフトウェアやサービスメーカーがやっているのは、ハード専業メーカーを揺さぶって、自分達の利益率がより上がるものを得ようとしているのだろう。簡単に言えば、普通ならソフトウェアやサービスメーカーはそれ以上(自分がやっているビジネスに計上する以上)のビジネスにお金を出す予算などないはずだが、その元々やっていたビジネスがそろそろ頭打ちで、今はコスト削減や、さらに手を広げられるビジネスを探している状況なのだと、示しているのだろう。
そこで、出てきたのが自社が持つクラウドに対して自社の部品を使うことだった。これを開発して、研究し上手く行けば最終的にそれ自体を自社以外にも本格的に売り込むことで、裾野を広げるか、またはそれが上手く行かなくても専業メーカーを揺さぶることで、優位な販売条件を手に入れることが出来る可能性がある。
少なくともAmazonは今それを試しているようにも見える。これが、果たしてAmazonブランドのサーバーを世界に売り出すような時代を呼び寄せるか?
それとも、結果的にLenovoやIBM、HP Enterpriseのような企業のサーバーを安く入手するだけに留まるのか?
それは、今後Graviton 3、4と世代が重なっていき、最終的にXeonなどより遙かに優れていると、市場が認めるか(簡単に言えばAmazon以外に外販されるか)どうかに掛かっている。
この記事へのコメント