HUOXIU

グラビトン・イノベーションズ、Amazonクラウドコンピューティングチップのソリューションを発表

生成型AIの波の中で、コンピューティングチップは「ハードカレンシー」となっています。Amazon Web Servicesの「切り札」はクラウドコンピューティングサービスですが、コンピューティングパワーの中核を掌握しようともしています。これが、クラウドコンピューティング企業が「自社開発チップ」の道を進もうとする根本的な理由です。現在、Amazon Web Servicesに牽引され、世界中のクラウドベンダーが追随し、自社開発チップの方向性を模索し始めています。

しかし、チップは孤立した技術ではなく、人間環境と相互依存的な世界を形成しています。『チップ小史』の著者である王波博士が述べたように、チップ開発の歴史はイノベーションの歴史です。私たちはアプリケーションのトレンドを追うとともに、アプリケーションのニーズから新たなブレークスルーを模索し、そこから最適化、あるいは新たなチップを発明していくべきです。

自社開発チップの「パイオニア」として、Amazon Web Servicesはユーザーのニーズを起点に常に卓越性を追求する「職人精神」を核に活動してきました。2013年にNitroチップを発売して市場に参入して以来、2018年には主要クラウドプロバイダーとして初の自社開発ARMチップであるAmazon Gravitonを発売し、現在では実際のワークロードにおける大規模な商用アプリケーションへと発展しています。

ユーザーのニーズに応えて、Amazon Graviton は進化を続けています。

チップが登場してまだ60年しか経っていませんが、ビジネスアプリケーションにおいて限界を押し広げるという課題は常に存在してきました。Amazon Web Services(AWS)には、Amazon EC2(Amazon Elastic Compute Cloudの略)と呼ばれるコンピューティングレベルのコアサービスがあり、クラウドコンピューティングの基盤プラットフォームとして、多くの重要なアプリケーションをホストしています。サービスプラットフォームの進化に伴い、ソフトウェアレベルでのパフォーマンスと柔軟性の最適化は限界に達し、エンジニアリングチームはハードウェアの最適化に重点を移し始めました。より正確に言えば、チップはクラウドコンピューティングエクスペリエンスの向上における大きなボトルネックとなっており、市場に出回っている多くの汎用チップはAWSのカスタマイズされたニーズを満たすことができません。

2013年から、Amazon Web Services(AWS)は独自のチップ開発の道を進むことを決定しました。2016年に発売された最初のチップは、2x25Gイーサネットのパケット処理をサポートするように設計されました。特に、クラウドコンピューティングと新しい時代の需要により適切に対応するため、従来のx86チップアーキテクチャを採用せず、ArmのNeoverseカーネルをベースに構築することを選択しました。AWSは2018年に第1世代のAmazon Gravitonプロセッサをリリースし、その後、2020年にAmazon Graviton 2、2021年にAmazon Graviton 3、2022年にAmazon Graviton 3E、2023年にAmazon Graviton 4をリリースし、毎年一貫したリリーススケジュールを維持しています。Gravitonの各世代は、前世代と比較して2桁のパフォーマンス向上を実現しています。

過去 5 年間は、クラウドコンピューティングの深化と実用化の期間であると同時に、Amazon Web Services の自社開発チップの急速な発展の期間でもありました。この期間に、Amazon Web Services は 4 世代の Amazon Graviton インスタンスをリリースし、パフォーマンスの向上だけでなく、コンピューティング能力あたりの消費電力の継続的な削減も実現しました。第 1 世代の Graviton と比較して、Graviton 2 はプロセッサ性能が 7 倍、コンピューティングコア数が最大 4 倍、キャッシュが 2 倍、メモリ速度が 5 倍向上しています。Graviton 3 は、Graviton 2 と比較してシングルコア性能が 25%、浮動小数点性能が 2 倍向上しており、同じタイプの他の EC2 インスタンスと比較してエネルギー消費を 60% 削減します。また、より強力で消費電力の少ない DDR5 メモリがクラウドコンピューティングチップに使用されたのは初めてです。Graviton 3E は、浮動小数点およびベクトル命令演算に特に最適化されています。 HPc7gインスタンスをベースとしたベクトル命令のパフォーマンスは、Graviton 3インスタンスと比較して35%向上しています。Graviton 4は、最大30%のパフォーマンス向上、独立コア数の50%以上増加、メモリ帯域幅の75%以上増加を実現します。

チップのイノベーション能力の向上に伴い、Amazon Web Services(AWS)は自社開発チップの商用化範囲も拡大しています。現在、Amazon Graviton ベースの Amazon EC2 インスタンスは 150 種類以上あり、世界中で 200 万台以上の Amazon Graviton プロセッサが展開され、5 万社以上のお客様にサービスを提供しています。これには、Amazon EC2 の上位 100 社のお客様の 90% 以上が含まれており、お客様は Amazon Graviton ベースのインスタンスを使用して、アプリケーションに優れたコスト効率を実現しています。

より高速で、より経済的で、より幅広いアプリケーション シナリオをサポートします。

チップのイノベーションのプロセスにおいて、Amazon Web Services は、パフォーマンス、コスト効率、エネルギー効率の向上だけでなく、実際のワークロードの最適化にも取り組んでいます。

Amazon Graviton インスタンスの高いコスト効率をお客様がより容易にご利用いただけるよう、Amazon Web Services (AWS) は、Amazon Relational Database Service、Amazon Aurora、Amazon ElastiCache、Amazon MemoryDB for Redis、Amazon OpenSearch、Amazon EMR、Amazon Elastic Kubernetes Service、Amazon Lambda といった人気の高いオプションを含む、Graviton ベースのマネージドサービスを順次提供開始しています。お客様は、わずか数分でマネージドサービスを Graviton インスタンスに移行することで、最大 40% のパフォーマンス向上を実現できます。

さらに、機械学習のシナリオにより適合させるために、Amazon Web Services はトレーニング用の Amazon Trainium チップと推論用の Amazon Inferentia チップをリリースしました。

アマゾン ウェブ サービス (AWS) は、専用トレーニングチップに関するイノベーションで大きな成果を上げています。2022 年には、AWS は Amazon Trainium をベースとした Amazon EC2 Trn1 インスタンスをリリースし、2023 年には、数兆個のパラメータまたは変数を持つ基本モデルと大規模言語モデルの高性能トレーニング用に特別に構築された Amazon Trainium2 チップをリリースしました。第 1 世代の Amazon Trainium チップと比較して、Trainium2 は最大 4 倍のパフォーマンス、3 倍のメモリ、最大 2 倍のエネルギー効率 (ワットあたりのパフォーマンス) を提供します。実用的な観点から見ると、Amazon Trainium2 インスタンスの利点は、次世代 EC2 UltraClusters で最大 10 万個の Trainium2 アクセラレータチップまで拡張でき、Amazon Elastic Fabric Adapter (EFA) のペタバイト規模のネットワークと相互接続して最大 65 エクサフロップスのコンピューティング能力を提供できることにあります。これにより、顧客はスーパーコンピューティング レベルのパフォーマンスをオンデマンドで得ることができます。

Amazon Web Services(AWS)も、推論専用チップにおいて大きな進歩を遂げています。2018年には推論用チップ「Amazon Inferentia」をリリースし、2022年のグローバルカンファレンス「re:Invent」では次世代推論チップ「Amazon Inferentia 2」を発表しました。Inf1インスタンスと比較して、Inf2インスタンスはスループットが4倍、レイテンシーはわずか10分の1、ワットあたりのパフォーマンスは45%向上しています。

現在、Amazon Web Servicesの自社開発チップは、Amazon Nitroシステムの6世代、Amazon Gravitonの4世代、Amazon Trainiumの2世代、そしてAmazon Inferentiaという4つの主要な製品ポートフォリオを形成しています。これらは、高性能コンピューティング、機械学習、人工知能、コンテナアプリケーション、データ分析、データ処理など、幅広いアプリケーションをサポートしています。例えば、高性能コンピューティングにおいては、Amazon Gravitonのマルチコアと高効率機能は、科学計算、ゲノム解析、天気予報など、強力なコンピューティング能力を必要とするタスクに最適です。さらに、機械学習という重要な分野において、Amazon GravitonはTensorFlowやPyTorchなどのディープラーニングフレームワークの実行において非常に優れたパフォーマンスを発揮し、モデルのトレーニングや推論タスクに適しており、大規模データ処理や行列計算のニーズをより適切に満たします。同時に、Amazon GravitonはAIアプリケーションの推論部分を効率的にサポートし、画像認識や自然言語処理などのリアルタイムAIタスクを実行する際に低レイテンシーのコンピューティング環境を提供します。

企業のインテリジェント化が進むこの重要な局面において、Amazon Web Servicesの自社開発チップを採用するユーザーが増えています。クラウドコスト管理・最適化プラットフォームであるVantageの調査によると、インスタンスタイプコストの観点から、2024年第1四半期には、Amazon EC2 M7シリーズ汎用インスタンスタイプにおけるGravitonのM7gシリーズが市場の3分の1以上(34.5%)を占めました。さらに、2024年第2四半期には、Amazon RDS、Amazon ElastiCache、Amazon OpenSearchマネージドサービスで使用されるインスタンスタイプにおいて、GravitonはIntelを上回りました。

世界的に有名なゲーム開発プラットフォームであるEpic Gamesを例に挙げましょう。同社は2021年初頭から自社ゲーム「Fortnite」でAmazon Gravitonを積極的に活用し、現在では数万個のGravitonチップをゲーム運用の基盤として活用しています。ビジネスパフォーマンスの観点から見ると、GravitonがEpic Gamesにもたらす価値は「Fortnite」だけにとどまらず、Unreal Engineを使用して構築されたすべてのゲームサーバーにも及びます。Epic GamesのUnreal Engine 5を使用したオープンソースのチュートリアルゲーム「Lyra Starter Game」のテストシナリオでは、Graviton 4はGraviton 3と比較して25%以上のパフォーマンス向上、Intel Sapphire RapidsやAMD Genoaと比較して30%~35%のパフォーマンス向上を示しました。

結論は:

Amazon Web Services(AWS)は、ユーザーに幅広い選択肢を提供するために、より低コストで高性能なチップの開発に努めてきました。しかし、チップのイノベーションは容易ではありません。ソフトウェアの不具合は簡単に修正できますが、ハードウェアの問題は多くの場合、ゼロから開発をスタートさせる必要があり、そのプロセスは長期にわたることがあります。ハードウェアとソフトウェアの相互作用の複雑さ、そして企業に求められる忍耐と努力は、実際に経験してみなければ真に理解できません。チップ危機に対処するには独自のイノベーションが必要であり、現実と歴史を真摯に受け止めるしかないという意見もあるのも無理はありません。地に足のついたアプローチと、職人技による長期的なイノベーションへの献身において、AWSはすべてのパイオニアにとって模範となるでしょう。