NVIDIA発・AIファクトリー横断「スケールアクロス」最前線2025
この記事を読むと、NVIDIA Spectrum-XGSに代表されるAIファクトリーの広域連携『スケールアクロス』の世界と、それを支える光インターコネクト技術(Marvell COLORZ 800、Broadcom Jericho 4)、そして巨大IT企業の最新戦略が物語形式で深く理解できます。
この記事は、専門的な詳細に踏み込んだ技術解説記事です。
📌AIデータセンターネットワークの全体像や基本から学びたい方
➡NVLink vs Broadcom論争の真相|AIネットワークの力学を読み解く
📌LLMの基本的な仕組みや専門用語を学びたい方
➡初学者用LLM技術:NVLinkを理解するために【2025】
- 要点1:長距離接続の主役は「光」。コヒーレント光(東京-大阪間ノンストップ級)が物理制約を破る。
- 要点2:NVIDIAの垂直統合に対し、Broadcom/Marvellらの水平分業エコシステムが対抗する構図が鮮明に。
- 要点3:真のボトルネックは「電力と冷却」。1ラック120kW超時代を迎え、“性能 per ワット”が最重要指標となる。
→ 各社の戦略比較は「第二部」へ、未来の展望は「第三部」へ。
序章:新たな地図の空白
要約:AIクラスター内部の地図を完成させたエバとレオ。しかし、データセンターの壁を越えた「外側」の世界は、まだ空白のままだった。
数日後の午後、エバとレオはオフィスの巨大なインタラクティブ・ディスプレイの前に立っていた。画面には、彼らが先日議論したAIクラスターの内部構造──NVLinkの神経系とInfiniBand/Ethernetの交通網──が描かれている。
レオ:「エバ、この地図はよく分かった。でも、君が最後に残した問いがずっと頭から離れないんだ。『次のボトルネックは電力と冷却だ』って。その前に、僕はこの地図の“外側”が知りたい。この“都市”(AIラック)は、どうやって他の都市と繋がるんだ?都市間、いや、大陸間で連携するなんて、一体どうやって?」
エバは微笑んで、ディスプレイの表示を世界地図に切り替えた。「いい質問ね、レオ。それこそが、AIファクトリーの第三層、スケールアクロスの世界よ」彼女は意味深に続けた。「実はね、2ヶ月前に地図の風景が一気に変わったの。今日は、その最新の地図を一緒に見ていきましょう」
第一部:データセンターの壁を越える“光の橋”
要約:長距離接続の主役は「光」。Marvellのコヒーレント光、BroadcomのルーターASIC、NVIDIAの広域連携構想が物理的な距離の制約を克服しつつある。
エバは微笑むと、レオに語りかけた。
「いいわ、レオ。この“光の橋”がどうやってできているか、その設計図を見せてあげる。この橋は主に3つの重要な技術要素で成り立っているの」
エバはディスプレイに3つのキーワードを浮かび上がらせた。
「一つは、橋そのものを架けるための『長距離光伝送』技術。二つ目は、橋の上の膨大な交通を整理する『ルーティングの中枢』。そして三つ目が、全ての橋を連携させて一つの交通網として機能させる『広域統合の仕組み』よ。この3つの主役たちの話を順番にしていきましょう」
Marvell COLORZ 800が拓く長距離光伝送
エバは地図上の二つの都市、東京と大阪を指で結んだ。
「数百キロ、数千キロ離れたデータセンター同士を繋ぐには、もう電気信号の銅線では話にならない。主役は“光”よ」
レオ:「光インターコネクトだね。でも、そんな長距離を低遅延で結べるなんて、まるでSFの世界だよ」
エバ:「そのSFを現実にする技術が揃ってきたのよ」
エバはいくつかのキーワードを地図上に書き出した。
「一つは、Marvell(マーベル)が得意なコヒーレント光技術。
彼らのCOLORZ 800──“カラーズ”と呼ばれる製品は、手のひらサイズのモジュールをルーターに差し込むだけで長距離通信を可能にする“光のエンジン”よ。最大800Gbpsで500km、さらにPCS(Probabilistic Constellation Shaping)という技術を使えば1,000km級までデータを飛ばせるの。東京-大阪間(約500km)なら、まさに最適な技術ね」
Broadcom Jericho 4が担うルーティング中枢
レオ:「橋を架けるだけじゃなく、その橋の入口と出口も重要だよね?交通整理はどうするんだい?」
エバ:「そこがBroadcom(ブロードコム)の出番」
「彼らのJericho(ジェリコ)4のようなルーターASICは、まさにこの長距離・広帯域通信のために設計された“交通管制塔”。
51.2Tbpsのスループットとディープバッファ、MACsecによる暗号化、長距離RoCE対応といった多機能で、大量の光信号を捌き、渋滞が起きないよう制御する。AIファクトリーという国家の、国際空港を司る頭脳よ」
NVIDIA Spectrum-XGSによる広域統合
レオは腕を組んだ。「二社とも、重要な部品を握っているわけか。じゃあ、NVIDIAはどう動くんだい?」
エバ:「NVIDIAは、その“光の橋”を使って、全ての都市を一つの巨大な国、彼らが言うところの“ギガスケールAIファクトリー”として統合する技術を、つい2ヶ月前の8月に発表したわ。それがSpectrum-XGS。既存のハードウェアに新しいアルゴリズムを加えるだけで、大陸間の距離を感じさせないレベルまで性能を引き上げるの。
もちろん、物理限界(光の速度)による遅延は残るわ。例えば東京–大阪間(約500km)なら、片道約2.5〜3ミリ秒の遅延が理論上の下限になるけれどね。CoreWeaveが最初に飛びついて、既に展開を始めているのよ」
第二部:プレイヤーたちの野望――垂直統合か、水平分業か
要約:NVIDIAはすべてを自社で最適化する「垂直統合」モデル、Broadcom/Marvellは最高の部品を供給する「水平分業」モデルで競い合っています。
レオ:「なるほどな…。NVIDIAの垂直統合戦略と、BroadcomやMarvellの水平分業戦略がぶつかり合っているわけだね。以前僕たちが読んだ『AIインフラ市場2025』の記事で語られていた構図が、まさにこのネットワークの世界で起きているんだな」
エバ:「その通りよ。そして今日のテーマは、その大きな戦略の違いが、スケールアクロスという“国境を越えた”戦場で、具体的にどんな技術の差になって現れているのか、ということ」
エバ:「NVIDIAの戦略は“垂直統合”。GPUという心臓から、NVLinkという神経、InfiniBand/Spectrum-Xという交通網、そしてCUDAという言語まで、すべて自社で開発する。顧客はNVIDIAから、完璧にチューニングされた“完成品のスポーツカー”を買うようなものね。最高の性能が出るけど、カスタマイズの自由度は低い」
レオ:「じゃあ、BroadcomとMarvellは?」
エバ:「彼らは“水平分業”の王者。Broadcomは最高の“エンジン”(Tomahawk)と“シャーシ”(Jericho)を製造し、Marvellは高性能な“タイヤ”や“燃料供給システム”(光技術)を供給しているわ。そして、CiscoやAristaのようなネットワーク機器ベンダーが、これらの部品を自在に組み合わせて、顧客の目的やニーズに応じた多様なネットワークシステムやデータセンターインフラを構築するの。
選択肢は広がるけど、最高の性能を引き出すには“設計・組み立てる側”──つまりシステムインテグレータや実務エンジニアの腕も問われる。それはまさに、『AIチップ覇権戦争』の記事で描かれていた“反逆者たち”の戦い方そのものね」
レオ:「どちらが良いというわけではなく、顧客が何を求めるか、で選ぶべき道が変わるわけか。そういえば、NVIDIAがQualcommと組んだNVLink Fusionの動きも、この水平分業陣営への対抗策と見ると面白いね」
エバ:「ええ、その通り。自社の“閉じた”エコシステムに、一部だけ“開かれた”ドアを用意して、戦略的なパートナーを引き込もうとしている。すべてが単純な対立ではないのよ」
エバ:「面白いことに、この戦いは今まさに進行中よ。8月にNVIDIAがSpectrum-XGSを発表したとき、CoreWeaveは即座に採用を決めた。一方で、GoogleやMetaは既存のSpectrum-Xプラットフォームを採用しており、2025年8月に発表されたSpectrum-XGSへの対応も今後進むと見られているわ。巨人たちが、それぞれの戦略で動き始めているの」
レオ:「つまり、僕たちが今見ているこの地図は…」
エバ:「ええ、まだインクも乾いていない、描かれたばかりの地図よ」
第三部:未来のボトルネック――本当の戦場は「熱」と「電力」
要約:計算性能の競争は、やがて「電力」と「熱」という物理的な壁に突き当たる。“性能 per ワット”を最大化する技術が、次の勝者を決めます。
エバは満足げにディスプレイを眺めながら言った。「これで、今の地図はほぼ完成ね」
だが、レオは彼女が以前残した言葉を忘れてはいなかった。
レオ:「待ってくれ、エバ。一番聞きたかったのはここからだ。君は言った、『次のボトルネックは電力と冷却だ』と。この地図が、そのせいで描き変わるかもしれない、と」
エバの表情が引き締まる。「ええ。まさに、そこが次の主戦場よ」
彼女はディスプレイに、一つのAIラックの消費電力グラフを映し出す。
エバ:「例えば2025年最新のAIラック、特にNVIDIA GB200 NVL72のような次世代システムは、1台あたり120kW以上、場合によっては150kW近くの電力を消費するようになっているわ。OpenAIの最新プロジェクトやxAIの施設のように、1モジュールで最大20MW規模の電力を使用する構想が報じられているわ。最近では、新興企業のSuperXが『1モジュール20MW』のAIファクトリー構想を発表(※注: 2025年10月発表のリリースに基づく情報)するなど、競争が激化しているの。もう、空冷では限界なの」
レオ:「だから、最近よく聞く“液冷”が重要になるのか」
エバ:「その通り。でも、それだけじゃない。究極の省電力化は、チップのすぐそばで電気を光に変えること。チップパッケージに光学素子を統合するCPO(Co-Packaged Optics)やシリコンフォトニクス。
MarvellもNVIDIAも、この分野に巨額の投資をしているわ。なぜなら、AIファクトリーの競争は、最終的に“性能 per ワット”──1ワットの電力でどれだけ計算できるか──の戦いになるから。
NVIDIAがGTCで語る『トークン採掘』というビジョンも、この電力効率と無関係ではないのよ」
エバは、地図の片隅に、大きな文字で「POWER & COOLING」と書き加えた。
エバ:「これからの勝者は、最速のチップを作った者じゃない。そのチップを、最も効率的に、最も持続可能な形で動かす“インフラ全体”を設計した者よ。
OpenAIやSuperXといった先端ユーザーは、世界各地に分散したDC群を一体運用するために、すでに液冷と高度な電源設備を組み合わせた新型アーキテクチャを構築し始めているわ」
二人が見つめるディスプレイの中で、世界地図は静かに輝いていた。それは完成した地図であると同時に、新たな冒険の始まりを告げる、未知の領域に満ちた地図でもあった。
レオ:「エバ、一つ聞いていい? この地図を最初に完成させた者が、次の10年を支配するんだろうか?」
エバは地図に目を向け、静かに答えた。
「これから本当の競争が始まるのよ、レオ。誰が“未来の地図”を最初に描ききるのか…その答えは、まだここには記されていないわ。」
まとめ
エバとレオの対話を通じて、AIファクトリーのネットワーク戦略が、データセンターの壁を越える「スケールアクロス」の段階へと進化していることが明らかになりました。
そこでは、物理的な距離を克服する光技術と、各社のビジネスモデルが色濃く反映された戦略(垂直統合 vs 水平分業)が複雑に絡み合います。そして、その競争の先には、「電力」と「熱」という、より根源的な物理法則との戦いが待っています。私たちの“地図”は、これからも絶えず描き変えられていくのです。
専門用語まとめ
- スケールアクロス (Scale-Across)
- 地理的に離れた複数のデータセンターを、ソフトウェアとハードウェアの力で、あたかも単一の巨大なAIスーパーコンピュータのように連携させる技術。NVIDIAが2025年8月に発表したSpectrum-XGSがその代表例です。
- Spectrum-XGS
- NVIDIAが発表した、地理的に分散したDCを統合する広域イーサネット技術。Scale-Across構想の中核。
- Jericho 4
- Broadcom製の広域ルータASIC。51.2Tbpsのスループットを誇り、長距離DCIを支える。
- COLORZ 800
- Marvell製のコヒーレント光モジュール。800Gbpsで500km~1000km級の長距離伝送を可能にする。
- 光インターコネクト (Optical Interconnect)
- 情報を電気信号ではなく光信号で伝送する接続技術。長距離でも信号の劣化が少なく、低消費電力で高速・大容量の通信が可能です。MarvellのCOLORZ 800などが代表的な製品です。
- 垂直統合 (Vertical Integration)
- 半導体チップからハードウェア、ソフトウェア、サービスまで、製品開発に関わる多くの工程を自社で一貫して手掛けるビジネスモデル。NVIDIAがこの戦略の代表例で、高度な最適化が可能ですが、顧客の選択肢は限定的になります。
- 水平分業 (Horizontal Specialization)
- 特定の分野(例:スイッチASIC、光技術)に特化し、最高の「部品」を開発・供給するビジネスモデル。BroadcomやMarvellが代表例。顧客は多様なベンダーの部品を自由に組み合わせることができます。
- CPO (Co-Packaged Optics)
- スイッチASICなどの半導体チップと光送受信モジュールを、一つのパッケージ内に極めて近接して実装する技術。電気配線の距離を最小化し、消費電力と遅延を大幅に削減する次世代の光インターコネクト技術として期待されています。
よくある質問(FAQ)
Q1. なぜ今、スケールアクロスが重要になっているのですか?
A1. AIモデルの巨大化が続き、単一のデータセンターでは計算リソースや電力が不足し始めているためです。また、顧客の近くで推論サービスを提供したり、災害対策(DR)の観点からも、地理的に分散したリソースを連携させる必要性が高まっています。
Q2. NVIDIAの垂直統合モデルの最大のメリットとデメリットは何ですか?
A2. メリットは、ハードとソフトが極限まで最適化されており、導入すればすぐに最高の性能が期待できる「時間対効果」の高さです。デメリットは、特定ベンダーへの依存度が高まること(ベンダーロックイン)と、柔軟なカスタマイズが難しい点です。
Q3. “性能 per ワット”の競争になると、具体的に何が変わりますか?
A3. AIインフラの評価基準が「計算速度」から「電力効率」にシフトします。これにより、単純に高速なチップよりも、液冷システムやCPOのような光技術と組み合わせることで、システム全体の電力効率を高めるソリューションの価値が相対的に上昇します。
Q4. なぜ2025年になってスケールアクロスが現実味を帯びたのですか?
A4. Spectrum-XGSのようなソフトウェア最適化技術の登場に加え、COLORZ 800のような800Gコヒーレント光モジュールや、Jericho 4のような51.2Tbps級ルータが実用化され、ハードとソフトの両面で長距離・広帯域通信の基盤が整ったためです。
主な参考サイト
- NVIDIA Spectrum-X Official News
- Broadcom Jericho Router ASICs
- Marvell COLORZ Coherent Pluggable Modules
- Co-Packaged Optics (Industry Resource)
- ServeTheHome (for independent hardware news)
合わせて読みたい
- NVLink vs Broadcom論争の真相|AIネットワークの力学を読み解く
- AIネットワーク三層|NVLink・IB・Ethernet/Spectrum-X【2025】
- 初学者用LLM技術:NVLinkを理解するために【2025】
- NVIDIA NVLink Fusion発表|AIチップ市場の新展開
- AIが金を掘る時代へ:NVIDIA GTC 2025が示したトークン採掘の未来
- AIインフラ市場2025最新|NVIDIA独占に挑む各社戦略
- AIチップ覇権戦争2025: NVIDIAの銀河系戦略に挑む反逆者たち
更新履歴
- 初版公開
