Mark Harris

マーク・ハリス著

2025年4月28日発行

私はSDNの初期の時代を経験しました。

ベンチャーキャピタルの支援を受けた10社以上のスタートアップ企業が、それぞれ独自のネットワークOSを開発し、市場を席巻しました。共通点は、各スタートアップ企業が開発したOSが、市販のシリコンをベースにした業界標準のオープンスイッチに搭載されるという点です。当然のことながら、これらのOSを動作させるために必要なオープンハードウェアプラットフォームとして、長年にわたりオープンソリューションを提供してきたEdgecoreが主要な選択肢の一つとなりました。

オープン化の未開の地、まさに無法地帯でした。この分離型アプローチを早期に導入した企業は、ハードウェアとソフトウェアの分離がいかに魅力的であるかを、資金力で実証していました。彼らは、既存の従来型およびプロプライエタリなソリューションとは「異なる」「優れた」実稼働グレードのデータセンタースイッチングプラットフォームを開発するために、実際に資金を投じていました。オペレーティングシステム戦争は2010年から2016年頃まで続きましたが、その後、魔法のような出来事が起こりました…。

SONIC (クラウドにおけるオープン ネットワーキング用ソフトウェア) が登場しました。

SONiCは、SDNベンダーが覇権を争っていたまさにその時期に、MicrosoftがAzure向けに開発しました。MicrosoftはAzureクラウドサービスを支える手段を模索し、主力製品であるLinuxプラットフォームをベースに独自のOSを開発するという戦略的な選択を行いました。MicrosoftのSONiCは非常に優れたパフォーマンスを発揮したため、2017年にオープンソースコミュニティに公開されました。その後の展開は言うまでもありません!TELCOなどの特殊なアプリケーション向けには他のネットワークOSも存在しますが、SONiCはデータセンターやAI推論のためのオープンインフラ構築において急速に主流になりつつあります。

SONiCプロジェクトは現在、Linux Foundationによって管理されており、500社以上の企業を代表する5,000人以上のアクティブなコミュニティメンバーが参加しています。このプロジェクトは、高性能およびAIデータセンターの導入向けに設計されており、柔軟性、拡張性、そしてTCOの低減を実現するネットワークソリューションを提供します。これは、要求が厳しく進化する最新世代のGPU中心のインフラストラクチャにとって特に有益です。

では、SONiC は AI データ センターの展開にとってなぜそれほど重要なのでしょうか?

AIデータセンターにおけるSONICの価値:

1. 高性能ネットワークファブリック: AIワークロード、特に複数のGPUにまたがる分散トレーニングには、高帯域幅、低レイテンシ、ロスレスのネットワークファブリックが必要です。SONiCは、効率的なGPU間通信とメモリアクセスに不可欠なRoCE(Remote Direct Memory Access)over Converged Ethernet(RDMA)などの機能をサポートし、ボトルネックを最小限に抑え、トレーニング速度を最大化します。

2. スケーラビリティ: AI データセンターは、増大するデータセットやより複雑なモデルに対応するために、多くの場合、迅速に拡張する必要があります。SONiC のモジュール型アーキテクチャと幅広いハードウェア プラットフォームのサポートにより、単一ベンダーのエコシステムに縛られることなく、ネットワーク インフラストラクチャをシームレスに拡張できます。

3. 柔軟性とカスタマイズ: SONiCはオープンソースであるため、ネットワーク事業者はAIインフラストラクチャの特定の要件に合わせてオペレーティングシステムをカスタマイズできます。AIワークロード向けにカスタマイズされた専用プロトコル、自動化ツール、監視システムを統合できます。

4. ベンダー中立性: SONiCは、ネットワークオペレーティングシステムと基盤ハードウェアを分離します。この分離により、AIデータセンターは様々なベンダーから最適なハードウェアを選択できるようになり、ベンダーロックインを回避し、設備投資の削減につながります。組織は、パフォーマンス、コスト、そしてAIアクセラレーションに関連する特定の機能(特定のASIC機能など)に基づいてハードウェアを選択できます。

5. 自動化とオーケストレーション: AIデータセンターにおける大規模ネットワークインフラの管理には、堅牢な自動化が不可欠です。SONiCは、オープンで標準化されたAPI(REST APIなど)をサポートし、様々な自動化ツールやオーケストレーションツールと連携することで、ネットワークの効率的なプロビジョニング、構成、監視、管理を実現します。これは、AIワークロードとインフラの動的な性質に対応する上で極めて重要です。

6. ネットワークの可視性と診断: AI ネットワークのパフォーマンスと安定性を維持するには、リアルタイムの監視と診断が不可欠です。SONiC は、さまざまなハードウェア ベンダー間でテレメトリと診断のための統合インターフェイスを提供し、トラブルシューティングとパフォーマンスの最適化を簡素化します。

7. AIインフラストラクチャとの統合: SONiC は、SmartNIC (DASH – SONiC ホスト向け分散 API などのイニシアチブを使用) などの AI インフラストラクチャの他のコンポーネントと統合して、パフォーマンスをさらに向上させ、CPU からネットワーク処理タスクをオフロードして AI 計算に解放することができます。

AIデータセンターにおけるSONICの利点:

• TCOの削減: AIデータセンターは、プロプライエタリシステムから脱却し、今日の非常に高性能な市販シリコンを活用することで、ハードウェアの初期資本コスト(CAPEX)と、ライセンスやベンダーロックインに関連する継続的な運用コスト(OPEX)の両方を大幅に削減できます。実際、アナリスト企業Dell'Oroは、AIデータセンターにおけるイーサネットの使用が今後24ヶ月以内にInfiniBandを上回るというトレンドデータを公開しており、IDCはSONiCがオープンスイッチ向けのオープンネットワークオペレーティングシステムとして最も急速に成長していると指摘しています。イーサネットとSONiCは、現在非常に限られたInfiniBand製品よりも低いTCOで必要な接続性を提供します。

• イノベーションと俊敏性の向上: オープンソースコミュニティは、SONiCにおける急速なイノベーションを推進しています。AIデータセンターは、新しいネットワーク技術の迅速な導入によるメリットを享受し、AIワークロードに特有の機能の開発に貢献できます。モジュール型アーキテクチャにより、ネットワーク全体を中断することなく、新しいサービスや機能を迅速に導入できます。

• 強化された制御と柔軟性: 組織はネットワークインフラをより強力に制御できるようになり、AIアプリケーションの需要に合わせて的確にカスタマイズ・最適化できるようになります。単一ベンダーの機能やロードマップに制限されることはありません。

• 信頼性と稼働時間の向上: SONiCのコンテナ化されたコンポーネントなどの機能により、稼働中のアップグレードと障害分離が可能になり、AIトレーニングと推論タスクの中断なく稼働し続けるために不可欠なダウンタイムを最小限に抑えることができます。アクティブ/アクティブTop-of-Rack(ToR)構成のサポートにより、ネットワークの耐障害性が向上します。

• 強力なコミュニティサポート: AI およびネットワーク分野の主要企業 (Microsoft、NVIDIA、Broadcom など) を含む大規模でアクティブな SONiC コミュニティは、広範なサポート、ドキュメント、豊富な専門知識を提供し、複雑な AI 環境での SONiC の導入と管理を容易にします。

最終的な結果:

AIデータセンターはイーサネットスイッチングへと移行し、イーサネットスイッチングはオープンシリコンを搭載したオープンスイッチの利用へと移行し、オープンスイッチは価値提供のためにSONiCの利用へと移行しています。その理由は?SONICは、AI推論の独特で厳しい要件(高性能、低遅延、RDMA、輻輳制御など)に対応するのに適した、最新かつ適応性に優れ、コスト効率の高いネットワーク基盤を提供します。SONiCをベースとしたオープンインフラストラクチャは、高コストリソース(GPUなど)の利用率を大幅に向上させ、トレーニングと推論のジョブ時間を短縮します。AI向けSONiCは、より優れた制御性、最大限の柔軟性、そして卓越したAI推論ワークロードパフォーマンスを実現します。

あなたも好きかもしれません

🔹 SONiC の詳細については、Edgecore をご覧ください 👉 https://www.edge-core.com/sonic/

🔹 私たちとつながり続けましょう 👉 https://www.edge-core.com/subscribe-newsletter/

🔹 お問い合わせ 👉 https://www.edge-core.com/Contact-inquiry/

当社の製品やサービスに関してご意見、お問い合わせ、ご質問がございましたら、以下のフォームにご記入ください。

このフォームを送信することにより、お客様は、当社がお客様のリクエスト/提出およびEdgecoreのソリューションとサービスに関連する情報をお客様に連絡するために、お客様が提供するデータを使用することに同意するものとします。当社がお客様の個人情報をどのように取り扱い、使用するかについての詳細は、当社の プライバシーポリシー.