Mark Harris

Автор Марк Харрис

Опубликовано 28 апреля 2025 г.

Я пережил первые дни SDN,

Где дюжина или более стартапов, поддерживаемых венчурным капиталом, вышли на сцену со своим собственным взглядом на сетевую операционную систему. Общая черта: ОС, которую создавал каждый стартап, загружалась на стандартные открытые коммутаторы, которые были основаны на коммерческом кремнии. Неудивительно, что Edgecore был одним из основных вариантов открытой аппаратной платформы, необходимой для запуска каждой из этих операционных систем, поскольку он предоставлял открытые решения в течение очень долгого времени.

Это был Дикий Запад открытости, и ранние последователи этого дезагрегированного подхода демонстрировали своими долларами, что дезагрегация оборудования и программного обеспечения была интересной. Они тратили реальные деньги на создание платформ коммутации центров обработки данных промышленного класса, которые были «другими» и «лучше», чем традиционные и проприетарные решения, уже доступные. Войны операционных систем продолжались с 2010 по 2016 год или около того, а затем произошло нечто волшебное…

На рынок вышло программное обеспечение SONIC (программное обеспечение для открытых сетей в облаке).

SONiC был разработан Microsoft для Azure в тот же самый период, когда игроки SDN боролись за доминирование. Microsoft искала способ для своих облачных сервисов Azure и сделала стратегический выбор в пользу разработки собственной ОС на основе рабочей платформы Linux. SONiC от Microsoft работала так хорошо, что в 2017 году они предложили ее сообществу с открытым исходным кодом. Остальное, как говорится, уже история! И хотя другие сетевые операционные системы все еще существуют для специализированных приложений, таких как TELCO, SONiC быстро становится доминирующим игроком в открытых инфраструктурных построениях для центров обработки данных и вывода ИИ.

Проект SONiC в настоящее время управляется Linux Foundation и насчитывает более 5000 активных членов сообщества, представляющих более 500 компаний. Он разработан для высокопроизводительных и ИИ-развертываний дата-центров и предлагает гибкое, масштабируемое и низкое TCO сетевое решение, что делает его особенно полезным для последнего поколения инфраструктур, ориентированных на GPU, с высокими и меняющимися потребностями.

Так почему же SONiC так важен для развертывания центра обработки данных ИИ?

Ценность SONIC в центрах обработки данных ИИ:

1. Высокопроизводительная сетевая структура: Рабочие нагрузки ИИ, особенно распределенное обучение на нескольких графических процессорах, требуют сетевой инфраструктуры с высокой пропускной способностью, малой задержкой и отсутствием потерь. SONiC поддерживает такие функции, как удаленный прямой доступ к памяти (RDMA) через конвергентный Ethernet (RoCE), что имеет решающее значение для эффективной связи между графическими процессорами и доступа к памяти, минимизации узких мест и максимальной скорости обучения.

2. Масштабируемость: Центры обработки данных ИИ часто нуждаются в быстром масштабировании для размещения растущих наборов данных и более сложных моделей. Модульная архитектура SONiC и поддержка широкого спектра аппаратных платформ позволяют плавно масштабировать сетевую инфраструктуру, не привязываясь к экосистеме одного поставщика.

3. Гибкость и настройка: Открытый исходный код SONiC позволяет сетевым операторам настраивать операционную систему в соответствии с конкретными требованиями их инфраструктуры ИИ. Они могут интегрировать специализированные протоколы, инструменты автоматизации и системы мониторинга, адаптированные для рабочих нагрузок ИИ.

4. Нейтральность поставщика: SONiC отделяет сетевую операционную систему от базового оборудования. Такое разделение позволяет центрам обработки данных ИИ выбирать лучшее в своем классе оборудование от разных поставщиков, избегая привязки к поставщику и потенциально сокращая капитальные затраты. Организации могут выбирать оборудование на основе производительности, стоимости и конкретных функций, относящихся к ускорению ИИ (например, конкретных возможностей ASIC).

5. Автоматизация и оркестровка: Управление крупномасштабной сетевой инфраструктурой в центре обработки данных ИИ требует надежной автоматизации. SONiC поддерживает открытые и стандартизированные API (например, REST API) и хорошо интегрируется с различными инструментами автоматизации и оркестровки, обеспечивая эффективное предоставление, настройку, мониторинг и управление сетью. Это имеет решающее значение для обработки динамической природы рабочих нагрузок и инфраструктуры ИИ.

6. Видимость и диагностика сети: Мониторинг и диагностика в реальном времени необходимы для поддержания производительности и стабильности сети ИИ. SONiC предоставляет унифицированный интерфейс для телеметрии и диагностики для различных поставщиков оборудования, упрощая устранение неполадок и оптимизацию производительности.

7. Интеграция с инфраструктурой ИИ: SONiC можно интегрировать с другими компонентами инфраструктуры ИИ, такими как SmartNIC (используя такие инициативы, как DASH — Disaggregated APIs for SONiC Hosts), чтобы еще больше повысить производительность и разгрузить центральные процессоры от задач сетевой обработки, освободив их для вычислений ИИ.

Преимущества SONIC для центров обработки данных ИИ:

• Более низкая совокупная стоимость владения: Освободившись от фирменных систем и используя современные очень эффективные коммерческие кремниевые решения, центры обработки данных ИИ могут значительно сократить как первоначальные капитальные затраты (CAPEX) на оборудование, так и текущие эксплуатационные расходы (OPEX), связанные с лицензированием и привязкой к поставщику. Фактически, аналитическая фирма Dell'Oro опубликовала данные о тенденциях, которые показывают, что Ethernet обгонит использование InfiniBand в центрах обработки данных ИИ в течение следующих 24 месяцев, а IDC указала, что SONiC является самой быстрорастущей открытой сетевой операционной системой для открытых коммутаторов. Ethernet и SONiC могут обеспечить требуемое подключение с более низкой совокупной стоимостью владения, чем на сегодняшнем крайне ограниченном рынке предложений Infiniband.

• Повышение инновационности и гибкости: Сообщество с открытым исходным кодом стимулирует быстрые инновации в SONiC. Центры обработки данных ИИ могут выиграть от более быстрого внедрения новых сетевых технологий и способствовать разработке функций, специально необходимых для рабочих нагрузок ИИ. Модульная архитектура позволяет быстрее развертывать новые сервисы и функции, не нарушая работу всей сети.

• Улучшенный контроль и гибкость: Организации получают больший контроль над своей сетевой инфраструктурой, что позволяет им адаптировать и оптимизировать ее в точности под требования приложений ИИ. Они не ограничены функциями и дорожными картами одного поставщика.

• Повышенная надежность и время безотказной работы: Такие функции, как контейнерные компоненты в SONiC, позволяют проводить обновления в процессе эксплуатации и изолировать неисправности, минимизируя время простоя, что имеет решающее значение для непрерывного обучения ИИ и задач вывода. Поддержка конфигураций «активный-активный» Top-of-Rack (ToR) повышает устойчивость сети.

• Сильная поддержка сообщества: Большое и активное сообщество SONiC, включающее основных игроков в сфере ИИ и сетевых технологий (таких как Microsoft, NVIDIA, Broadcom и другие), предоставляет обширную поддержку, документацию и богатый опыт, что упрощает развертывание и управление SONiC в сложных средах ИИ.

Чистый результат:

Центры обработки данных ИИ склоняются к коммутации Ethernet, коммутация Ethernet склоняется к использованию открытых коммутаторов, включающих открытый кремний, а открытые коммутаторы склоняются к использованию SONiC для обеспечения ценности. Почему? SONIC предоставляет современную, адаптивную и экономически эффективную сетевую основу, которая хорошо подходит для обработки уникальных и требовательных требований вывода ИИ (высокая производительность и низкая задержка, RDMA, контроль перегрузки и т. д.). Открытая инфраструктура на основе SONiC позволяет значительно увеличить использование дорогостоящих ресурсов (например, графических процессоров) и сократить время обучения и выполнения заданий вывода. SONiC для ИИ обеспечивает больший контроль, максимальную гибкость и завидную производительность рабочей нагрузки вывода ИИ.

Вам также может понравиться

🔹 Посетите Edgecore, чтобы узнать больше о SONiC 👉 https://www.edge-core.com/sonic/

🔹 Оставайтесь с нами на связи 👉 https://www.edge-core.com/subscribe-newsletter/

🔹 Свяжитесь с нами 👉 https://www.edge-core.com/Contact-inquiry/

Если у вас есть какие-либо комментарии, запросы или вопросы относительно наших продуктов и услуг, пожалуйста, заполните следующую форму.

Отправляя эту форму, вы соглашаетесь с тем, что мы можем использовать предоставленные вами данные для связи с вами по поводу информации, касающейся вашего запроса/отправки, а также решений и услуг Edgecore.
Более подробную информацию о том, как мы обрабатываем и используем вашу личную информацию, см. в нашем Политика конфиденциальности.

СВЯЗАННЫЕ НОВОСТИ