Mark Harris

Escrito por Mark Harris

Publicado em 28 de abril de 2025

Eu vivi os primeiros dias do SDN,

Onde uma dúzia ou mais de startups apoiadas por capital de risco surgiram com sua própria versão de um sistema operacional de rede. A característica comum: o sistema operacional criado por cada startup seria carregado em switches abertos padrão da indústria, baseados em silício comercial. Não é de surpreender que o Edgecore tenha sido uma das principais escolhas para a plataforma de hardware aberta necessária para executar cada um desses sistemas operacionais, visto que fornece soluções abertas há muito tempo.

Era o velho oeste do open source, e os pioneiros dessa abordagem desagregada demonstravam com seus investimentos que a desagregação de hardware e software era interessante. Eles estavam investindo dinheiro de verdade para criar plataformas de comutação de data center de nível de produção que eram "diferentes" e "melhores" do que as soluções tradicionais e proprietárias já disponíveis. A guerra dos sistemas operacionais continuou de 2010 a 2016, aproximadamente, e então algo mágico aconteceu...

O SONIC (Software para Redes Abertas na Nuvem) entrou em cena.

O SONiC foi desenvolvido pela Microsoft para alimentar o Azure exatamente no mesmo período em que os players de SDN disputavam o domínio. A Microsoft buscava uma maneira de alimentar seus serviços de nuvem do Azure e fez a escolha estratégica de desenvolver seu próprio sistema operacional baseado na plataforma Linux. O SONiC da Microsoft funcionou tão bem que, em 2017, foi oferecido à comunidade de código aberto. O resto da história, como dizem, é história! E embora outros sistemas operacionais de rede ainda existam para aplicações especializadas, como TELCO, o SONiC está rapidamente se tornando o player dominante em construções de infraestrutura aberta para data centers e inferência de IA.

O projeto SONiC é atualmente gerenciado pela Linux Foundation e conta com mais de 5.000 membros ativos da comunidade, representando mais de 500 empresas. Ele foi projetado para implantações de data center de alto desempenho e IA e oferece uma solução de rede flexível, escalável e de baixo TCO, tornando-o particularmente benéfico para a última geração de infraestruturas centradas em GPU, com necessidades exigentes e em constante evolução.

Então por que o SONiC é tão importante para a implantação de um data center de IA?

O valor do SONIC em Data Centers de IA:

1. Estrutura de rede de alto desempenho: Cargas de trabalho de IA, especialmente treinamento distribuído entre múltiplas GPUs, exigem estruturas de rede de alta largura de banda, baixa latência e sem perdas. O SONiC oferece suporte a recursos como Acesso Direto à Memória Remota (RDMA) sobre Ethernet Convergente (RoCE), que é crucial para comunicação eficiente entre GPUs e acesso à memória, minimizando gargalos e maximizando a velocidade do treinamento.

2. Escalabilidade: Os data centers de IA geralmente precisam ser escalonados rapidamente para acomodar conjuntos de dados crescentes e modelos mais complexos. A arquitetura modular do SONiC e o suporte para uma ampla gama de plataformas de hardware permitem o escalonamento perfeito da infraestrutura de rede sem ficar preso ao ecossistema de um único fornecedor.

3. Flexibilidade e personalização: A natureza de código aberto do SONiC permite que as operadoras de rede personalizem o sistema operacional para atender aos requisitos específicos de sua infraestrutura de IA. Elas podem integrar protocolos especializados, ferramentas de automação e sistemas de monitoramento adaptados para cargas de trabalho de IA.

4. Neutralidade do fornecedor: O SONiC desacopla o sistema operacional de rede do hardware subjacente. Essa desagregação permite que os data centers de IA escolham o melhor hardware de diversos fornecedores, evitando a dependência de um único fornecedor e potencialmente reduzindo os gastos de capital. As organizações podem selecionar o hardware com base em desempenho, custo e recursos específicos relevantes para a aceleração de IA (como recursos específicos de ASIC).

5. Automação e Orquestração: Gerenciar a infraestrutura de rede em larga escala em um data center de IA requer automação robusta. O SONiC suporta APIs abertas e padronizadas (como APIs REST) e se integra bem a diversas ferramentas de automação e orquestração, permitindo provisionamento, configuração, monitoramento e gerenciamento eficientes da rede. Isso é crucial para lidar com a natureza dinâmica das cargas de trabalho e da infraestrutura de IA.

6. Visibilidade e diagnóstico da rede: O monitoramento e o diagnóstico em tempo real são essenciais para manter o desempenho e a estabilidade da rede de IA. O SONiC fornece uma interface unificada para telemetria e diagnóstico entre diferentes fornecedores de hardware, simplificando a solução de problemas e a otimização do desempenho.

7. Integração com infraestrutura de IA: O SONiC pode ser integrado a outros componentes da infraestrutura de IA, como SmartNICs (usando iniciativas como DASH – Disaggregated APIs for SONiC Hosts), para melhorar ainda mais o desempenho e descarregar tarefas de processamento de rede das CPUs, liberando-as para cálculos de IA.

Os benefícios do SONIC para data centers de IA:

• Menor TCO: Ao se libertarem de sistemas proprietários e aproveitarem o silício comercial de alta capacidade atual, os data centers de IA podem reduzir significativamente tanto os custos iniciais de capital (CAPEX) em hardware quanto os custos operacionais contínuos (OPEX) relacionados a licenciamento e dependência de fornecedores. De fato, a empresa de análise Dell'Oro publicou dados de tendências que mostram que a Ethernet ultrapassará o uso da InfiniBand em data centers de IA nos próximos 24 meses, e a IDC indicou que o SONiC é o sistema operacional de rede aberta de crescimento mais rápido para switches abertos. A Ethernet e o SONiC podem fornecer a conectividade necessária com um TCO menor do que o mercado extremamente limitado de ofertas InfiniBand atual.

• Aumento da inovação e agilidade: A comunidade de código aberto impulsiona a inovação rápida no SONiC. Os data centers de IA podem se beneficiar da adoção mais rápida de novas tecnologias de rede e contribuir para o desenvolvimento de recursos especificamente necessários para cargas de trabalho de IA. A arquitetura modular permite a implantação mais rápida de novos serviços e recursos sem interromper toda a rede.

• Controle e flexibilidade aprimorados: As organizações ganham maior controle sobre sua infraestrutura de rede, permitindo que a adaptem e otimizem precisamente às demandas das aplicações de IA. Elas não estão limitadas aos recursos e roteiros de um único fornecedor.

• Maior confiabilidade e tempo de atividade: Recursos como componentes em contêineres no SONiC permitem atualizações em serviço e isolamento de falhas, minimizando o tempo de inatividade, essencial para o treinamento ininterrupto de IA e tarefas de inferência. O suporte para configurações Top-of-Rack ativo-ativo (ToR) aumenta a resiliência da rede.

• Forte apoio da comunidade: A grande e ativa comunidade SONiC, incluindo grandes players no setor de IA e redes (como Microsoft, NVIDIA, Broadcom e outros), fornece amplo suporte, documentação e uma riqueza de conhecimento, facilitando a implantação e o gerenciamento do SONiC em ambientes de IA complexos.

O resultado líquido:

Os data centers de IA estão migrando para a comutação Ethernet, a comutação Ethernet está migrando para o uso de comutadores abertos que incluem silício aberto, e os comutadores abertos estão migrando para o uso do SONiC para agregar valor. Por quê? O SONIC fornece uma base de rede moderna, adaptável e econômica, adequada para atender aos requisitos exclusivos e exigentes da Inferência de IA (alto desempenho e baixa latência, RDMA, controle de congestionamento, etc.). A infraestrutura aberta baseada no SONiC permite aumentar drasticamente a utilização de recursos de alto custo (como GPUs) e reduzir o tempo de treinamento e inferência. O SONiC para IA permite maior controle, máxima flexibilidade e desempenho invejável da carga de trabalho de Inferência de IA.

Você também pode gostar

🔹 Visite Edgecore para saber mais sobre SONiC 👉 https://www.edge-core.com/sonic/

🔹 Fique conectado conosco 👉 https://www.edge-core.com/subscribe-newsletter/

🔹 Entre em contato conosco 👉 https://www.edge-core.com/Contact-inquiry/

Se você tiver algum comentário, pergunta ou dúvida sobre nossos produtos e serviços, preencha o formulário a seguir.

Ao enviar este formulário, você concorda que podemos usar os dados fornecidos para entrar em contato com você com informações relacionadas à sua solicitação/envio e às soluções e serviços da Edgecore.
Para obter mais informações sobre como lidamos e usamos suas informações pessoais, consulte nossa política de Privacidade.