O desafio: provar o poder do Ethernet para a supercomputação de IA 

Tradicionalmente, a computação de alto desempenho (HPC) e o desenvolvimento em larga escala de LLM (Large Language Model) exigiam protocolos fechados e específicos de fornecedores, como o InfiniBand. A Sakura Internet buscou superar essa dependência de fornecedores ao utilizar tecnologia Ethernet transparente de alta velocidade que pudesse se integrar perfeitamente à sua infraestrutura de nuvem existente baseada em Linux. 

Parceria Estratégica: Verificação Conjunta da Macnica e do Edgecore* 

O sucesso do Sakura ONE foi impulsionado por uma colaboração tripartite entre a Sakura Internet, a Macnica e a Edgecore Networks. Juntas, elas desenvolveram uma estrutura de rede desagregada que combinava hardware de ponta com um suporte técnico local robusto: 

  • Comutação 800GbE de alta densidade: Sakura Internet implantada 26 switches Edgecore 800G (com tecnologia Broadcom Tomahawk 5) para lidar com a enorme quantidade de dados necessária para um cluster de 800 GPUs. 
  • Distribuição Enterprise SONiC: Ao escolher Empresa SONiC, Com o Sakura Internet, a estabilidade e a rápida resolução de problemas necessárias para serviços comerciais foram superadas, ultrapassando as limitações das versões exclusivas para a comunidade. 
  • Coordenação e verificação especializadas: Macnica próForneceram suporte essencial em campo, desde a verificação proativa de desempenho até a resolução de problemas complexos. Sua coordenação em tempo real com a equipe de P&D do Edgecore garantiu que os requisitos técnicos fossem atendidos com velocidade e precisão incomparáveis. 

Resultados: Velocidade de lançamento no mercado sem precedentes 

Aproveitando as soluções de rede aberta da Edgecore e a coordenação técnica especializada da Macnica, a Sakura Internet superou o que antes era considerado um desafio sem precedentes: 

  • Implantação de 4 meses: Reduziu o projeto de um supercomputador, que normalmente levaria dois anos, para apenas quatro meses. 
  • Ranking dos 50 melhores: Comprovado que Ethernet e SONiC estão prontos para as cargas de trabalho de treinamento de IA mais exigentes do mundo. 
  • Otimização do Custo Total de Propriedade (TCO): Redução significativa dos custos de hardware, ao mesmo tempo que se obtém a flexibilidade estratégica para escalar para 1,6T e além. 

A Macnica é a distribuidora autorizada da Edgecore no Japão, fornecendo suporte técnico especializado e verificação do sistema. 

Leia na íntegra

Artigo retirado da BUSINESS NETWORK

Comprovando que redes abertas podem competir com os protocolos tradicionais de HPC, Sakura UM alcançou o Top 50 global usando um Edgecore 800G e Enterprise SONiC tecido. Esta implementação histórica demonstra como soluções desagregadas proporcionam o desempenho, a automação e a rapidez de lançamento no mercado necessários para a modernidade. supercomputação de IA.

Leia na íntegra
NÓS RECOMENDAMOS
  • 64 portas de switch OSFP800 com Tomahawk 5 Switch de alto desempenho e baixa latência para data centers de alto desempenho

    64 portas de switch OSFP800 com Tomahawk 5 Switch de alto desempenho e baixa latência para data centers de alto desempenho

  • 64 portas de switch QSFP-DD800 com Tomahawk 5 Switch de alto desempenho e baixa latência para data centers de alto desempenho

    64 portas de switch QSFP-DD800 com Tomahawk 5 Switch de alto desempenho e baixa latência para data centers de alto desempenho