
Описание
В последние годы спрос на возможности искусственного интеллекта и машинного обучения (ИИ/МО) в центрах обработки данных растет. Большинство приложений теперь используют глубокое машинное обучение с развертыванием в распределенных нейронных сетях. Такой подход гарантирует, что ресурсы остаются разблокированными и вычисляются параллельно, обеспечивая плавное масштабирование для удовлетворения растущих потребностей в услугах. В таких высокоскоростных сетевых средах DCQCN (квантовое уведомление о перегрузке центра обработки данных) выступает в качестве основного алгоритма контроля перегрузки в сетях RoCEv2, эффективно сочетая ECN (явное уведомление о перегрузке) и PFC (управление приоритетным потоком) для обеспечения сквозной передачи без потерь. Ethernet.
Существует одно основное различие между сетями AI/ML и облачными сетями; в AI/ML больше случаев слоновьего потока. Другими словами, более высокие скорости необходимы, чтобы выдержать пиковый поток данных и справиться с растущим трафиком распределенных вычислений. Что касается этих проблем, необходимо найти способ настроить сеть без потерь и с малой задержкой в более высокоскоростной среде. К этой задаче можно подойти с двух точек зрения: с точки зрения вычислительного узла и с точки зрения сети связи.
- Скачать
- Скачать 411
- Размер файла 381 КБ