
我的整个职业生涯都从事网络交换业务,始于DEC。我参与了将以太网引入世界的团队,我记得当时10 Mbps的速度与我们习以为常的56K和“T1”点对点专线相比简直是闪电般的速度。虽然以太网听起来很棒,但基本的部署要求仍在制定中;例如,如何使用双绞线来承载最初设计为使用同轴电缆作为介质的以太网,以及如何构建透明、经济高效且能够大幅扩展原本非常局限的局域网技术的距离和规模的交换机元件(而不是中继器)。因此,每当我想起我们已经取得的进展,并听到像博通最新的Tomahawk 6这样的新芯片组时,我都会感到欣慰。
博通的“商用芯片”系列长期以来一直是高性能网络交换的代名词,构成了全球数据中心和超大规模环境的骨干。博通商用芯片产品的每一次迭代,都突破了带宽、密度和功能集的界限,持续提供所需的创新,以跟上日益加速的数字格局。博通最近发布的第六代旗舰交换芯片Tomahawk 6,标志着又一次重大飞跃,突破了100 Tbps的门槛,巩固了其作为全球人工智能基础设施建设基石的地位。(作为参考,100 Tbps的带宽比英特尔、DEC和施乐公司的Bob Metcalf于1978年左右率先推出的第一代以太网高出5个数量级。)
但这不应令人意外,因为过去十年,博通的交换芯片发布始终致力于在软件定义封装中追求更高性能和更高效率。博通证明了交换芯片并非固定功能,无需昂贵且耗时的ASIC“旋转”来解决错误或性能问题。从早期的多TB容量芯片到集成先进遥测和可编程流水线的后续产品,每款产品都建立在上一代产品的基础上,最终成就了如今的“Tomahawk 6”这款强大的芯片。这一进步不仅仅关乎原始速度,更关乎打造出能够处理最苛刻工作负载的、日益智能化和适应性更强的网络芯片。在人工智能时代,最新的Tomahawk对认知路由和超以太网(即“无损”)的支持,立即成为衡量所有其他解决方案的标杆。因此,Dell'Oro集团最近报告称,人工智能后端网络对以太网的需求现已超过所有其他技术,也就不足为奇了。
Tomahawk 6:深入探讨突破性创新
正如我上面所说,这不仅仅关乎速度。Tomahawk 6 不仅仅是一款速度提升的芯片;它代表着方法上的重大革新,以满足 AI 训练和推理前所未有的需求。
与前代产品相比,以下是其最具影响力的五个新功能或显著改进的功能:
1.前所未有的带宽和端口密度:
Tomahawk 6 打破了之前的带宽记录,提供惊人的 102.4 Tbps 交换容量。这意味着它能够在单个芯片中支持多达 64 个 1.6T 端口、128 个 800G 端口、256 个 400G 端口或 512 个 200G 端口!带宽的大幅提升对于构建 AI 集群至关重要,因为数百或数千个 GPU 需要以最小延迟和最大带宽进行通信,以共享海量数据集和模型参数。这种密度可以实现极其平坦高效的网络拓扑。
2.AI/ML 工作负载的超低延迟:
大规模 AI 训练面临的最大挑战之一是最大限度地降低 GPU 间的通信延迟。Tomahawk 6 引入了多项架构增强功能,旨在降低整个架构的延迟。这通过优化数据包处理、减少缓冲延迟、认知路由和高级流量管理算法来实现。在 AI 领域,即使延迟降低几微秒,也能显著缩短模型训练时间,降低成本,并提高整体集群效率。
3.增强拥塞管理和流量控制:
AI 工作负载的特点是“巨流”——计算节点之间海量、持续的数据传输。有效管理这些流量而不引入瓶颈至关重要。Tomahawk 6 集成了更先进的拥塞管理机制,包括高级 ECN(显式拥塞通知)功能和智能缓冲区管理。这些功能确保即使在峰值负载下,数据也能顺畅高效地传输,防止敏感 AI 应用的性能下降。随着超级以太网及其高级流量功能的日益普及,Tomahawk 6 也为其提供了全面支持。
4. 先进的带内网络遥测 (INT) 和可视性:
随着网络日益复杂,了解其核心性能对于故障排除和优化至关重要。Tomahawk 6 显著增强了博通本已强大的遥测功能,这些功能已在 Tomahawk 各代产品中得到应用。Tomahawk 6 提供更深入、更精细的带内网络遥测,使运营商能够实时监控网络状态、识别微突发并查明性能异常。这种可视性对于维护高风险 AI 基础设施的健康和性能至关重要,因为即使是微小的问题也可能中断昂贵的训练工作。
5. 更高的可编程性和功能集灵活性:
Tomahawk 6 延续了博通对可编程管道的承诺,为网络运营商提供更高的灵活性,使其能够定制数据包处理并实现创新的网络功能。这种可编程性在快速发展的人工智能领域至关重要,因为该领域可能需要新的协议和优化的数据路径。此外,它还使超大规模网络运营商能够实现网络差异化,并集成专有的优化技术,从而获得竞争优势。

Tomahawk 6 在人工智能革命中不可或缺的作用
全球人工智能基础设施建设的“狂潮”前所未有。它催生了曼哈顿规模的数据中心建设提案,推动了一度被废弃的核能重新成为关键能源,成为1000多家“人工智能”初创企业获得融资的催化剂,并造就了超过一百万的百万富翁。
人工智能要求网络不仅能够处理海量带宽,还必须具备前所未有的低延迟、高可靠性和精细控制能力。这正是 Tomahawk 6 的真正优势所在。
- 扩展人工智能超级集群: 训练最先进的 AI 模型需要将工作负载分布在数千个 GPU 上。Tomahawk 6 的 1.6Tbps 容量和高端口密度使其能够创建极其平坦的高基数网络拓扑,从而最大限度地减少跳数并最大化这些分布式计算资源之间的带宽。这对于防止网络瓶颈成为 AI 模型开发的限制因素至关重要。
- 实现分解基础设施: 随着人工智能工作负载日益多样化和动态化,对分散式计算、存储和加速资源的需求也日益增长。Tomahawk 6 驱动的网络提供必要的高速互连,使这些组件能够作为统一的高性能系统运行,从而实现灵活的资源分配并最大限度地提高利用率。本质上,Tomahawk 6 使所有这些资源都能够“以线速”运行。
- 面向未来的人工智能创新: Tomahawk 6 的软件定义可编程特性和先进功能集提供了高度的未来发展保障,这在固定功能 ASIC 芯片时代是前所未有的。随着人工智能算法和网络协议的演进,基于 Tomahawk 6 构建的底层网络基础设施将具备适应性,确保长久使用寿命并保护重要的基础设施投资。
综上所述,在以太网时代成长起来的IT专业人士会发现自己身处一个似曾相识的领域,但其水平却前所未有。由单个网络设备制造商定制ASIC芯片设计的时代已经一去不复返,商用高性能平台的软件定义时代已经到来。博通的Tomahawk 6展示了无限可能的高端技术。它不仅仅是一款高速网络芯片,更是下一波人工智能创新浪潮的关键推动者。其前所未有的带宽、超低延迟和先进的管理功能正是蓬勃发展的人工智能行业所需要的,它能够释放新的能力并实现扩展,以满足数据驱动型世界的需求。随着人工智能革命的持续发展,博通交换芯片系列(包括最新的Tomahawk 6)将在赋能塑造我们未来的智能领域中发挥不可或缺的作用。作为全球超过一半 Whitebox 解决方案的长期提供商,Accton 将始终保持领先地位,继续提供基于超大规模、企业和服务提供商社区所需的 Broadcom 芯片组的最高质量的开放式软件定义基础设施。
如果您对我们的产品和服务有任何意见、询问或问题,请填写以下表格。
最近的博客
2025 年 10 月 7 日
2025 年 9 月 30 日
2025 年 9 月 9 日