You are currently viewing 突破800G! – 第一部分

突破800G! – 第一部分

作者: Barry McGinley 2024年3月7日

自ChatGPT于2022年底问世以来,世界各地每个社交场所的神学家都在广泛讨论人工智能和机器学习的优势。无论你认为它是上帝的礼物,还是撒旦的后代,它都会存在并将越来越多地影响我们的生活。

这篇博客不是关于人工智能或机器学习的优缺点,而是这些闪亮平台背后的网络技术。这些平台减少了人为错误,全天候工作,协助医疗诊断,并为我们编写了像下面这张馅饼一样的美味食谱!

(这是在输入了30,000份食谱并要求它创建自己的食谱之后)

“甜菜金枪鱼馅饼。“想成功吗?你需要以下材料:

  • “1份煮熟的苹果蛋黄酱”
  • “5杯块状物;切成薄片”。
  • “将一个半打重水倒入高锅中,放置并排好,然后倒出水,切成1/4英寸大小留在锅中”。

玩笑归玩笑,这是一项严肃的技术,虽然还处于起步阶段,但它已经开始让世界变得更美好。

在数据中心的幕后,我们有GPU或图形处理单元。英伟达拥有这一市场约90%的份额,AMD获得了这一市场份额。GPU是人工智能工作的内在特征,在简单的层面上,它将使用并行处理同时处理多个任务。这种处理能力非常重要,但其背后的网络也非常重要。

让这个人工智能发电站结出硕果的硬件和软件秘诀是什么?

 

硬件

硬件 交换机

OCP硬件现在可用的各种开放网络硬件证明了像开放计算项目(超链接)这样的组织,我会小声说这个,Meta。当时的脸书在2012年启动了OCP,目标是将硬件和软件分开。这将使硬件原始设备制造商以更快的速度前进,而软件公司则专注于他们擅长的软件领域。当时,硬件供应商都在使用博通的三叉戟和战斧系列ASICs,因此开始了某种标准化。对于Meta和谷歌等超大规模公司来说,由于竞争加剧,它们可以以更低的价格从多家供应商那里购买硬件。

在硬件供应商方面,我们有Asterfusion、Celestica、Delta、纬创、广达、Micas、锐捷以及Edgecore Networks和Ufispace这两家市场领导者。

 

EDGECORE NETWORKS

edgecore

Edgecore由Accton Group于2010年创立,旨在引领开放网络革命。Accton是台湾的一家OEM/ODM公司,为几乎所有人生产交换机和路由器。自开放网络诞生以来,它们一直是开放网络的黄金标准,自2012年以来,它们已将其交换机设计附属产品添加回OCP。这反过来允许其他硬件制造商在没有大量R&D开销的情况下构建交换机。你可能会说,为团队牺牲一下吧!

让我们来看看Edgecore Networks的新800G产品,该产品专为AI/ML使用情形而设计,作为主干交换机,允许移动到400G叶交换机。

AIS800-64D

AIS800-64D

AIS800-64D – AS9817-64D AIS800-64D / AS9817-64D 具有64个QSFP-DD800交换机端口,带有Broadcom的Tomahawk 5 ASIC。一种用于AI/ML集群的高性能、低延迟交换机,可用作主干交换机。支持在数据中心内迁移到400G叶子连接。

因此,我们有64个QSFP-DD800端口。这些可用于每个端口1x 800G 或通过分线、2x 400G, 4x 200G, 或 8x 100G ,最多320个端口。那会有点乱,对吧?我们的前面板上有1PPS、10 MHz和ToD连接器,支持同步和PTP。它采用2 RU外形规格,具有2个热插拔3000瓦PSU和4个热插拔风扇模块。在芯片方面,我们有一款支持Tomahawk 5,51.2T的ASIC,具有大量新功能,当您接触时,我会让您感到厌烦…

OSFP800

 

在软件方面,与所有开放式网络交换机一样,该交换机预装了开放式网络安装环境(ONIE)。ONIE是一个引导程序,允许我们安装NOS。唯一可用的NOS将是SONiC,可能还有IP Infusion的OcNOS,但我会在软件部分详细解释这一点。

AIS800-64O

AIS800-64O-2

带OSFP800端口的AS9817
AIS800-64O / AS9817-64O具有64个OSFP800端口,采用Broadcom的Tomahawk 5 ASIC。同样,用于高性能、低延迟AI/ML集群并用作主干交换机。

如您所见,与之前的AS9817-64D型号相似。主要区别在于OSFP800端口而不是QSFP-DD。这些光模块相似,但OSFP800的功率在12-15W之间,QSFP-DD在7- 12W之间。此机箱可支持1个800g(100G PAM 4)端口,或通过分线接口支持 2x 400G, 2x 200G, 或 8x 100G端口,最多320个端口。与其他一样,我们有所有的定时支持、热插拔PSU和风扇,以及Broadcom的Tomahawk 51.2T ASIC。我们还有一个BMC模块,用于远程监控和管理主机系统。软件选项有限,但我会很快解释。尽快联系以演示该设备!

UFISPACE

ufispace

UfiSpace 十多年来,Ufi一直为电信公司、服务提供商和数据中心提供端到端解决方案。他们是像Edgecore一样的台湾OEM/ODM。他们还在OCP和TIP等开放网络组织中发挥着领导作用,并且在工程和R&D部门非常强大。我们已经与UfiSpace合作了大约5年,对他们的评价很高。

UfiSpace有三款800G的型号供我们查看。他们有两个使用QSFP-DD和OSFP800端口的基于Tomahawk的交换机,但也有一个基于Trident 5的leaf或ToR选项。以下是800克比赛中的UfiSpaces选手和选手。

S9321-64E – QSFP-DD或OSFP

S9321-64E

UfiSpace S9321-64EAs顾名思义,我们有64个QSFP-DD或64个OSFP端口,带有Broadcom的Tomahawk 5 AfSIC。用于超大规模数据服务和AI/ML集群作为主干交换机,为上述GPU提供低延迟和超高基数。我们有4个英特尔Ice lake-D内核、热插拔风扇和电源、基于硬件的封装、增强的缓冲和流量管理等。

S9321

UfiSpace S9321拓扑结构
上面是一个示例架构,使用s 9321-64E(TH5)作为主干交换机,s 9320-32ED(TD5,我们将在下面介绍)和400G S9300-32D作为架顶式交换机连接到400G GPUs。使用主干和树叶,或一些人所说的CLOS拓扑结构,为我们提供了一系列好处。

  • 冗余–由于结构布局的原因,如果DC中的一台主干交换机发生故障,网络流量将会重新路由到另一台主干交换机,因为每片叶子都连接到每台主干交换机。这消除了我们网络中的任何单点故障。
  • 可扩展性–再简单不过了!只需添加更多的边缘交换机来适应不断增加的容量。我们告诉我们的客户保留备用的叶交换机,由于裸机硬件的价格较低,因此资本支出不会很大。
  • 降低成本–我之前提到过该领域的竞争降低了消费者的硬件价格。当涉及到软件部分时,也没有隐藏成本。没有额外功能的年度订阅或隐藏费用。
  • 最小延迟–我们在Tomahawk 5机器上增加了额外的功能来显著降低延迟,但拓扑本身也降低了延迟,并使交换机到交换机的可预测性更高。软件方面的融合以太网RDMA也将获得更低的延迟。

Ufispace拥有从1G到800G的全套交换机产品组合,因此如果您不需要这些令人难以置信的速度,就没有必要感到被排除在外。下面是端口、速度和容量可用产品集的快速指南。如果您需要关于任何开关的任何信息,请与我们联系。

800g路线图

这几乎涵盖了开放网络中可用的800G硬件。总之,我们有多个使用OSFP外形的模型、多个使用QSFP-DD的模型以及一个基于Trident 5的超大规模leaf用例模型。正如我常说的那样,没有软件的镇纸非常昂贵,所以请继续关注第2部分,了解行业内的所有软件。

和往常一样,我非常乐意与您分享更多资源,或者想了解更多关于产品或SDN的技术信息,请在此给我发邮件,您也可以在此浏览我们的开放式网络产品。

Slán go fóill,
Barry

发表回复