8304亿元建数据中心,OpenAI想用以太网交换机替代IB?
据 IT 外媒《The Information》近日报道,微软和 OpenAI 正在共建一个大型数据中心“星际之门”(Stargate),以容纳一台面向 AI 的超级计算机,该项目可能耗资超过 1150 亿美元(8304 亿元人民币)。尽管微软在当前的项目中使用了IB线缆,在网络基础设施方面,OpenAI倾向于使用开放以太网协议取代Nvidia InfiniBand(简称IB),旨在摆脱对英伟达的依赖。
自AI大火以来,市场对英伟达GPU需求量居高不下,英伟达因此拥有了市场定价权,像微软和OpenAI这样的公司不愿被厂商绑定、希望另辟蹊径的公司不在少数,国内诸如字节跳动等互联网大厂也纷纷自研交换机,今天做一台高端的交换机比以往任何时候都要容易。
与过去少数几个通信厂家靠着大机箱、大背板、大电源建立起高门槛的市场形势不同,现在可以用CLOS架构去背板,使用通用的硬件设计;在“软件定义一切”的时代,开放标准SAI和开源SONiC为用户提供更灵活、可定制和高性能的网络解决方案;加上国内外领先的芯片公司和软件公司给更多中小厂家提供了一个做自己交换机的开放底座,似乎只要拥有编程能力,多尝试便能自研交换机,自己构建网络。但事实果真如此吗?
对于许多AI企业来说,自研交换机付出的时间成本远高于直接购买交换机,且碍于IB交换机供货周期长、IB网络故障高度依赖原厂等问题,找到性能媲美IB的以太网交换机是降低网络部署成本的关键点,应该如何找到合适的厂商呢?
数据中心交换机多场景应用
星融元是国内唯一提供软硬一体的一站式企业级开放网络解决方案的供应商,经过多年的技术探索和经验积累,星融元收获许多企业的认可,在海内外已多次实现数据中心交换机的规模化部署。
轻松组建智算中心万卡网络
星智AI网络解决方案轻松组建智算中心万卡网络,满足用户智算中心网络建设需求的同时,也避免了传统网络在智算中心的不足。
- 不影响性能的情况下,网络架构精简极大的降低用户网络建设成本
- 网络只需1跳,减少业务时延
- 网络结构简化,降低运维以及故障排查难度
以32768个GPU,128端口交换机组网为例:
CLOS层数:1层(Rail Only)
交换机需要:256台
光发射器数量:65536
网络成本最大可降低:75%
低时延、零丢包、高性能的无损网络
AI方案以外,星融元还提供分布式存储网络解决方案和全以太HPC网络解决方案,可以为高性能计算集群提供真正意义上的低时延、零丢包、高性能的无损网络。在HPC 和分布式存储的方案现场测试中,星融元和IB交换机的数据相近,端到端可媲美甚至优于IB交换机。
方案详情请点击查看:
星融元发布基于RoCE的分布式存储网络解决方案
星融元发布基于超低时延交换机的全以太HPC网络解决方案
Dell’Oro预测AI需求将促使数据中心交换机市场扩大50%,交换机市场鱼龙复杂,选择部署数据中心交换机的厂商时,备受市场青睐和研究报告认可的星融元是国内AI企业的最好选择,毕竟谁会拒绝一台性能优越、成本低廉、供货周期短、售后服务周到的数据中心交换机呢?