(原标题:Jim Keller建议英伟达:使用以太网,而不是InfiniBand)
要是您但愿不错平常碰头,接待标星保藏哦~
开端:试验由半导体行业不雅察(ID:icbank)编译自tomshardware,谢谢。
行为灵通尺度的刚硬相沿者,Jim Keller 在推特上暗示,Nvidia 应该在基于 Blackwell 的GB200 GPU 中使用以太网公约芯片到芯片衔接,用于 AI 和 HPC。凯勒以为,这不错为英伟达过火硬件用户从简多数资金。这也将使这些客户更容易地将他们的软件搬动到不同的硬件平台,而英伟达不一定但愿这么作念。
当 Nvidia 推出用于 AI 和 HPC 应用的 GB200 GPU 时,该公司主要眷注其 AI 性能和先进的内存子系统,很少先容该开拓的制造形势。与此同期,Nvidia的GB200 GPU由两个盘算处置器构成,使用台积电的CoWoS-L封装技能和使用私有公约的NVLink互连技能缝合在沿路。关于那些如故使用 Nvidia 硬件和软件的东谈主来说,这不是问题,但这对业界从 Nvidia 平台移植软件建议了挑战。
神话 CPU 遐想师兼 Nvidia 竞争敌手Tenstorrent首席践诺官 Jim Keller建议 Nvidia 应该使用以太网而不是私有的NVLink ,这是有原因的。Nvidia 的平台使用私有的低延长 NVLink 进行芯片到芯片和奇迹器到奇迹器的通讯(与基于CXL公约的 PCIe 竞争),并使用私有的 InfiniBand 衔接进行更高层的通讯。为了最大赶走地种植性能,该软件针对这两种技能的特质进行了革新。出于不问可知的原因,这可能会使软件移植到其他硬件平台变得愈加复杂,这对 Nvidia 故意,但并不统共合适其竞争敌手。
不外,有一个问题。以太网在硬件和软件层面齐是一种无处不在的技能,它是 Nvidia 用于数据中心的低延长和高带宽(高达 200 GbE)InfiniBand 互连的竞争敌手。在性能方面,微交易平台以太网(极度是下一代 400 GbE 和 800 GbE)不错与 InfiniBand 竞争。
然则,InfiniBand 在 AI 和 HPC 功能以及出色的尾延长方面仍然具有一些上风,因此有些东谈主可能会说以太网的功能无法满足新兴的 AI 和 HPC 职责负载。与此同期,由 AMD、博通、英特尔、Meta、微软和甲骨文带头的行业正在开发超以太网互连技能,准备为东谈主工智能和高性能盘算通讯提供更高的费解量和功能。诚然,关于此类职责负载,超等以太网将成为 Nvidia InfiniBand 更有用的竞争敌手。
Nvidia 还面对着 CUDA 软件平台主导地位的挑战,因此受到业界平淡相沿的协调加快器基金会 (UXL)的出现,这是一个包括 Arm、英特尔、高通和三星等在内的行业定约,旨在提供一种替代决策到 CUDA。
诚然,英伟达需要开发可供此时使用的数据中心平台,这可能至少是其破耗数十亿好意思元购买私有技能的愿望的一部分。要是像带有 CXL 的 PCIe 和 Ultra 以太网这么的灵通尺度技能在性能和功能方面将非凡 Nvidia 私有的 NVLink 和 InfiniBand 技能,那么 Nvidia 将不得不重新开发其平台,因此 Keller 建议Nvidia 应遴选以太网。然则,这可能还需要数年期间,因此当今英伟达的遐想不息运用私有的互连。
英文原文:
https://www.tomshardware.com/tech-industry/artificial-intelligence/jim-keller-suggests-nvidia-should-have-used-ethernet-to-stitch-together-blackwell-gpus
点这里加眷注,锁定更多原创试验
*免责声明:本文由作家原创。著作试验系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或相沿,要是有任何异议,接待有关半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3735期试验,接待眷注。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的试验就点“在看”共享给小伙伴哦