與英偉達的NVlink相似,AMD則推出了其Infinity Fabric技術,AMD Infinity 架構與第二代 AMD EPYC處理器一同推出,使系統構建者和云架構師能夠釋放最新的服務器性能,同時又不犧牲功能、可管理性或幫助保護組織最重要資產(數據)的能力。Infinity Fabric支持芯片間、芯片對芯片,以及即將推出的節點對節點的數據傳輸。
英特爾則是以太網的堅實擁護者,英特爾的用于生成式AI的Gaudi AI芯片則一直沿用傳統的以太網互聯技術。Gaudi 2每個芯片使用了24個100Gb以太網鏈路;Gaudi 3也使用了24個200Gbps以太網RDMA NIC,但是他們將這些鏈路的帶寬增加了一倍,達到200Gb/秒,使芯片的外部以太網I/O總帶寬達到8.4TB/秒。
拼服務
諸如ChatGPT這樣的生成式AI開發任務極其復雜,大模型需要在多臺計算機上運行數十億到數萬億個參數,它需要在多個GPU上并行執行工作,采用張量并行、流水線并行、數據并行等多種并行處理方式,以盡可能快地處理任務。
因此,如何能夠幫助用戶更快的開發,提供良好的服務也是關鍵一役。
在這方面,英偉達推出了一種新型的軟件NIMS,即NVIDIA Inference Microservices(推理微服務)。黃仁勛稱之為“盒子里的人工智能”,NIMS中包含了英偉達的CUDA、cuDNN、TensorRT、Triton。NIMS 不僅使部署 AI 變得更容易,只需幾分鐘而不是幾個月,它們還構成了客戶可以創建新應用程序和解決新問題的構建塊。如果采用,NIMS 將有助于加速創新并縮短價值實現時間。Nvidia 還宣布,NIMS 現在可供開發人員和研究人員免費使用。在生產中部署NIMS需要AI Enterprise許可證,每個GPU的價格為4500美元。
結語
下一場AI之戰已然打響,綜合來看,當前AI芯片市場上,英偉達、AMD和英特爾等主要芯片巨頭正在展開激烈的競爭。他們不僅在速度、技術和工藝方面競相創新,還在互聯和服務等領域積極拓展,致力于為用戶提供更快、更強、更智能的AI解決方案。AI芯片爭霸戰仍在繼續,誰能最終勝出?讓我們拭目以待。
(原標題:下一代AI芯片,拼什么?)