國際電子商情訊,根據美媒近日披露,英偉達新一代Blackwell AI GPU已經面臨延遲交付,并遇到了配套服務器過熱的問題,客戶擔憂沒有足夠的時間讓新數據中心啟動和運行。
根據知情人士的爆料,Blackwell AI GPU裝入可容納多達72顆芯片的服務器機架時會出現過熱的問題,這些機器預計每個機架的功耗高達120kW。而過熱會限制GPU性能并有損壞組件的風險。
目前,包括英偉達員工、客戶和供應商在內的多方面消息稱,英偉達已多次要求供應商調整機架設計,但這種過熱的問題依然存在。
外媒的報道稱,一些英偉達客戶擔心沒有足夠的時間推進新數據中心的建設運行,包括元宇宙、谷歌和微軟等在內的科技巨頭均受到影響。
對此,有多家媒體致電英偉達。英偉達方面對媒體回應表示:“我們正在與領先的云服務提供商合作,將其作為我們工程團隊和流程中不可或缺的一部分。工程迭代是正常且符合預期的。將GB200這一迄今為止最先進的系統集成到各種數據中心環境中,需要與我們的客戶共同設計。”
據悉,Blackwell用作培訓大語言AI模型,其速度比英偉達上一代芯片H100的速度快2.5倍。該芯片此前預計發貨時間為今年第二季度。
據悉,Blackwell是英偉達在2024年3月推出的新一代AI芯片與超級計算平臺。Blackwell的強悍性能一直為大家津津樂道,它由多個英偉達芯片組成,包括Blackwell GPU、Grace CPU、BlueField數據處理單元、ConnectX網絡接口卡、NVLink交換機、Spectrum以太網交換機和Quantum InfiniBand交換機,涵蓋了從CPU和GPU計算到用于互連的不同類型的網絡,可支持多達10萬億參數的模型進行AI訓練和實時大語言模型(LLM)推理。
Blackwell的具體性能還包括以下:
信息來源:ESM China
日期:2024年11月20日