英偉達AI GPU交貨周期縮至3-4個月,美國AI軟件公司高層表示,隨著明年供需再平衡,英偉達GPU芯片價格將會大幅下降。
自ChatGPT商用落地以來,在過去近一年半時間里,生成式AI應用加速落地,供應端力求盡快形成新質生產力。風口首先吹向的是AI算力市場,AI服務器作為算力主要載體,自然也首當其沖吃到第一波紅利。
一時間,大家探索“AI大模型+行業”的熱情高漲,高科技企業也需要AI服務器來訓練AI大模型。現在的AI大模型有數億至數千億個參數,數據量遠超傳統模型的規模。AI模型越復雜其數據集規模就越大,需要更多的算力資源來支撐訓練過程,這也催生了大量的AI芯片需求。
對AI芯片供應商來說,由于去年突然增加的需求過多,在短期內來不及跟進產能。一方面是“紅到發紫”的市場需求,另一方面是AI芯片供不應求,AI行業遭遇了“甜蜜的負擔”。
AI芯片可根據其設計和應用特性,分為 GPU、FPGA、ASIC(含NPU、ASSP)。FPGA和ASIC是半定制和全定制芯片,它們可針對AI需求特征定制。GPU是通用型AI芯片,是AI領域的主流芯片,它適合多種計算任務,在AI市場表現突出。
從AI GPU供應商層面來看,英偉達是全球當之無愧的No.1。2023年,市場研究機構TrendForce預計,英偉達GPU在全球AI服務器市場的占有率為60%至70%,而云端廠商自研AISC芯片的占有率超過20%。
當然,即使是英偉達這般體量的供應商,也難以滿足突增的AI GPU需求。早在去年上半年,供給端就傳出“算力市場供不應求”的消息——英偉達的多款GPU缺貨,GPU交貨周期拉長,半年累計漲幅近40%。H100 GPU在eBay上的價格,甚至一度被炒到4萬美元以上。而中國“特供”版A800/H800 GPU也被炒成高價,從原來的人民幣12萬元左右“炒”到了25-30萬,甚至還有高達50萬元一張的價格。一時間,大家都在調侃“顯卡已經成為理財產品”。
AI芯片供應緊張的情況,貫穿了2023年全年。去年Q4,英偉達AI GPU的交貨周期仍長達8至11個月,供應問題直到今年Q1才得到緩解,目前的交貨周期縮至3-4個月。
對此,瑞銀(UBS)分析師給出了兩種判斷:第一種是英偉達正在規劃新的方案提高產能,滿足未來的訂單;而另一種可能是英偉達目前已具備足夠的產能,可以處理積壓的訂單。當然,不排除是這兩個因素疊加的效果。
針對英偉達AI GPU交貨周期顯著縮短,美國AI軟件公司Databricks聯合創始人兼CEO Ali Ghodsi評價表示,隨著明年供需再平衡,英偉達GPU芯片價格將會大幅下降,從而給眾多AI科技巨頭和初創公司的商業模式帶來影響。
一般來說,當某類產品供應緊張時,廠商會爭分奪秒進行增產。可能會有人好奇,GPU缺貨早在去年上半年就已顯現,為何直到2024年Q1才緩解?其實,GPU缺貨并非受限于英偉達,而是受限于臺積電的CoWoS封裝產能。
CoWoS(Chip on Wafer on Substrate)是目前主流的AI處理器封裝方案,它是臺積電開發的一種2.5D芯片封裝技術,由CoW和oS兩種技術組合而來。先通過Chip on Wafer(CoW)的封裝制程,把芯片封裝到硅轉接板(硅中介層)上,并使用硅轉接板上的高密度布線進行互連,然后再安裝在封裝基板上。
經過了以上封裝步驟的芯片,具有封裝體積小、功耗低、引腳少的優勢。目前,CoWoS封裝主要使用在高性能計算、人工智能、云計算等領域。除了AI GPU之外,HBM、Chiplet也采用了CoWoS封裝技術。因此,CoWoS的產能是限制AI芯片出貨量的關鍵。
據Omdia的研究報告統計,僅在2023年Q3這一個季度,英偉達就售出了近50萬張AI計算卡,其中包括了H100、A100、H800、A800、L40S等。這些AI計算卡的買家有Meta、微軟、谷歌、亞馬遜、甲骨文和騰訊,其中Meta和微軟分別采購了15萬張H100 GPU,谷歌、亞馬遜、甲骨文和騰訊均采購了5萬張。
即使如此,英偉達供應的AI GPU仍無法滿足當前AI大模型訓練的需求。早在去年5月,就有消息傳出英偉達向臺積電增加A100和H100 AI GPU訂單,導致臺積電的晶圓開工量增加。到去年10月,英偉達確定擴大AI GPU訂單量的消息,隨后蘋果、AMD、博通、Marvell等企業也向臺積電追加了CoWoS封裝芯片訂單。
實際上,CoWoS的產能并不算高。截至2023年底,臺積電CoWoS的月產能不足2萬片晶圓。2023年10月,臺積電總裁魏哲家在法說會上表示,預計2024年底,將增加一倍以上的CoWoS產能,一直到2025年,臺積電將持續擴充CoWoS封裝產能。基于對臺積電的CoWoS擴充計劃,業內分析師估計,今年Q3 CoWoS產能可能迎來明顯增長。
為了實現提升CoWoS產能的目標,臺積電提前尋找設備供應商追加了30%的設備訂單,不過由于新設備交期長達8個月,難以快速滿足客戶的AI芯片訂單需求,為此臺積電改造了部分InFO(集成扇出型)設備,以此來支持CoWoS封裝芯片的生產。
2024年1月18日,魏哲家在法說會上再次談及先進封裝話題,他指出AI芯片先進封裝需求持續強勁,目前產能仍無法滿足客戶的強勁需求,供不應求狀況可能會延續到2025年。
雖然高科技巨頭如今都在聚焦AI,為了訓練自己的大模型,紛紛布局了AI服務器,但是來自中國的科技企業,在該輪AI競賽中遭遇了挑戰。
2022年10月,美國商務部工業和安全局(BIS)更新了針對中國的“先進計算芯片、半導體制造設備出口管制規則”,而英偉達的A100、H100等高端芯片在對華禁售范圍內。英偉達為規避限制規則,在A100、H100基礎上推出A800、H800,這兩款新品“特供”給中國市場。有業內人士爆料稱,H800的數據傳輸速率只有H100的一半。
到2023年10月,美國商務部再一次收緊了芯片規則,限制了英偉達A800、H800的出貨。業內再傳出,英偉達還將針對中國市場發布HGX H20、L20 PCle和L2 PCle,但這三款芯片的性能會再次“打折”。
信息來源:ESM China