突圍英偉達算力壟斷!亞馬遜(AMZN.US)AI ASIC迎來結構性拐點:開始獲業界青睞
時間:2026-05-20 15:10:59
亞馬遜
英偉達
智通財經APP獲悉,據報道,亞馬遜(AMZN.US)的 Trainium 人工智能加速器開始贏得一些人工智能開發人員的青睞,這些開發人員歷來依賴英偉達(NVDA.US)的產品。
英偉達的GPU被廣泛認為在AI加速器市場佔據主導地位,由於超大規模數據中心、AI前沿模型實驗室和其他買家的旺盛需求,其供應一直處於短缺狀態。雖然市場上存在英偉達產品的替代方案,包括AMD、亞馬遜、谷歌以及其他定製專用集成電路(ASIC)產品,但據報道,越來越多的開發者開始意識到亞馬遜Trainium產品的吸引力。媒體The Information援引了六位使用該芯片或與該芯片合作的人士的訪談。
Superlinked首席執行官Daniel Svonava告訴The Information:“我們一直以來都認為軟件支持不足是一個障礙。但這種情況在過去幾個月裏發生了改變,這個障礙已經消除。”
另一位開發者,Loka 的機器學習負責人 Bojan Jakimovski 也表示,過去幾個月人們對 Trainium 的興趣有所上升,部分原因是英偉達 GPU 的供應緊張。他還補充説,一位客户在測試表明 Trainium 第二代芯片的成本比英偉達 H100 系列芯片最多可降低 35% 後,將其推理工作負載切換到了 Trainium 的第二代芯片上。不過,Jakimovski 補充説,他仍然建議在英偉達的產品上進行大型語言模型訓練。
亞馬遜首席執行官Andy Jassy近日表示,該公司芯片業務如果獨立運營,每年可創造500億美元的收入。傑西在最近致股東的信中寫道: “我們的定製芯片業務現在是全球三大數據中心芯片業務之一。”
開發者為何從"別無選擇"走向"主動擁抱"?
英偉達的GPU被廣泛認為是AI加速器市場的王者,其CUDA軟件生態更是構建了一道令競爭對手難以逾越的護城河。然而,正是因為英偉達的地位太過強勢,其產品供應長期處於緊繃狀態——超大規模雲服務商、AI前沿模型實驗室和其他買家如飢似渴的需求,使英偉達GPU長期處於結構性短缺之中。
這種供不應求的局面,催生了市場對替代方案的剛性需求。雖然市場上存在AMD、谷歌TPU及其他定製ASIC等替代選項,但Trainium正以超出市場預期的速度獲得開發者的實際採用。
軟件生態:從"障礙"到"消除"的質變
Superlinked首席執行官Daniel Svonava對The Information的一番話精準概括了這一轉折:"我們一直以來都認為軟件支持不足是一個障礙。但這種情況在過去幾個月裏發生了改變,這個障礙已經消除。"這句話的分量在於:在AI芯片的競爭中,硬件參數往往只決定產品的下限,而軟件生態決定了產品的上限。Trainium在軟件層面實現從"障礙"到"消除"的蜕變,意味着其不再是一個僅供小範圍測試的替代選項,而是具備了規模化商用條件的生產力工具。
成本優勢:新一代"降本增效"武器
Loka機器學習負責人Bojan Jakimovski同樣觀察到Trainium的吸引力正在顯著上升,且背後有堅實的經濟邏輯支撐。部分客户之所以轉向Trainium,直接原因在於英偉達GPU的獲取難度;但更重要的是,一位客户在測試發現Trainium第二代芯片的成本比英偉達H100系列最多可降低35%後,果斷將其推理工作負載切換到了Trainium上。
在AI推理工作負載日益成為算力消耗主力(目前約佔全部AI計算量的三分之二)的趨勢下,35%的成本優勢意味着對於一家中等規模的AI公司而言,每年可能節省數百萬至數千萬美元的算力支出。這並非零和博弈中的輕微偏移,而是足以改變採購決策的結構性優勢。
技術架構的先發優勢:MoE推理的獨特護城河
Gavin Baker的判斷尤為尖鋭且具技術洞察力。他指出,當前主流的前沿AI模型均採用混合專家模型(Mixture of Experts,MoE)架構,而運行此類模型的推理任務,需要交換式擴展網絡(Switched Scale-up Network)的基礎設施。全球目前僅有兩家公司擁有運行中的交換式擴展網絡:一家支撐着英偉達的GPU集羣,另一家則驅動着亞馬遜的Trainium。
這意味着,在MoE模型推理這一快速增長的關鍵賽道上,Trainium並非簡單的追趕者,而是擁有獨特技術壁壘的先發者。Baker進一步指出,谷歌TPU在同一領域並不具備同等能力,並透露谷歌雖然發明了MLPerf基準測試,卻從未提交過TPU的測試成績。這一細節的透露,無疑強化了市場對Trainium技術獨特性的重新評估。Baker預計,Trainium 3在今年下半年大規模量產後,Trainium在2026年的市場地位將相當於TPU在2025年的地位。
客户生態:從"萬級"到"十萬級"的臨界點躍遷
Trainium的突破不僅體現在技術層面,更體現在客户基礎的規模化驗證上。據亞馬遜在4月與Anthropic深化戰略合作時的披露,Trainium與Graviton各自均有超過10萬家客户,Amazon Bedrock目前的大部分推理任務均基於Trainium運行。10萬家客户這一數字,標誌着Trainium的客户基礎在2025年下半年以來發生了從量變到質變的躍遷——它已不再是一個只在少數實驗室中進行測試的小眾產品,而是具備了大規模商用驗證的系統性替代方案。
Anthropic與OpenAI:最大的"質量證明"
在關鍵客户層面,Trainium獲得了兩家全球最重要AI模型公司的深度綁定。4月20日,亞馬遜與Anthropic宣佈深化戰略合作:亞馬遜在原有基礎上再向Anthropic追加投資最高250億美元,而Anthropic則承諾未來10年內將在AWS相關技術上投入超過1000億美元,並採購最高5吉瓦的AWS當前及未來幾代Trainium芯片算力。Anthropic的旗艦模型Claude運行在超過100萬個Trainium2芯片上。
OpenAI的加盟同樣意義深遠。今年2月,OpenAI與亞馬遜建立多年期戰略合作伙伴關係,亞馬遜向其投資500億美元,並向OpenAI提供2吉瓦的Trainium算力容量。OpenAI承諾使用Trainium 3及下一代Trainium 4芯片,用於支撐其廣泛的先進人工智能工作負載。
對於芯片產品而言,客户質量往往比客户數量更具信號意義。當全球最具技術鑑別能力的AI前沿實驗室選擇將核心工作負載運行在Trainium上時,這本身就是對芯片性能和生態成熟度最有力的背書。
從"租借算力"到"直銷芯片":500億美元帝國的藍圖
更值得關注的是Trainium商業模式的戰略升維。今年4月,亞馬遜CEO安迪·賈西在一封致股東的信中披露,公司正在考慮改變以往僅供內部使用的策略,轉而向第三方直接銷售其自研芯片及整機架——若該部門獨立運營並全面對外開放,年化營收規模有望達到500億美元。
賈西進一步指出,這一數字已超過AMD和英特爾的同期水平,並直言"我們的定製芯片業務現在已是全球三大數據中心芯片業務之一"。這並非紙上談兵。截至披露時,亞馬遜已手握2250億美元的Trainium芯片收入承諾,涵蓋Anthropic、OpenAI等戰略客户。Trainium2的性價比已高出同類GPU產品30%,且已基本售罄;Trainium3剛剛在2026年開始發貨,性價比較Trainium2再提升30%至40%,已幾乎全部被預訂;就連距離大規模供貨還有約18個月的Trainium4,其絕大部分產能也已被鎖定。
兩代產品全部售罄、連尚未大規模量產的下一代芯片也已被大量預訂——這種需求信號在半導體行業歷史上極為罕見。它表明Trainium的吸引力並非短期炒作,而是客户在充分評估後做出的長期戰略鎖定。
ASIC結構性拐點
Trainium的崛起,正在重塑AI芯片領域最深層的產業關係——亞馬遜與英偉達之間長期的"供應商與客户"模式。這一關係原本清晰:英偉達負責設計和製造最強大的AI芯片,亞馬遜作為最大的雲服務商之一大規模採購。然而,當亞馬遜開始設計並部署自己的AI加速器時,雙方的角色發生了微妙變化。最新數據顯示,亞馬遜目前部署的Trainium服務器數量已超過英偉達服務器,且公司估算自研芯片相較採用外購GPU可節省數十億美元的資本支出。
但這一關係並非簡單的替代。亞馬遜既沒有放棄採購英偉達芯片——最新簽署的採購承諾仍在擴大——也沒有停止對Trainium的重注。兩者目前呈現出一種複雜的"競爭共存"格局:Trainium在推理工作負載中快速擴大份額,而英偉達GPU在訓練大規模基礎模型方面仍佔據主導。
從更宏觀的行業視角來看,定製ASIC正在經歷一個結構性拐點。數據顯示,2026年,來自谷歌、微軟、亞馬遜和Meta的定製AI芯片正以44.6%的複合年增長率高速擴張,而通用GPU的複合年增長率僅為16.1%。定製ASIC的增長主要瞄準推理市場——目前推理已佔全部AI計算量的約三分之二。雖然英偉達當前仍佔據AI加速器市場超過90%的份額,但分析師預計到2028年,其在推理領域的份額可能從90%以上降至20%至30%。
Trainium是這股定製ASIC浪潮中最重要的變量之一。正如行業報告所論斷的:2026年標誌着"定製ASIC不再只是實驗項目,而是成為英偉達GPU壟斷的生產力規模替代方案"的時刻。
現實邊界:Trainium距離"全面替代"還有多遠?
儘管Trainium正在經歷顯著的用户增長和性能升級,但在全面評估其市場定位時,必須保持客觀與冷靜。最需要澄清的一點是:對多數前沿AI實驗室而言,Trainium當前更適合推理而非訓練。
Bojan Jakimovski雖然證實了Trainium在推理環節的成本優勢,但他仍表示會建議客户在大型語言模型訓練上繼續使用英偉達的產品。這反映了一個現實:在大規模模型訓練的靈活性、算子生態的完整性以及社區支持的深度方面,英偉達CUDA生態建立起的優勢仍然十分顯著。
此外,值得注意的是,Trainium的火熱需求與亞馬遜股價近期的表現存在一定脱節。儘管Trainium AI芯片正吸引越來越多的開發者興趣,但亞馬遜股價表現近期仍然不如其他科技巨頭。市場對於AI芯片領域的競爭加劇——英偉達、AMD、谷歌TPU、微軟Maia和Meta MTIA同台競技——存在整體性的估值重新定價過程。Gavin Baker雖然在Trainium上持積極立場,但同時也強調“我永遠不會做空谷歌,也不會做空博通”,表明這是一個多贏市場,而非零和博弈。
此外,所有主流AI芯片——無論是定製ASIC還是英偉達GPU——均採用台積電3nm工藝製造。這意味着谷歌、微軟、亞馬遜、Meta、英偉達全都在爭奪同一家代工廠的有限產能。產能約束對所有玩家一視同仁,任何一家芯片設計商的快速擴張都可能遭遇物理交付上限的制約。
免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!


