輝達的現狀與轉型重點/訓練(Training)vs. 推理(Inference): 目前輝達靠著訓練市場(市佔 86%)賺取暴利,但未來 AI 應用的重心將轉向「推理」。用輝達昂貴的 GPU 做推理如同「開法拉利送外送」,成本過高。這給了客製化晶片(ASIC)和雲端巨頭(Google, Amazon, Microsoft)反攻的機會。收購 AI 晶片公司,看重的是其在「推理效率」或「架構簡化」上的突破。在訓練階段,開發者需要的是強大的算力來消化海量數據;但在推理階段(即用戶端使用時),客戶更在意的是功耗比(Perf/Watt)與單位成本/雲端供應商自行開發的晶片(如 Google 的 TPU)在特定任務下的推理效率往往高於通用型 GPU。如果輝達不能在推理端推出更具成本效益的解決方案,2030 年市佔率掉到 22.5% 的預測並非危言聳聽。


輝達的現狀與轉型重點
1. 市場結構的劇烈位移
訓練(Training)vs. 推理(Inference): 目前輝達靠著訓練市場(市佔 86%)賺取暴利,但未來 AI 應用的重心將轉向「推理」。
成本危機: 稿件指出,用輝達昂貴的 GPU 做推理如同「開法拉利送外送」,成本過高。這給了客製化晶片(ASIC)和雲端巨頭(Google, Amazon, Microsoft)反攻的機會。
2. 戰略防禦:從「賣零件」到「賣工廠」
AI 工廠(AI Factory): 黃仁勳不再只賣單顆晶片,而是推廣整座資料中心(機櫃與系統),提高競爭門檻與客單價。
鎖死供應鏈: 預付 450 億美元包下 SK 海力士與美光的 HBM(高頻寬記憶體)產能,讓對手無米下鍋。
3. 神秘收購案:收購 GG 公司與詹娜·羅斯
技術補強: 2025 年底以 200 億美元收購 AI 晶片公司,看重的是其在「推理效率」或「架構簡化」上的突破。
靈魂人物: 詹娜·羅斯(Jenna Ross)具備深厚的數學背景,曾解決 Google 基礎架構的效能瓶頸,這正是輝達在後 GPU 時代需要的軟硬體優化能力。
## 補充與深度分析
1. 為什麼「推理」會讓輝達焦慮?
在訓練階段,開發者需要的是強大的算力來消化海量數據;但在推理階段(即用戶端使用時),客戶更在意的是功耗比(Perf/Watt)與單位成本
威脅: 雲端供應商自行開發的晶片(如 Google 的 TPU)在特定任務下的推理效率往往高於通用型 GPU。如果輝達不能在推理端推出更具成本效益的解決方案,2030 年市佔率掉到 22.5% 的預測並非危言聳聽。
2. 「用魔法打敗魔法」的本質
黃仁勳深知硬體終究會面臨效能邊際效應,因此他正在加固 CUDA 生態系。
軟體定義硬體: 通過收購具備強大數學演算法背景的人才(如羅斯),輝達試圖從底層編譯器和演算法去優化運算路徑,讓原本沉重的 GPU 也能在推理任務中表現得像專用晶片一樣輕快。
3. 地緣政治與台積電的鏈結
稿件提到黃仁勳在台灣夜市的行為是「演給對手看」。
供應鏈韌性: 在 2026 年的節點,2 奈米(N2)產能的爭奪戰已經進入白熱化。黃仁勳頻繁訪台,實則是為了確保台積電最

留言