人工智慧已從第一階段的「訓練為主」進入第二階段的「推論為主」從訓練轉向推論：雲端服務供應商（CSP）已完成初步訓練，現在需要透過「推論」來實現商業變現（賺錢）。運算需求暴增-代理型 AI 的發展將使運算需求比 ChatGPT 時期成長 1 萬倍/光進銅退（CPO 技術）當產業焦點從通用型 GPU 轉向專用的 AI 加速器（如 LPU）時，代表產業正進入成熟期。輝達透過軟硬體高度整合的「AI 工廠」方案，旨在協助客戶在推論時代大幅提升業績與效率

這段影片由「曲博科技教室」提供，深入解析了 NVIDIA GTC 2026 大會的重點。影片強調人工智慧已從第一階段的「訓練為主」進入第二階段的「推論為主」，並詳細介紹了輝達（NVIDIA）如何透過硬體與軟體革命來應對這一轉變。

以下是該影片的重點整理與內容摘要：

1. AI 發展的兩大轉折點 [00:00]

從訓練轉向推論：雲端服務供應商（CSP）已完成初步訓練，現在需要透過「推論」來實現商業變現（賺錢）。

運算需求暴增：預測到 2025 年，代理型 AI 的發展將使運算需求比 ChatGPT 時期成長 1 萬倍 [08:07]。

2. 核心硬體與架構革新

五層蛋糕架構：黃仁勳提出 AI 的五層架構，分別是能源、晶片、基礎設施（前三層合稱 AI 工廠）、模型以及應用 [01:41]。

首度整合 LPU（語言處理器）：輝達首度將 Groq 的 LPU 整合進其 AI 工廠，推出 LPX 伺服器，專門加速「推論」運算 [00:33]。

全新晶片 Rubin 系列：預計 2026 年推出的 Rubin GPU 將與 Vera CPU、NVLink 6 等組成強大的運算叢集，效能遠超目前的 Blackwell [12:36]。

光進銅退（CPO 技術）：介紹了 Spectrum-X **共同封裝光學（CPO）**交換機，解決海量數據傳輸的瓶頸 [14:12]。

3. 推論之王：提升獲利能力 [10:20]

降低成本：透過 GB300 等新架構，輝達宣稱能將推論成本降低 35 倍 [10:20]。

區分用戶等級：針對「高級用戶」與「超級用戶」，單靠 GPU 運算能力可能不足，必須導入 LPU 加速器才能維持高效能與高營收回報 [18:33]。

4. 軟體與生態系佈局

資料處理：推出 CUDF（處理結構化資料）與 CUVS（處理非結構化資料，如向量搜尋），大幅降低企業處理數據的成本與時間 [03:44]。

AI 代理作業系統：介紹了 OpenCloud 與 NVIDIA Nemo Cloud。黃仁勳將 OpenCloud 比喻為個人 AI 代理的作業系統，地位如同 PC 時代的 Windows [27:37]。

開源聯盟：輝達領導開放模型生態系，其 Nemotron-3 8B 在開源模型評比中名列前茅 [29:41]。

5. 其他亮點與未來展望

太空規格驗證： Vera Rubin 模組已通過太空輻射測試（NVIDIA Space 1），應對未來將資料中心部署於外太空的可能 [26:02]。

機器人與自駕：輝達持續提供機器人解決方案，現場並與迪士尼的卡通機器人進行互動 [30:37]。

總結：

曲博指出，當產業焦點從通用型 GPU 轉向專用的 AI 加速器（如 LPU）時，代表產業正進入成熟期。輝達透過軟硬體高度整合的「AI 工廠」方案，旨在協助客戶在推論時代大幅提升業績與效率

姜朝鳳宗族/姜太公文化/灶神信仰