OpenAI 亮相 Jalapeño:首款自製 AI 推理晶片及其意義
目錄
你可能想知道的
• OpenAI 自行研發的晶片能否降低對像 Nvidia 這類第三方 GPU 供應商的依賴?
• 為推理而設計的客製化加速器,是否會在大型語言模型上顯著降低成本和能源使用?
主要主題
OpenAI 已公開推出 Jalapeño,這是其首款自製人工智慧推理晶片,與 Broadcom 共同開發。這項宣布表明,OpenAI 正在朝向掌控運行大型語言模型和其他生成式 AI 系統所需硬體堆疊的戰略方向邁進。OpenAI 表示,他們設計 Jalapeño 是專門用於模型推理階段——訓練完成的模型對使用者查詢產生回應的那個階段,而不是單純依賴主要廠商提供的一般用途 GPU。
Jalapeño 的設計重點在於大型 transformer 類模型的推理。根據 OpenAI 的說法,該晶片已針對語言模型推理常見的特定運算模式和記憶體存取行為進行優化,而不是支援廣泛的工作負載。這種專一化旨在帶來效能優勢:比必須處理更多不同任務的硬體擁有更高的吞吐量、更低的延遲以及更佳的能源效率。
OpenAI 將 Jalapeño 描述為規劃中多世代運算平台的第一個產品。早期矽片已在 OpenAI 的實驗室內進行驗證,據稱正在與進階模型測試,包括像 GPT-5.3-Codex-Spark 之類模型的開發版本。公司聲稱該加速器能在消耗較少電力的同時提供更多運算能力,但在宣布時尚未公布獨立基準數據或詳細的比較資料。
與 Broadcom 的合作凸顯此計畫的規模與野心。Broadcom 帶來生產級矽片專業知識與供應鏈能力,有助於把研究設計轉化為可部署的硬體。Broadcom 的領導層將此夥伴關係視為對建立大規模 AI 部署所需實體基礎設施的承諾。他們的共同路線圖據稱包括未來世代的晶片,並計劃支援千兆瓦級的資料中心基礎設施,微軟等合作夥伴也參與更廣泛的部署工作。
產業報導與先前洩漏資訊已暗示 OpenAI 正在追求客製矽片,以降低對現成 GPU(特別是來自主導供應商)的依賴。Jalapeño 證實了這些報導並說明了 OpenAI 的方向:公司打算共同設計針對現代生成式模型工作負載特性的硬體,而非僅僅租用或購買更多 GPU 容量。這種做法與計算史上的模式相呼應:大型雲端或 AI 業者設計客製加速器,以取得一般用途裝置無法達到的效率提升。
從技術觀點來看,打造以推理為重心的晶片涉及取捨。為推理優化的設計通常重視記憶體頻寬與延遲、稀疏矩陣處理、專用資料流以及支援低精度運算以在降低功耗與面積的同時保留足夠的模型準確度。這些選擇對於大規模運行大型語言模型,特別是對延遲敏感的互動式服務(例如聊天機器人),可帶來顯著效益。然而,此類設計也可能降低彈性:為 transformer 推理調校的晶片在訓練工作負載或非 AI 的資料中心任務上可能效果較差。
在策略上,此舉提供幾項潛在優勢。首先,對硬體堆疊擁有更大控制權,可隨著時間降低營運成本,藉由提升每瓦效能與每美元效能來改善 OpenAI 最常用推理工作負載的成本結構。第二,掌握設計能降低對第三方加速器在價格、供應或政策上的曝險。第三,客製化堆疊能啟用在商品化硬體限制下難以實現的效能與功能創新。OpenAI 將 Jalapeño 視為一項長期基礎設施策略的一部分,目標是讓算力更充裕且更經濟,從而可能解鎖更廣泛的先進 AI 使用。
當然也存在風險與未解問題。設計與生產客製矽片的經濟性取決於規模:龐大的前期工程與製造投資必須在大規模部署上攤銷。達成此規模通常需要與資料中心營運者與雲端供應商的緊密合作;OpenAI 與微軟及 Broadcom 的合作似乎旨在回應這項需求。另一項不確定性是 Jalapeño 在獨立基準測試中,對比最新 GPU 與其他 AI 加速器時的表現,涵蓋各種模型尺寸與真實世界工作負載。在基準數據與獨立測試出爐前,有關能源效率與效能的說法應視為公司聲明而非經驗證的事實。
最後,這項宣布對 AI 硬體生態系具有更廣泛的影響。如果 OpenAI 的客製晶片在成本與效率上帶來顯著改進,其他 AI 公司與雲端供應商可能會加速自家客製化硬體計畫或深化與矽片公司的合作。產業可能會出現為推理、訓練、邊緣部署或特定模型類型量身打造的加速器架構多樣化。這類變化將影響採購、資料中心設計與 AI 堆疊的軟體優化方向。
總結來說,Jalapeño 標誌著 OpenAI 與 Broadcom 共同開發的首款公開披露的客製推理矽片。該晶片定位為針對大型語言模型的專用加速器,旨在提升效能與能源效率,同時降低對通用 GPU 的依賴。雖然其策略邏輯明確,但是否具備轉型能力仍取決於獨立效能驗證與能否達到量產規模。
要點表格
| 面向 | 描述 |
|---|---|
| 產品 | Jalapeño,OpenAI 與 Broadcom 共同開發的首款客製推理晶片。 |
| 主要用途 | 針對大型語言模型推理進行優化,以驅動聊天機器人及類似服務。 |
| 宣稱 | 與領先 AI 晶片相比具有更高運算密度與更低耗電(尚無公開基準)。 |
| 策略目標 | 降低對商品化 GPU 的依賴、提高效率並促進更廣泛的先進 AI 可及性。 |
| 合作夥伴 | Broadcom 負責矽片開發;微軟及其他夥伴被提及將協助大規模部署。 |
之後⋯⋯
展望未來,Jalapeño 的成功將取決於獨立效能驗證、製造規模,與 OpenAI 與夥伴在生產資料中心部署該硬體的效能。如果該晶片能兌現效率與成本承諾,可能會加速 AI 基礎設施朝向更垂直整合的轉變。相反地,若出現技術或經濟障礙,產業可能仍偏好通用 GPU 與其他加速器。無論哪種結果,這次宣布凸顯了專用硬體作為 AI 競爭與創新的重要軸心正日益受到重視。