
人工智慧研究公司 OpenAI, 與合作 博通引進了墨西哥辣椒, OpenAI這是該公司的首款智慧處理器,以及專為大型語言模型推理而客製化設計的AI加速器。該系統是兩家公司共同開發的多代運算平台的首個組件,其目標是提高先進AI系統的速度、效率和易用性。
這一里程碑反映了更廣泛的戰略方向,即 OpenAI 該公司正日益致力於控制支撐其模型和應用程式的整個基礎設施堆疊,而不是僅僅依賴外部運算平台。
Jalapeño 的設計完全基於對現代 LLM 推理需求的內部研究。其架構體現了從以下方面獲得的洞見: OpenAI此晶片的模型開發路線圖涵蓋了核心最佳化、記憶體處理、網路和服務系統等方面的考量。該晶片由微軟與博通和Celestica合作開發,這兩家公司分別參與了製造流程、電路板和機架整合、網路系統以及大規模部署基礎設施的開發。據各公司稱,該設計旨在保持靈活性,能夠相容於不同的大型語言模型,而不限於單一架構或產品線。
早期工程樣品已經在實驗室環境中以目標運行頻率和功耗水平運行機器學習工作負載,包括與高級模型相關的工作負載,例如: GPT-5.3-Codex-Spark。初步內部評估表明,與現有領先的AI加速器相比,Jalapeño的每瓦性能可能更高。據悉,該架構著重於減少資料傳輸,並更均衡地分配運算、記憶體和網路資源,旨在使實際應用更接近理論硬體極限。博通的晶片技術,包括其Tomahawk網路元件,被認為是實現大規模部署的關鍵推動因素。
全端人工智慧基礎設施策略與系統集成
該公司將此次研發視為轉型為運算驅動型經濟模式的一部分。在此背景下,該晶片旨在提高運算資源的可用性,降低營運成本,並提升人工智慧系統在消費者和企業應用中的反應速度。其核心策略在於更緊密地整合模型開發、硬體設計和基礎設施部署,從而實現整個系統的最佳化,而非僅限於孤立的元件。

Jalapeño 背後的工程方法高度專注於 LLM 推理,而非通用計算工作負載。它藉鑒了諸如以下產品中使用的生產系統: ChatGPT、Codex 和基於 API 的服務,以及未來基於代理的應用程式的預期需求。設計目標是在確保高吞吐量的同時降低延遲,從而為大規模互動式 AI 用例提供更靈敏的效能。
該專案的一個關鍵方面是軟硬體系統的協同設計,其中模型和基礎設施同步演進。這包括晶片架構、儲存系統、網路層、調度機制和部署框架。透過協調這些組件,該系統旨在提高效率並降低單位智慧交付成本。
更廣泛的平台策略將 Jalapeño 定位為長期基礎設施路線圖的第一步,該路線圖計劃從 2026 年開始分階段部署,其中包括 Broadcom 在晶片和網路方面的貢獻以及 Celestica 在系統整合方面的貢獻。
從系統層面來看,該計畫的核心在於提升人工智慧推理的效率,也就是模型與使用者直接互動的效率。預計這一層面的改進將轉化為更快的回應速度、更低的成本以及更可靠的應用可用性。該計劃的長期目標是擴大先進人工智慧功能的使用範圍,使其在教育、專業和商業領域中得到更廣泛的應用。
免责声明:本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。