Cerebras 晶片跑兆參數 AI 模型 速度飆升近 GPU 雲端七倍

Date:

圖/本報資料庫

商傳媒|葉安庭/綜合外電報導

根據《VentureBeat》報導,人工智慧晶片公司 Cerebras 於本週一(5月18日)宣布,其晶圓級晶片運算月之暗面(Moonshot AI)推出的兆參數開源權重模型 Kimi K2.6 時,能以每秒近 1,000 個 token 的速度服務企業客戶。

報導指出,Cerebras 測得的輸出速度為每秒 981 個 token。根據獨立評測機構 Artificial Analysis 的數據,這項速度比市場上最快的 GPU 雲端供應商快了 6.7 倍,更比平均速度快了 23 倍。在處理一個包含 10,000 個輸入 token 的標準代理式編碼請求時,Cerebras 的系統僅需 5.6 秒就能交付完整回應,相較於 Kimi 官方端點所需的 163.7 秒,效率提升了 29 倍。

Cerebras 產品行銷總監 James Wang 表示,Cerebras 能夠在其晶圓級架構上處理 Kimi K2.6 這類大型模型,並展現其聞名的驚人速度。Kimi K2.6 是 Cerebras 首次在生產環境中服務的兆參數開源權重模型。此宣布正值 Cerebras 完成 2026 年科技業規模最大的首次公開募股(IPO)之後。

由北京月之暗面於 4 月 20 日發布的 Kimi K2.6,是一個兆參數專家混合模型(Mixture-of-Experts model),其在 SWE-Bench Pro 測試中獲得 58.6 分,超越 Claude Opus 4.6 並與 GPT-5.4 表現持平。該模型採用 320 億個活躍參數,總參數達到 1 兆,並在 256,000 個 token 的內容視窗下運行。

Kimi K2.6 被視為 Anthropic 和 OpenAI 等公司高價且產能受限的閉源 API 的潛在替代方案,尤其適用於編碼和代理工作負載。James Wang 提到,企業對 Kimi K2.6 抱持濃厚興趣,以尋求 Anthropic 模型之外的替代方案,主要考量其成本效益與可用產能。

Cerebras 的 Wafer-Scale Engine 3 是一片矽晶圓大小的單一晶片,內建 44 GB 的 SRAM。為處理 Kimi K2.6,Cerebras 將模型權重儲存在原始的 4 位元精確度,並以 16 位元浮點運算。模型權重分布在約 20 個 CS-3 系統的叢集中的多個晶圓上,晶圓內網路結構提供的頻寬比 NVL72 的 NVLink 高出 200 倍以上。James Wang 形容,Cerebras 的單一單元容量更為龐大,相當於「20 個機架,而非 72 個 GPU」。

目前,財富美國 500 強企業中,包括軟體、金融服務和醫療保健領域的公司,正在生產雲端試用中測試 Cerebras 的兆參數推論能力。James Wang 強調,Cerebras 的成本與 GPU 雲端供應商大致相當,提供類似的每 token 成本但更快的交付速度。他指出,輝達(Nvidia)以 200 億美元收購 Groq 的行動,顯示其也意識到快速推論是一個極其重要的市場。Cerebras 與 OpenAI 也在 2026 年初達成一項價值逾 200 億美元的協議,用於提供運算容量及相關服務。

ba360aa2 5b14 4304 8407 b4ea9f30027d

相關新聞推薦

正在載入相關新聞…

Share post:

spot_imgspot_img

熱門

相關新聞
Related

美國SEC延遲代幣化資產交易豁免計畫 監管前景添變數

商傳媒|方承業/綜合外電報導美國證券交易委員會(SEC)近期決定延後公布一項廣泛豁免計畫,該計畫原欲允許美國加密貨幣公司交易代幣化資產。此舉恐將使市場期盼已久的監管清晰度再次蒙上陰影。這項被稱為「創新豁免」(innovation exemption)的計畫,原訂近期內發布,旨在為代幣化證券交易提供明確路徑。然而,美國證券交易委員會最終選擇延遲發布,具體原因並未公開說明。此一決定對尋求在美國市場拓展代幣化業務的企業而言,無疑增加了監管的不確定性。分析人士指出,美國在全球金融市場扮演重要角色,其監管動向常為其他國家或地區的數位資產監管框架提供借鑒。美國證券交易委員會的這項延遲舉措,可能讓全球數位資產市場的發展面臨更多變數,同時也可能影響包含台灣在內,正在積極探索和建立自身加密貨幣與代幣化資產監管體系的國家,使其在規劃相關法規時面臨類似的挑戰與不確定性。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

南韓世宗新設投資公司 年薪上看1.3億韓元挑戰人才磁吸

商傳媒|吳承岳/台北報導南韓世宗特別自治市將成立一家負責管理 2,000 億美元對美戰略投資的全新實體——Korea-US Strategic Investment Corporation,提供年薪高達 1.3 億韓元的職位,被視為當地的高薪「神級職場」。這家新設的投資公司預計下個月正式啟動,並將招募 16...

慶應大學教授示警:伊朗情勢引通膨,減消費稅反添薪柴

商傳媒|吳承岳/台北報導慶應義塾大學經濟學部教授土居丈朗近日指出,在全球通膨壓力持續、伊朗地緣政治緊張情勢未歇之際,日本政府若透過減徵消費稅來刺激國內需求,不僅無助於抑制物價上漲,反而可能加劇通膨。土居丈朗教授強調,伊朗衝突的長期化,可能對全球經濟造成顯著衝擊。由於日本與東南亞國家的供應鏈緊密連結,一旦東南亞地區的石油供應受阻,將直接影響日本的物資供應。他提到,日本企業受困於長達三十年的通縮環境,導致其「價格轉嫁能力」普遍較弱,難以有效將上漲的原料成本轉嫁給消費者,進而影響企業獲利,甚至造成貿易條件惡化。面對當前的物價上漲,土居教授認為,政府的財政政策應著重於抑制需求,而非不必要地刺激需求。他以日本前首相田中角榮為例,田中角榮在第一次石油危機時,曾果斷放棄其「日本列島改造論」,轉而實施抑制需求的政策。土居教授建議,與其片面減免食品消費稅,不如考慮推動「育兒給付稅額抵減」作為更具效益的解決方案。對於財政健全與貨幣政策,土居丈朗教授也表達擔憂。他指出,政府針對十七個領域提出的「危機管理投資」策略,初期可能需發行公債支應,若缺乏明確的償還計畫,可能在現有通膨壓力下,進一步推升利率。他強調,一旦市場對日本財政產生不信任感,將需要付出十倍的努力才能挽回。此外,為遏止日圓持續貶值,日本銀行(BOJ)必須擁有充分的彈性來適時調整利率。儘管有傳聞首相高市不樂見升息,日本銀行仍需向市場明確表達其獨立性,以便在關鍵時刻果斷採取行動。土居教授提到,儘管財政年度 2026 一般會計年度的初級平衡(PB)預計將轉為正數,但如果無法穩定實現初級平衡盈餘,通膨所帶來的名目 GDP 增長恐掩蓋潛在的財政問題,而非真正的財政改善。他呼籲日本各界應進行更誠實、透明的經濟政策討論,而非礙於對首相高市的「過度忖度」而迴避關鍵議題。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

「大空頭」巴里示警:晶片股狂飆恐重演 2000 年網路泡沫

商傳媒|吳承岳/台北報導曾因準確預測 2008 年金融危機而聞名的美國投資家邁克爾·巴里(MICHAEL Burry)近日示警,指稱科技業已進入危險的「拋物線式」成長階段,這與 2000 年網路泡沫破裂前夕的模式如出一轍。他認為,當前晶片股的狂飆突進,如同市場已「走火入魔」。根據《The Business Times》報導,自三月底以來,費城證券交易所半導體指數(Philadelphia Stock...