Cerebras 晶片跑兆參數 AI 模型 速度飆升近 GPU 雲端七倍

Date:

圖/本報資料庫

商傳媒|葉安庭/綜合外電報導

根據《VentureBeat》報導,人工智慧晶片公司 Cerebras 於本週一(5月18日)宣布,其晶圓級晶片運算月之暗面(Moonshot AI)推出的兆參數開源權重模型 Kimi K2.6 時,能以每秒近 1,000 個 token 的速度服務企業客戶。

報導指出,Cerebras 測得的輸出速度為每秒 981 個 token。根據獨立評測機構 Artificial Analysis 的數據,這項速度比市場上最快的 GPU 雲端供應商快了 6.7 倍,更比平均速度快了 23 倍。在處理一個包含 10,000 個輸入 token 的標準代理式編碼請求時,Cerebras 的系統僅需 5.6 秒就能交付完整回應,相較於 Kimi 官方端點所需的 163.7 秒,效率提升了 29 倍。

Cerebras 產品行銷總監 James Wang 表示,Cerebras 能夠在其晶圓級架構上處理 Kimi K2.6 這類大型模型,並展現其聞名的驚人速度。Kimi K2.6 是 Cerebras 首次在生產環境中服務的兆參數開源權重模型。此宣布正值 Cerebras 完成 2026 年科技業規模最大的首次公開募股(IPO)之後。

由北京月之暗面於 4 月 20 日發布的 Kimi K2.6,是一個兆參數專家混合模型(Mixture-of-Experts model),其在 SWE-Bench Pro 測試中獲得 58.6 分,超越 Claude Opus 4.6 並與 GPT-5.4 表現持平。該模型採用 320 億個活躍參數,總參數達到 1 兆,並在 256,000 個 token 的內容視窗下運行。

Kimi K2.6 被視為 Anthropic 和 OpenAI 等公司高價且產能受限的閉源 API 的潛在替代方案,尤其適用於編碼和代理工作負載。James Wang 提到,企業對 Kimi K2.6 抱持濃厚興趣,以尋求 Anthropic 模型之外的替代方案,主要考量其成本效益與可用產能。

Cerebras 的 Wafer-Scale Engine 3 是一片矽晶圓大小的單一晶片,內建 44 GB 的 SRAM。為處理 Kimi K2.6,Cerebras 將模型權重儲存在原始的 4 位元精確度,並以 16 位元浮點運算。模型權重分布在約 20 個 CS-3 系統的叢集中的多個晶圓上,晶圓內網路結構提供的頻寬比 NVL72 的 NVLink 高出 200 倍以上。James Wang 形容,Cerebras 的單一單元容量更為龐大,相當於「20 個機架,而非 72 個 GPU」。

目前,財富美國 500 強企業中,包括軟體、金融服務和醫療保健領域的公司,正在生產雲端試用中測試 Cerebras 的兆參數推論能力。James Wang 強調,Cerebras 的成本與 GPU 雲端供應商大致相當,提供類似的每 token 成本但更快的交付速度。他指出,輝達(Nvidia)以 200 億美元收購 Groq 的行動,顯示其也意識到快速推論是一個極其重要的市場。Cerebras 與 OpenAI 也在 2026 年初達成一項價值逾 200 億美元的協議,用於提供運算容量及相關服務。

ba360aa2 5b14 4304 8407 b4ea9f30027d

相關新聞推薦

正在載入相關新聞…

Share post:

spot_imgspot_img

熱門

相關新聞
Related

算力代價太高?美國、印度綠能大爆發 法國AI用電三年增近四成

商傳媒|記者顏康寧/台北報導綜合《TechCrunch》與法國電子通訊、郵政暨媒體發行監管局(Arcep)發布的最新產業資訊,全球綠色能源轉型與人工智慧基礎設施擴張,正呈現結構性改變。在分散式能源方面,總部位於孟買的印度屋頂太陽能全棧平台 SolarSquare,傳出正與 B Capital、Lightspeed Venture Partners 等投資方洽談 C 輪融資,金額約...

AI穿戴走向全天候感知?蘋果、亞馬遜布局健康與記憶助理

商傳媒|記者顏康寧/台北報導根據《彭博社》資深記者古曼(Mark Gurman)發布的最新通訊,以及科技評論媒體《TechCrunch》針對亞馬遜(Amazon)新一代穿戴式裝置 Bee 的實測內容,2026 年 5 月底全球穿戴式人工智慧(AI)基礎設施正迎來軟硬體架構調整期。外媒報導指出,蘋果(Apple)預計於今年秋季發布的 watchOS 27...

臺東「智繪健康行 營接新生活」跨世代攜手同行!打造友善幸福城市

活動成功提升縣民對健康的重視,也展現臺東持續推動全齡友善環境決心。未來將持續結合在地自然資源與健康促進議題,以更多元、創新方式,陪伴縣民一起「營」向健康、迎接活力新生活。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

AI協作助手改變商務會議生態 提升資訊整合與即時互動

商傳媒|何映辰/台北報導隨著2026年數位工作空間的巨幅轉變,企業會議已不再僅限於視訊通話,而演化為高度智能的協作平台,其中人工智慧(AI)協作助手的發展扮演關鍵角色。這些先進的AI工具,被視為能為使用者提供前所未有的協助,幫助企業追求最大效率,並將對話轉化為具體的實行計畫。過去多年來,「資訊衰退」一直是企業溝通的最大挑戰,會議中的建議常因人為記憶的限制,到了下午便被遺忘。早期的自動化嘗試,如簡單的會議錄影,卻需耗費數小時重新觀看才能找到重點,效果不彰。如今,新一代的AI工具已從單純的「錄影」進化到「理解」,能即時辨識發言目的、分類行動項目,並提供可搜尋的決策歷史紀錄,讓團隊成員能專注於討論,無需分心筆記。AI即時對話助理猶如一個「認知緩衝區」,在對話進行時顯示相關事實、歷史資訊與建議,賦予使用者更從容且具權威性地引導會議。儘管許多AI會議工具仍著重於會後摘要與分析,但部分平台已朝向會議中的即時協助發展。例如,ORO AI便是其中一例,專為Zoom、Microsoft Teams和Google Meet等平台提供即時螢幕支援,功能涵蓋即時對話提示、情境資訊、提醒事項,以及預先上傳議程、筆記等會議準備。AI會議助手的支持者認為,它們能讓資訊即時可得,從而減輕高風險對話的壓力,並透過AI自動標示所需數據,讓資淺同仁也能掌握複雜的技術討論,實現專業知識的普及化。此外,這項技術也藉由即時翻譯與文化背景補充,提升了跨時區與語言團隊的包容性。然而,批評者也對透明度、職場期望以及專業人士在即時討論中對AI生成指引的依賴程度提出疑慮。未來AI在會議中的角色將更趨主動,例如自動建議休息時間或顯示相關文件。AI的目標是透過消除資料搜尋和筆記的負擔,來增強人類判斷力而非取代。使用者若要善用數位協作助手,應預先提供會議目標與議程等背景資訊,並在會議中保持螢幕整潔,讓技術在背景自動檢索資料。會後也應檢閱自動生成的摘要,以確保行動步驟得以持續推進。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒