三大 AI 模型挑戰開發 Chrome 擴充功能 僅 Claude 寫出可用程式碼

Date:

圖/本報AI製圖(示意圖)

商傳媒|葉安庭/綜合外電報導

日前,一份針對大型語言模型(LLM)開發能力的實測報告指出,在給予模糊需求的情況下,OpenAI 的 ChatGPT、Google 的 Gemini 以及 Anthropic 的 Claude 三大主流 AI 模型中,僅有 Claude 成功開發出一個功能完整的 Chrome 擴充功能。

根據科技媒體《MakeUseOf》報導,測試作者要求這三款模型開發一個 Chrome 擴充功能,用於搜尋 Instagram 貼文觀看者名單中的特定使用者。作者僅提供一個非常模糊的提示,旨在測試模型在沒有詳細說明下自行理解和執行任務的能力。

ChatGPT 數次嘗試仍有瑕疵

ChatGPT 的首次嘗試未能成功,生成了一個因缺少工具列彈出視窗而無法點擊的擴充功能。經過修補後,雖然擴充功能可運作,但受限於 Instagram 的「懶載入」機制,每次只能處理少量觀看者名單。儘管 ChatGPT 隨後嘗試改進,加入了「索引所有觀看者」按鈕,聲稱能自動捲動並建立本地索引,但在實際測試中,該功能依然僅限於螢幕上可見的觀看者,未能完全達到預期效果。作者形容,ChatGPT 雖最終讓核心功能運作,卻是透過多次除錯及「相當取巧」的方式達成。

Gemini 表現不如預期

Google 的 Gemini 在測試中表現最不理想。它最初並未直接生成程式碼,反而提供了一份架構分析、關於 DOM 遍歷的教學,以及一段需要貼入代理整合開發環境(IDE)的提示。當作者要求其開發程式碼時,Gemini 試圖將搜尋欄位直接注入 Instagram 的使用者介面中,但該搜尋欄位始終未出現。在經歷六輪不斷失敗的修正後,搜尋欄位雖最終現身,卻仍無法找到任何觀看者,未能實現任何搜尋功能。

Claude 成功克服挑戰

相較之下,Anthropic 的 Claude 展現了出色的問題解決能力。儘管其第一個版本也未能運作,但 Claude 隨後主動分析了 Instagram 的文件物件模型(DOM)結構,並利用 Instagram 的內部應用程式介面(API)端點重新建構了擴充功能。作者表示,Claude 解釋這些內部 API 端點在已登入狀態下更為可靠。最終,經過這次調整,Claude 成功開發出一個完全符合預期且功能完善的 Chrome 擴充功能。作者總結,Claude 是此次測試中最快且僅用最少訊息就達成目標的模型,也是唯一一個成功開發出完全可用工具的模型。

9e26f402 0d7a 4c4b b112 7d3e01a65d79

Share post:

spot_imgspot_img

熱門

相關新聞
Related

臺東「智繪健康行 營接新生活」跨世代攜手同行!打造友善幸福城市

活動成功提升縣民對健康的重視,也展現臺東持續推動全齡友善環境決心。未來將持續結合在地自然資源與健康促進議題,以更多元、創新方式,陪伴縣民一起「營」向健康、迎接活力新生活。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

AI協作助手改變商務會議生態 提升資訊整合與即時互動

商傳媒|何映辰/台北報導隨著2026年數位工作空間的巨幅轉變,企業會議已不再僅限於視訊通話,而演化為高度智能的協作平台,其中人工智慧(AI)協作助手的發展扮演關鍵角色。這些先進的AI工具,被視為能為使用者提供前所未有的協助,幫助企業追求最大效率,並將對話轉化為具體的實行計畫。過去多年來,「資訊衰退」一直是企業溝通的最大挑戰,會議中的建議常因人為記憶的限制,到了下午便被遺忘。早期的自動化嘗試,如簡單的會議錄影,卻需耗費數小時重新觀看才能找到重點,效果不彰。如今,新一代的AI工具已從單純的「錄影」進化到「理解」,能即時辨識發言目的、分類行動項目,並提供可搜尋的決策歷史紀錄,讓團隊成員能專注於討論,無需分心筆記。AI即時對話助理猶如一個「認知緩衝區」,在對話進行時顯示相關事實、歷史資訊與建議,賦予使用者更從容且具權威性地引導會議。儘管許多AI會議工具仍著重於會後摘要與分析,但部分平台已朝向會議中的即時協助發展。例如,ORO AI便是其中一例,專為Zoom、Microsoft Teams和Google Meet等平台提供即時螢幕支援,功能涵蓋即時對話提示、情境資訊、提醒事項,以及預先上傳議程、筆記等會議準備。AI會議助手的支持者認為,它們能讓資訊即時可得,從而減輕高風險對話的壓力,並透過AI自動標示所需數據,讓資淺同仁也能掌握複雜的技術討論,實現專業知識的普及化。此外,這項技術也藉由即時翻譯與文化背景補充,提升了跨時區與語言團隊的包容性。然而,批評者也對透明度、職場期望以及專業人士在即時討論中對AI生成指引的依賴程度提出疑慮。未來AI在會議中的角色將更趨主動,例如自動建議休息時間或顯示相關文件。AI的目標是透過消除資料搜尋和筆記的負擔,來增強人類判斷力而非取代。使用者若要善用數位協作助手,應預先提供會議目標與議程等背景資訊,並在會議中保持螢幕整潔,讓技術在背景自動檢索資料。會後也應檢閱自動生成的摘要,以確保行動步驟得以持續推進。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

麥肯錫AI化招聘與諮詢:全球人才市場迎來新變革

商傳媒|責任編輯/綜合外電報導管理顧問巨頭麥肯錫公司(McKinsey & Company)已開始在其招募與評估流程中運用最新人工智慧(AI)工具,此舉不僅重塑其自身的人才策略,更反映全球就業市場正迎來一波由AI驅動的深層變革。根據《Jawlah》報導,麥肯錫正仰賴人工智慧分析與評估工具,特別針對顧問職位招募中常用的量化測驗與個案研究,精準衡量應徵者的技能。這些新工具主要評估候選人的量化與分析能力,這在顧問產業中是最關鍵的技能之一。麥肯錫透過分析模型和數位測驗,衡量思考模式、問題解決能力以及處理數據和複雜個案的能力。這有助於縮短招募決策所需時間,並提升大型組織的選才效率。管理顧問業正普遍趨向在招募、專案管理、數據分析和客戶解決方案提供等環節導入AI。此一趨勢顯示,顧問公司越來越依賴智慧系統加速評估流程,並更準確、系統化地分析候選人的能力與技能。麥肯錫此舉,正凸顯人工智慧在高度依賴人類技能評估、分析和決策的產業中,其應用範圍不斷擴大。這種轉變反映了全球就業市場的普遍趨勢,人工智慧工具正直接影響招募與專業評估流程。智慧系統已不只侷限於自動化任務,更成為大型組織內人才選拔、績效評估和團隊建構的關鍵環節。企業也日益仰賴數位分析來進行招募、升遷和人才發展的決策。對於求職者而言,他們正面臨一個更加依賴數位測驗和數據驅動分析的招募環境。現代工作環境下的成功,已不再單純取決於履歷或傳統面試,更關乎處理智慧測驗和實際展現分析能力。數位技能和使用人工智慧工具的能力,正成為新就業市場的要求。企業不僅是為了降低成本或加快流程,更期望建立一套基於數據、分析和數位能力,更為精確的評估系統。每年數以萬計的職位申請,促使大型組織尋求能更準確地加速篩選、分析和發掘最佳人才的工具。預計人工智慧工具在未來幾年內,將在重塑招聘和專業評估方法方面扮演日益重要的角色。相關新聞推薦正在載入相關新聞...標籤: 合作媒體商傳媒

谷歌高管駁斥AI大規模失業論 稱工作本質將改變

商傳媒|責任編輯/綜合外電報導谷歌Alphabet高階副總裁詹姆斯·馬尼卡(James Manyika)日前表示,矽谷對於人工智慧(AI)將導致大規模失業的預測言過其實,他強調AI技術的主要影響將是改變現有工作模式,而非大量取代人力。馬尼卡指出,他並不認同關於AI將在短期內造成大規模失業的說法。他認為,有些極端預測曾指出,AI將在兩年內取代50%的工作,但這並未發生。他引用了自己於2017年為麥肯錫全球研究院(McKinsey Global Institute)共同撰寫的報告《工作流失,工作獲得》,該報告闡述自動化將對勞工產生多重影響:部分工作會減少,部分新工作會被創造,而更多現有工作會轉型。馬尼卡堅信這項框架至今仍適用。他擁有牛津大學(Oxford University)AI與機器人學博士學位,並曾共同主持UN Secretary-General’s AI advisory body,並擔任麥肯錫全球研究院主席。馬尼卡認為,AI產業本身對於過度渲染AI將帶來大規模失業的討論,反而加劇了公眾的焦慮。他提到:「當我們這些在AI領域的人談論會取代50%的工作時,這對技術發展產生非凡影響的可能性造成了阻礙,因為我們坦白說嚇壞了所有人,而這種恐懼其實毫無根據。」根據網路輿觀(YouGov)在5月初發布的民調顯示,七成美國民眾認為AI發展「過快」,亦有七成民眾反對在當地興建為AI系統提供動力的資料中心,這顯示公眾對AI的疑慮正在增加。他強調,AI產業應證明其基礎設施不會增加社區的能源成本。不僅是馬尼卡,其他科技業界高層也表達了類似觀點。派拓網路(Palo...