Google AI總覽準確率逾九成 調查揭每月仍產數百萬筆錯誤資訊

Date:

圖/本報資料庫

商傳媒|林昭衡/綜合外電報導

一份由新創公司 Oumi 為《紐約時報》執行的研究指出,Google 的 AI Overviews(人工智慧總覽)在回答問題時,準確率可達九成以上。然而,即使是看似微小的錯誤率,在全球數十億次的搜尋規模下,仍可能導致每小時數百萬筆的錯誤資訊傳播,引發外界對人工智慧可信度的疑慮。

這項研究針對 4,326 個 Google 搜尋查詢進行分析,並採用業界標準的 SimpleQA 基準測試 Google 的 AI Overviews。測試分為兩輪,第一輪於 2023 年 10 月以 Gemini 2 模型為基礎進行,結果顯示準確率為 85%。隨著 Google 將模型升級至 Gemini 3,第二輪測試於 2024 年 2 月進行,準確率提升至 91%。Google 後續推出的 Gemini 3.1 Pro 模型,其幻覺率(hallucination rate)相較 Gemini 3 更大幅下降了 38 個百分點。Google 也強調,結合網路搜尋結果的人工智慧答案會比單純依賴模型知識更為精確。

儘管準確率看似亮眼,Oumi 發現 Google 的 AI Overviews 在提供答案時,約有 56% 的正確回答無法透過其引用的來源進行驗證。研究中也揭露了多個錯誤案例,例如在搜尋「古典音樂名人堂」相關問題時,AI 總覽雖然辨識出正確網站,卻聲稱大提琴家馬友友(Yo-Yo Ma)未被收錄。在另一個關於北卡羅來納州戈爾茲伯羅(Goldsboro)西部河流的提問中,AI 總覽錯誤地將「小河」(Little River)誤認為「努斯河」(Neuse River),這源於對旅遊網站資訊的錯誤解讀。針對「巴布·馬利博物館」(Bob Marley Museum)的開放年份,AI 總覽則給出了錯誤的 1987 年,原因在於它引用了來自 Facebook 貼文、旅遊部落格和維基百科上相互矛盾的資訊。

研究發現,在 Google 引用的 5,380 個來源中,Facebook 和 Reddit 分別是第二和第四常見的引用平台。其中,Facebook 在 5% 的正確答案中被引用,卻在 7% 的錯誤答案中被引用,顯示其資訊可靠性不穩定。

Google 的 AI Overviews 直接提供答案,而非引導使用者點擊外部網站,這種模式雖然提升了便利性,卻也引發內容發布者對流量流失的擔憂,甚至可能影響其經濟基礎。對此,Google 發言人奈德·艾德里安斯(Ned Adriance)坦承人工智慧的回應可能存在「嚴重漏洞」,並在免責聲明中警示「AI 回應可能包含錯誤」。這使得使用者在面對 AI 提供的資訊時,更需要保持警惕,思考如何辨別真偽。OpenAI 過去在推出 ChatGPT 網路功能時曾表示,樂於聽取使用者對於如何將流量導回原始來源的建議,以維護網路生態系統的健康發展。

1adbda3b d192 404e a36c 8f22c2c752ef

Share post:

spot_imgspot_img

熱門

相關新聞
Related

韓國迎「完全主動式ETF」時代 資產管理業積極備戰新賽局

商傳媒|吳承岳/台北報導為提升國內資本市場的競爭力,韓國金融監管機關正著手放寬對主動型指數股票型基金(ETF)的規範。面對這項變革,當地資產管理業者已加速調整組織架構並招募人才,為即將到來的新一輪市場競爭預作準備。目前,韓國ETF市場的監管規定要求,被動型ETF必須與追蹤指數保持至少0.9的相關係數,而主動型ETF則需維持至少0.7的相關係數。此外,為分散風險,ETF必須至少持有十檔股票。這些相關係數的限制,在過去很大程度上約束了主動型ETF的投資策略彈性。據悉,韓國金融當局正朝著引入「完全主動式ETF」的方向邁進,此舉是效仿主要已開發國家,取消對主動型ETF的相關係數限制。這項政策鬆綁預計將使ETF能夠採行更具差異化的管理策略,進而提升市場整體競爭力。業界普遍認為,市場佔有率領先的資產管理公司正主動加強其在主動型ETF領域的競爭力。《KB Think》報導指出,截至目前,Mirae Asset Asset Management的ETF淨資產高達128.4兆韓元,位居業界第二;而KB Asset Management的ETF淨資產則為28.8兆韓元,在28家業者中排名第四。為應對市場新環境,各大資產管理公司已展開積極佈局。Mirae Asset Asset...

以太坊基金會計畫揭百名北韓駭客潛伏Web3 恐觸發數十億美元損失

商傳媒|方承業/綜合外電報導以太坊基金會(Ethereum Foundation)近期資助的一項為期六個月的計畫,成功揭發逾百名北韓惡意網攻人員透過偽造身份,滲透多家 Web3 區塊鏈公司。此發現揭示了加密貨幣領域持續面臨的嚴峻資安挑戰。根據《MSN》報導,這項名為 ETH Rangers 的計畫已於2024年末啟動,旨在提供資金給致力於以太坊生態系公共產品安全工作的個人。其中一位受資助者,利用該筆資金建立了 Ketman Project,專注於調查加密貨幣領域中潛藏的「假開發者」,特別是來自北韓的惡意網攻人員。在為期六個月的資助期間,Ketman...

大型交易集中化 南韓IPO市場首季兩極分化 NH證券奪冠

商傳媒|吳承岳/台北報導根據韓國交易所上市公開系統(KIND)及金融投資業界數據,今年第一季南韓首次公開發行(IPO)市場呈現明顯的兩極分化現象。NH投資證券(NH Investment & Securities)以主辦承銷金額達5,730億韓元,榮登第一季IPO承銷寶座,這主要得益於成功承銷K-Bank及德陽能源(Deokyang Energen)等大型案件。三星證券(Samsung Securities)雖僅主辦一筆大型交易,其承銷金額仍以4,980億韓元位居第二。這顯示大型交易的掌握能力,成為決定證券商IPO承銷排名的關鍵因素。反觀韓國投資證券(Korea Investment & Securities)雖然承銷了5個IPO案,數量居業界之冠,但因多為中小型案件,總承銷金額僅1,436億韓元,排名第三。分析指出,缺乏大型案件的證券商面臨挑戰。去年表現優異的KB證券(KB...

電玩巨頭Electronic Arts股價狂飆逾四成,此刻進場是否為時已晚?

商傳媒|方承業/綜合外電報導電玩巨頭Electronic Arts(EA)在過去一年股價表現亮眼,已累計上漲近41%,引發市場對其當前投資價值的廣泛討論。金融分析平台Simply Wall St 於 2026年4月18日發布分析指出,儘管該公司股價漲勢驚人,但多數估值模型顯示其可能已處於高估狀態。這家總部位於美國的大型電玩發行商,目前股價約為每股203.83美元。其股價變動與新遊戲發行排程、玩家參與趨勢以及新作發布密切相關,市場對其未來遊戲與服務需求的看法,直接影響股價敏感度。分析顯示,Electronic Arts目前的本益比(P/E ratio)約為75.0倍,遠高於娛樂產業平均的37.4倍,也高於同業平均的68.3倍。根據折現現金流(DCF)模型估算,Electronic Arts的公允價值約為每股152.00美元。這項分析表明,目前股價較其預估內在價值高出約34.1%,暗示其依此方法計算可能被高估。此外,Simply...