Google AI總覽準確率逾九成 調查揭每月仍產數百萬筆錯誤資訊

Date:

圖/本報資料庫

商傳媒|林昭衡/綜合外電報導

一份由新創公司 Oumi 為《紐約時報》執行的研究指出,Google 的 AI Overviews(人工智慧總覽)在回答問題時,準確率可達九成以上。然而,即使是看似微小的錯誤率,在全球數十億次的搜尋規模下,仍可能導致每小時數百萬筆的錯誤資訊傳播,引發外界對人工智慧可信度的疑慮。

這項研究針對 4,326 個 Google 搜尋查詢進行分析,並採用業界標準的 SimpleQA 基準測試 Google 的 AI Overviews。測試分為兩輪,第一輪於 2023 年 10 月以 Gemini 2 模型為基礎進行,結果顯示準確率為 85%。隨著 Google 將模型升級至 Gemini 3,第二輪測試於 2024 年 2 月進行,準確率提升至 91%。Google 後續推出的 Gemini 3.1 Pro 模型,其幻覺率(hallucination rate)相較 Gemini 3 更大幅下降了 38 個百分點。Google 也強調,結合網路搜尋結果的人工智慧答案會比單純依賴模型知識更為精確。

儘管準確率看似亮眼,Oumi 發現 Google 的 AI Overviews 在提供答案時,約有 56% 的正確回答無法透過其引用的來源進行驗證。研究中也揭露了多個錯誤案例,例如在搜尋「古典音樂名人堂」相關問題時,AI 總覽雖然辨識出正確網站,卻聲稱大提琴家馬友友(Yo-Yo Ma)未被收錄。在另一個關於北卡羅來納州戈爾茲伯羅(Goldsboro)西部河流的提問中,AI 總覽錯誤地將「小河」(Little River)誤認為「努斯河」(Neuse River),這源於對旅遊網站資訊的錯誤解讀。針對「巴布·馬利博物館」(Bob Marley Museum)的開放年份,AI 總覽則給出了錯誤的 1987 年,原因在於它引用了來自 Facebook 貼文、旅遊部落格和維基百科上相互矛盾的資訊。

研究發現,在 Google 引用的 5,380 個來源中,Facebook 和 Reddit 分別是第二和第四常見的引用平台。其中,Facebook 在 5% 的正確答案中被引用,卻在 7% 的錯誤答案中被引用,顯示其資訊可靠性不穩定。

Google 的 AI Overviews 直接提供答案,而非引導使用者點擊外部網站,這種模式雖然提升了便利性,卻也引發內容發布者對流量流失的擔憂,甚至可能影響其經濟基礎。對此,Google 發言人奈德·艾德里安斯(Ned Adriance)坦承人工智慧的回應可能存在「嚴重漏洞」,並在免責聲明中警示「AI 回應可能包含錯誤」。這使得使用者在面對 AI 提供的資訊時,更需要保持警惕,思考如何辨別真偽。OpenAI 過去在推出 ChatGPT 網路功能時曾表示,樂於聽取使用者對於如何將流量導回原始來源的建議,以維護網路生態系統的健康發展。

1adbda3b d192 404e a36c 8f22c2c752ef

Share post:

spot_imgspot_img

熱門

相關新聞
Related

《Metal Gear Solid》電影版重啟 《絕命終結站》導演接棒執導

商傳媒|方承業/綜合外電報導根據《Glass Almanac》報導,索尼影視娛樂(Sony Pictures)已正式簽下導演扎克·利普夫斯基(Zach Lipovsky)與亞當·斯坦(Adam B. Stein),將由他們執導備受遊戲迷期待的電玩改編電影《Metal Gear Solid》。此舉標誌著這部改編作品在歷經多年籌備後,終於邁向新的里程碑。兩位導演先前曾合作成功重啟《絕命終結站》(Final Destination)系列電影。該系列以僅...

日本通訊基礎設施迎革新浪潮 5G普及驅動產業鏈新機遇

商傳媒|吳承岳/台北報導日本正經歷一場通訊基礎設施的「世代變革」,隨著第五代行動通訊(5G)技術的普及,行動虛擬網路業者(MVNO)及行動虛擬網路促成者(MVNE)的角色日益關鍵。這波轉型不僅重塑了電信產業生態,也為相關科技企業帶來了顯著的發展機遇。在這次通訊基礎設施革新浪潮中,日本通訊株式會社(Japan Communications, 9424)扮演了先行者角色,該公司早在2001年便啟動全球首個數據通訊MVNO業務。為提升服務自由度,日本通訊株式會社與NTT Docomo自2022年6月展開語音及簡訊網路互連協議談判,並於2024年2月達成協議。該公司規劃自2026年5月起,將利用其自有的虛擬化語音核心(virtualized voice core)推出新服務,此舉將大幅提升其在定價與功能上的靈活性,並採用來自德國的美國之音(ng-voice)的虛擬化解決方案。值得注意的是,日本通訊株式會社的個人品牌在2024年君迪(J.D. Power Japan)行動服務客戶滿意度調查中,於MVNO類別獲得整體滿意度第一名。該公司也積極擴展企業業務,包括與銀行網路服務合作,於2026年3月推出針對金融機構的聯合服務,以及針對工廠與體育場域的本地4G/5G「FPoS IoT」解決方案,並於2026年4月宣布為入境旅客平台提供FPoS函式庫。另一家在此變革中佔據重要地位的企業是開放移動聯盟(Internet...

AI時代品牌能見度關鍵:九成四引用來自口碑媒體 公關預算追漲

商傳媒|責任編輯/綜合外電報導一份最新分析指出,人工智慧(AI)工具在引用內容時,高達94%的連結皆源自口碑媒體(Earned Media),這使得公關在AI驅動的傳播環境中,成為企業品牌能見度和權威性的核心基礎。這項趨勢促使公關預算預計在2027年翻倍成長,顯示業界正積極應對AI帶來的影響。研究發現,口碑媒體不僅是品牌獲取曝光的引擎,更是AI工具建立資訊可信度的關鍵策略。AI系統傾向引用來自知名出版物、受認可記者及具高權威性平台的內容。相較之下,付費廣告與企業自有內容鮮少能獲得同樣的引用權威。口碑媒體的曝光具備長期效益,因為其內容會持續被AI系統索引和檢索,確保品牌資訊的持久能見度。每次成功的媒體曝光都能強化品牌權威形象,形成正向循環。隨著AI技術的發展,傳統的搜尋引擎最佳化(SEO)正演變為生成式引擎最佳化(GEO),重點已從單純提升搜尋排名,轉向確保品牌內容被納入AI生成的答案中。公關和傳播專業人士可利用這些AI引用數據,作為爭取更多投資的有力依據,以提升品牌在AI平台上的能見度、引用頻率,並強化其在生成式搜尋中的地位。及早增加公關投資的組織,將能在編輯報導競爭相對較低的環境下,更快累積權威性提及,並在AI訓練數據中取得更強地位,大幅增加在新型AI工具中被引用的機會。成功的AI能見度策略,仰賴持續性、定期在可信賴媒體上曝光、涵蓋多個垂直領域、與熱門話題保持一致,並透過高權威管道發布。透過如蘋果新聞(Apple News)及谷歌新聞(Google News)等具有廣泛發行網絡的媒體,能為品牌提供直接進入AI生態系的途徑。在AI驅動的搜尋環境中,公關已成為品牌如何被理解、參考和推薦的核心要素。今日獲得的報導,將成為AI系統未來談論品牌時所使用的關鍵訓練數據。標籤: 合作媒體商傳媒

韓國國防出口躍居全球第四 大幅超前2030年目標

商傳媒|吳承岳/台北報導韓國國防工業近年在全球軍武市場表現亮眼,根據斯德哥爾摩國際和平研究所(SIPRI)的最新數據,韓國已躍升為全球第四大武器出口國,市佔率達6.0%。此成就較原先李在明政府設定的2030年達到「世界四大國防強國」目標,提前了四年達成。目前全球武器出口市場由美國以42%的市佔率領先,法國則以10%位居第二,以色列以7.8%排名第三,韓國緊追在後。相較於前一年的全球第八名,韓國的武器出口量在一年內成長了83%。這項快速成長的趨勢,部分也受到俄羅斯因戰爭導致出口能力下降,以及中國雖具生產能力卻難以擴展市場的國際情勢所影響。韓國的國防產品線廣泛,涵蓋陸海空防禦系統,包括K2戰車、K9自走砲、天舞多管火箭系統、天弓二型防空飛彈(M-SAM)、FA-50輕型攻擊機以及Redback步兵戰鬥車等。主要的國防企業,如韓華航空航天公司(Hanwha Aerospace)的K9自走砲與天舞系統已成功在歐洲及中東地區取得合約,其中與挪威簽訂了價值1.3兆韓元的「天舞全套方案」合約。現代Rotem(Hyundai Rotem)的K2戰車透過與波蘭的合約,為其地面戰力樹立新標準。韓國航空宇宙產業(KAI)憑藉FA-50打開了航空出口大門,而韓華海洋(Hanwha Ocean)則正將其海事防禦技術推進美國及加拿大市場。韓國國防工業的成功不僅在於產品本身,更在於其「全套工業系統」的出口模式,將維護、維修、技術轉移及生產等一併納入,形成長期合約並深化影響力。總統辦公廳主任姜勳植(Kang Hoon-sik)作為「韓國第一號業務員」,頻繁會晤各國總理及部長,積極推動軍售外交,其戰略經濟合作特使的角色被認為是去年出口大幅成長的關鍵因素。這股國防產業的躍升可追溯至朴正熙(Park Chung-hee)政府時期,當時韓國從仰賴美國裝備轉向自主生產,並成立國防科學研究所。如今韓國國防力量位居全球第五,而國防開支排名全球第十一,顯示出其「效率創造力量」的特點。然而,作為主要武器出口國,韓國也面臨如何在國際衝突中負起責任,並思考其武器使用的倫理議題。據報導所述,韓國已不再僅是供應商,其武器出口正對全球衝突結構產生影響。標籤: 合作媒體商傳媒