繁簡切換

普立茲獎入圍者如何在報導中使用AI

本文摘譯自 Andrew Deck 於5月22日發表在尼曼新聞實驗室(Nieman Lab)的《How this year’s Pulitzer awardees used AI in their reporting》

這是連續第二年,普立茲獎主辦方要求參賽者揭露在報導過程中是否使用了AI工具,並在突發新聞攝影與專題攝影類別,首次要求參賽者必須一併提交相機拍攝原始檔和已發表的照片。

和2024年情形相似,參賽報導所應用的AI工具大多並非生成式AI。製作這些報導的記者表示,他們採用的工具,主要是在ChatGPT與大型語言模型(LLMs)問世前便已存在的機器學習技術。

普立茲獎行政主管 Marjorie Miller 說:「我們認為負責任地使用AI,是現今新聞工作者日益多樣化工具箱中的重要環節。」她指出,獲獎報導中還運用了其他工具,例如統計分析、公開資料請求與影像鑑識。「適當使用AI技術,能為新聞增添靈活性、深度與嚴謹性,這在十年前是不可能做到的。」

整體而言,今年使用AI工具的新聞從業人員仍以調查記者為主。以下介紹這四篇報導及其應用AI工具的情形。

《華爾街日報》用AI技術把資料轉為向量並視覺化呈現。(翻攝《華爾街日報》官網)

案例一:馬斯克(Elon Musk)政治立場轉變的視覺化分析

《華爾街日報》(WSJ)分析馬斯克自2019年以來在X上逾4萬1千條互動資料。他們以機器學習技術,將這份資料賦予數值、轉換為向量,並將向量視覺化呈現,包含相似關鍵字的貼文被聚集成群,以展示出馬斯克言論隨時間演變的趨勢。結果顯示,馬斯克從發布迷因的商業人物轉變成更常提及政治議題的政治人物。

參與該系列報導的記者 John West 說,這篇報導並未使用生成式AI工具,「這不是把資料餵給ChatGPT」。他們使用了文本與圖像嵌入模型來創建向量,得以捕捉包括迷因在內的語意,模型則來自Google軟體開發套件(SDK)。他說:「現在的影像嵌入模型非常強大,我們一年前根本無法做到這些。」

該報導是《華爾街日報》針對馬斯克政治影響力系列報導之一,使其團隊贏得2025年國家新聞獎項。

《華盛頓郵報》藉由影像辨識演算法來搜尋檔案庫資料。(翻攝《華盛頓郵報》官網)

案例二:追溯十九世紀中期美國土地撥贈的族譜調查

《華盛頓郵報》(The Washington Post)《四十英畝和一個謊言》系列報導深入挖掘美國財富的歷史秘密。該報記者將自由民局(Freedmen’s Bureau)的180萬份手寫土地所有權文件數位化。由於資料數量龐大,記者 Pratheek Rebala 開發了影像辨識演算法,將團隊先前已識別出的土地所有權書與土地登記冊作為訓練資料,接著使用生成的模型搜尋整個自由民局的檔案庫。

「AI工具幫助我們擴大了專案範圍,並顯示『四十英畝和一頭騾子計畫』影響的人數比許多人意識到的要多,」雷巴拉說。

該報導以資料作為起點,確認了超過1000名在美國南北內戰後獲得土地、但在一年半內即被剝奪的前奴隸黑人男女,團隊找到幾位這些人的後代並做訪談。該項目入圍解釋性報導獎項。

《華盛頓郵報》與AI公司合作,報導以色列軍方空襲巴勒斯坦加薩走廊。(翻攝《華盛頓郵報》官網)

案例三:透過影像鑑識分析推翻以色列軍方殺害記者的說法

《華盛頓郵報》的視覺取證團隊在一篇報導中,推翻以色列軍方對於空襲加薩、造成兩名半島電視台記者死亡的說法。以色列國防軍稱,空襲目標是一名「操作飛行器、對以軍構成威脅的恐怖分子」;報導團隊與地理空間AI公司Preligens合作,確認空襲當天,記者所在地點方圓十英里內沒有任何軍事車輛。這項結果與無人機影像一致,也佐證其他分析專家的判斷:當時當地並無任何即時威脅。

由於以色列禁止多數國際記者進入加薩,大型媒體的視覺調查團隊日益仰賴AI模型分析衛星影像,例如《紐約時報》曾透過分析加薩地區的彈坑分布,證實以色列軍方曾在標示為平民安全區的地點動用重型武器。《華盛頓郵報》這篇報導成為國際新聞獎項入圍作品之一,也成為遠距戰地調查報導的新典範。

《美聯社》與學術單位合作,以AI技術整理逾千件「致命壓制」案的死因和方式。(翻攝《美聯社》官網)

案例四:建立美國警方使用「非致命武力」致死人數的資料庫

《美聯社》(AP)在佛洛伊德(George Floyd)被警察壓頸致死後的隔年,即2022年,開始著手調查受到較少關注的致命執法:美國有多少人在沒有遭到槍擊的情況下,被執法人員壓制致死。最後確認了各地1000多起「致命執法」事件

AP團隊與馬里蘭大學的霍華德調查新聞中心(Howard Center for Investigative Journalism)等單位合作,在三年調查期間內蒐集了超過20萬頁的數位檔案,涵蓋法院紀錄、警方報告、驗屍報告與死亡證明等,部分為手寫或品質不佳的掃描影像。此系列報導成為調查新聞獎項入圍作品之一。

霍華德調查新聞中心將機器學習與AI工具導入調查流程,例如光學字元辨識(OCR)技術成為資料處理的關鍵,像Amazon Textract這類工具不僅大幅提升文件可讀性,也加快了搜尋效率。霍華德中心資料編輯穆森登 Sean Mussenden 說,機器學習技術協助團隊統整超過1000起「致命壓制」案件的死因與方式,揭示驗屍官判定中存在的偏見與疏失。

Sean Mussenden還提到,團隊特別運用OpenAI的語音辨識模型Whisper,將數百小時的警用隨身攝影機錄音轉錄成文字,這些影片大多是透過公開資訊申請取得的。他強調,這些工具只是輔助記者掌握核心資訊的手段,所有資料都經過多層人工審查,「最關鍵的工作仍是人類記者親自閱讀與萃取文件內容。」

有話要說

相關文章

【在田間學】如何做一個有立場的文化媒體?b.l!nk的創辦與編採之路
【在田間學】如何做一個有立場的文化媒體?b.l!nk的創辦與編採之路
【在田間學】我們如何報導戰爭 — 烏克蘭和台灣的一線分享
【在田間學】我們如何報導戰爭 — 烏克蘭和台灣的一線分享
【紐時幕後】我們如何報導暴力事件中的施暴者、嫌疑犯和受害人
【紐時幕後】我們如何報導暴力事件中的施暴者、嫌疑犯和受害人