編譯/特約記者 朱弘川 | 譯校/田育志

人工智慧(AI)正襲捲當今新聞業,新聞自動化生產和發行已為不可逆的現實,然而讀者卻未必知情。這提出了一些基本問題,未來的記者需要學習什麼?人工智慧能否改善行業的工作條件?媒體的收益又如何?

儘管媒體規模不斷削減,出現正職人員減少、低薪接案工作反增的情況,但將資金投入創新的項目仍是可預期的。

(圖片來源:Unsplash

人工智慧如何改變新聞業-納入機器學習輔助

根據路透研究中心2019年〈新聞業、媒體、科技趨勢報告〉,在200位受訪的媒體出版商編輯和主管中,有超過3/4表示今年將更專注在人工智慧(AI)和機器學習(ML)的開發上,可見機器學習將成為人工智慧發展不可或缺的一部份。

根據Equal Times的María Crespo觀察,機器學習在新聞室的應用,可借鏡2016年挪威新聞社(NTB)的案例。NTB當時為了進行自動化產出足球新聞,要求記者與AI專家共同「訓練」機器人,從氣象預報和商品市場行情,到未來挪威地方選舉的規劃,自動新聞報導在編輯團隊監督下,有高達99%正確率。

前挪威新聞通訊社創新總監Helen Vogt提到,大量的編輯參數幫助機器人做出正確的選擇,新聞團隊也在過程中得到未來自動化生產新聞的想法。不僅如此,Vogt看到了媒體從中獲益的可能:「我們的客戶在比賽結束後立即得到所需的報告,自動化幫助NTB報導了許多過去無法採訪的低層級比賽,也提供了更廣泛的新聞服務。」

與此同時,新聞機構也找到了另一個賣點,既符合媒體收益考量,也搭上AI應用的熱潮,那就是虛擬主播。中國新華社和搜尋引擎公司「搜狗」合作開發的虛擬主播,標榜著「無自我,隨時準備工作」,模擬了真人主播的聲音、肢體動作和表情,未來甚至可以編入幽默感。同樣,NHK近期也推出虛擬主播Yomiko,不僅在日常新聞時段現身,讀者也能透過亞馬遜Alexa和Google Home使用這項服務。

自動化新聞可以看作是20世紀80年代末新聞編輯室實行自動化的延續,也是資料驅動(data-driven)新聞的未來。

新聞室必須學習如何使用人工智能-更多有助於記者的工具

機器學習、演算法和自然語言處理成為如何報導、製作和分發新聞的常用方法。雖然人工智慧(AI)可以識別人臉和物體、辨別語言,並從不同的資料生成數千篇文章,但機器人真的可以取代記者的工作嗎?

「數據資料本身既帶有偏見,因此,像是種族或性別偏見可能會產生新的錯誤並將其放大千倍」美聯社商業版編輯Lisa Gibbs說。

例如,洛杉磯時報的地震新聞生成系統QuakeBot在2017年就1925年的大地震資料,發表了一篇即時新聞和推文,其中誤用美國地質調查局的歷史數據,即便報社隨即刪除文章,這種「時空錯置」的狀況在當時造成不小騒動。

由此可見,自動化新聞生產流程仍需要專業知識和技術的正確結合,路透社副主編 Alice Rizzo在2017年便撰文寫道,新聞業面對AI該有的基本認知:

  1. 目前電腦編程能力有限,許多重大突發性事件,仍需要值得信賴的記者來理解和撰寫有意義的報導。
  2. AI需要人力投入,也需要專業的記者查驗結果並解釋它們。
  3. 在分析大量數據時,AI能增加內容量,但不一定是質量。

目前美聯社和Google合作進行AP Verify,將人工智慧與編輯專業知識相結合,並可直接在雲端作業,以獲取和驗證用戶生成的內容。這款工具可以分析影音,並透過網路查看是否發佈過,及發生在何時何地,確保資料的真實性。路透社的News Tracer使用人工智慧來確定趨勢主題是否具有新聞價值和真實性,幫助記者分析大數據並提出報導想法。

網路媒體Quartz旗下AI Studio的機器學習工具,即便沒有編碼或數學技能的記者也能輕鬆上手。這款工具能篩選大量的資料,無論是文字、數字還是圖片,還能根據過去的事件進行預測。Quartz的機器學習技術工程師John Keefe認為:「這有助於人機之間的對話,例如,理解和解釋自然語言,或者學習何時是與某人交談的最佳時間。」

Quartz AI Studio還為記者推出專門的Slack機器人Quackbot,可直接從網站截圖或篩選特定的詞彙。隨著更多「資料導向」新聞發布,AI Studio最終希望能與更多的記者分享此工具。

記者如何為AI未來做好準備?一所芬蘭大學提供免費課程,並向全世界開放,大約30個小時就能完成修業並獲得證書,並可發佈到的LinkedIn專頁。亞馬遜還為開發人員設計的專門的課程,預計2019年將有更多的公共和私人計劃問世。

另一觀點是,新聞記者須了解到,數位時代的充斥著虛假和錯誤的訊息,AI工具的確能幫助記者過濾不必要的資料。

「不肖的創作者利用AI來創造和傳播錯誤的消息,因此記者必須用相同的技術來對抗這種情況。」Gibbs解釋道。

新聞自動化生產會讓記者失業嗎?

雖然重複性更高的任務可以自動化,但是記者的本事可不只於此,例如與消息來源的交流,這是比利時大學博士研究生,目前從事新聞室AI相關研究的Laurence Dierickx和許多專家都同意的觀點。

Dierickx並強調:「不要將自動化技術視為對手,何不盡自己最大的努力讓它們成為盟友呢?現在有足夠的例子證明它正在發揮作用。」類似的例子像是INJECT,可以幫助使用者更容易地找到報導的原始角度。」

Vogt則從過往挪威通訊社的經驗學到,記者應與開發人員合作才是新聞室進步的不二法則。「許多老派記者似乎無法與技術人員溝通,也不尊重他們的工作,也許學習基礎python語言會對現在的記者有所幫助。」

實際上,人工智慧和機器學習的潛力無限,其他新聞機構也在這個領域進行了試驗。例如,芬蘭新聞機構(STT)能在幾秒鐘內將新聞翻譯成英語和瑞典語。芬蘭廣播公司(YLE)的Voitto智能助手每週生產大約100則體育新聞和250個插圖。而美聯社則預計在今年製作40,000則自動產出的報導,主要是商業和體育新聞,接下來更打算使用圖像識別軟體為新聞編輯室簡化分類和字幕處理過程。中國的騰訊2015年便開發寫稿機器人Dreamwriter,目前每年約產出2,500件關於金融、科技和體育的新聞。

無論新技術再怎麼強大,也仍要導入人類的思維相互磨合,才能優化數位時代編輯室的工作流程。「機器人不是未來的記者,他們是記者的助手,我們正試驗自動化和人工智慧能否減輕日常工作量,如影像的翻譯和轉錄,這樣記者就可以集中精力進行其他創造性的工作」Gibbs補充道。

新聞個性化推薦(personalization)所隱含的道德和法律風險-新聞業的信任受到威脅

中國新聞軟體如〈今日頭條〉、〈趣頭條〉和騰訊的〈快報〉目前皆使用人工智慧(主要是機器學習技術)提供新聞,〈今日頭條〉甚至擁有約1.2億活躍用戶(平均每天使用超過一小時),其母企業字節跳動(Bytedance)也參與了印度最受歡迎的Newsdog投資計劃。隨著西方市場技術的飽和,Google和Facebook又受限中國法規而動彈不得,讓中國和印度等市場後勢看漲,亞洲科技公司得以殺出一條血路。

中國新華社社長蔡名照曾對外表示,新華社將建立一個「基於資訊技術和人機協作的新聞編輯室」。該媒體的代表作為2017年推出的媒體大腦(Media Brain)平台,號稱集雲端計算、物聯網和人工智慧於一身,以利產出更多新聞。但中國政府主導的人工智慧發展,也引發外界對個人資料的保全疑慮。

中國金融投資網的聯合創始人尼娜·林(Nina Xiang)表示:「媒體大腦……就像阿里巴巴與中國官媒間的合作,這種夥伴關係就好比亞馬遜、Paypal、CBS、新聞集團與美國各級政府間,他們共享彼此蒐集的數據,以監控各地所發生的事件,而人們卻未必了解它的使用情況。」

人工智慧與機器學習技術的日漸成熟,卻也引起新聞實踐上的道德探討。演算法鼓勵誘餌式標題(clickbait),易產出過量的病毒影音和材料,中國政府於2018年4月曾暫停〈今日頭條〉在內的一系列應用程式,理由是過多的粗俗和不真實的內容。可以預期的是,新聞聚合應用程式今年將面臨更嚴格的監督。

新聞服務的個性化至關重要,但並不是將編輯判斷移交給演算法

對於傳統出版商來說,最大的問題是如何負責任地和透明地使用AI,及如何與用戶進行溝通。芬蘭廣播公司(YLE)的智能助手Voitto,可直接在智能裝置休眠情況下收集用戶的使用資訊,目的是與用戶的個性化建立持續對話,但重點是它以點擊率(Click through rate, CTR)為主要衡量標準,及考量用戶是否對收到的內容和類型感到滿意。

在2019年,英國BBC也將企圖定義「符合公眾利益的演算法」(public service algorithm),這意味著將教育聽眾有關演算法的好處,以及如何妥善的使用個性化選項,而不是任憑出版商擺佈。

倫敦政經學院Polis媒體智庫的負責人Charlie Beckett也為此感到擔憂。「圍繞新聞從業道德面的探討,若仍聚焦透明度和演算法程序上偏見的層面,這不是新聞業所樂見的。」

目前歐盟沒有具體立法規範人工智慧,但有相關針對演算法量身定制的法規,如金融工具市場指令(Directive on Markets in Financial Instruments)或一般數據保護法規(General Data Protection Regulation),但僅涉及個人資料助於自動化決策層面的保障。我們須了解到,若自動生成的文章具爭議性,該承擔責任仍會是出版商,而不是機器人。

「如果自動生成的文本,像足球比賽或商業報告的新聞,應註明是自動化並讓讀者知道嗎?」提倡演算法透明度的非營利組織Algorithm Watch創始人兼執行董事Matthias Spielkamp認為,讀者需要透明度,但與此同時,許多讀者似乎並不關心新聞是否為自動化生產,正如氣象報導等制式的資訊,但現在也許是向讀者揭露此過程的絕佳時機。

但新聞業這樣以人為本的專業領域,新聞編輯室如何將AI應用納入更多道德層面的探討?

BBC新興科技和戰略總監Ali Shah,在半島電視台2018年舉辦的媒體領袖峰會上提到,AI工具的應用有助於記者的工作,但短期內仍無法取代記者,因為「機器學習不會成為我們面臨的每個問題的答案」。

Ali Shah認為,新聞組織仍應在「受眾對新聞的信任度」與新技術兩者之間取得平衡,並對「人工智慧工程師和作為預定消費者的大眾進行教育」。換句話說,機器學習過程不該只有工程師和記者,也該讓受眾參與,讓其知曉機器學習和人工智慧如何影響他們。