大型Twitter研究︰假消息傳得更快更遠,原因是甚麼?

Photo Credit: Depositphotos
我們想讓你知道的是

一項大型研究印證「錯誤消息傳得比較快」的說法,卻同時發現自動貼文的程式並非主因。

有句諺語是「謊言環遊了半個地球的時候,真相還在穿鞋」,意指錯誤訊息傳播極快,事實遠遠趕不上。稍為有留意謠言傳播的人,相信都知道這個現象,而在網絡特別是社交網站面世後,資訊散播加速,就令謠言流傳得更快。

近年假新聞興起,營運假新聞網站不但有利可圖,更可變成打擊對手的政治武器。2016年美國大選後,《BuzzFeed》透過分析Facebook上跟選舉有關的新聞傳播數據,發現表現最好的假新聞的參與度甚至比「真新聞」還要好。

學界亦有不少關於謠言傳播的研究,不過當中不少分析單一謠言或單一事件,也有些研究主題是謠言傳播的模型或如何阻止謠言散佈等,反而缺乏全面評核、比較事實及流言傳播差異的研究。

麻省理工大學媒體實驗室的三名研究員就此議題發表論文,在最新一期的期刊《科學》刊登。他們使用由2006至2017年來自300萬人的Twitter貼文數據,涉及約126,000個傳言。分析這些傳言散播的數字後,三人除了印證「錯誤消息就是傳得比較快」外,還可以看到錯誤消息傳播得比真相快多少、遠多少,更發現貼文程式(bots)不是謠言流傳的罪魁禍首。

分析傳播的指標

論文作者表示,由於現時「假新聞」一詞已無可挽回地兩極化,所以他們避免使用這個詞語,另外,文中對「新聞」(news)一詞的定義較廣,基本上就是任何宣稱,所以下文將譯為「消息」。因此研究探討的是「真確消息」和「錯誤消息」。這項研究的另一重要概念是「傳言」(rumor),指的是消息透過Twitter傳開去的社交現象,其內容可以是正確亦可以錯誤(所以不譯作「謠言」)。

當有一名Twitter用戶貼文作出一項宣稱,不論是純文字、貼圖抑或貼出連結,就開始了一個「傳言串」(rumor cascade),如果有其他用戶轉發(retweet),轉發的貼文亦屬於同一傳言串。如果有兩人各自獨立貼出同一個傳言,比方說「地球是平的」(這是錯誤的),則視作兩個傳言串。

換言之,一個傳言可以有多個傳言串,而每個傳言串都是一個樹狀圖,如下圖所示︰

作者用上四項指標分析傳言串,分別是︰深度、大小、結構傳播度(structural virality)以及最大闊度。

傳言串的「深度」定義為由源頭開始轉發、最長而連續的路徑之頂點數量,例如上面的傳言串深度為4。傳言串的「大小」定義則是涉及的獨立帳戶數量,由於每個帳戶不能重複轉發同一則貼文,因此就等同於轉發次數再加一,如上圖表示的傳言串大小為8。

結構傳播度則是計算兩點之間的平均最短距離,圖中任意兩點的最短距離,即最短路徑需要經過多少個點。每一層的闊度,是指同一層有多少用戶,例如上圖第一層為源頭,闊度為1;第二層由兩名轉發用戶構成,闊度為2;第三層闊度為4;第四層闊度為1。因此「最大闊度」就是闊度最高那一層的數字,上圖那個傳言串的最大闊度正是4。

錯誤傳言︰更快、更遠、更廣

為分辨研究資料中的傳言真假,研究作者對比6個獨立的事實查證機構的資訊,這些機構查證傳言串的準確度有95%至98%吻合。在126,301個傳言串中,有82,605個(65.4%)屬錯誤,24,409個(19.3%)屬真確,19,287個(15.3%)為混合。這些傳言串對應2,448個傳言,其中1,660屬錯誤,490個屬真確,259個為混合。可見錯誤傳言的數量佔多數。

分析結果顯示,從多項指標看來,真確傳言在Twitter遠遠及不上錯誤傳言。

F2_large
Image Credit: Soroush Vosoughi et al. 2018
從多項指標看,錯誤傳言串(紅色)的傳播表現均比真確傳言串(綠色)好。

首先,從傳言串深度而言,沒有真確傳言串可以到達超越10層,相比之下,不但有錯誤傳言串超越10層,其中最高的0.01%更超過19層。以接觸人數而言,真確傳言串鮮有到達1000人的級別,但有百分之一的錯誤傳言串大小為1000至10萬人左右。

比較傳言串每層的闊度,同樣是錯誤傳言要比真確傳言多,顯示更多人轉發錯誤消息。傳播度亦顯示錯誤消息並非單靠廣播來傳開去,也依靠人與人之間的散播。除了接觸人數外,錯誤消息傳播速度要快得多。真確傳言觸及1500人所花的時間,是錯誤傳言的6倍,抵達10層深度的時間更是20倍,某程度上印證了文章開首提及的諺語。

作者亦有為傳言歸類,政治類別佔最多,約有4.5萬個傳言串,其餘順數量排序為都市傳說、商業、恐怖主義、科學、娛樂及自然災害。在錯誤資訊當中,政治消息屬傳播表現最強的一類,各項指標勝過其他類別的錯誤傳言,傳播速度也快上不少。

新奇內容較吸引人分享?

為甚麼錯誤消息會更加吸引?作者認為其中一個可能解釋是新奇的消息更加吸引,也更令人想分享,因為新資訊會更新我們對世界的理解,所以更有價值。於是他們測試到底錯誤消息是否比真確消息更加新奇,以及Twitter用戶是否更傾向轉發新資訊。

他們先隨機選取約5000名傳播真確及錯誤傳言的用戶,並隨機抽取他們轉發傳言前60天看到的約25,000則貼文。利用統計模型,作者分析這些用戶轉發的傳言以及讀到的貼文之間有多大關係,他們發現錯誤消息在所有指標上,都顯得比真確消息新奇。

雖然如此,轉發的用戶可能不覺得這些消息新奇,因此他們進一步比較用戶回應真確及錯誤傳言時的內容,透過情緒分析發言和標籤,發現錯誤傳言引起的回應更表達出驚奇,支持他們的猜想。雖然作者並未宣稱「新奇」是用戶轉發錯誤消息的原因,但他們發現錯誤消息比較新奇,而且新奇的內容較大機會被轉發。

因為取樣問題?

研究一大限制在於,作者選取由事實查證機構檢驗過的傳言,這個取樣偏差有可能影響了真確傳言和錯誤傳言的傳播比率。於是他們搜集另一組數據,再作比較。

他們訓練了三位大學本科生作事實查證,以及使其自動偵測傳言的演算法,在300萬則英語Twitter貼文中找出傳言,再作調查。三位學生需要忽略所有已被其中一家查證機構檢驗的傳言,並要在查證後按調查結果把傳言標記為「真確」、「錯誤」或「混合」。

三位學生各自獨立查證了13,240個傳言串,亦不知道其他人做相同工作,他們有90%標記完全吻合。當研究作者分析這組數據時,發現結果跟主要的研究數據幾乎一樣。即使把條件放寬,接受三人其中兩人相同的標記,從而包含更多傳言串在內,結果仍然一樣。由此可見,上述取樣限制似乎不太影響結果。

貼文程式令錯誤訊息流傳?

不少研究顯示,社交網絡上充斥一些貼文程式/機械人(bots),大量轉發、散播特定訊息,意圖影響公眾意見。那麼,這些貼文程式會否扭曲研究結果?

作者表示,在分析數據之前,他們先用演算法偵測出貼文程式帳戶,再把有關貼文移除。不過即使把這些貼文都納入考慮,再分析得出的結果並未改變他們的結論——錯誤消息仍然比真確消息傳播得更快更深遠。

他們亦嘗試使用另一個偵測貼文程式的演算法,以及修改演算法辨認的參數,結論仍然相同。雖然貼文程式的確會加速消息傳播,但對真確或錯誤的消息影響大致一樣,這顯示錯誤消息之所以傳播得更快更遠,主要原因是人類更傾向轉發錯誤消息。

如何阻止錯誤資訊流傳?

研究作者指出,錯誤消息有多項害處,但相關研究往往針對特定流言,而非大型、有系統的分析。今次研究則確認了網上錯誤消息傳得比真相快和遠,亦推翻了一些關於錯誤消息傳播的「傳統智慧」,例如貼文程式的影響有限。

作者比較了傳播錯誤消息和真確消息的用戶,發現前者不論追蹤人數、活躍程度、受認證數量以及在Twitter上的時間,都明顯低於後者,可見錯誤消息傳播較快並非因為個別「KOL」的影響力所致,這個網絡本身應該較有利真確消息傳播,卻得出相反結果。

他們認為了解錯誤消息如何傳播,是遏制其影響的第一步,針對錯誤資訊傳播的政策,應該著重行為介入,例如標籤錯誤資訊、提供誘因阻止傳播假消息等,而非只封殺貼文程式。

相關文章︰

資料來源︰

或許你會想看
更多『新聞』文章 更多『科技』文章 更多『Kayue』文章
Loader