Google跟對手的「過濾泡泡」論爭︰用無痕模式搜尋仍得到「度身訂造」結果?

Google跟對手的「過濾泡泡」論爭︰用無痕模式搜尋仍得到「度身訂造」結果?
Photo Credit: Arnd Wiegmann / REUTERS / 達志影像
我們想讓你知道的是

網絡搜尋器DuckDuckGo發表報告,指他們的義工測試發現,即使瀏覽器打開「無痕模式」、未有登入帳戶,使用Google搜尋時亦顯示個人化的結果,而Google則反駁指調查方法有問題。

現時不少人均會用Google搜尋資訊,然而未必太多人注意到,每個人搜尋得出的結果或多或少都有所不同。

自2005年起,Google在其搜尋器加入「個人化搜尋」(personalized search)功能,搜尋結果排序不單取決於跟關鍵字的相關程度,更會透過用家的數據「度身訂造」。到了2009年,即使沒有登入帳戶Google仍可按照記錄提供個人化搜尋服務,其後更收起「停止顯示個人化結果」的按鈕。

網絡行動者帕理澤(Eli Pariser)把科技公司提供個人化資訊,以致用戶較難接觸到其他不同意見的憂慮稱為「過濾泡泡」(filter bubble)︰假如我們搜尋資訊時,只能夠找到自己想看的內容,那就很難知道其他想法,令人們更容易趨向極端、更難理解別人立場。

個人化搜尋結果佔多少?
2017年一項研究發現,Google搜尋結果當中平均有11.7%為個人化結果,但不同議題的差異有別。

在今年6月,主打私隱及避免「過濾泡泡」的網絡搜尋器公司DuckDuckGo招募了87名義工,協助測試Google的個人化搜尋結果差異,並在上周二(4日)發表結果。根據該公司的報告,即使登出Google帳戶以及使用「無痕模式」搜尋,Google仍然會提供個人化結果。

不過Google反駁指測試方法有問題,強調搜尋結果有別源於其他原因。

DuckDuckGo的測試

DuckDuckGo表示,87位義工在今年6月24日美國東岸時間晚上9時順序搜尋「槍械管制」(gun control)、「移民」(immigration)及「接種疫苗」(vaccination)三項議題,他們首先用「無痕模式」及登出Google搜尋,然後再以正常模式搜尋。76人使用電腦,11人使用手機。

根據DuckDuckGo的分析,他們共有以下四項發現︰

一,大多數用戶見到的結果都是獨特的。各個搜尋結果之間的差異,不能以「地點不同」、「時間有別」、「登入Google」或「Google在一小撮用戶身上測試演算法」解釋。

二,在首頁顯示的搜尋結果中,Google向部分參與者提供的一些連結,並未顯示在別的參與者搜尋結果首頁上,即使登出Google並使用無痕模式亦一樣。

domain-occurrences-2
DuckDuckGo以圖像說明,87位參與者以無痕模式搜尋「槍械管制」時,首頁會顯示9至11個網站,而且顯示的網站及排序各有不同。

三,搜尋結果頁上的「焦點新聞」和「影片」資訊箱(infobox)內容亦有顯著差異,即使在同一時間搜尋,仍會得到不同的資訊來源(這排除了地點的影響)。

四,無痕模式及登出Google無法使人免於「過濾泡泡」的影響。這些方法不會如大多數人預計般令你匿名。事實上,不可能使用Google搜尋而避免「過濾泡泡」。

Google反駁

在DuckDuckGo發表報告後,Google發聲明指這項研究「方法錯誤、結論誤導」,認為原因在於DuckDuckGo把所有搜尋結果差異都視作個人化搜尋的結果。聲明又指多項因素會導致結果有些微差異,包括時間及地點,並認為該項研究未有控制這些因素的影響。

Google搜尋的公共聯絡Twitter帳戶亦發表帖文反駁,指搜尋結果並不經常個人化,而且一般不會大幅度影響結果,而搜尋結果有分別通常源於其他原因,包括地區、語言、時間、裝置等。

該帳戶解釋,Google的數據中心持續更新大量數據,雖然他們盡量令改變同步進行,但仍有可能出現時滯,導致顯示不同結果。帖文宣稱即使相隔幾分鐘,搜尋結果亦有可能已經更新,從而出現差異。

近來Google宣稱只有小量搜尋結果經個人化處理,而且通常是當關鍵字有歧義的時候,原因是個人化未必能帶來更準確的搜尋結果。

如何理解這項測試結果?

DuckDuckGo是Google的競爭對手,其定位為注重私隱、破除「過濾泡泡」的影響,因此這項測試顯然有利益衝突,或會令結果出現偏差,應保持懷疑。不過DuckDuckGo在明確描述測試方法之餘,也公開數據及程式碼供外界分析,曲解數據的可能不大。

而且DuckDuckGo所設計的測試方法,已經考慮到時間和地點差異,例如要求參與者同時間按其規定的次序搜尋特定字眼,以及在分析時把屬地區性的新聞來源分開處理(將所有地區新聞視作相同來源),並指出對結果影響不大。

至於Google的反駁,則未有明確指出DuckDuckGo的方法有何錯誤,但按照該公司的回應去推斷,應包括以下兩點︰

  • 未有準確記錄尋搜時間的差異(因為Google宣稱相差幾分鐘也會影響結果);
  • 在分析各個搜尋結果的差異時,未有將參與者之間的距離納入考慮(因為Google指數據中心未必同步更新結果)。

然而若對DuckDuckGo的測試有此嚴格要求,Google方面應首先為兩項宣稱提供證據,並證明參與者見到不同結果,並非因為個人化搜尋所致。

「無痕模式」的用途及限制

現時各大瀏覽器均設有「無痕模式」(又稱「私隱模式」、「私密瀏覽」等),聽起來似乎比較安全。

啟用無痕模式時,瀏覽器會開設新資料夾存取瀏覽記錄、cookies及快取(cache)檔案等資料,當關閉無痕模式視窗後這些資料便會刪取,而且使用無痕模式時,瀏覽器無法讀取原本的cookies,因此不會自動登入帳戶。

sipaphotoseight547575
Photo Credit: Jaap Arriens / Sipa USA / Newscom / 達志影像

然而使用無痕模式只是瀏覽器本身不留下記錄,不代表你能夠在網絡上隱身——你的網絡供應商(ISP)能夠記錄你上哪個網站,而你連上的網站亦可保存相關記錄。此外每個人所用的硬件、作業系統和瀏覽器均有不同,這些差異足以讓網站為每個瀏覽器製作獨一無二的「指紋」作記錄。

簡言之,使用無痕模式上網,網站仍然有辦法辨認用家身份。

詮釋結果問題

DuckDuckGo分析測試中各參與者的搜尋結果,比較各組結果的相似程度,發現使用無痕模式和正常模式搜尋時,平均而言結果有些微差別,相比之下,不同用戶之間使用無痕模式的搜尋結果差異更大。

若按照DuckDuckGo的理解,這項結果代表Google的個人化搜尋影響明顯存在,因為不同用戶——即使已開啟無痕模式——所得結果有顯著差別,而且遠比是否使用無痕模式(及登入Google)影響更大,這亦說明用上無痕模式仍會被Google追蹤及辨認到身份。

然而另一方面,若按照Google的解釋,不同用戶所得結果的差異並非個人化所致,而且Google甚少使用個人化排序,那麼正常模式及無痕模式結果差別不大,倒可能印證了Google的說法——沒有cookies不會影響搜尋結果。

到底應該相信哪一方?恐怕要等獨立的第三方嘗試重複實驗,而且Google更公開透明討論其搜尋個人化排序問題,我們才能夠有充分資料下判斷。

相關文章︰

資料來源︰

或許你會想看
更多『新聞』文章 更多『科技』文章 更多『Kayue』文章
Loader