◎菜市場政治學
瑞典哥德堡大學所主持的V-Dem計劃,日前釋出最新年度的資料庫。在熱騰騰的「數位社會」新單元當中,有一個調查變項(variable)是對全球各國「遭受外國假資訊攻擊」的程度做調查,結果:台灣榮登世界第一!
台灣是2018年,全球國家當中接收來自外國政府或其代理人的假資訊最嚴重的國家!在上圖中,顏色越淺受害越深,在這個指標中台灣是第1名。前十名排行榜:拉脫維亞,巴林,卡達,匈牙利,葉門,科索沃,敘利亞,喬治亞,委內瑞拉。已被研究證實接收許多來自俄國假資訊的美國與烏克蘭,分別為第13與14名。
另外,我們把前幾名的國家畫成圖,分數越低代表受害越深。圖中也顯示,台灣不但榮登世界冠軍,且分數也與其他國家拉開了相當大的差距;也就是說台灣已被負責評比的國內外專家一致肯定為「受害程度相當嚴重」。
在菜市場政治學資訊BOX貼出來後引起不小的迴響,我們也在這邊把讀者們的問題一併做個說明。
V-Dem資料庫介紹
V-Dem的全名是Varieties of Democracy,是一個針對政治體制與民主運作各面向的大型政治學跨國調查計劃,有全球近兩百個國家的資料,是目前政治學界在國家與變數上涵蓋最廣的資料庫之一,且任何人都可免費下載所有資料。此計畫試著以更精細的方式提供概念化與測量民主的新途徑。
V-Dem 計畫的緣起在於雖然之前已有許多資料庫進行對民主的測量,如Polity IV或Freedom House等;然而這些資料庫的測量與加總方法較為不公開,且往往只依賴少數外國專家提供判斷、往往忽略了在地社會的意見。另外,這些資料庫僅著重於測量選舉以及部分自由權利 (liberal rights) 的程度,並以此作為「民主」的定義。
然而除了選舉是否自由公平以及自由權利的有無這樣的核心定義之外,民主運作的其他多元面向,例如國會監督的能量、司法獨立的程度、直接民主的門檻、審議式民主的可能、以及社經資源分配的公平性等,都需要更好地被反應在資料搜集與相關的指標建構中。
雖然強調民主的多元表現,不過V-Dem並未試圖挑戰既存規範理論上對於「民主」的定義;相反地,團隊參考既有規範與實證文獻中所提到民主應該具有的特徵,在資料搜集中盡可能地涵蓋民主的一個核心原則 (principle) 與其他六個多元原則。與既有資料庫相似,核心為選舉的有無以及執行的品質,而另外六個的原則則包含「自由 liberal」、「共識 consensual」、「審議 deliberative」、「多數決 majoritarian」、「平等 egalitarian」、與「參與 participatory」。
接著將每個原則都拆開成為更具體、細節而容易回答的問題以進行測量。舉例而言,民主的自由 (liberal) 原則在意的是人民的自由權利 (liberal rights),如言論、結社、經濟自由等;這些項目更具體細分為各種媒體與訊息的自由、政黨組成的限制、私有產權的有無等。專家針對這些具體細項進行判斷,而不是直接回答「這個國家的人民是否擁有自由權利」這樣較廣泛而抽象的問題。
資料搜集的方式與限制
在整個計畫中共有超過300個類似這樣具體的問項,從而試圖捕捉民主這個複雜而多面向的概念。這300 多個問項中有部分有「正確」答案(例如國會單一性別保障名額的比例),就由一位專家/研究助理來搜集資訊。另外將近200個指標則仰賴人為判斷(例如某次選舉中作票的情形是否普遍),由專家評估來作答。這次的「數位社會」單元都是屬於此性質的指標。針對這些指標,依照問題的性質,邀請相關領域的學者與非政府組織工作者,每一個國家每一個指標由超過5位本國與外國的專家來作答。專家匿名作答,在任何狀況之下都不會也不應該公布專家名單,以避免針對較敏感的議題或來自威權國家的專家不敢真誠地評分。
來源:V-Dem網頁
接著以貝氏項目反應理論 (Bayesian item response model) 來加總各專家的評分。採用項目反應理論來加總的原因在於,每位專家給分時心裡可能有不同的評斷基準、來自不同國家的專家也可能對現象有不同的理解。項目反應理論模型能夠調節這些不同的給分標準,也控制專家們出錯的可能,讓國家與國家之間的分數能夠相互比較。
讀者們或許會疑惑,5位專家的給分真能有什麼測量效度嗎?真的能反映該國的表現嗎?這是專家調查與民意調查的不同之處,民意調查會想要知道大眾對於某些事情的想法、態度、感覺,也就是說重點並非事情的真相究竟何在、而是民眾到底是如何「感覺」的,由於重心在於個別民眾的主觀想法、而非客觀事實,所以民意調查需要有大規模、甚至是具有人口代表性的樣本,來知道大家的感覺。
然而專家調查假定有一個客觀事實的存在,例如台灣受到境外假訊息攻擊的程度、或選舉的公平程度,這是真實存在的現象,每個人當然可以對於這個現象有不同的感受,然而我們在這裏是想知道若盡量客觀來說、與其他國家比較,台灣的這個現象是否普遍。這個情況有點類似口試時5位面試委員來判斷學生或應徵者的能力表現,5個人可能有不同的判斷標準(因此V-Dem採用項目反應理論來調節)、但他們是針對同一位候選人的表現來進行評分的;又或者是語文考試中的作文項目,每一份試卷可能交由2-3位閱卷者來進行評分、而並非以大規模民調的方式來決定分數。我們可以把V-Dem專家調查的狀況想像為有超過5位專家來為例如「台灣在2018年的選舉公平程度」這樣的變項打分數。
類似採用專家調查的計畫通常就是以少數專家的判斷為依據,而V-Dem 所邀集的專家人數已遠超過大家較熟悉的自由之家或Polity IV等資料庫。另外V-Dem也曾實驗過,比較少數專家的判斷、或廣邀許多一般民眾來為相同的政治現象打分數,發現以V-Dem所關注的變項來說,專家確實能提供更有效率、具有一致性的評分。
當然,所有無論質化量化的判斷都有其限制、也都有測量誤差(measurement error)的可能,V-Dem也不例外。比方由於資料最早蒐集到1900年,專家是否能針對這麼早期的現象進行判斷確實會有疑問,另外若專家們同質性太高的話(例如都畢業自類似的學校/國家、閱讀類似的期刊報章),也可能使評分受限。V-Dem在所有的專家調查資料中,都有提供「信賴區間」,信賴區間是由項目反應理論模型計算出的,也就是除了各國各年度在特定變項上的分數之外,也提供該分數可能的上限與下限;若是專家間彼此的意見越不相同,那麼信賴區間就會越大,代表評分的不確定性越大。而若將信賴區間考慮進去後,兩個國家的分數仍有差異,那我們就可以比較有信心的下結論說:縱然考量一些不確定與測量誤差的可能,這兩個國家的表現仍然不一樣。
為了執行這樣龐大且跨越多國的資料搜集,V-Dem 團隊成員超過五十人、許多都是相關領域的著名學者,並邀請三千多名來自超過170個國家的學者專家來作答。整個計畫目前涵蓋了180個國家自1900年至2018年的資料,並每年進行更新;另外針對部分國家也開始執行Historical V-Dem的計劃,主要仰賴歷史學家的判斷、以搜集各國在1800至1920年間的資料。
目前計畫經費來自相當多機構,包含世界銀行, International IDEA, 歐盟,以及部分北歐國家負責國際援助的部門等;這些機構依據自身目標,可能針對計畫的特定部分或特定國家提供經費。由於這樣的經費取得方式,除了學界之外、V-Dem資料也受到政府與非政府組織的廣泛應用。
關於數位社會以及假資訊傳播
「數位社會」是V-Dem計劃當中最新的一個單元,新單元中的變數包括:各國政府散播與接收假資訊的頻率,針對假資訊在不同載具上的應對方式,整體的應對能力,對隱私權的保護,人們使用媒介的方式,政治菁英和政黨傳播訊息的方式等等。調查方式如同前述,是由本國與外國的專家來評分。與其他V-Dem變項不同之處在於,由於這些問題是關於新型態的資訊傳播,因此資料涵蓋的時間僅有2000年至2018年。
這次引起迴響的「接收外國假資訊」變項,具體是詢問專家「外國政府及其代理人有多頻繁地透過社群媒體來傳播誤導的觀點或錯誤的資訊,來試圖影響這個國家的國內政治?」指標分數介於0-4之間,0分(淺色)代表來自境外的假資訊最嚴重,4分(深色)則代表該國沒有這樣的問題。(V-Dem一向都是以比較好的表現為高分,圖表也都是呈現好的一面為深色。)
除了這個問題之外,調查中也試圖理解各國政府對內向自己的民眾傳播誤導、錯誤訊息的程度,以及是否向國外傳播假訊息。下圖就是這兩個問題各國在2018年時的表現盒型圖(盒子裡的粗線是中位數的位置,盒子的上下範圍涵蓋中間50%的資料所在,直線則是資料的整體分佈)。圖中標示台灣、美國、東亞鄰國包含日、韓、中國的位置作為對照。我們可以發現,台灣政府無論對內對外,傳播假訊息的程度都不高。
另外也有一部分變項想知道政府對於網路言論與活動的控制情形,下圖列出了其中四個指標,包含政府是否審查過濾網路內容、是否限制人民上網、是否禁止人民上社群網站、以及是否審查社群網站的言論。不令人意外的,台灣的分數與其他民主國家接近,政府對於網路活動的過濾與審查相當有限。
另外,調查中也顯示台灣民眾在網路上有很多元頻繁的活動。使用/接收網路媒體的普遍程度也是2018年的全球第一名 (下圖左上),而網路媒體所呈現的觀點相當多元、並不侷限於政府立場(右上)。甚至各網路媒體對同一件事情會有相當不同的詮釋與報導方式(左下),而這個現象可能導致或反映了不同網路媒體受眾(各同溫層)之間,在立場與觀點、甚至是對現象的理解上有相當程度的分歧。另外,網路也已經成為台灣民眾用來號召例如抗議、連署、遊行等政治行動的普遍媒介了(右下)。
其他還有許多有趣的變項。整體來說,這組新的調查除了讓我們發現台灣很頻繁地接收到來自境外的假新聞之外,台灣也是個網路言論相當自由多元、能觸發許多可能的地方。
當然,有許多大家所關心的問題沒辦法透過上述簡單的圖表得到答案,例如應如何應對假訊息?網路媒體報導的高度分歧會帶來什麼影響?為何出現這樣的現象?另外,調查中也沒有直接詢問假訊息究竟來自哪個國家。這些問題都需要結合其他資料、以及更進一步的分析才能更完整回答;而除了專家調查之外,透過其他方式所搜集的資料也都很重要(例如延伸閱讀中的各種分析),結合不同來源的資料能夠幫助我們更沒有偏誤地判斷相關現象。
延伸閱讀:
中國鬥爭生存之道:習近平為何對台文攻武嚇?
以文革為背景的中國禁書「天罡系列」共4冊,作者訪問文革後出任某省會城市市委的韓姓書記。韓書記有一句話令我印象深刻:「我們這一代人有誰沒有主動或被動殺過人」。這句話與一位歷經文革年代的中國友人說的,「能在鬥爭是生存的硬道理的環境下生存下來的人都是不簡單的人」相呼應。
客觀事實顯示,從鄧小平,到江澤民,到胡錦濤,到習近平及其各自率領的執政團隊成員都是歷經「每個人必須主動或被動殺過人」才能在「鬥爭是生存的硬道理的環境」的人。這樣的經歷陶鑄了這些人「彪悍、陰狠、冷血、冷酷」的價值取向與行事風格。他們在時機未到的時候就用「韜光養晦」隱藏自己,一旦得勢立刻「耀武揚威」霸凌異己。
習近平的父親習仲勛,從革命元老被打成牛鬼蛇神的起伏人生,更讓習近平深得其中三味。這也在習近平掌握權勢後,「彪悍、陰狠、冷血、冷酷」地清洗曾經拉拔他的江澤民及其團隊看出端倪。習近平這種價值取向與行事風格不僅用在對付曾經的領導江澤民,也用來對付其同僚與人民。2018年7月16日,《人民日報》一篇題為:
「做一股清流」的評論文章指出:一些人「假大空、背臺詞、虛浮誇、邪惡醜等等」在習近平治下的官場隱憂。今年2月27日公布的「中共中央關於加強黨的政治建設的意見」,公開警告:不得搞任何形式的「低級紅」、「高級黑」,決不允許對黨中央陽奉陰違做兩面人、搞兩面派、搞「偽忠誠」……。
呼應了《人民日報》的文章指陳的暗潮洶湧的反對勢力。今年1月21日,習近平在「省部級主要領導幹部堅持底線思維著力防範化解重大風險」專題研討班的開班講話時,警告要「警惕黑天鵝與防範灰犀牛」,要做好「兩個維護」,則迂迴承認習近平政權的內外交困。「兩個維護」是指:堅決維護習近平總書記黨中央的核心、全黨的核心地位,堅決維護黨中央權威和集中統一領導。
客觀事實顯示,經濟下滑,新疆亂局,美中貿易逐漸居於下風,一帶一路踢到鐵板,美國及英、美、德、法、日、印、澳、紐、加拿大等西方國家反中力量的逐步集結,已經讓習近平的「文革套路」捉襟見肘而陷入困境,這也反應在美中貿易戰中,不得不接受美國「結構改變」的要求,及先前中印軍事對峙時的色厲內荏,及對台灣的加緊「文攻、經誘、武嚇、圍困」的吹哨子壯膽行動。江山易改本性難移,但習近平若不移其本性,恐怕江山可能更改,習近平政權可能如當年四人幫與2010年茉莉花革命的本˙阿里一樣,一夕垮台。https://tw.news.appledaily.com/forum/realtime/20190412/1549179/
五位專家的樣本.可以代表一個國家..5位專家代表2300萬樣本. 我的quantity method重修了
資料庫和各種量化資料本就會有各自的侷限
世界上有很多著名的資料庫都是使用專家評比,自由之家、Polity、聯合國的各種發展指數等等
Macro層級的資料本來就是有很多是靠專家評比來的
Micro層級的資料,如果是民調資料也只是抽樣一千人代表全部人
不需要重修,這只是人類智識的侷限
了解各種方法的優缺點即可
“另外,調查中也顯示台灣民眾在網路上有很多元頻繁的活動。使用/接收網路媒體的普遍程度也是2018年的全球第一名 (略),而網路媒體所呈現的觀點相當多元、並不侷限於政府立場(略)。甚至各網路媒體對同一件事情會有相當不同的詮釋與報導方式(略),而這個現象可能導致或反映了不同網路媒體受眾(各同溫層)之間,在立場與觀點、甚至是對現象的理解上有相當程度的分歧。”
那正是問題所在:信任假訊息的關鍵,是建立在不信任權威的基礎之上。尤其是多元化的輿論環境,只要利用不同族群存在矛盾心理,煽動及散佈反方批評輿論挑撥離間,及連結特定議題產生不信任聯想,當各方產生嫌隙及不信任時,理智已不存在,假訊息變成事實。
瑞典哥德堡大学的V-Dem資料庫,自2000年以来,台灣的數值一直都相當低,而且,除了2010年至2012年略低于拉脱维亞以外,【台灣的數值一直都是最低】。
2014~2016的三年數據如同2018年也是最低的,那三年的台灣媒體輿論場也是假訊息當道嗎?
瑞典哥德堡大学的V-Dem資料庫,自2000年以来,台灣的數值一直都相當低,而且,除了2010年至2012年略低于拉脱维亞以外,【台灣的數值一直都是最低】。
2014~2016那三年台灣的數據也是全世界最低的,難道那三年台灣的媒體輿論場也是假訊息當道嗎?
幫北韓鼓鼓掌,新聞的正確性比台灣高多了,連香港都比不上北韓。
表現最好的都是衣索匹亞玻利維亞伊朗這類國家。
To Mark:這個變數是在講境外假資訊流入的程度,不是總體新聞正確不正確
如果是要諷刺的話,建議最好先看清楚不同的變數是在測什麼