◎王宏恩/內華達大學拉斯維加斯分校政治系助理教授、吳冠昇/普度大學政治學博士候選人、葉耀元/休士頓聖湯瑪斯大學國際研究與當代語言學系副教授兼系主任、陳方隅/科技部人文社會科學研究中心博後研究員

 

 

台灣因為Covid-19肺炎疫情的緣故,而讓大多數人被迫隔離,這也大幅度影響到了台灣的民意調查的進行。大部分的民調機構都是由十幾位訪員跟督察同處一室,使用數十台電腦輔助撥號,以此方式來紀錄訪談結果的。這樣的形式,很明顯的在目前看來就是所謂的「群聚」。然而,因為疫情發展快速,民意調查在此時又特別重要且備受矚目,因此一些比較嚴謹的學術機構(例如位於政治大學的台灣政經傳播研究中心),已從原本的抽樣面訪改採一個個線上訪談的形式,藉此完成民調。但更多媒體的民調方式已改成線上投票,包括聯合、Nownews、蘋果日報等;一些網紅們也紛紛在自己的臉書上舉辦投票。乍看之下,許多這些線上投票都有好幾萬人參與,比傳統電話訪問規模一千人的樣本高多了。但是,這些網路投票的結果,有比傳統民調更為準確嗎?它們能找出民眾的真實態度分布?最重要的是,這些網路投票真的具有參考性嗎?

在這裡,我們要來講一個民調史上最著名的故事:一個兩百萬人參與、預測總統大選錯誤、最後導致一個新領域全面興起的故事。

 

圖說:許多新聞網站都有專門的線上民調專區,大家覺得這樣的民調結果能否推論到所有民眾的狀況呢?圖片來源:Yahoo新聞線上民調專區。

 

1936年的美國總統大選,當時的美國正在想辦法走出「經濟大蕭條」的陰影,民主黨的羅斯福總統爭取連任(Franklin D. Roosevelt。對,就是台北市羅斯福路的那個羅斯福),而共和黨派出了蘭登(Alf Landon)挑戰。這場大選於該年11月3日投票。

在投票前四天,10月30日,一個雜誌貼出了他們的選舉預測,內容立刻登上了全美各大新聞頭條:他們預測在普選票方面,蘭登會以55%的得票數大勝羅斯福的41%!(另外還有一個小黨候選人會拿到4%)

這個雜誌叫做《文學文摘》Literacy Digest,是一個1890年創刊的文學雜誌,每周出版,其內容包含文學跟新聞。自從1920年開始,雖然發行量已經到達百萬、屬於高度受歡迎的雜誌,還開始印刷彩色封面,但這家媒體高層決定改變策略:他們開始在總統大選之前,在雜誌裡面夾帶問卷民調給訂閱雜誌的讀者,請他們免費寄回雜誌公司,然後該雜誌會在投票日前一次出刊時公布結果。

 

1921年的彩色封面

圖片來源:wikipedia

 

1934年的封面人物是汪精衛。

圖片來源:kongfz.com 

 

Literacy Digest 寄給讀者的問卷

圖片來源:quora

 

這樣的民調似乎收到了很好的效果,他們從1920、1924、1928、以及1932這幾次大選前一周公布的讀者投票,都猜對了該屆總統大選的當選人!甚至在1932年時,他們預測的結果只跟實際的結果差1%!每次的預測正確,都更讓這家雜誌社聲名大噪,而兩大黨人物也都會特別提到這雜誌的「民調」,在政治界沒人敢怠慢。

然而,當時一些統計學者就提出了一些不同的看法;他們認為這些預測成功只是運氣好,沒有任何學理基礎可以證明他們下次的預測也會成功。

到了1936年的選舉,《文學文摘》在選前發了一千萬張民調出去,在選前一周一共收回了兩百三十萬張讀者的回函。發出一千萬、收回兩百三十萬,這應該是史上最多人參與的調查了,甚至比許多小國的人口數還多。因此文學文摘雜誌信心十足,在選前四天公布了藍登55%大勝羅斯福41%的調查結果。這樣的消息瞬間登上了隔天美國各大報的頭條。

 

 

圖片來源:twitter

 

 

圖片來源:twitter

 

諷刺的是,四天後選舉結果出爐,羅斯福以61%大勝蘭登的37%。羅斯福在48個州裡獲勝了46個州,拿到523張選舉人票(總共538);而蘭登只拿到2個州,獲得8張選舉人票。簡言之,最後選舉結果,跟四天前文學文摘公布的民調結果,不僅完全顛倒,差距更高達了38%。

這家在當時已經經營了46年的雜誌、可以發出一千萬份讀者問卷的文學文摘,兩年後因為經營不善,在1938年宣布倒閉。訂閱者名單後來被Time雜誌收購,從此消失在美國媒體界。

而就在同一時間,三位三十幾歲的小夥子在1936總統大選前一年,在紐澤西成立了一家小公司,號稱要用科學的方式,以全美電話抽樣的方式來做民調。為了預測同一場大選,他們「只」抽樣了三千位受訪者,其結果不只準確地預測了該次美國總統大選,甚至在問卷裡也問了哪些受訪者有訂這家文學文摘,因此成功地預測了文學文摘會失準。這是一個三千人打敗兩百萬人的民調戰爭,而這樣的結果,也讓這家小公司後來聲名大噪,從此讓全美都走上科學民調之路;而政治科學也在十年後的1948年正式從密西根大學開始執行全美的學術民調。這家小公司帶頭的小夥子叫做George Gallup,當年34歲,哥倫比亞大學新聞系教授,他所成立的公司就是現在家喻戶曉的蓋洛普民調公司。

為何文學文摘會預測失準?這裡面有兩個最簡單的原因:第一,即使《文學文摘》成功發出了一千萬張的民調,這樣的數字並不包含各種背景的美國民眾。畢竟,有辦法訂閱這種雜誌的讀者,有較高的比例是有錢又有閒的美國中上階級。換而言之,其他一般藍領勞工選民的民意就完全沒有被包括在這份《文學文摘》的調查結果裡面。第二,雖然訂這雜誌的人有不同的政治經濟背景,但兩大黨支持者回覆問卷的意願可能大不相同,進而導致特定傾向的支持者灌票來影響結果,所以收集資料的過程並不完整,其結果也容易因為特定群的的灌票行為導致偏差。

這兩個假設是真的嗎?政治學是一個實證科學,可以科學驗證。在1988年的美國民調學術期刊Public Opinion Quarterly,有人翻出了當初1936、1937年蓋洛普公司針對文學文摘讀者所做的的民意調查。在蓋洛普的問卷中,有問受訪者是否有訂閱文學文摘、是否有拿到文學文摘的選前問卷、是否有把問卷寄回去、以及在問卷裡面回答自己投誰等問題。

根據蓋洛普的資料分析,的確,文學文摘的訂閱者有車、有電話的比例都比該時的美國社會平居值來的高,而有這些財產的人,照道理來說也比較支持民主黨的羅斯福總統。但假如只根據背景來對調查結果作修正,文學文摘理當還是會預測羅斯福險勝才是。

而真正問題的關鍵,出現在問卷的回復率。共和黨蘭登支持者回覆問卷的比例,遠高於羅斯福的支持者。導致最後文學文摘收到的回函裡,多數都是支持蘭登的。

 

表三

圖片來源:academic.oup

 

所以我們可以說,文學文摘之所以在對一千萬人進行調查、得到兩百三十萬人回覆之後仍然預測失準,就是來自於蘭登支持者的熱情灌票、以及羅斯福支持者回覆率偏低所導致的偏差,進而在最後產生了跟現實來回差距將近40%的結果。從當代統計學來看,這個誤差,你甚至只要在全美隨機抽打100個人的電話所取得的結果,所造成的抽樣誤差都不太可能比這個大(假如隨機抽樣100位受訪者所得到的平均值,在95%信賴區間下的誤差值為正負10%左右,假如隨機抽樣1000位則是正負3%)。

這個著名的事件,也使得後來民意調查的清冊「代表性」、以及「隨機性」都成為金科玉律。假如你一開始打電話的清冊沒有代表到全體(母體)、假如你不是用隨機的方式來對電話清冊進行抽樣,再來打電話、而是用民眾主動投票、開放灌票的話,就算你調查到了兩百萬人,還是可能會與真實存在有40%的差距,遠不如你在家裡隨機打個一百個人的電話做調查來的準。

這個案例當然可以跟現在許多媒體或網紅的線上投票作為對照。這些媒體或網紅的線上投票,也大多都是針對自己的讀者,而也通常都是各陣營最熱情的支持者,並會透過動員的方式來灌票,猶如八十年前的文學文摘一般。因此,其誤差可能也會跟80年前文學文摘在總統大選的預測失誤一樣高。

最後,拉到現代來看,這也是為什麼現在各家民調公司都在研究家用電話跟手機民調的整合,畢竟現在不是每個人都有家用電話、也不是每個人都有手機。假如要追求代表性,讓隨機抽樣的結果接近真實的母體參數,那就要取得有代表性的清冊,如同之前菜市場政治學所介紹的這篇文章所說:如何估計手機族對民意調查的影響?解三元一次聯立方程式

所以簡單來說,各種網路調查,只要它的取樣方式並不是隨機的,那麼就是僅供參考就好,它跟現實的距離必定會是很遠的。或者我們可以說,網路上那種供所有人自由填答的調查,它的目的本來就跟隨機抽樣的民調不一樣,它並不是要拿來推測真實狀況的。


菜市場政治學 調查方法專題:

線上投票等於民調嗎?一個兩百萬人參與還預測大錯誤的故事
Tagged on:                             

Leave a Reply

Your email address will not be published. Required fields are marked *