◎陳方隅/東吳大學政治系助理教授

 

台灣的輿論市場上面,有許多人在討論寫論文的研究倫理、正確的引用方式與避免抄襲,最近則是全民都在google什麼是抽樣誤差,對於民意調查的進行方式非常有興趣,身為在大學教民調、統計、以及研究法方的老師,實在感到非常欣慰(?)

不過說真的,最近政治人物實在「發明」了太多的統計名詞,事實上民意調查是一件非常講究科學方法的研究方式,例如抽樣誤差的計算就是有正確答案的事情,而不是政治喊價。以下,就讓我們暫時政治歸政治,科學歸科學,我們來為大家整理一些基本的民調與統計的名詞解釋,還有本站以及友站的一些相關閱讀,我們也都放在後面。

 

 

一、全民調是一個好的初選方式嗎? 不是。

 

台灣用全民調進行初選、候選人之間以民調來決勝負,這是一個獨步全球的設計,應該沒有任何一個國家有類似的制度。這是因為,全民調比的是動員能力──要動員支持者顧電話,並不是比全民的支持度,而且民調有很多需要注意之處,不適合直接比數字。

 

民意調查是一種估計的方式,每一個環節的設定都有影響結果的可能,例如:樣本要多少,抽樣的時間,要不要戶中抽樣(電話接起來之後,再請接電話者去找到另外在家的人來聽,例如請該戶內的最年長男性、最年輕女性之類的設定),市話和手機的比例要怎麼設定,還有影響最大的:要怎麼「加權」(抽樣當中比較少人的群體意見,把它等比例加上去,例如某次抽樣當中,30歲以下年輕人的比例很低,那就讓每一個抽中的30歲以下年輕人,其意見的數目乘上一個數值,等比例放大)。

 

每一個設定,都會影響到最後結果,所以全民調的結果會依照規則的設定而有可能出現不同的結果。每一個設定,可能最後也都會影響到抽樣誤差該如何計算,像是有沒有加權過後去計算的抽樣誤差與原始樣本的抽樣誤差可能就會不一樣。說到底,民調本來就是一個預估值。真正的值,只有上帝知道,我們只能用盡量最科學的方法去預估。

 

那如果全民調不是好的初選方式,為什麼藍綠都很愛用?事實上,初選方式的規則設定,本來就一向都是政治的決定。制度決定行為,規則決定結果,這是必然的。每一個比賽、協商,最重要的第一件事情,永遠都是遊戲規則。所以,當一個黨內的大家都決定了用某一種方式來比賽,那麼,這種方式就會是(對大家而言)最好的方式。只要能讓大家同意的方式就是最好的方式。

 

 

二、藍白合的民調問題出在哪裡?到底什麼是抽樣誤差(margin of error)?

承上題,藍白合之間進定要用民調決勝負,決定到底誰當總統候選人,兩黨之間的爭議其實從來就不是民調內容的問題,而是規則設定的問題。

前幾天馬英九、柯文哲、朱立倫、侯友宜四個人,歷經密室會談後,簽了一個協議,那就註定了今天的結果。因為內容根本沒有設定好規則。雙方只有大致同意要採計民調,並由民調專家來判斷輸贏。 但是,雙方並沒有講說要採計「幾份」民調,哪種民調才納入(網路民調是否納入?只用市話的民調是否納入?),甚至沒有講說輸贏「多少」算是贏,只有講說在如果雙方在「誤差範圍」內則算侯友宜贏。

 

 

 

那現在重點來了,什麼叫做誤差範圍?關於誤差範圍,到底怎麼計算?

 

必須要強調一下,不管是抽樣誤差或者是估計區間,都有一定的公式(隨信心水準的設定和樣本數而有所變動),並不是像自詡理性科學的政客一樣,出來隨意喊價的。

要先知道的是,只要有抽樣都會有誤差。但這個誤差(error)其實並不是不好的,而只是一個區間估計值。統計的計算(中央極限定理+二項分布)讓我們得知,當我們抽 1068 個樣本的時候,95%的信心水準下,抽樣誤差大約是正負 3%。也就是說,如果我們做一個民調,發現政治人物某甲的支持率是 20%,意思是說實際可能落在 17% 到 23% 之間。如果另一個政治人物某甲的支持率是35%,那意思是說實際可能落在32%到38%之間。這個區間就叫做「信賴區間」(confidence interval)

 

事實上,以上是比較直觀的解釋,如果要精確一點來說,我們認為,這個信賴區間會有95%的可能性,會涵蓋真實的那個支持率。也就是說,對某甲來說,他的真實支持率有95%的可能性會落在17%到23%之間。並不是所有的統計都是用95%的信心水準,也有可能是99%,或者90%,但那就會影響到信賴區間的大小(例如,物理領域在檢定時要99.9999%)。

 

 

三、柯文哲與侯友宜之間,統計誤差要怎麼算?

 

柯侯白紙黑字簽的協議上規定:兩個人比民調,在統計誤差之間算侯贏,統計誤差之外,誰民調高就是誰贏。有些人說,如果我們用最簡單的方式來想這個區間,那柯至少要贏6%才能算是超過抽樣誤差,因為每一個人自己的預估值都是正負3%。所以我們也看到,協議簽了之後,柯文哲陣營反悔了,接下來集中在爭議說到底抽樣誤差是多少──柯認為 6% 不合理,應該是 3%,甚至,應該是 1.5%,因為他認為抽樣誤差應該是3%,所以要讓分只有在1.5%的範圍內可以讓。

 

不過其實在「對比式」的民調當中,不是這樣算誤差的,並不是一個估計值的抽樣誤差是3%另一個估計的抽樣誤差是3%,兩個估計值相比的抽樣誤差就是6%,而是另外有計算的公式。在民調當中,每一個候選人,本身支持度都是單一樣本,抽樣誤差是算自己的估計值,正負 3% 只適用在估計自己一個人的值(而且是要在樣本數1068,信心水準95%的方式才是3%,這個數值會因樣本數和信心水準而有改變)。

 

然而,當兩個估計值相比的時候,是要去計算「兩個估計值之間」有沒有顯著差異。統計術語來說:是看我們的資料能否拒絕「兩個估計值沒有顯著差異」的這個虛無假設。統計檢定要做的事情是,去檢驗我們抽出來的樣本分布,觀察兩個樣本之間的值,有沒有顯著差異,而並不是說誰一定贏過誰。也就是說,如果兩個人都在同一份民調上的話,抽樣誤差就必須是兩兩相比,不是自己的估計。

 

葉耀元老師(葉教授的國際事務學院),那邊有詳細的解釋

「(同一民調當中的兩兩相比時)這個時候要用的統計模型,其實是無母數分析中的麥內瑪檢定(McNemar’s test),也就是去檢查在同一個樣本中,兩個不同測驗的分配模式是否相同。」

其實中間過程可以先跳過沒關係,葉教授算好了給大家:

在信心水準達 95% 的的狀況,「柯侯配」至少要贏「侯柯配」 5%──例如,37% 柯侯配支持率對比 32% 侯柯配支持率,這樣就會統計顯著。

 

 

林澤民老師也有詳細的說明:

「什麼條件下,對比式民調兩候選人支持度差異p1-p2的抽樣誤差會接近一般所謂抽樣誤差的兩倍?這只有在p1+p2=1,且p1、p2相差不大的時候。

又在什麼條件下,對比式民調兩候選人支持度差異p1-p2的抽樣誤差會接近6%?這只有在樣本數N≈1068,p1+p2=1,且p1、p2相差不大的時候。」

 

那對比式的民調,抽樣誤差怎麼計算呢?林澤民老師寫好了公式給大家,請參考該文

 

再強調一次,不管是抽樣誤差或者是估計區間,都是由一定的公式計算出來的,並會隨信心水準的設定,和樣本數而有所變動,並不是像自詡理性科學的政客一樣出來喊價的。

 

 

結論

不管是台灣還是國外,在大學部的統計課程往往都會被學生嫌,覺得社會科學相關科系為什麼一定要學統計。不過現在大家可能都可以體會到,統計的應用非常廣泛。

統計其實不是數學,很多時候是在學習處理資料和處理數字的方式,這比較關乎「邏輯」。不過,當科學碰上政治的時候,可能政治考量才是首要。比較麻煩的是有些不讀書的政客整天發明新的「偽科學」觀念誤導大眾,這就會有點麻煩了。

 

而統計與民調之外的事情,關於「憲政體制」的討論,最近也有很多莫名其妙的偽科學說法,又或是各種關於「聯合政府」的奇怪想像(例:副總統「監督」總統,行政權內部可切割出來「監督」,或者是改成內閣制為了「制衡」總統這些說法),那更是需要好好地來討論。

套用我們政治學「祖師爺」亞里斯多德的說法,政治學是一個「首要學科」(master science),因為它決定了我們人類生活的各種重大問題,以及決定我們整個共同體命運。那麼,關於政治學的一些基本知識,我們當然必須要有正確的認識!

 

:在「菜市場政治學」上的相關文章,以及我們看到很值得大家參考的文章,通通放在下方的參考閱讀。

 


※參考閱讀

林伯佐:信賴區間與信心水準的解讀  https://reurl.cc/p509yQ

陳光輝:關於「推論統計」與「無罪推論」:法院判決的類比  https://reurl.cc/My56kp

林澤民:對比式選舉民調的錯誤解讀 https://reurl.cc/m05RG9

林澤民:對比式民調抽樣誤差的計算公式 https://reurl.cc/My552p

廖育嶒:反映真實民意:網路、市話與手機民調的差異 https://reurl.cc/V4O05y

政大選研:誤差值的意義 https://reurl.cc/GKy5rG

「全民調」初選限制多,為何藍綠仍情有獨鍾? https://reurl.cc/QZA53O

葉耀元:解讀抽樣誤差 https://reurl.cc/RyGL1g

 

關於民調、抽樣、誤差範圍的一些基本認識
Tagged on:                 

One thought on “關於民調、抽樣、誤差範圍的一些基本認識

  • November 25, 2023 at 12:16 pm
    Permalink

    这不是简单的对比式民调。而是比较两个单一民调。所以你说的其实根本就无法应用。比如你说的“如果兩個人都在同一份民調上的話,抽樣誤差就必須是兩兩相比,不是自己的估計”。根本跟这次的问题都没有关系,引用的分析又怎么能正确呢?“柯侯” 和 “侯柯”这是两个人,柯和侯不是两个人。而这两组人并不在同一份民调中。这就是问题的所在。
    统计的实验设计都没搞清楚就开始进行推导和分析,本末倒置怎么能不错呢?

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *