謝達文/輸了選舉,贏了民調又如何?為什麼民調領先不代表勝利 | 特約作者 | 鳴人堂
親愛的網友:
為確保您享有最佳的瀏覽體驗,建議您提升您的 IE 瀏覽器至最新版本,感謝您的配合。

謝達文/輸了選舉,贏了民調又如何?為什麼民調領先不代表勝利

台灣民意基金會定期舉行民調記者會,民進黨大老林濁水(左)、台灣民意基金會董事長游盈隆(中)、台大副教授丁庭宇(右)公開討論與分析。 圖/聯合報系資料照
台灣民意基金會定期舉行民調記者會,民進黨大老林濁水(左)、台灣民意基金會董事長游盈隆(中)、台大副教授丁庭宇(右)公開討論與分析。 圖/聯合報系資料照

(※ 文:謝達文,台大社會所博士候選人)

每次選舉,從初選到選前,民調都會成為重要的話題。但民調雖然「經常」能告訴我們誰的勝算較大,但民調領先的候選人,卻不「總是」勝選的那方。

為什麼會這樣呢?民調是一門科學,而科學意味著「我們嘗試運用目前最好的方法,而且不斷想要越做越好,但總是有可能有錯」。

誤讀:其實本來就不該說他領先

不過有的時候,出問題不是民調本身,而是大家的誤讀——一個最需要強調的重點是,民調這種事,贏2%不能叫做贏,當今天A候選人的民調數字,多出B候選人2%,比較好的報導和解讀方式,其實不是「A候選人微幅領先」,而是「民調不足以告訴我們目前誰領先」。舉例而言,像這次選情相對膠著的新竹市,領先群的兩位候選人,就經常在這個「不相上下」的範圍之內。

同理,如果我們看到A候選人帳面上的數字,今天比上週多2%,也不應該說「A候選人的民調微幅提升」,而是「民調不足以告訴我們A候選人的民調確實有變化」。

為什麼這樣呢?選舉不是贏1%也算贏嗎,為什麼民調不是一樣的道理呢?

這涉及到統計學基本的推論邏輯:由於我們不是真的叫所有人出來投票,所以我們是透過「抽樣」來推知全體的狀況(一般而言,會隨機抽出約兩千人上下)。不過,因為這終究是抽樣,所以我們永遠不能真的確定全國(或全縣市)的「真實」狀況是什麼——誰知道我們會不會就這麼剛好,隨機抽樣下,剛好就是比較多藍營或綠營的支持者接到電話?

因此,我們會用一個比較迂迴的邏輯,來思考統計證據。這個邏輯,我通常稱之為「哪有這麼衰?」的邏輯——「好,我們今天抽樣的結果,看到兩個候選人差5%。那麼假設現實上兩個候選人的支持度其實一樣,但隨機抽樣下來,兩個候選人的支持率,居然差到那麼多,我們運氣有這麼差嗎?」

圖為台灣民意基金會董事長游盈隆。 圖/聯合報系資料照
圖為台灣民意基金會董事長游盈隆。 圖/聯合報系資料照

這就好像,如果我們手上有一包巧克力糖,裡面有藍色有綠色,我們想知道是不是有哪個顏色的糖比較多,所以把整包揉勻之後,隨機抓了20顆出來。即使不談背後的數學,用常識就可以推知:如果整包裡面藍色糖跟綠色糖一樣多,今天我們抓20顆糖出來,還滿有可能當中有11顆藍的、9顆綠的(運氣不用真的很差,就可能有這樣的狀況),但不太可能抽到18顆藍的、2顆綠的(確實還是有可能,只是如果這樣,運氣要真的很差)。

所以,在機會很小的狀況下真的抽到18顆藍的、2顆綠的,我們就比較有「信心」說,這包巧克力糖應該是真的藍大於綠;但是,11顆藍的、9顆綠的,我們就會認為,證據不足以讓我們有這樣的信心。

統計學家發展出了一個辦法,可以來計算「衰」的程度,知道在「抽出來差多少」的狀況下,我們可以比較有信心說真的有差。

如果不是民調專業的讀者,未必需要知道背後的統計學原理,只要知道,民調上「小幅」的差異和變動,是不應該過度解讀的;至於多小叫做「小幅」?一般民調在公布時,會加註「在95%的信心水準下,誤差範圍為正負2.5%」,指的就是這樣「不應過度解讀」的範圍大小。

圖/聯合報系資料照
圖/聯合報系資料照

加權:把樣本變成選民的形狀

但有的時候,問題不是讀者、記者(甚至民調發布者)的「解讀」錯誤,而是民調在「加工」的過程中出了問題。

民調的「加工程序」是民調科學的重要一環,很多人不知道的事情是,民調不是打完電話、做完紀錄之後,就可以直接把數字送出去了,這個數字還需要經過「加工」才能用。

為什麼要做「加工」?這是因為「接到民調電話」的人,組成未必跟「全體選民」一樣,可能男性比女性多了一點,老人比年輕人多了一點。

有時我們會在民調的新聞後面看到,這份民調有「依內政部人口統計資料,進行性別、年齡加權」之類的文字,這就是指民調機構有嘗試「加工」他們收到的原始數據,讓數字長得更像全體選民的樣子。

簡化一點說,假設收到的原始數據男性比女性多了一點,民調機構就會「放大」每位女性受訪者的聲音,比如一個人當1.1個人來算,以符合全體人口的比率。

此外,在這個技術性的層次上,不同家民調機構也可能有不同做法:教育程度要加權嗎?地區呢?甚至,加權時實際使用的「數學工具」,市面上也有各種做法——這也是各家民調為何有時會不一樣的原因之一。

圖為國民黨造勢大會。 圖/聯合報系資料照
圖為國民黨造勢大會。 圖/聯合報系資料照

此外,就算不管這些技術性的問題,把樣本變成選民的形狀,問題是不是就都解決了呢?許多民調公司,都是公布「把樣本變成全體選民的樣子」之後的數據,但我們甚至可以說:很可惜的,這個數據幾乎確定不會跟最終的得票數據相同。

為什麼呢?因為「全體選民」的形狀,不等於「投票當天會去投票的選民」的形狀。即使兩個候選人的支持率,在依照「全體選民」組成調整後之後,都是40%左右,但一個候選人的票可能比較「死忠」,出來投票的比率比較高,另一個候選人的支持者有些則不那麼熱中,有比較多人覺得「不投票也可以」比較多。嚴格說來,民調機構做的事情完全沒錯,此時此刻,全體選民中A、B支持率真的各有40%,但是因為兩群候選人支持者的投票率高低不同,導致選舉的結果可能距離40% vs. 40%很遠。

有些民調機構會做進一步嘗試,不但把樣本變成全體選民的形狀,還又進一步按照「預估的投票意願」去調整,希望能變成「會投票的選民的形狀」。這在英美等許多國家,已經是民調機構的常態,台灣也有些民調機構嘗試這麼做。

要怎麼執行呢?這是每家民調機構的產業機密,但整體而言,有兩個可以參考的數值,一個是「選民自己說的投票意願」,另一個是「按照過去的經驗,這群人的投票率有多高」(這可能是看人口特質,如性別、教育程度、種族,也有些機構會額外參考「過去是否投票」和「對其他議題的態度」)。每家民調數據之所以不同,有一部分也是因為這裡的計算不一樣:有些機構更相信選民自己說的意願,有些機構更相信歷史上的投票紀錄——《紐約時報》做過一個實驗,把同一筆原始資料給四家聲譽卓著的民調機構做「加工」,就因為加權的方式不同,而導致回報的結果很不一樣。

而且,這個加工說起來很理想,但很容易失敗:選民自己回報的投票率經常不準,以2020年總統大選為例,實際投票率是75%,但根據其中一家選前民調,回答自己「一定會」去投票的人已經有72.6%,加上說自己「可能會」的19.6%,顯示有許多說自己可能會去投票的人,最終沒有去投;2021年的四大公投差異更大,另一家選前民調中,有其中49%說自己「一定會」去投票(另有17%說可能會),但最終投票率只有41%。

可是,難道用歷史紀錄一定會比較準確嗎?如果投票率的趨勢大致沒有變動就會準確,但如果「過去比較少投票的人,這次也出來投票了」,這樣的結果就會失準。比如英國脫歐公投,就是脫歐方成功鼓勵許多過去不投票的人出來投票;而在歐美的一些選舉中,民調之所以失準,有些評論者也認為這是原因之一,以歷史資料評估,沒有預料到該次選舉的特殊性,因此高估或低估了一群人的投票率(參考BBC、《倫敦旗幟晚報》的分析),甚至可能反而越調越差

圖為新北市長候選人林佳龍在樹林育林國小舉辦「新北大翻新」造勢晚會。 圖/聯合報系資料照
圖為新北市長候選人林佳龍在樹林育林國小舉辦「新北大翻新」造勢晚會。 圖/聯合報系資料照

原始資料:這小群人可以代表一大群人嗎?

當然,如果原始的食材不好,再怎麼加工也沒有用。而有的時候,民調的問題就出在原始資料上。

這首先就牽涉到所謂「抽樣框架」的問題,用白話文來說,就是「全台灣的選民,你都有機會抽到嗎?抽到的機會都一樣嗎?」這題答案通常都是否定的。以台灣最流行的市話民調來說,平常不會接市話的人(如在外地的學生,只使用手機沒有市話的租屋族),就沒有機會被抽中(或者除非剛好回老家才會被抽中),所以每個人被抽到的機率是不一樣的。

換言之,這不是「回應率」高低的問題:回應率可以很高,但是如果不回應的那群人「有一定的特色」、「跟回答的人長得不一樣」,那麼,我們用有回應的人去「推估」全體狀況會出問題時,民調就會失準。至於有多嚴重?就要看「我們問到的人」跟「我們沒問到的人」差異有多遠。

前面提到我們會用加權的方式「加工」原始數據,但這只能解決部分的問題:舉例來說,如果特別加權「年輕人」,我們等於拿「有被問到的年輕人」去代表全體年輕人的聲音;但接到市話的年輕人,或許比較可能是「住在原生家庭的年輕人」,他們跟在外地念書、工作的年輕人,是同一批人嗎?跟雖然待在戶籍縣市,但租屋處沒有市話的人,也是同一批人嗎?他們投票的意向會不會有差別?如果有,這就不是加權能夠解決的問題了。

圖/聯合報系資料照
圖/聯合報系資料照

對此,有些學者建議,應該採用「多底本」的作法,融合多種方式接觸受訪者,包含台灣就有學者建議同步採用市話與手機

而跟「市話 vs. 手機」的道理相仿,另一個相關、而且或許更根本的問題是:「會回答民調」的人,和「不想回答民調」的人,意向會不會有差異?會不會有一方的支持者,特別不愛回答民調?

這又可以區分為兩個狀況,一個是政治人物或民調機構的影響,比如川普對媒體的攻擊,或者之前韓國瑜的「蓋牌」,都可能使得他們的支持者比較不願意回答民調電話,甚至亂回答,這些都會使民調失準。相似地,至於民調機構的影響,就是著名的「機構效應」:有時候不是民調單位自己真的偏頗,但是由於「有一群選民認為這個機構偏頗」,所以遇到這個機構,就比較不願意回答他們真實的想法,可能會拒訪,或甚至會胡亂回答,這也會造成民調的「原始材料失準」。

但同時,有一些態度或價值,也可能影響人們是否回答民調,比如有些人可能「比較不信任陌生人」,所以比較不願意回答民調,而在一場選舉中,「比較不信任陌生人」的人們,如果比較可能支持某個候選人,也都會導致民調失準。

回到文章最開始的問題:為什麼民調領先的候選人,未必是最終勝選的一方?這可能是因為民調很接近,從統計的觀點來說,他其實不算真的有領先;可能是因為民調數字沒有辦法百分之百反映出「選民的形狀」、特別是「會去投票的選民的形狀」(這在不同候選人的支持者投票率不同時,特別容易發生);最後,也可能是因為「有候選人的支持者」比較不容易被抽到,或者是比較不愛回答民調,也會導致民調失準。民調是一門科學,而科學總是有誤差的可能,而這只能靠著一次一次的嘗試逐步改進。

圖為國民黨基隆市長候選人謝國樑(左二起)、桃園市長候選人張善政、主席朱立倫、新北市長候選人侯友宜、台北市長候選人蔣萬安在11月20日造勢晚會大合體,向選民們請託。 圖/聯合報系資料照
圖為國民黨基隆市長候選人謝國樑(左二起)、桃園市長候選人張善政、主席朱立倫、新北市長候選人侯友宜、台北市長候選人蔣萬安在11月20日造勢晚會大合體,向選民們請託。 圖/聯合報系資料照

留言區
TOP