◎曾子軒/台大新聞所碩士、R語言愛好者
從李登輝、陳水扁,再到馬英九和蔡英文,每任總統除了就職上任演說以外,每年還會在國慶日發表演說,今年(2023)恰逢蔡英文最後一次國慶演說,非常適合比較幾位總統的演說內容。
總統國慶演說重點歸納
利用 term frequency、tf-idf、word co-occurence 等簡單的指標 (請見附錄說明),回顧1997年至2023年(維基文庫收錄範圍)四位民選總統的演說,從中能夠發現幾個重點:
(一)總統們最常使用的詞彙中,相似比分歧的多;特色詞彙則反映出各自任內課題
(二)馬英九演說中,更強調兩岸關係,並提到貿易協議與經濟,蔡英文則多次提及區域穩定的挑戰,並重申民主與自由
(三)陳水扁在2007年卸任前提到近百次「台灣」,為歷年最多;「中華民國」則以馬英九在2011年(民國百年)提到近40次最多。中國(大陸)也是歷任總統都會提到的重點。
(四)蔡英文相較馬英九在「台灣」和「中華民國」的使用的確有消長
總統最常講哪些詞?
總統們最常使用的詞彙中,相似比分歧的多。查看熱門詞彙,最常見的有演講時能夠喚起群眾的「我們」、塑造共同體的「國家」,還有價值類型的「民主」、「自由」。
圖一、歷任總統國慶演說使用的熱門詞彙
至於特色詞彙,則反映出各自總統任內的課題。陳水扁談到政黨輪替、談到韓國作為競爭者,也提到加入聯合國的企盼,馬英九提到大陸與九二共識,以及貿易協議與架構,蔡英文任內則面臨疫情,同時不得不提到外部加劇的威脅。
圖二、歷任總統國慶演說使用的重要詞彙
對比蔡英文與馬英九,兩人演說有何差異?
在馬英九任內的演說中,明顯更強調維繫兩岸關係,同時驅動經濟增長。另外,馬英九外交上強調活路外交,積極參與國際組織、簽訂貿易協議、提升免簽國數量等。
圖三、馬英九國慶演說的詞彙網絡
對比之下,因為兩岸政策不同、面臨的威脅更大,蔡英文多次提及區域穩定面臨挑戰,且談到國防上要提升自主防衛能力、強化國軍戰力,同時她也重申,會帶領台灣捍衛民主與自由。經濟方面,也談到全球供應鏈重整、產業因應做出轉型的議題。
圖四、蔡英文國慶演說的詞彙網絡
除了各自談論的重點外,直接對比蔡英文與馬英九談論的高頻詞彙,也是看點。蔡英文相較馬英九,在「台灣」和「中國民國」的使用的確有消長,提到更多次台灣(超過50次)、提到更少次中華民國(少去50次)。
圖五、蔡英文與馬英九國慶演說使用的熱門詞彙頻率差異
另外,也能看出蔡英文提到很多次「區域」、「穩定」與「挑戰」,馬英九則是講述更多「經濟」、「協議」與「兩岸」,明確反映出兩者各自重視的基調:馬英九政府透過與中國(大陸)保持連結,以交流締造和平、再藉此提升經濟表現。
對比蔡英文,無論是出於單邊或者雙邊的因素,蔡政府跟中國的關係較差,因此對區域穩定帶來挑戰,她的相應之道是引進更多夥伴、強化共享民主價值者的關係。
中華民國有變不見嗎?台灣有借殼上市嗎?
爬梳「中華民國」與「台灣」相關詞彙出現的次數,可以發現,馬英九確實在演說中著墨最多,他在2011年(民國百年)提到近40次「中華民國」。
相比之下,蔡英文在任內提到台灣的次數很穩定地多。不過,提到最多次台灣的其實是陳水扁,他在2007年卸任前提到近百次「台灣」,為歷年最多。
圖六、歷年總統國慶演說台灣和中華民國出現次數
不過,無論是哪任總統,兩岸關係始終都是焦點,因此頻繁提到「中國」、「大陸」、「兩岸」等詞彙。至於「美國」出現的次數,就相對較低。
圖七、歷年總統國慶演說中國和美國出現次數
因為也跑了陳水扁任內的詞彙網絡,因此一併附上。從中可以看出,以台灣之名「入聯」是其中一個演說重點,其他還有從威權體制轉型、做到政黨輪替,以及與韓國競爭等。
圖八、陳水扁國慶演說的詞彙網絡
總結:台灣人面臨艱難的選擇
對比馬英九和蔡英文,兩人任內的經濟局勢差異很大,前者面臨金融風暴,後者則遇上疫情;兩岸局勢亦然,前者更傾向談判與開放,後者則以相對強硬的態度面對北京。
卜睿哲(Richard C. Bush III,曾任AIT主席)在《艱難的抉擇》書中末章,向台灣人與台灣當權者提問:「台灣做得到國家安全、人民有錢嗎?」這個提問,同時也是韓國瑜參選時高喊的口號,然而,想要同時做到兩者,並非易事。
當對岸步步進逼,馬英九選擇深化交流,且不明白拒絕走向終極統一,藉此安撫北京、得到安全,他領導的8年因而享受到經濟果實,這是馬英九走向有錢的方式。不過,馬英九任內也遇到反撲,民眾擔心台灣無法保有既有生活方式因而上街反抗。
蔡英文則選擇對抗路線,因為她不認為兩岸繼續走近,能夠讓國家安全,選擇更與其他廣義盟友走近,包含美國與日本,也因此觸怒北京。至於經濟,(與大環境也有關)蔡英文任內台灣搭上AI大浪,經濟成長率高過前任,但同時也有貧富差距持續擴大的挑戰。
評論卜睿哲著作時,朱敬一有兩則提醒很值得一讀
第一,朱敬一說,「當台灣人民說『我是台灣人但不是中國人』的時候,他們口中『不是』所想要否定、拒絕的,大概是些什麼呢?」他自問自答,給出的答案是「我相信台灣人民所否定的『中國』,不是要在語言、文化、血源等『民族』面向做一刀兩斷的切割,而是要在生活方式、自由思想等『民主』面向,做清楚的抉擇。台灣人民拒絕『不民主』。」
第二,「卜睿哲與經濟學人雜誌,都指出台灣民主的可貴。但是這兩則文件都沒有將民主自由鏈接到價值捍衛。」朱敬一接著說,「『有錢』+『安全」,絕對是全球所有國家人民的期待,但是除此之外,台灣人民還有一種期待,可能是美國人、歐洲人比較難以想像的,就是『尊嚴』。」
在安全與有錢之間,台灣應該怎麼做?兩者是零和嗎?與對岸和平共處有可能嗎?又有可能和平共處而不被併吞嗎?若選擇對抗會有活路嗎?這確實是台灣人艱難的選擇。卜睿哲與朱敬一的想法與提問,同樣值得深思。
※附錄
附錄一:研究方法
研究方法部分,本文資料搜集、分析、視覺化都利用R語言完成。先爬下維基文庫後清整文章,接著以中研院CKIP斷詞系統與自定義辭典輔助斷詞、貼上詞性,再依序計算熱門詞彙、特色詞彙;還有計算詞彙共現的相關係數、並繪製詞彙網絡;自選議題包含中華民國與台灣、中國與美國等部分,則是利用正規表達式結合字串偵測計算。
附錄二:指標解釋
word frequency:詞彙頻率,指詞彙在文件中出現的次數。若以年份為單位看,代表該年份國慶演說中,總統使用特定詞彙的總次數;若以總統為單位看,代表該為總統在任內所有國慶演說中,使用特定詞彙的總次數。
tf-idf:全名為Term Frequency – Inverse Document Frequency,同時考慮詞彙頻率與文件中出現頻率的指標。有許多詞彙出現頻率很高,同時在所有文件中出現頻率也很高,例如「我們」、「國家」、「社會」等詞,在歷年演說中都頻繁出現。然而,這種詞彙每一年都會出現,反而讓我們無法看出特定年份演說中各自具備的獨特性。因此,我們也將文件中詞彙出現的次數納入考慮,取其倒數後乘上詞彙頻率,如此便可看出特色詞。舉例來說,只有陳水扁提到「聯合國」,其他三位總統都沒有使用這個詞彙,則這個詞的文件出現頻率很低、倒數很高,就可以加大其影響力。
word co-occurence:指詞彙共同出現的次數,它同樣用來克服上面常見詞彙淹沒特色詞彙的問題。在此利用的指標是詞對相關性(pariwise correlation),也就是考慮「詞彙要不一起出現、要不就都不出現」,藉此找出特色詞彙。
附錄三:歷屆總統演說關鍵字
最後,附上歷年的國慶演說高頻率詞彙,以及特色詞彙。
圖九、歷年總統國慶演說特色詞彙
圖十、歷年總統國慶演說特色詞彙