AI現在辯論都贏你,這是好事還壞事?
本週一,舊金山的IBM辦公室辦了兩場辯論比賽,分別由以色列辯士奧瓦迪亞(Noa Ovadia)和札夫瑞爾(Dan Zafrir)對戰IBM開發的辯論程式Project Debater。Project Debater的巨大本體位於機房,以網路連線到它在辯論場上的發言器,發言器是直立的黑色長方體,會讓夠宅的人想到《福音戰士》。
兩場比賽的題目都很嚴肅:「國家應該補助太空探索嗎?」和「我們應該多用遠距醫療嗎?」Project Debater和它的人類對手分別提供四分鐘申論、四分鐘反駁和兩分鐘結辯。比賽結束後,現場觀眾針對不同項目投票。投票結果顯示:Project Debater在表達上比人差,在資訊整合上比人好,在綜合說服力上贏過札夫瑞爾。
IBM致力於證明AI能勝過人,因為這是宣傳企業科技實力的好方法。一直到現在,許多人都還記得IBM在1997年用來打敗世界棋王卡斯帕洛夫(Garry Kasparov)的深藍(Deep Blue),以及在2011年贏得英國機智問答大賽冠軍的華生(Watson)。
考慮到辯論比賽相對之下的主觀判準,以及參與投票者當中有一些IBM員工,Project Debater的勝利可能沒有像當年前輩打贏世界棋王那麼風光。然而,辯論帶來的宣傳效果,比起西洋棋,恐怕更有質的躍進:對棋譜的熟悉難以直接運用到西洋棋之外的地方,但語音辯論需要的自然語言組織能力和資料檢索能力,則完全不同。比起只能以短句子應對的華生,Project Debater是認真向自然語言挑戰。
人與AI的差異
投票者認為Project Debater的表達力不如人,從比賽過程可以看出來,Project Debater的句子並不非常自然,有時候會重複使用無須堆砌的近義詞。
這裡可以看出AI和人的巨大不同。我想,如果是英文母語使用者,恐怕連國中生都可以輕易認出Project Debater話語的不順暢之處。但要獨立整理出Project Debater比賽時引用的資料,就算對熟悉議題的人來說,恐怕也不是一時半刻能搞定的。
你不需要是AI專家,也可以知道目前的AI擅長的東西,跟人往往相反。AI可以一秒比對超多資料,但是連控制機器雙腳自然走路都很難。卡斯帕洛夫2017年出版《深度思考》一書,回顧他和深藍的對弈,指出AI對手跟人類對手有不同「思考」模式,人類看來愚蠢無比的棋步,有時用在AI身上反而有奇效。我們不了解Project Debater的運算模式,不過如果它的強項是檢索和整合資料,而不是處理自然語言和區分語意,那麼在辯論當中層層堆疊抽象概念或許也會有奇效,至少在評審開始討厭你之前。
人類辯士難以取代,因為……
目前我們面子還掛得住,因為在Project Debater的辯論場上,人展現的強項跟AI不一樣。不過假設幾十年後,人類辯士能做到的AI也都能做到,我相信人類辯論比賽也不會因此失去價值。對人來說,有些事情由人達成,跟由機器達成,代表的意義差很多。手工皮鞋跟機器做的皮鞋不一樣,而若用比投手快上一倍的發球機取代投手,則是作弊。
在《訂製完美》裡,哈佛大學哲學家桑德爾(Michael Sandel)討論我們可以允許運動員進行哪些科技強化:如果覺得禁藥不行,那注射能增加肌耐力的「紅血球生成素」呢?如果覺得人工注射算是犯規,那NIKE鉅額建設的「高地屋」呢?高地屋可以降低氣壓和氧濃度,模擬高海拔環境,讓運動員更有效率增加紅血球數量。
實際上,奧委會禁止注射紅血球生成素,而其轄下的世界運動禁藥管制組織,則認為人工的缺氧訓練環境「違反運動精神」,不過這並不妨礙我們思考這些做法背後的理由。桑德爾認為,人可以接受哪些強化,端賴我們如何理解運動和競技的意義。如果認為比賽比的不是資金,甚至應該降低貧富差距造成的影響,你可能會支持禁用高地屋訓練法;如果認為美式足球的價值在於展現技巧,而不是靠體重碾壓,你可能會反對美國國家足球聯盟球員們過去三十年的「體重軍備競賽」。
只要我們依然欣賞人類藉由辯論展現的機智才巧,AI就不會取代人類辯論比賽。不過可以確定的是,科技會影響人類辯士的表現和比賽策略。網路普及之後,人類辯士會預期雙方都有更完整的數據。在能組織資料和論點的AI普及之後,人類辯士應該會預期雙方都對可能出現的論證加倍熟悉。
AI如何讓我們想得更好?
IBM的研究總監克里希納(Arvind Krishna)認為,Project Debater呈現的技術能幫助人類建構有說服力的論證、在資訊充分的情況下做決定。我認為這些技術也能協助人思考。
科學家斯洛曼和芬恩巴赫在《知識的假象》裡提到的一些心理學實驗指出,若發現自己的立場其實是建立在自己不怎麼了解的因果前提上,人會對不同立場更開放。我想像,有資料搜尋功能強大的AI在一旁戳戳點點,或許我們在將來能更謹慎選擇合理的立場。
或者想像,如果社群網站的「駐站AI」能認出筆戰,並提醒你你目前正在輸入的回應預設了經驗上錯誤的前提,或者你的反駁跟對方在邏輯上其實沒有衝突,我們應該可以節省很多時間。
我是說,如果我們有雅量被機器人糾正的話。
*感謝PTK、Hsu-Cheng Tsai和Poyu Chen閱讀初稿並提供資訊建議。