AI和真人的一對一辯論賽
19號晚上,在美國舊金山IBM公司的會議室舞台上,展開了一場IBM最新研發出來的AI辯論機器人Project Debater和真人一對一的辯論賽。雙方在比賽開始之前都不知道題目,在辯論期間雙邊也不得使用網路。
整場比賽共兩回合,每一回合正、反雙方必須先準備 4分鐘申論,接著是 4分鐘質詢和 2分鐘結辯。
兩個題目 真人組各派一名選手出場
第一回合的辯論主題為「我們該補助太空旅行」,由歐瓦迪雅(Noa Ovadia)對上Project Debater,歐瓦迪雅是 2016年以色列全國辯論賽冠軍。
第二回合的主題是「我們該更常使用遠距醫療」,由辯論專家札菲爾(Dan Zafrir)力抗Project Debater。
這支影片為第一回合Project Debater(左)對上歐瓦迪雅(右)的辯論賽。從影片中可以看到歐瓦迪雅在質詢的時候很認真地聽著Project Debater的論點邊作筆記。
結果由現場來賓票選
辯論結束後,由現場來賓投票決定究竟是AI還是由真人勝出。
現場來賓認為,雖然Project Debater的表現並非完美無缺,歐瓦迪雅和札菲爾說起話來絕對比Project Debater流暢,但Project Debater的論點最實際,而判IBM的AI辯論機器人獲勝。
辯論賽中 數據和例證不是一切
面對這場辯論賽的結果,IBM表示這就是他們所追求的目標:AI比人類能更快做出決策,還能提供更多的數據。
而歐瓦迪雅則認為,在辯論過程中例證和數據固然重要,「但當我們正在辯論的時候,這不是一切」、「我認為最終當它(指AI)能做的比我們更好的時候,這對於人類來說是一件好事──能使我們做出資訊充足的決定、投票或任何事」。
Project Debater是怎麼辦到的?
為求比賽公平,Project Debater和歐瓦迪雅、札菲爾在事前都不知道比賽題目,Project Debater也沒有接上網路。那Project Debater是怎麼找到資料的呢?
IBM研發團隊在事前便在Project Debater的資料庫當中存入約 100條左右常見的辯論賽主題,內容集結了「數以億計」的報章雜誌和學術期刊內容。
所以,Project Debater在辯論賽期間只需要找出它所需要的資料,把各個內容剪輯成一篇流暢的散文並「說」出來即可。
語言還是一大挑戰
但難就難在Project Debater該如何把不同的文章整合成一篇內容架構完整的短文,這也是這次比賽最多現場來賓感受到的──Project Debater雖然「說起話」來很有自信,在發音上也很自然,但在語言的使用上不夠精確,核心的論點也不夠明確。
「這很簡單,我不反對」
舉例來說,當歐瓦迪雅說她認為錢應該花在比太空旅行更迫切的需求上時,Project Debater說:「說要把錢花在更重要的事情上,這很簡單,我不反對。沒有人說這(指太空旅行)是唯一一個列在購物清單上的項目,但那不是重點。」
「由於贊助太空旅行很顯然地能讓社會受益,我認為這是政府應該推行的事。」
不僅如此,在太空旅行的辯論上,Project Debater不斷重申太空旅行有利於經濟,但每一次的內容只是稍微抽換一下幾個字詞。
句子間不夠連貫 還會穿插小趣聞
有的時候Project Debater也會出現文法上的問題,第二字句和前面的子句之間沒有連貫。有的時候,Project Debater會穿插一些聽起來像是隨機出現的趣聞或引用某個人說過的話。
其中一次是當Project Debater提到太空人凱利(Scott Kelly)時,在句子中間突然冒出和前後文不搭的單字「voiceover」(旁白),讓人一聽就知道這段內容一定是從某個影片當中擷取出來的。
這不是第一次AI和真人對抗
這當然不是第一次AI在正式活動上和真人對決,2011年IBM的超級電腦Watson在美國遊戲節目《危險邊緣》(Jeopardy)上獲勝,超級電腦深藍(Deep Blue)擊敗西洋棋世界冠軍卡斯帕洛夫(Garry Kasparov),還有Google人工智慧程式AlphaGo戰勝南韓圍棋大師李世乭等。
辯論賽比棋賽更難
但比起棋賽,使用語言來進行辯論對於AI來說是更困難的遊戲。
鄧迪大學電腦科學與哲學教授里德(Chris Reed)看完整場Project Debater辯論賽後說道:「西洋棋的規則很少,棋盤很小、棋子數也少,即便是棋盤大上許多的圍棋,我們討論的都還是一個有明確邊界和空間的事物。」
AI不會是決策者 但有利於討論
如同IBM在辯論賽結束後所說的,在未來只要AI能提供更有說服力的論點,就能作為輔助人類進行決策的工具。
《衛報》舉了企業裡董事會進行決策的例子,在討論過程中各方論點彼此矛盾、衝突,但AI能不帶任何情感地傾聽對話過程,在評估完所有證據和論點之後挑戰各方的推理。
但整個過程當中AI都不會是決策者的角色,AI只能做為現場的一位發言者,有利於討論的進行。
像是噱頭 也證明目前AI的極限
里德認為,這樣的系統在未來可以應用於反恐情報分析,也可能提升在做出決策前能以事實證據作為判斷的基礎。
里德也說道,雖然這次的辯論賽看起來像是IBM的噱頭,但這場辯論賽同時也證明了AI的極限。他說:「這讓大眾知道現在AI的極限,這意味著人們可以稍微緩和一下對於即將來臨的機器人末日(robot apocalypse)的恐慌。」