當AI遇上真人,猜猜是誰最會辯?

by:時時
7366

近日,IBM公司研發出一款專門打辯論賽的人工智慧(AI)機器人。究竟AI機器人對上真人的辯論賽,哪一邊能獲勝呢?

post title

圖為第二回合Project Debater(左)對上札菲爾(右)的辯論賽。Project Debater在外型上是一個深黑色的箱子,隨著它「說話」的時候,面板上的藍色圓圈會跟著聲音起落。

Photo: IBM Research

AI和真人的一對一辯論賽

19號晚上,在美國舊金山IBM公司的會議室舞台上,展開了一場IBM最新研發出來的AI辯論機器人Project Debater和真人一對一的辯論賽。雙方在比賽開始之前都不知道題目,在辯論期間雙邊也不得使用網路。

整場比賽共兩回合,每一回合正、反雙方必須先準備 4分鐘申論,接著是 4分鐘質詢和 2分鐘結辯。

兩個題目  真人組各派一名選手出場

第一回合的辯論主題為「我們該補助太空旅行」,由歐瓦迪雅(Noa Ovadia)對上Project Debater,歐瓦迪雅是 2016年以色列全國辯論賽冠軍。

第二回合的主題是「我們該更常使用遠距醫療」,由辯論專家札菲爾(Dan Zafrir)力抗Project Debater。

這支影片為第一回合Project Debater(左)對上歐瓦迪雅(右)的辯論賽。從影片中可以看到歐瓦迪雅在質詢的時候很認真地聽著Project Debater的論點邊作筆記。

結果由現場來賓票選

辯論結束後,由現場來賓投票決定究竟是AI還是由真人勝出。

現場來賓認為,雖然Project Debater的表現並非完美無缺,歐瓦迪雅和札菲爾說起話來絕對比Project Debater流暢,但Project Debater的論點最實際,而判IBM的AI辯論機器人獲勝。

辯論賽中  數據和例證不是一切

面對這場辯論賽的結果,IBM表示這就是他們所追求的目標:AI比人類能更快做出決策,還能提供更多的數據。

而歐瓦迪雅則認為,在辯論過程中例證和數據固然重要,「但當我們正在辯論的時候,這不是一切」、「我認為最終當它(指AI)能做的比我們更好的時候,這對於人類來說是一件好事──能使我們做出資訊充足的決定、投票或任何事」。

post title

圖為 2017年8月,在日本東京的生命終結產業博覽會上,為人誦經超渡的和尚帶著機器人Pepper出場。

路透社

Project Debater是怎麼辦到的?

為求比賽公平,Project Debater和歐瓦迪雅、札菲爾在事前都不知道比賽題目,Project Debater也沒有接上網路。那Project Debater是怎麼找到資料的呢?

IBM研發團隊在事前便在Project Debater的資料庫當中存入約 100條左右常見的辯論賽主題,內容集結了「數以億計」的報章雜誌和學術期刊內容。

所以,Project Debater在辯論賽期間只需要找出它所需要的資料,把各個內容剪輯成一篇流暢的散文並「說」出來即可。

語言還是一大挑戰

但難就難在Project Debater該如何把不同的文章整合成一篇內容架構完整的短文,這也是這次比賽最多現場來賓感受到的──Project Debater雖然「說起話」來很有自信,在發音上也很自然,但在語言的使用上不夠精確,核心的論點也不夠明確。

post title

圖為 2015年4月11日,NASA太空人威爾摩(Barry Wilmore)在國際太空站外和地球自拍

路透社

「這很簡單,我不反對」

舉例來說,當歐瓦迪雅說她認為錢應該花在比太空旅行更迫切的需求上時,Project Debater說:「說要把錢花在更重要的事情上,這很簡單,我不反對。沒有人說這(指太空旅行)是唯一一個列在購物清單上的項目,但那不是重點。」

「由於贊助太空旅行很顯然地能讓社會受益,我認為這是政府應該推行的事。」

不僅如此,在太空旅行的辯論上,Project Debater不斷重申太空旅行有利於經濟,但每一次的內容只是稍微抽換一下幾個字詞。

句子間不夠連貫  還會穿插小趣聞

有的時候Project Debater也會出現文法上的問題,第二字句和前面的子句之間沒有連貫。有的時候,Project Debater會穿插一些聽起來像是隨機出現的趣聞或引用某個人說過的話。

其中一次是當Project Debater提到太空人凱利(Scott Kelly)時,在句子中間突然冒出和前後文不搭的單字「voiceover」(旁白),讓人一聽就知道這段內容一定是從某個影片當中擷取出來的。

post title

圖為 2017年5月,中國棋王柯潔正在和AlphaGo對弈。

路透社

這不是第一次AI和真人對抗

這當然不是第一次AI在正式活動上和真人對決,2011年IBM的超級電腦Watson在美國遊戲節目《危險邊緣》(Jeopardy)上獲勝,超級電腦深藍(Deep Blue)擊敗西洋棋世界冠軍卡斯帕洛夫(Garry Kasparov),還有Google人工智慧程式AlphaGo戰勝南韓圍棋大師李世乭等。

辯論賽比棋賽更難

但比起棋賽,使用語言來進行辯論對於AI來說是更困難的遊戲。

鄧迪大學電腦科學與哲學教授里德(Chris Reed)看完整場Project Debater辯論賽後說道:「西洋棋的規則很少,棋盤很小、棋子的數量也少,即便對於Go(指AlphaGo)來說,棋盤基本上來說很大,但我們討論的都還是在一個有明確邊界和空間的事物。」

post title

在未來,如果AI能提供人類更有說服力的論點,或許就能協助決策者在做出判斷之前,有更多事實、數據佐證。

Photo: Imagens TVE e FM Cultura

AI不會是決策者  但有利於討論

如同IBM在辯論賽結束後所說的,在未來只要AI能提供更有說服力的論點,就能作為輔助人類進行決策的工具。

《衛報》舉了企業裡董事會進行決策的例子,在討論過程中各方論點彼此矛盾、衝突,但AI能不帶任何情感地傾聽對話過程,在評估完所有證據和論點之後挑戰各方的推理。

但整個過程當中AI都不會是決策者的角色,AI只能做為現場的一位發言者,有利於討論的進行。

像是噱頭  也證明目前AI的極限

里德認為,這樣的系統在未來可以應用於反恐情報分析,也可能提升在做出決策前能以事實證據作為判斷的基礎。

里德也說道,雖然這次的辯論賽看起來像是IBM的噱頭,但這場辯論賽同時也證明了AI的極限。他說:「這讓大眾知道現在AI的極限,這意味著人們可以稍微緩和一下對於即將來臨的機器人末日(robot apocalypse)的恐慌。」


延伸閱讀:《臉書「發展出自己語言的人工智慧」恐怖故事 真的是這麼回事嗎?
為什麼人工智慧助理都是女聲?

參考資料:
01 IBM's machine argues, pretty convincingly, with humans
02 Man 1, machine 1: landmark debate between AI and humans ends in draw
03 This AI program could beat you in an argument—but it doesn't know what it's saying
04 IBM'S NEWEST AI CAN PROBABLY ARGUE BETTER THAN YOU