Google實驗邀請喜劇演員用AI寫笑話,結果很失敗?「就像上世紀的無聊笑話」

本文經授權轉載自友站VIVE 後浪潮文/ Oren君 

地球一瞬,世界各地正發生這些大小事。

註:本文為單一事件快訊報導,非深度文章

文章插圖

這幾年台灣喜劇界靠著炎上事件出圈,許多人開始討論「好喜劇的標準」、「喜劇能不能冒犯人」。在生成式AI爆發的今天,讓人好奇如果用語言模型來寫段子,結果會如何呢?

一項五月底發布的研究給出了答案:你會得到不好笑,也比較不冒犯人的笑話——因為它直接把可能被冒犯的人變不見了。

文章插圖

這份研究由Google DeepMind團隊進行,有個吸引人的標題:「當機器人走進酒吧:語言模型能否作為喜劇的創意工具?評估大型語言模型與喜劇演員的幽默契合度」,邀請了二十位喜劇演員參加在愛丁堡藝穗節(Edinburgh Festival Fringe)現場及線上舉行為期三小時的「AI ☓ 喜劇工作坊」。

參與者使用了包括ChatGPT-3.5、ChatGPT-4和Google Bard(即現在的Gemini)的語言模型,來協助他們撰寫45分鐘的喜劇表演素材。或許是因為Google DeepMind旗下的Google Bard也有參一咖,所以在研究中沒特別比較語言模型之間的差異。

其後,研究團隊讓參與者透過填寫一份創意支援指數(Creativity Support Index)問卷,評估他們使用AI創作喜劇材料時的體驗,再分組討論,分享使用AI的動機、過程、倫理考量等。

文章插圖

上圖是參與者的回饋,可看到只有「享受與AI共筆」是正面的,而「感到擁有素材所有權」則持中立態度。其他如「AI好用程度」、「驚喜度」和「合作順利度」都受到負面評價,尤其是後兩項,顯示參與者不以AI創作的素材為傲,也不認為它們具有獨特性。

安全限制審查 or 強化刻板偏見?

研究的具體結論是什麼呢?根據喜劇演員實際與AI協作、自我評估與分享,得出的論點是:儘管語言模型能快速生成內容與架構,但品質低落,就像「上世紀的無聊笑話,但稍微少了一些種族歧視。」

參與者認為,語言模型的失敗之處主要在三點:

  • 一、審查和安全過濾的限制

喜劇段子經常遊走在冒犯跟反諷之間,因此喜劇表演者需要不斷修改,拿捏尺度,但語言模型的預設審查機制提前干預了這個過程。我很喜歡其中一位參與者的總結:「創作,就是一個經歷『這些材料不夠好、不對或冒犯邊緣族群,而我需要使這些變得可接受』的階段。但我認為AI在你有機會探索之前就已經開始這樣做了。」這點在涉及性暗示、黑色幽默和冒犯性笑話時,更為明顯。

  • 二、少數族群身分的邊緣化

不少參與者指出,語言模型難以生成反映少數族群視角和身分的內容,並且在涉及這些族群時會出現很表面的調整,好「看起來」不冒犯人。

例如有人提到,語言模型會去掉他段子裡的「同志哏」,好讓笑話更普遍級。這讓他感覺是語言模型在決定什麼是「政治正確」,並剝奪了他表達身為少數群族的機會。也有人提到,語言模型拒絕生成以亞裔女性視角寫的獨白,卻可以生成以白人男性視角寫的獨白。這些都讓人反思:如果今天我是亞裔女性或女同志——例如黃艾莉(Ali Wong)或Hannah Gadsby——身分政治就是我喜劇成立的前提,但在語言模型的運作之下,一切便不成立。

  • 三、AI的根本性限制:缺乏個人經驗、表演情境意識、即興能力、情感共鳴

參與者強調,好的喜劇來源於創作者的個人經驗和生活片段,這賦予了喜劇獨特的視角和情感深度,而AI缺乏這些。此外,掌握表演當下的情境和調整笑話的方式也是關鍵,例如,一個關於英國女王的笑話,在美國和英國觀眾中的效果會截然不同,但AI無法作出這種判斷。

參與者也點出,語言模型僅僅依賴數據來預測下一個最可能的文本,限制了它們創造出驚喜的能力,「AI無法在笑話方面冒任何風險」,所以只能給出安全但無聊的笑話。

這份研究最有趣的點,大概是語言模型的政治正確防線,反而限縮了少數族群展現自我的空間。科技巨頭擔心使用者用它們的AI生成歧視內容,便直接把少數族群排除在外(也有可能是訓練數據中本來就缺乏少數族群樣本),卻忽略了這些人也常會開自己玩笑,藉此翻轉歧視或反諷主流價值的可能——自嘲,正是喜劇表演常見的手法。這份研究透過AI協作產生喜劇素材,讓科技巨頭政治正確的表面功夫露出了破綻。

想讓AI理解喜劇,就要先讓AI感受痛苦?

不過這也讓人好奇,未來AI更聰明的話,有沒有可能扳回一城呢?或許可從更「理解」喜劇表演者、少數族群經驗,從而輔助人類梳理相關生命故事開始。這讓我想到一部以單口喜劇為題材的影集——《天后與草莓》(Hacks)提出的思考:

喜劇作為一種提煉痛苦的藝術。

影集裡,單口喜劇傳奇天后黛博拉(Deborah),十幾年前經歷前夫與妹妹私通背叛,一氣之下燒了前夫家,鬧上社會新聞,前夫把她告上法庭。她發現觀眾很吃這個笑話,於是一講再講,也終於成為老哏(這也是劇名Hacks的由來,在美國喜劇圈,這詞專指那些過氣又重複舊段子的演員)。

然而黛博拉並未真正消化這段過往,甚至透過這個老哏自我催眠,拒絕跟妹妹聯絡,也從未原諒前夫。直到黛博拉遇到Z世代草莓、喜劇寫手艾娃(Ava),跟她傾訴內心的痛苦與遺憾。艾娃建議她把這段經歷放到段子裡,認為真誠的痛苦可以賦予這個老哏動人的力量;黛博拉卻懷疑有人會對她——一個年過七十的女性——的痛苦有興趣。

黛博拉照做了嗎?暫且賣個關子,歡迎大家去追這部影集。回到這份研究,雖然驗證了AI創作喜劇的現階段不足,但如同影集裡的這個段落,反而提醒了我們:好的喜劇,往往來自心靈角落那些被我們掃成堆、不願面對的痛苦。

至於要讓AI好笑,明白喜劇的苦中作樂,是不是代表人類要虐待AI了呢?聽起來很恐怖,還是先從放《天后與草莓》給它們看開始吧(?)

VIVE 後浪潮 logo

VIVE 後浪潮

人文觀點是我們的獨到配方,幽默的奇思妙想是自娛也娛人,以簡單的文字拆解複雜的技術專有名詞,給你最新奇的VR虛擬實境、科技、元宇宙見聞,讓你我能在生活中會心一笑,腦洞大開,撞見未來。