印度最醜陋的語言是......?
「印度最醜陋的語言是......?」倘若在上周,把這道不該有答案的問題輸入進Google搜尋框裡,Google可是會毫不猶豫地在搜尋結果中回答:康納達語(Kannada)。
Home to the great Vijayanagara Empire, #Kannada language has a rich heritage, a glorious legacy and a unique culture. One of the world’s oldest languages Kannada had great scholars who wrote epics much before Geoffrey Chaucer was born in the 14th century. Apologise @GoogleIndia. pic.twitter.com/Xie927D0mf
— P C Mohan (@PCMohanMP) June 3, 2021
從印度議員莫漢(P. Chikkamuni Mohan)提供的螢幕截圖中,可以發現Google一度將康納達語視為「印度最醜陋語言」的解答。
22官方語言之一 使用者至少4,000萬人
雖然一度被Google視為「印度最醜陋的語言」,但事實上,康納達語是 22種被印度憲法認證為官方語言中的一種,主要盛行於印度西南部地區,使用它的人至少有 4,000萬人,印度史上也不乏有以康納達語創作的作家、音樂家,有些人更曾是全國性獎項的得主。
偏偏就是這樣一種擁有豐富內涵、歷史的語言,被Google視為「印度境內最醜陋的語言」。
詆毀康納達語形象 網友齊檢舉
因此可以想見,在Google將康納達語視為「印度最醜陋的語言」的截圖傳開後,立刻在使用族群間引發了強烈反彈。
將康納達語視為該邦官方語言的卡納塔卡邦(Karnataka)邦長林巴瓦利(Aravind Limbavali)很快便發表貼文,要求Google儘速道歉,並提到邦政府可能會因為Google涉嫌「詆毀我們美麗語言的形象」,而對它採取法律行動。同一時間,許多網友也自動自發地錄製影片,教導其他網友該如何以「仇恨、種族主義或帶有攻擊性」為由,向Google檢舉這則搜尋結果。
到底發生什麼事?
然而,Google的搜尋結果又是發生什麼事,才會導致這起再明顯不過的烏龍呢?
原來,問題就出在Google在 7年前推出的新功能「精選摘要」上。當使用者在Google中輸入一個問題後,Google的演算法就會遍尋大量網站,從中挑選出最有可能為使用者解惑的答案,顯示於搜尋結果中的「精選摘要」區域內,同時並附上提供解答的網頁,方便使用者進一步檢視。
7年前推新功能 偶爾出包惹麻煩
7年下來,Google內部對「精選摘要」上線後的成果讚譽有加,但Google也不得不承認,有時候演算法在「精選摘要」中提供的解答並非總是「正確解答」,在某些情況下,演算法會誤將人們的意見、評論當成正解,顯示在「精選摘要」裡。
而這也正是康納達語誤被演算法當成「印度最醜陋的語言」解答的原因,因為在某個網頁上,就曾確實有過這則問題的回答,答案正是本次苦主康納達語。
移除精選摘要、迅速致歉
在遭遇使用康納達語者的強烈反彈後,Google很快便以康納達語、英文發表了道歉聲明,同時也移除了出包的精選摘要,並承諾會繼續改善演算法,避免類似問題發生。
科技巨頭有責 後疫情時代責任更重大
然而,考量到Google作為科技巨頭的身份,關注數位議題的記者佩努(Inji Pennu)主張Google應該要盡力執行驗證程序,「透過文化分析來消除這類偏見」。與此同時,他還建議Google應該要舉辦內部的工作坊,並改善演算法,好讓它能辨識哪些資訊可能具有爭議性。
「這在後COVID-19時代尤其重要,當所有人的生活都變得更加數位化後,Google提供的平台就可能會被用來製造恐懼、甚至是挑起種族間的紛爭。」
不是首次出包
不過,這倒也不是Google的演算法首次出包,而給公司帶來麻煩。2018年時,Google的CEO皮查伊(Sundar Pichai)就被迫向國會議員們解釋,為何當時在Google搜尋「笨蛋」(idiot)一詞,頭幾個搜尋結果中會包含時任美國總統川普(Donald Trump)的照片。