「我每天的工作,就是不斷的把照片上的人臉圈出來,」來自委內瑞拉的蜜雪兒(Michelle Muñoz)說,這份工作她已做了兩年,就像傳統工廠生產線工人,每天做著無止盡、重複的工作。令人訝異的是,之前她是一位牙醫師,還有自己的診所,卻因為經濟不景氣被迫結束經營。而她現在所做的「圈臉」工作,其實就是我們每天常看到的各種美顏相機、人臉辨識、變臉軟體的基礎工程。
根據 BBC 報導,光是亞馬遜(Amazon)公司每個月雇用的這些「資料工人」,至少超過 1 萬,主要來自美國和印度。亞馬遜 CEO 貝佐斯 2005 年就說過,「artificial artificial intelligence」(人工打造的人工智慧,網路圈常稱工人智慧)是公司未來發展的關鍵,甚至還有個新潮好聽的名詞叫「群眾外包」(crowdsourcing)。
在所有神奇的人工智慧應用中,最關鍵的元素可簡化成兩個,第一是演算法,第二是數據。好的演算法可以創造奇蹟,運用較少、較差的數據就能做出好結果,而數據則是人工智慧發展的硬道理,只要擁有夠好的數據資料庫,理論上就可以為所欲為。因此全球最強大的人工智慧,幾乎都出自掌控大數據的公司之手,像是亞馬遜、Google、Facebook、騰訊、阿里巴巴等,而這些公司最需要的就是源源不絕的數據,來訓練各種人工智慧系統。
想像人工智慧是一隻強力的召喚獸,各家公司就是召喚獸的主人,想讓你的召喚獸變得更強,就需要不斷餵食肥料,而肥料要從哪來?遊戲裡你得自己去肝(燃燒你的肝花時間去收集材料)出來,在現實世界,來自全球的資料工人,隨時待命為你服務。
基礎的機器學習模型,一定會需要兩種資料,第一是訓練用的資料,第二是測試用資料。
訓練用的資料就像學生的參考書,往後翻就有答案。舉例來說,要訓練一個能辨識性別的人工智慧,訓練資料形式如果是照片,那麼每張照片就要標註正確答案,也就是照片中人物的性別。但是要去哪裡找有標註性別的照片呢?我們都已經幫 Google 跟 Facebook 做好這份工作了,然而如果需要更多照片,或是更複雜的標註,比如說要辨識人的五官、頭髮的位置,那就需要更精細的處理,也就是大量資料工人上場的時候。
這種工作的涵蓋範圍沒有極限,可能是在影片中標記樹木、紅綠燈,或是聽一段聲音,判斷是男聲女聲,而這些微小的工作,就成為各種人工智慧系統的肥料,像是自動駕駛、語音辨識,幫助它們不斷成長、進化。
這些資料工人的學歷幾乎都在大學以上,其中還有半數是資訊跟工程領域畢業,但根據國際勞工組織調查,他們的平均時薪介於新台幣 45 元到 150 元,亞洲地區工人每小時約可賺到新台幣 70 元,這個數據遠低於一般薪資,然而對許多人來說卻是最好的選擇,特別是那些局勢動盪的國家。
「在難民營裡找工作顯然不太容易,這份工作不需要面試或履歷,又可以遠端賺錢。」來自敘利亞的阿米德(Yahya Ayoub Ahmed),內戰時逃離故鄉,現在住在伊拉克境內的難民營,他在這裡接受救援組織的訓練,學會一些英文和電腦技術,因此成了資料工人。
然而這種工作充滿各種風險,由於雇主多半來自已開發國家,光是要正確支付工資,有時候都需要克服重重難關,畢竟像伊朗、伊拉克等國家的跨境金流,不像北美或歐洲那樣單純。更別提許多雇主在交件後,就神隱無蹤,工作者也求助無門只能認栽。
運氣好的時候,一天可以賺新台幣好幾百元,或許沒辦法稱得上好日子,但至少可以吃得不錯。國際勞工組織也呼籲各國政府與企業,應設法保護這些資料工人的權益,維持整個系統的持續運作。
半個小時賺 1 塊錢
目前有幾家專門在協助資料工人外包的企業,像是 Figure Eight,他們建立一個認證的平台,讓 Google、Microsoft、Oracle 等大型公司可在這發專案,而工作者則自行接案。
記者實際註冊測試,完成教學後,第一份工作是協助確認 Linkedin 用戶的工作經歷是否跟系統資料庫相符合,大約花了 20 分鐘時間,完成 20 份用戶資料檢測,收入則是非常寶貴的 3 分美元(約新台幣 1 元)。這是目前平台上最低階的工作,畢竟只是一個 Level 0 的工人。升等之後,就能接到更好的案子了(吧)。
如果你覺得這份工作跟人工智慧無關,那就大錯特錯囉。這份工作看起來像是在檢查 Linkedin 用戶資料,根據推測,這應該是在幫某款人工智慧檢查答案。應該是某家公司寫了一套系統,讓用戶只要輸入姓名,就可以快速找到前一份工作或目前的工作。而記者所做的就是在幫這套系統「檢查」答案是否正確。經過小小的體驗,可以確認這份工作不好賺,同時也不是簡單的工作。至少你需要不太差的英文能力,並熟悉電腦網頁操作,才能有效率的進行。相對於提供的薪水,對一般人來說實在不划算。但與此同時,這世界可能有數以萬計的人,卻依靠這樣的平台過活。我們隨手可得的這些人工智慧應用背後,就是這些工人的無數微小工作累積而來。