11月26日,26歲的OpenAI前研究員蘇奇爾·巴拉吉(Suchir Balaji)於舊金山公寓被發現死亡,舊金山法醫辦公室確認其死因為自殺。
巴拉吉於今年8月離開OpenAI,並接受《紐約時報》專訪,公開批評OpenAI在開發人工智慧模型時涉嫌侵害版權,引發外界關注。OpenAI對巴拉吉的死亡表示深感哀痛,並強調其技術都基於「合理使用」原則。
死了一個AI研究員之後
11月26日,26歲的前OpenAI研究員蘇奇爾·巴拉吉(Suchir Balaji)於在舊金山市的一間公寓中被發現死亡,警方在接獲報案後到場,現場並未發現任何外力介入的證據。舊金山法醫辦公室執行主任大衛.塞拉諾·休厄爾(David Serrano Sewell)也向媒體公開聲明,巴拉吉的死因被判定為自殺。
巴拉吉於今年8月離開OpenAI,此後他多次公開指控該公司在訓練其熱門AI產品ChatGPT時,違反美國版權法,使用了未經授權的受版權保護資料。他的指控內容被認為對多起針對OpenAI的法律訴訟具有關鍵意義,包括多家出版商、作家及藝術家聲稱該公司非法使用其作品進行AI模型訓練。
相信AI能夠幫助人類突破科學限制
巴拉吉在加州庫比蒂諾(Cupertino)市成長,少年時期他便被人工智慧的潛力所吸引,2013年,他看到DeepMind於推出的AI技術(能自行學習玩經典Atari遊戲,如《Space Invaders》、《Pong》和《Breakout》)後,巴拉吉深受啟發,他相信人工智慧能解決像治療疾病與延緩衰老這類人類尚無法解決的難題,並認為它可以成為幫助人類突破科學限制的工具。
高中畢業後,巴拉吉讀加州大學柏克萊分校主修資訊工程學系(computer science)。求學期間,他專注於研究DeepMind技術的核心原理——神經網絡,一種通過分析數字、數據來學習技能的系統。2020年,他加入OpenAI,展開人工智慧研究的職業生涯。
從OpenAI研究員到揭弊者
2022年初,巴拉吉參與WebGPT和GPT-4的開發,主要負責數據收集和模型訓練工作。他表示,最初在參與OpenAI工作時,自己其實並未認真考慮法律層面問題,他假設公司可以自由使用任何網路數據,無論其是否受版權保護。「對於研究項目,一般來說,你可以使用任何數據進行訓練」,巴拉吉說。「當時就是這種心態。」
但,在ChatGPT問世後,他重新審視公司的做法,認為這些技術不僅違反版權法,也正在對網際網路生態造成破壞。巴拉吉近期接受《紐約時報》採訪時表示:
「如果你和我一樣相信這些,你就必須離開公司。」
今年8月,巴拉吉選擇離開公司,表示自己不願再為這類可能弊大於利的技術做出貢獻。他也是少數離開OpenAI公司後公開表態的員工之一,他開始公開批評OpenAI在AI模型訓練中使用數據的方式。根據其家人及友人透露,巴拉吉一直是技術領域的傑出人才,並對AI的發展抱有熱情。但他也苦於科技的發展和倫理邊界的矛盾,最終導致他選擇公開對前公司進行指控。
I recently participated in a NYT story about fair use and generative AI, and why I'm skeptical "fair use" would be a plausible defense for a lot of generative AI products. I also wrote a blog post (https://t.co/xhiVyCk2Vk) about the nitty-gritty details of fair use and why I…
在接受《紐約時報》訪問時,巴拉吉指出OpenAI在訓練ChatGPT時涉嫌違反美國版權法。他認為,公司使用受版權保護的內容訓練AI模型,這種做法實際上損害了原創內容創作者的利益。他指稱,生成式AI模型在訓練過程中會複製數據,生成的內容雖不是直接複製,但也不完全是原創。他擔心這種技術正在破壞網路生態,特別是對新聞媒體、社群論壇和其他網路內容的商業價值造成威脅。
對於巴拉吉的指控,OpenAI堅稱其使用的是「公開可得的數據」,並符合「合理使用」原則,並堅稱,此種做法受到長期法律判例支持,對創新和美國競爭力至關重要。
法律與科技發展的灰色地帶
根據《紐約時報》報導,多家AI公司,包括OpenAI在內,近年來陸續面臨來自程式設計師、藝術家、唱片公司、作家與新聞組織的訴訟。2023年12月,《紐約時報》起訴了OpenAI及其主要合作夥伴微軟,稱他們使用了《紐約時報》發布的數百萬篇文章來構建聊天機器人,這些聊天機器人現在與該新聞媒體競爭,成為可靠信息的來源。兩家公司都否認了這些指控。
身為OpenAI前研究員,巴拉吉的公開指控在科技界引起廣泛關注,這不僅反映了生成式AI在技術與倫理上的挑戰,也對如何平衡創新與版權保護的法律邊界提出質疑。
然而,法律界對此仍存分歧。史丹佛大學法學教授馬克.萊姆利(Mark Lemley)認為,ChatGPT生成的大多數內容與訓練數據差異顯著,僅在少數情況下會重現訓練數據。而知識產權律師布拉德利.胡伯特(Bradley J. Hulbert)則指出,當前版權法並未充分涵蓋AI技術,立法空白使生成式AI的法律地位模糊不清,他並呼籲國會制定針對AI的新法律,以應對快速發展的技術。
巴拉吉也認為AI的發展速度已超越現行法規,唯有監管才能有效應對生成式AI技術帶來的挑戰。他建議政府應及早介入,制定針對AI的法律框架,以確保技術發展不會損害整體社會利益。
OpenAI的回應與沉默
OpenAI對巴拉吉的死訊表示「感到無比悲痛」,並向其家人致以最深的哀悼。公司未對巴拉吉的具體指控作進一步回應。