Meta 被指控在人工智慧開發中使用盜版數據

在卡德瑞 (Kadrey) 等人訴梅塔 (Meta) 的案件中，原告已提出動議，指控該公司在開發其人工智慧 (AI) 模型時，故意使用受版權保護的作品。

這些原告包括作家理查德·卡德瑞 (Richard Kadrey)，他們在美國加州北區地區法院提交了“支持原告申請提交第三次修訂合併訴狀的回覆”。

這份檔案指控梅塔系統性地從盜版數據集中下載並刪除版權管理資訊 (CMI)，包括來自臭名昭著的影子圖書館 LibGen 的作品。

根據最近提交給法院的文件，證據顯示梅塔高層領導的行為非常不當。原告指控梅塔執行長馬克·祖克柏 (Mark Zuckerberg) 明確批准使用 LibGen 數據集，儘管公司內部的 AI 高管提出了擔憂。

梅塔內部討論的一份2024年12月的備忘錄承認 LibGen 是“一個我們知道是盜版的數據集”，並對使用這類資料的倫理和法律影響展開辯論。文件還顯示，頂尖工程師對於使用公司筆記本電腦進行可能違法的活動表示猶豫。

此外，內部通信表明，在獲得 LibGen 數據集後，梅塔刪除了其中受版權保護的作品的 CMI，這一做法是原告強調的版權侵權指控的核心。

根據梅塔的公司代表麥可·克拉克 (Michael Clark) 的證詞，該公司實施了旨在刪除任何識別這些作品為受版權保護的資訊的腳本，包括“版權”、“致謝”或通常用於這類文本的行句。克拉克證實，這種做法是故意的，目的是為了準備數據集以訓練梅塔的 Llama AI 模型。

“感覺不太對”

對梅塔的指控描繪出一家故意參與廣泛盜版計畫的公司，並透過下載盜版資料來進行操作。

根據一系列電子郵件的展示，梅塔的工程師表達了對在公司內部下載盜版數據集的擔憂。一位工程師指出，“用 [梅塔擁有的] 公司筆記本電腦下載資料感覺不太對”，但儘管有猶豫，盜版數據的快速下載和分發——或稱為“播種”——仍然發生了。

原告的法律顧問表示，直到2024年1月，梅塔仍然“已經從 LibGen 下載並分發數據”。此外，記錄顯示，與此相關的數百份文件在幾個月前就已被梅塔獲得，但在早期發現過程中被隱瞞。原告認為這種延遲披露等同於梅塔故意阻止對重要證據的獲取。

在2024年12月17日的證詞中，祖克柏本人據報承認，這種活動會引發“許多紅旗”，並表示這“看起來是一件壞事”，儘管他對梅塔更廣泛的 AI 訓練做法只給出了有限的直接回應。

這起案件最初是針對版權侵權的行動，代表作者和出版商聲稱其材料的 AI 使用違反了相關規定。然而，原告現在希望在訴訟中增加兩項主要指控：違反《數位千年版權法》(DMCA) 和違反《加州綜合數據訪問和詐欺法》(CDAFA)。

根據 DMCA，原告主張梅塔故意移除版權保護，以掩蓋其 Llama 模型中未經授權使用版權文本的行為。

在投訴中提到，梅塔據稱刪除了 CMI“以減少模型記住這些數據的機會”，而這種刪除權益管理指標的行為使得版權持有者更難發現侵權行為。

CDAFA 的指控涉及梅塔獲取 LibGen 數據集的方法，包括據稱參與盜版下載以獲取未經許可的版權數據集。內部文件顯示，梅塔的工程師公開討論了播種和下載可能被視為“法律上不合法”的擔憂。

梅塔的案件可能影響 AI 開發的相關法規

這場不斷擴大的法律戰的核心是對版權法與 AI 之間交集的日益關注。

原告認為，從文字數據集中剝奪版權保護，使版權擁有者無法獲得應有的報酬，並讓梅塔能夠在作者和出版商的創造努力的經濟基礎上建立如 Llama 等 AI 系統。

這些指控的提出恰逢全球對“生成性 AI”技術的關注加劇。像 OpenAI、谷歌 (Google) 和梅塔這樣的公司都因使用版權數據來訓練其模型而受到批評。各地法院目前正努力應對 AI 對權益管理的長期影響，可能在美國和英國裁定具有里程碑意義的案件。

在這起案件中，美國法院對於聽取有關 AI 可能對長期建立的版權法先例造成損害的投訴表現出日益的意願。原告在其動議中提到了《Intercept Media 訴 OpenAI》的案例，這是一個最近來自紐約的裁定，類似的 DMCA 投訴獲准繼續進行。

梅塔持續否認該案件中的所有指控，並尚未對祖克柏報告的證詞作出公開回應。

無論原告是否能成功進行這些修正，全球的作者都面臨著越來越多的擔憂，關於他們的創作作品在 AI 的背景下是如何被處理的。隨著版權法難以跟上技術的進步，這起案件凸顯了在國際層面上為創作者和創新者提供更清晰指導的必要性。

對於梅塔而言，這些指控也代表著名譽風險。隨著 AI 成為其未來戰略的中心，依賴盜版資料庫的指控不太可能有助於其在該領域保持領導地位的雄心。

卡德瑞等人訴梅塔的案件可能對未來 AI 模型的開發產生深遠影響，可能在美國及其他地區設立法律先例。

(圖片來源：艾米·西耶克 (Amy Syiek))

另見：英國希望證明 AI 可以負責任地現代化公共服務

想了解更多有關行業領導者的 AI 和大數據知識嗎？請查看在阿姆斯特丹、加州和倫敦舉行的 AI 和大數據博覽會。這個全面的活動與其他領先活動共同舉行，包括智能自動化會議、BlockX、數字轉型週以及網絡安全與雲博覽會。

在這裡探索其他即將舉行的企業科技活動和網絡研討會，由 TechForge 支持。

標籤： ai, 人工智慧, 版權, 法院, 發展, 倫理, 政府, 法律, 法規, 梅塔 (Meta), 動議

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

Tags: ai artificial intelligence copyright court development ethics government law legal meta motion regulation 被指控在人工智慧開發中使用盜版數據

Meta 被指控在人工智慧開發中使用盜版數據

人工智慧將如何重塑我們的工作場所

數位主權：國防的新時代

Related Posts

DeepSeek 是提醒人們以謹慎態度接觸AI未知領域的警示

ServiceNow 部署 AI 代理以提升企業工作流程

谷歌推出最新的開放式人工智慧模型

阿里巴巴 Qwen QwQ-32B：縮放強化學習展示

人工智慧語音模型減少醫療轉錄錯誤

安全數據以促進更好的決策與合作：擁抱數據清理空間

數位主權：國防的新時代

機器人對話第104集 – 受自然啟發的機器人群體，與Kirstin Petersen

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

Meta 被指控在人工智慧開發中使用盜版數據

“感覺不太對”

梅塔的案件可能影響 AI 開發的相關法規

人工智慧將如何重塑我們的工作場所

數位主權：國防的新時代

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆