美8家新聞社聯手控告微軟、OpenAI 非法複製內容以訓練AI模型

鉅亨網編譯許家華
(圖:REUTERS/TPG)
Tag

美國 8 家新聞社周二 (30 日) 在紐約聯邦法院對 OpenAI、微軟 (MSFT-US) 提起訴訟,指控這兩家公司在未經許可的情況下,使用其新聞作品來訓練生成式人工智慧 (Gen AI)。

8 家新聞社分別為《紐約每日新聞》、《芝加哥論壇報》、《奧蘭多哨兵報》、《水星報》、《丹佛郵報》、《先鋒新聞》等,均隸屬於奧爾登 (Alden) 全球資本公司旗下媒體新聞集團 (MediaNews Group) 。

這 8 家新聞社在訴狀中表示,微軟和 OpenAI 非法複製了數百萬篇文章來訓練 AI 產品,包括微軟的 Copilot 和 OpenAI 的 ChatGPT,要求 OpenAI 和微軟賠償其損失,並停止進一步侵犯版權的行為。

訴狀也提到,在某些情況下,微軟和 OpenAI 的 AI 會逐字或近乎逐字複製受版權保護的新聞作品,但不提供這些作品的作者、標題、版權或使用條款資訊。 更可惡的是,ChatGPT 也「偽造」了那些損害其聲譽的文章,例如《丹佛郵報》一篇宣揚吸煙可以治療氣喘的虛假文章。

OpenAI 發言人周二表示,公司在產品開發和設計過程中非常注重支持新聞機構。 「儘管我們之前沒有意識到奧爾登公司的擔憂,但我們正在積極與世界各地的許多新聞機構建立建設性的合作夥伴關係和進行對話,以探索機會,討論任何問題,並提供解決方案。」

在此之前,《紐約時報》與新聞媒體 The Intercept、Raw Story 和 AlterNet 已對微軟和 OpenAI 提起類似訴訟,OpenAI 已獲得微軟數十億美元的財務支持。

代表 MediaNews 的律師 Steven Lieberman 表示,OpenAI 巨大成功歸功於其他人的工作,因為在 OpenAI 未經許可或付款的情況下獲取了大量優質內容。

《紐約時報》本月揭露稱,OpenAI、Google、Meta 等公司為了取得訓練語料,不惜修改政策條款、無視網路資訊的使用規則,違法使用了「多個來源」的資料。

這一切的背後是,訓練大語言模型用的資料越多,表現就會越好,但現在科技公司使用資料的速度已經超過資料生產的速度,甚至已經耗盡了網路上所有可靠的英文文字資源 。

化干戈為玉帛

科技公司也正在與新聞機構達成合作協議。本周英國《金融時報》(FT) 宣布與 OpenAI 達成協議,將授權 OpenAI 使用其資料庫來訓練 AI 模型。

OpenAI 今年 1 月時表示,公司正與數十家出版商洽談文章授權協議。 截至目前,除了 FT 外,OpenAI 還和美國的美聯社、德國的施普林格、法國的《世界報》和西班牙的 Prisa Media 達成了協議。

谷歌周二同意,每年向《華爾街日報》的母公司新聞集團支付 500 萬至 600 萬美元,用於開發新的 AI 相關內容和產品。