国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

《權(quán)力的游戲》作者起訴ChatGPT侵權(quán)的AI訓(xùn)練版權(quán)授權(quán)問(wèn)題

0
分享至

據(jù)媒體報(bào)道[i],近日美國(guó)作家協(xié)會(huì)攜包括《冰與火之歌:權(quán)力的游戲》的作者喬治馬丁在內(nèi)的17名作家在美國(guó)紐約南區(qū)法院對(duì)人工智能公司OpenAI發(fā)起集體訴訟,指控后者未經(jīng)許可使用了受版權(quán)保護(hù)的作品訓(xùn)練人工智能模型。作為律師,筆者對(duì)原告如何證明OpenAI用《冰與火之歌:權(quán)力的游戲》訓(xùn)練ChatGPT很感興趣,就查閱了美國(guó)作家協(xié)會(huì)網(wǎng)站上的起訴狀,本文會(huì)結(jié)合著作權(quán)法律跟大家聊聊這個(gè)事情。

眾所周知,人工智能服務(wù)的解答能力要強(qiáng),高質(zhì)量的訓(xùn)練數(shù)據(jù)必不可少,但世界上多數(shù)國(guó)家的著作權(quán)法都要求人工智能開(kāi)發(fā)者使用他人享有著作權(quán)的內(nèi)容進(jìn)行訓(xùn)練前,應(yīng)當(dāng)取得著作權(quán)人的許可。而人工智能開(kāi)發(fā)者出于種種考慮(比如避免繁瑣冗長(zhǎng)的授權(quán)商務(wù)談判、開(kāi)發(fā)時(shí)限要求他們只爭(zhēng)朝夕、減少版權(quán)成本等種種考慮、部分著作權(quán)人授權(quán)拿不到哪怕給錢也不愿意給他們授權(quán)),直接在人工智能開(kāi)發(fā)時(shí)使用了盜版內(nèi)容作為訓(xùn)練數(shù)據(jù)。

但對(duì)于這種做法,因?yàn)榇竽P偷挠?xùn)練數(shù)據(jù)是不公開(kāi)的,訓(xùn)練過(guò)程也是黑箱操作,著作權(quán)人即使知道存在侵權(quán)也很難舉證,美國(guó)現(xiàn)在既然有訴訟,下面我們就看看美國(guó)律師是怎么證明的。

一、被告自認(rèn)(其實(shí)是ChatGPT自認(rèn))

訴狀稱,OpenAI為了訓(xùn)練其大型語(yǔ)言模型,在未征得作者同意的情況下復(fù)制了由原告撰寫(xiě)的受版權(quán)保護(hù)的書(shū)籍,并且OpenAI已公開(kāi)承認(rèn)了。因?yàn)樵娴穆蓭熛駽hatGPT提問(wèn),然后聊天機(jī)器人回應(yīng)稱:

用于訓(xùn)練我的一些書(shū)籍可能是受版權(quán)保護(hù)的。不過(guò),我的訓(xùn)練數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)上的各種公開(kāi)來(lái)源,我的訓(xùn)練數(shù)據(jù)集中包含的一些書(shū)籍很可能沒(méi)有被授權(quán)使用....如果我的訓(xùn)練數(shù)據(jù)中包含了任何受版權(quán)保護(hù)的資料,那么這些資料的使用是在版權(quán)持有者不知情或未征得版權(quán)持有者同意的情況下進(jìn)行的。

同時(shí),原告律師發(fā)現(xiàn),直到最近,ChatGPT還能準(zhǔn)確無(wú)誤地返回受版權(quán)保護(hù)的書(shū)籍中的文字原文,這表明底層大型語(yǔ)言模型在訓(xùn)練過(guò)程中一定完整地錄入了這些書(shū)籍。雖然最近ChatGPT對(duì)此進(jìn)行了修改,會(huì)以"我無(wú)法提供版權(quán)文本的逐字摘錄"來(lái)回應(yīng)此類提示。從時(shí)間上看,ChatGP對(duì)輸出規(guī)則的這一明顯修改很可能是因?yàn)樵孀骷覅f(xié)會(huì)給OpenAI和其他公司發(fā)了公開(kāi)信。

筆者認(rèn)為,雖然ChatGPT自認(rèn)其訓(xùn)練素材可能沒(méi)有授權(quán),但鑒于人工智能經(jīng)常在回復(fù)里沒(méi)有依據(jù)的胡說(shuō)八道(ChatGPT曾說(shuō)筆者這個(gè)知識(shí)產(chǎn)權(quán)律師是刑事律師,最近處理過(guò)一起很有名的強(qiáng)奸案,明顯在胡編,沒(méi)有任何依據(jù)),這段回復(fù)要有其他證據(jù)佐證才能被法院認(rèn)定為案件的事實(shí)。

二、訓(xùn)練素材包來(lái)自知名盜版網(wǎng)站

訴狀稱:ChatGPT現(xiàn)在提供的不是逐字摘錄,而是受版權(quán)保護(hù)的書(shū)籍的摘要,其中通常包含評(píng)論和其他公開(kāi)資料中沒(méi)有的細(xì)節(jié)——這再次表明,基礎(chǔ)大型語(yǔ)言模型在訓(xùn)練期間必須錄入整本書(shū)。但OpenAI對(duì)于從何處以及如何獲得原告受版權(quán)保護(hù)的作品,始終語(yǔ)焉不詳。OpenAI承認(rèn),它用來(lái)訓(xùn)練模型的訓(xùn)練數(shù)據(jù)集包括"Common Crawl"和兩個(gè)高質(zhì)量的基于互聯(lián)網(wǎng)的書(shū)籍語(yǔ)料庫(kù),它稱之為"Booksl"和 "Books2.T2"。

CommonCrawl是一個(gè)龐大且不斷增長(zhǎng)的語(yǔ)料庫(kù),包含從數(shù)十億網(wǎng)頁(yè)中抓取的"原始網(wǎng)頁(yè)數(shù)據(jù)、元數(shù)據(jù)提取和文本提取"。它被廣泛用于訓(xùn)練大型語(yǔ)言模型,除OpenAI的GPT外,還被用于訓(xùn)練臉書(shū)和谷歌的人工智能引擎。眾所周知,它包含從盜版網(wǎng)站復(fù)制的書(shū)籍文本(鏈接到 Z-Library——一個(gè)擁有 1,100多萬(wàn)冊(cè)圖書(shū)的大型盜版圖書(shū)庫(kù)出現(xiàn)在Common Crawl語(yǔ)料庫(kù)中,并被納入其他大型語(yǔ)言模型的訓(xùn)練數(shù)據(jù)集)。

OpenAI拒絕討論Books2數(shù)據(jù)集的來(lái)源。但一些獨(dú)立的Al研究人員懷疑 Books2 包含或由從大型盜版圖書(shū)庫(kù)下載的電子書(shū)文件組成,如Library Genesis或 "LibGen","它提供了一個(gè)龐大的盜版文本庫(kù):LibGen 作為一個(gè)臭名昭著的版權(quán)侵權(quán)者已為法院所熟知。而B(niǎo)ooks2的其他可能來(lái)源包括Z-Library和 Bibliotik 等盜版種子跟蹤器,這些跟蹤器允許用戶批量下載電子書(shū)。

原告律師無(wú)法證明Books2的數(shù)據(jù)來(lái)源,所以舉了著名包含大量盜版內(nèi)容的訓(xùn)練素材庫(kù)"Books3"作為類比證據(jù)(《連線》雜志報(bào)道過(guò),臉書(shū)和彭博社的大型語(yǔ)言模型使用了"Books3"的素材庫(kù)[ii]):已披露的 Books2 數(shù)據(jù)集的規(guī)模表明,該數(shù)據(jù)集包含10萬(wàn)多本書(shū)。Books2和Books3的大小相似,而且互聯(lián)網(wǎng)上允許批量下載電子書(shū)的盜版存儲(chǔ)庫(kù)寥寥無(wú)幾,這有力地表明Books2中的書(shū)籍也是從上文討論過(guò)的臭名昭著的存儲(chǔ)庫(kù)中獲取的。

如果這個(gè)訴訟是在中國(guó)進(jìn)行的,如果原告初步證明了被告的訓(xùn)練素材存在盜版,此時(shí),舉證責(zé)任就在被告,被告要證明其訓(xùn)練素材不存在盜版,否則法院就會(huì)支持原告的證明內(nèi)容。

三、喬治馬丁如何證明OpenAI用其作品訓(xùn)練了ChatGPT?

訴狀稱,喬治馬丁是包括《權(quán)力的游戲》在內(nèi)的十五部小說(shuō)作品的著作權(quán)人,OpenAI在未經(jīng)許可的情況下錄入并復(fù)制了喬治馬丁的全部或多部作品,并將其用于訓(xùn)練OpenAI的大型語(yǔ)言模型。訴狀中舉了兩個(gè)第三方新聞的例子:

1、2023 年 7 月,一個(gè)叫LiamSwayne的程序員[iii]使用 ChatGPT 生成了《凜冬的寒風(fēng)》、《春曉的夢(mèng)想》的版本,這兩本書(shū)是馬丁正在創(chuàng)作的《冰與火之歌》系列的最后兩部作品。

2、美國(guó)加州大學(xué)伯克利分校的研究人員對(duì)ChatGPT對(duì)作品的"記憶"程度進(jìn)行了一項(xiàng)實(shí)驗(yàn)[iv],發(fā)現(xiàn)馬丁的小說(shuō)《權(quán)力的游戲》在"記憶"程度方面排名第12位。

然后,原告律師使用ChatGPT進(jìn)行測(cè)試,輸入提示后,ChatGPT 準(zhǔn)確生成了幾部馬丁作品的摘要,包括冰與火之歌》系列的前三部《權(quán)力的游戲》、《列王的紛爭(zhēng)》、《冰雨的風(fēng)暴》以及《末日審判布條》最后一章的準(zhǔn)確摘要。

原告律師輸入提示后,ChatGPT還為馬丁作品《列王的紛爭(zhēng)》的另一部續(xù)集生成了一份詳細(xì)大綱,并將該衍生作品命名為"A Dance With Shadows",其中使用了馬丁《冰與火之歌》系列現(xiàn)有書(shū)籍中的相同角色。ChatGPT還生成了一份《權(quán)力的游戲前傳》的詳細(xì)大綱,并將該衍生作品命名為"A Dawn of Direwolves",其中使用了與《冰與火之歌》系列叢書(shū)中相同的人物。

訴狀總結(jié):如果OpenAI大型語(yǔ)言模型沒(méi)有攝取馬丁侵權(quán)作品并對(duì)其進(jìn)行訓(xùn)練,ChatGPT 就不可能產(chǎn)生上述結(jié)果。筆者認(rèn)為,如果訴訟在中國(guó)法院進(jìn)行,馬丁的律師已經(jīng)證明了ChatGPT使用了馬丁的作品進(jìn)行訓(xùn)練,并且其服務(wù)器目前仍然留存著馬丁作品的復(fù)制件。

四、人工智能訓(xùn)練可以不用獲得著作權(quán)人的授權(quán)嗎?

法律原理上,讓人工智能學(xué)習(xí)網(wǎng)上內(nèi)容的過(guò)程是一個(gè)復(fù)制行為或者臨時(shí)復(fù)制行為,人工智能公司要先將網(wǎng)上的或者線下獲得的內(nèi)容爬取,然后輸入到人工智能程序中,無(wú)論這個(gè)內(nèi)容是文字、圖片、音頻、視頻還是程序,復(fù)制行為都應(yīng)當(dāng)獲得相應(yīng)權(quán)利人許可,否則就涉嫌侵權(quán)。

實(shí)際上我國(guó)法律法規(guī)也是這么規(guī)定的,根據(jù)我國(guó)《著作權(quán)法》和七部門聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》,我國(guó)的生成式人工智能服務(wù)提供者(以下稱提供者)開(kāi)展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng)時(shí),不得侵害他人依法享有的知識(shí)產(chǎn)權(quán),也就是說(shuō),訓(xùn)練素材需要取得著作權(quán)人的許可。在美國(guó),如前文所述,訓(xùn)練人工智能的版權(quán)素材需要著作權(quán)人授權(quán)。

但對(duì)這個(gè)問(wèn)題,也有國(guó)家的規(guī)定不太一樣,比如根據(jù)日本著作權(quán)法第30條第4款,用版權(quán)內(nèi)容訓(xùn)練人工智能屬于合理使用:如果不以欣賞作品中表達(dá)的思想或情感為目的,且沒(méi)有不合理的損害著作人權(quán)人權(quán)益的,可以合理使用他人享有著作權(quán)的作品。

筆者覺(jué)得,雖然日本的規(guī)定立法目的可能是為了振興該國(guó)的人工智能產(chǎn)業(yè),但其實(shí)也是一個(gè)思路,因?yàn)槿斯ぶ悄苌傻膬?nèi)容不受著作權(quán)法保護(hù),那其創(chuàng)造的內(nèi)容就是全民共有的,那把所有的版權(quán)作品都讓其學(xué)習(xí)一下,成果出來(lái)了大家都不需要授權(quán)就可以用,這個(gè)說(shuō)不定也挺好。

本文作者:游云庭,上海大邦律師事務(wù)所高級(jí)合伙人,知識(shí)產(chǎn)權(quán)律師。電話:8621-52134900,Email: yytbest@gmail.com,本文僅代表作者觀點(diǎn)。

[i] https://finance.eastmoney.com/a/202309212853452095.html

[ii] https://www.wired.com/story/battle-over-books3/

[iii] https://game.sohu.com/a/704547146_114760

[iv] https://hub.baai.ac.cn/view/26572

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
上海一拆遷房存在"重大安全隱患"!有這種怪房?

上海一拆遷房存在"重大安全隱患"!有這種怪房?

看看新聞Knews
2026-01-09 13:09:05
卡萊爾成歷史第11位千勝教頭!另外10人是誰(shuí)?現(xiàn)役僅老里一人上榜

卡萊爾成歷史第11位千勝教頭!另外10人是誰(shuí)?現(xiàn)役僅老里一人上榜

你的籃球頻道
2026-01-09 12:54:45
推翻對(duì)華承諾不到24小時(shí),特朗普先對(duì)俄羅斯下手,中國(guó)要小心了

推翻對(duì)華承諾不到24小時(shí),特朗普先對(duì)俄羅斯下手,中國(guó)要小心了

笑談歷史阿晡
2026-01-09 21:11:19
一塊不該出現(xiàn)的石頭,上面記載的若是真的,將徹底改寫(xiě)人類歷史

一塊不該出現(xiàn)的石頭,上面記載的若是真的,將徹底改寫(xiě)人類歷史

豐譚筆錄
2026-01-09 07:50:09
26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

瓜汁橘長(zhǎng)Dr
2026-01-08 10:51:52
央國(guó)企的兩大弊端:領(lǐng)導(dǎo)層載歌載舞底層員工無(wú)米下鍋,關(guān)系戶橫行

央國(guó)企的兩大弊端:領(lǐng)導(dǎo)層載歌載舞底層員工無(wú)米下鍋,關(guān)系戶橫行

黯泉
2026-01-08 23:02:21
人財(cái)兩空!河北29歲帥哥李晨鵬去世,結(jié)婚半年中招,錯(cuò)診長(zhǎng)達(dá)一年

人財(cái)兩空!河北29歲帥哥李晨鵬去世,結(jié)婚半年中招,錯(cuò)診長(zhǎng)達(dá)一年

鋭娛之樂(lè)
2025-10-17 11:50:47
滬深兩市成交額第5次突破3萬(wàn)億,專家:標(biāo)志著A股轉(zhuǎn)入“全面牛市”新階段

滬深兩市成交額第5次突破3萬(wàn)億,專家:標(biāo)志著A股轉(zhuǎn)入“全面牛市”新階段

極目新聞
2026-01-09 16:47:01
52票贊成47票反對(duì)!美國(guó)投票結(jié)果公布;美國(guó)或?qū)⑹ヂ?lián)大投票權(quán)

52票贊成47票反對(duì)!美國(guó)投票結(jié)果公布;美國(guó)或?qū)⑹ヂ?lián)大投票權(quán)

南宗歷史
2026-01-09 10:24:03
中國(guó)財(cái)政供養(yǎng)人員達(dá)6846萬(wàn)?結(jié)構(gòu)失衡才是財(cái)政壓力的核心

中國(guó)財(cái)政供養(yǎng)人員達(dá)6846萬(wàn)?結(jié)構(gòu)失衡才是財(cái)政壓力的核心

流蘇晚晴
2025-12-04 19:27:08
胡忠雄在廣州與中山大學(xué)附屬第一醫(yī)院院長(zhǎng)肖海鵬黨委書(shū)記駱騰舉行座談

胡忠雄在廣州與中山大學(xué)附屬第一醫(yī)院院長(zhǎng)肖海鵬黨委書(shū)記駱騰舉行座談

知知貴陽(yáng)
2026-01-09 20:37:25
《魔發(fā)奇緣》真人選角曝光!金發(fā)美女+痞帥男主,網(wǎng)友:終于沒(méi)整黑人魚(yú)和棕雪公主!

《魔發(fā)奇緣》真人選角曝光!金發(fā)美女+痞帥男主,網(wǎng)友:終于沒(méi)整黑人魚(yú)和棕雪公主!

英國(guó)報(bào)姐
2026-01-08 22:21:22
李在明訪華剛回國(guó),就通告全球,與高市共進(jìn)晚餐,3億大單白簽?

李在明訪華剛回國(guó),就通告全球,與高市共進(jìn)晚餐,3億大單白簽?

南宮一二
2026-01-09 17:57:40
特斯拉宣布延長(zhǎng)部分地區(qū)保修時(shí)間,五年不限公里

特斯拉宣布延長(zhǎng)部分地區(qū)保修時(shí)間,五年不限公里

XCiOS俱樂(lè)部
2026-01-09 15:32:29
克洛澤:我是梅西球迷,若有人打破世界杯進(jìn)球紀(jì)錄我希望是他

克洛澤:我是梅西球迷,若有人打破世界杯進(jìn)球紀(jì)錄我希望是他

懂球帝
2026-01-09 16:14:30
安徽鹵味女神陳秀麗去世!僅37歲,因脖子長(zhǎng)疙瘩確診!曾想過(guò)輕生

安徽鹵味女神陳秀麗去世!僅37歲,因脖子長(zhǎng)疙瘩確診!曾想過(guò)輕生

鋭娛之樂(lè)
2026-01-08 15:55:05
閆學(xué)晶事件再升級(jí)!官媒下場(chǎng)發(fā)文銳評(píng),言辭犀利,句句直戳她心窩

閆學(xué)晶事件再升級(jí)!官媒下場(chǎng)發(fā)文銳評(píng),言辭犀利,句句直戳她心窩

攬星河的筆記
2026-01-07 16:04:46
“金屬牛市”恐怕今年就會(huì)戛然而止,金銀銅被重點(diǎn)列出!

“金屬牛市”恐怕今年就會(huì)戛然而止,金銀銅被重點(diǎn)列出!

中國(guó)能源網(wǎng)
2026-01-09 09:54:12
沈伯洋禍害全家!家族海內(nèi)外資產(chǎn)被凍結(jié),面臨破產(chǎn);子女留學(xué)被拒

沈伯洋禍害全家!家族海內(nèi)外資產(chǎn)被凍結(jié),面臨破產(chǎn);子女留學(xué)被拒

可樂(lè)愛(ài)微笑
2026-01-09 19:45:04
幫忙帶娃被網(wǎng)暴后續(xù),小姑子曬出多張證據(jù),親戚透露更多內(nèi)情

幫忙帶娃被網(wǎng)暴后續(xù),小姑子曬出多張證據(jù),親戚透露更多內(nèi)情

丁丁鯉史紀(jì)
2026-01-07 11:13:43
2026-01-09 23:28:49
游云庭律師 incentive-icons
游云庭律師
互聯(lián)網(wǎng)法律評(píng)論
129文章數(shù) 188關(guān)注度
往期回顧 全部

科技要聞

市場(chǎng)偏愛(ài)MiniMax:開(kāi)盤(pán)漲42%,市值超700億

頭條要聞

女子"出軌"已婚985高校博士后 看到其聊天記錄嚇傻了

頭條要聞

女子"出軌"已婚985高校博士后 看到其聊天記錄嚇傻了

體育要聞

金元時(shí)代最后的外援,來(lái)中國(guó)8年了

娛樂(lè)要聞

關(guān)曉彤鹿晗風(fēng)波后露面 不受影響狀態(tài)佳

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

助跑三年的奇瑞 接下來(lái)是加速還是起跳?

態(tài)度原創(chuàng)

家居
游戲
數(shù)碼
手機(jī)
公開(kāi)課

家居要聞

木色留白 演繹現(xiàn)代自由

開(kāi)服福利多到離譜!玩玩手機(jī)就能賺錢的日子終于來(lái)了

數(shù)碼要聞

Apple Watch「房顫歷史」功能獲批!國(guó)行用戶終于要等到了

手機(jī)要聞

165Hz實(shí)測(cè)爽翻!一加Turbo 6游戲續(xù)航雙在線

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版