国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從最近的洗稿爭議,想到大模型訓(xùn)練的素材許可

0
分享至

最近,又因為洗稿的事吵起來了。

不表態(tài),也沒有明確的態(tài)度,就說說看法。我記得多年前一位作家,撰文說自己夢中偶得一佳句“江湖夜雨十年燈”,結(jié)果不想是黃庭堅的詩句,被人笑話了一陣。

洗稿,是處于“人人都知道,但卻難以下定論”的一種狀態(tài)。


這其實很正常,很合理。

因為,著作權(quán)法保護的是思想的表達而非思想本身。思想一般指概念、術(shù)語、原則、客觀事實、創(chuàng)意、發(fā)現(xiàn)等等。表達則一般指是指對于思想觀念的各種形式或方式的表述,如文字的、音符的、數(shù)字的、線條的、色彩的、造型的、形體動作的表述或傳達等。顯然,洗稿就是從表達上改變,從而避開著作權(quán)法。嚴格地說,通過“洗稿”方式,篡改刪減,是可以不構(gòu)成侵權(quán)抄襲剽竊原創(chuàng)作品的。

知識產(chǎn)權(quán)的保護,本來就存在一定的模糊性。中國知識產(chǎn)權(quán)法學(xué)界的泰斗鄭成思曾說:“知識產(chǎn)權(quán)是一門詭辯的學(xué)科。

其實,要講獨創(chuàng)思路、觀點的話,這么多年,我就太多了,我文章的特點就是有觀點。都要追究,哪里追究得完。當然,我并不覺得該追究。別說所謂觀點,各類期刊直接把文章拿去發(fā),cnki一查。都很多。這個其實可以追究,但也麻煩。

比如,“智力的回歸”這個概念,我最初發(fā)在騰訊大家上的,把身高回歸的規(guī)律用在了智力上。我在網(wǎng)上搜索過,在我之前,沒人這么說過。如今,十多年過去,已經(jīng)成為常識了。那么,這是觀點的傳播還是洗稿?我能要求人人提到“智力回歸”都提到我的名字嗎?顯然,文章不是論文,沒辦法這樣要求。那么,不洗稿,觀點能傳播嗎?

其實,騰訊的洗稿評議機制,也在我公開發(fā)表的文章之后。當時是六神磊磊指控另一個大號周沖洗稿,引發(fā)業(yè)內(nèi)熱議。我當時提出,洗稿不違法,所以只能用行業(yè)評議解決。我是這么寫的:

洗稿乃至抄襲,大致上確定只需要兩個初中生,5分鐘,20塊錢。但法律上確定,需要請兩個博士后,5個月,200萬。如果洗稿的維權(quán)成本從后者變?yōu)榍罢撸S權(quán)就會變得簡單。所以,只有通過貝葉斯后驗的理念來進行判斷,即通過觀察到的信號來判斷發(fā)出信號的本質(zhì)。簡單地說就是,如果一只鳥多次看起來像鴨子,多次聽起來像鴨子,那么,它就是鴨子。


后來騰訊就有了洗稿評審,現(xiàn)在,我也不時能收到評議需求。不過,我當時提出的是對公號原創(chuàng)程度的標識,騰訊現(xiàn)在應(yīng)該是直接刪除。我提標注,是因為洗稿并不侵權(quán),刪除有法律風(fēng)險。不過,騰訊可以基于用戶協(xié)議刪除。

這類例子,很多我也想不起了。

比如,最近想寫一篇文章,核心觀點就幾個字“優(yōu)質(zhì)教育資源,是不可能增加的,因為拼教育資源是為了競爭,而不是多學(xué)知識。人們要的是排序,而不是絕對值?!边@個觀點,隨著國家抹平內(nèi)卷的效率,過個十來年也許也會成為常識。

但法律并不能,也不該保護“觀點是我的”。因為傳播必然伴隨啟發(fā),傳播和啟發(fā)是同時發(fā)生的,而且,啟發(fā)應(yīng)該再次被傳播。而且,這個過程,正是法律想要保護的。某種程度上,它也是作者本身想達到的目的。

我們追求的正是這種外部性。

天下文章一大抄,這話說的是一個一直存在的現(xiàn)象。這其實很難免。

太陽之下無新事,常識需要不斷說,被別人重復(fù),被自己重復(fù)。當然,我用自己之前的說理,我肯定會改改,不能完全一樣,或者引入當時的具體事件。再比如某個2萬字的報告,有人總結(jié)了,我拿過來,改一下就用。或者某個新聞,有人總結(jié)了,我改一下用。一般來說,我接到洗稿評議,文章只是洗一兩段,不是核心部分,我不會給出洗稿的判斷。

對于洗稿質(zhì)疑,當然還沒人質(zhì)疑過我哈,我覺得是不需要回應(yīng)的。因為我就是觀點產(chǎn)出型的,洗稿的指控對我不會有多大傷害。這同樣是基于貝葉斯后驗的,要多次看起來像洗稿,才能構(gòu)成對能力的質(zhì)疑。

寫這篇文章的時候,從洗稿想到AI訓(xùn)練的版權(quán)問題。這也是最近知識產(chǎn)權(quán)領(lǐng)域的爭論點?,F(xiàn)在有很多觀點了,我補充一個更底層的。(寫完了才發(fā)現(xiàn),這本身就是一個關(guān)于觀點傳播和洗稿的辨析例子)


第一個問題,訓(xùn)練是不是對素材的商業(yè)性應(yīng)用?

如果一個人看了一部電影,比如阿凡達,從中受到啟發(fā),創(chuàng)造了另一種外星人的形象。這個形象不侵權(quán),完全不一樣。那么,可以說他對阿凡達進行了商業(yè)性應(yīng)用嗎?

一本書,讓一個人讀了,這個人學(xué)到一個道理,一個句式,產(chǎn)生了一幅圖像,得到一個靈感,應(yīng)用到了另一個地方。

這就是所謂的“啟發(fā)”。顯然,這不構(gòu)成對這本書、這部電影的商業(yè)應(yīng)用。正如我前面所說,法律不可能限制“啟發(fā)”——這正是知識產(chǎn)權(quán)保護想要達到的目標。

那么,就進到第二個問題:啟發(fā)這個詞,形容的是一種觸類旁通的關(guān)系,是發(fā)散的、具有不確定性的智能上的因果關(guān)系。只有人才具有智能,所以,只有人才能受到啟發(fā)。那么,機器,從訓(xùn)練到生成文本或圖片,還是“啟發(fā)”嗎?

如果不是,反過來,則構(gòu)成對素材的商業(yè)應(yīng)用。某種程度上,就是另一種形式的洗稿。

那么,AI訓(xùn)練,從訓(xùn)練到生成新文本,是一種洗稿還是啟發(fā)?

如果計算機具有智慧的某種特征,那么,就可以視為啟發(fā)?,F(xiàn)在說大模型已經(jīng)有了涌現(xiàn)現(xiàn)象,應(yīng)該視為一個智能體。我覺得更關(guān)鍵的是,涌現(xiàn)具有發(fā)散性、不確定性的特征。

大模型中有很多隨機性。比如,temperature參數(shù)會直接改變輸出token的概率,這個參數(shù)甚至可以從外部環(huán)境調(diào)用,以獲得隨機性。

openai的api中也用seed這個參數(shù)來改變生成策略的隨機種子。

不同型號的GPU 之間的浮點數(shù)計算可能會略有差異,不能保證bit級別的一致性。這些差異,在巨大的參數(shù)累積下,剛開始生成的token是一樣的,但是從某個 token 開始,后續(xù)的生成結(jié)果就不一樣了。從這個角度,涌現(xiàn),也有發(fā)散、不確定性的特征。

這些隨機性,很多已經(jīng)是不可還原的了。這種不可還原的發(fā)散和不確定性,可以認定類似人類智慧,所以,訓(xùn)練是被啟發(fā),而不是洗稿,那么,就不構(gòu)成商業(yè)應(yīng)用,就無需許可。


單純從數(shù)量上說,資料浩如煙海,參數(shù)多數(shù)繁星,很難認定“素材——產(chǎn)出”的因果關(guān)系。而沒有這種因果關(guān)系,當然不構(gòu)成商業(yè)應(yīng)用,所以,自然不需要特殊的許可。凡是公開的,都可以被合法地用來訓(xùn)練。

或者說,只要被人看到是合法的,無需許可,那么,被用來訓(xùn)練,就無需許可。

需要注意的是,有這樣一種論證方式:人作為智能體,是有民事權(quán)利的。這是“啟發(fā)”的法律前提。但顯然,大模型沒有這個資格,所以,它不能被“啟發(fā)”。但是,這種論證只是循環(huán)論證。

這一段中,一些技術(shù)細節(jié),是我查閱的,然后拿來用了,另一些技術(shù)細節(jié)我本來就知道(當然,也是從其他地方看到),但這都并不影響我這段論述的原創(chuàng)性。

這一段論述,遇到相關(guān)話題,我肯定是要用的,不然挺可惜的。如果有人洗稿了,我也會不高興,但時間足夠長,我也就無所謂了??傊?,要求高沒錯,辯解也沒錯,都不必太在意。

劉 遠 舉


央視網(wǎng)、第一財經(jīng)、光明日報、騰訊大家、南方周末、新京報、南方都市報、FT中文網(wǎng)、澎湃等特約作家,多家智庫研究員。

關(guān)注時政、財經(jīng)、科技話題,以深度、專業(yè)、理性的態(tài)度,去掘現(xiàn)象背后的事實。

中國科技自媒體50人

第35屆中國新聞獎評論三等獎

第34屆中國經(jīng)濟新聞獎評論二等獎

第28屆北京新聞獎一等獎

2024年湖南新聞獎一等獎

騰訊大家年度作家獎

新浪最有價值專欄作家獎

紅辣椒評論年度佳作獎

已開快捷轉(zhuǎn)載,歡迎轉(zhuǎn)載

已開過白名單的公眾號,轉(zhuǎn)載請遵循轉(zhuǎn)載規(guī)則

您的關(guān)注是最好的支持!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
全網(wǎng)唱衰的下嫁!嫁普通人5年,前任是法拉利總裁,終究還是輸了

全網(wǎng)唱衰的下嫁!嫁普通人5年,前任是法拉利總裁,終究還是輸了

橙星文娛
2026-04-18 16:42:58
降速闖臺海的日本"雷"號軍艦 別忘了當年的下場

降速闖臺海的日本"雷"號軍艦 別忘了當年的下場

看看新聞Knews
2026-04-19 00:28:03
表妹與表哥亂倫8年,表嫂竟然默許!表哥欲拋棄表妹后被舉報貪腐

表妹與表哥亂倫8年,表嫂竟然默許!表哥欲拋棄表妹后被舉報貪腐

胡侃社會百態(tài)
2026-04-18 12:06:59
騎士126-113贏猛龍,3人迎來里程碑!這一戰(zhàn)我不得不承認5個現(xiàn)實

騎士126-113贏猛龍,3人迎來里程碑!這一戰(zhàn)我不得不承認5個現(xiàn)實

毒舌NBA
2026-04-19 04:58:48
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
巴薩皇馬狂喜!馬競5-6爆冷丟國王杯:決賽輸給皇社 小蜘蛛2年0冠

巴薩皇馬狂喜!馬競5-6爆冷丟國王杯:決賽輸給皇社 小蜘蛛2年0冠

風(fēng)過鄉(xiāng)
2026-04-19 06:22:13
快訊!伊朗大概率又要挨揍了!

快訊!伊朗大概率又要挨揍了!

達文西看世界
2026-04-19 09:06:22
不會干,你就別干了!中國勒令馬士基停運,巴拿馬的反應(yīng)很有意思

不會干,你就別干了!中國勒令馬士基停運,巴拿馬的反應(yīng)很有意思

阿腩講娛樂
2026-04-18 13:00:07
詹俊:羅塞尼爾真的水平有限;曼聯(lián)聯(lián)賽第三穩(wěn)了

詹?。毫_塞尼爾真的水平有限;曼聯(lián)聯(lián)賽第三穩(wěn)了

懂球帝
2026-04-19 05:29:08
更新大潮來了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

更新大潮來了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

專業(yè)聊房君
2026-04-18 16:45:50
美媒:特朗普的算盤空了,委內(nèi)瑞拉的高價油,中國連一桶都不肯買

美媒:特朗普的算盤空了,委內(nèi)瑞拉的高價油,中國連一桶都不肯買

人類文明之光
2026-04-19 08:37:10
意甲懸念終結(jié) 衛(wèi)冕冠軍2場不勝送禮 國米12分領(lǐng)跑 下輪或奪第21冠

意甲懸念終結(jié) 衛(wèi)冕冠軍2場不勝送禮 國米12分領(lǐng)跑 下輪或奪第21冠

我愛英超
2026-04-19 07:09:49
荷蘭政府花200億挽留無效,光刻機巨頭ASML為何執(zhí)意從老家搬走?

荷蘭政府花200億挽留無效,光刻機巨頭ASML為何執(zhí)意從老家搬走?

普陀動物世界
2026-04-18 00:30:08
4月21日油價調(diào)整!不是近5毛,別被忽悠

4月21日油價調(diào)整!不是近5毛,別被忽悠

沙雕小琳琳
2026-04-18 20:41:21
英媒:丁俊暉在32強中墊底!央媒:丁俊暉練習(xí)賽車提升擊球精準度

英媒:丁俊暉在32強中墊底!央媒:丁俊暉練習(xí)賽車提升擊球精準度

求球不落諦
2026-04-19 00:21:51
光通信風(fēng)口轉(zhuǎn)向:別盯光模塊,MLCC才是下一個核心主線

光通信風(fēng)口轉(zhuǎn)向:別盯光模塊,MLCC才是下一個核心主線

普陀動物世界
2026-04-18 20:12:11
俄外長剛歸國,普京就在開會時發(fā)火!但他心中明白:中方已盡力了

俄外長剛歸國,普京就在開會時發(fā)火!但他心中明白:中方已盡力了

夢醉為紅顏一笑
2026-04-18 17:55:00
騎士1-0猛龍!哈登承認錯誤,米切爾重點提到一人,湖人舊將拉胯

騎士1-0猛龍!哈登承認錯誤,米切爾重點提到一人,湖人舊將拉胯

魚崖大話籃球
2026-04-19 07:43:57
不建議有司機大老板買小米!雷軍回應(yīng)小米YU7二排比邁巴赫多一度:沒有詆毀 但確實多

不建議有司機大老板買小米!雷軍回應(yīng)小米YU7二排比邁巴赫多一度:沒有詆毀 但確實多

快科技
2026-04-18 10:12:12
斯諾克世錦賽:中國雙星不??!趙心童創(chuàng)紀錄,張安達2-2暫平名將

斯諾克世錦賽:中國雙星不??!趙心童創(chuàng)紀錄,張安達2-2暫平名將

劉姚堯的文字城堡
2026-04-18 19:12:24
2026-04-19 11:12:49
劉遠舉 incentive-icons
劉遠舉
易起探尋現(xiàn)象背后的事實與公正
368文章數(shù) 1523關(guān)注度
往期回顧 全部

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

頭條要聞

牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

體育要聞

掘金擒狼開門紅:五花肉與小辣椒

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

華誼兄弟,8年虧光85億

科技要聞

50分26秒!榮耀獲得人形機器人半馬冠軍

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

數(shù)碼
旅游
手機
公開課
軍事航空

數(shù)碼要聞

聯(lián)想ThinkPlus 190W移動電源開售,售價349元

旅游要聞

太原直飛莫斯科旅游包機復(fù)航

手機要聞

蘋果調(diào)整App Store更新入口位置,網(wǎng)頁端新增外區(qū)訪問限制!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗宣布關(guān)閉霍爾木茲海峽

無障礙瀏覽 進入關(guān)懷版