国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

詹韞如:反不正當競爭法下知識蒸餾違法性的認定 | 知識產權202511

0
分享至

【作者】詹韞如(上海交通大學凱原法學院博士研究生)

【來源】北大法寶法學期刊庫《知識產權》2025年第11期(文末附本期期刊目錄)。因篇幅較長,已略去原文注釋。


內容提要:隨著知識蒸餾技術在人工智能領域的廣泛應用,關于知識蒸餾合法性的探討日益增多。知識蒸餾即通過訓練更輕量的學生模型以充分接近參數規(guī)模較大的、高性能的教師模型?!爸R”雖包含部分表達屬性,但其并非具備表現形式的人類智力成果,系著作權法未覆蓋的商業(yè)成果,故反不正當競爭法得以有限介入。對于知識蒸餾涉嫌侵犯具備類似絕對權利的商業(yè)秘密的情形,可通過修正的“權益—損害”范式予以規(guī)制。以不正當手段對已采取合理保密措施的模型進行蒸餾涉嫌侵犯商業(yè)秘密,但當行為人對“知識”的載體具備合法處分權,且蒸餾屬于替代成本較低的反向工程時將阻卻違法性。對于存在搭便車嫌疑的知識蒸餾行為,依行為中心主義分析思路可知,其雖屬搭便車行為,但未扭曲優(yōu)勝劣汰的市場競爭機制,無法證成行為違法性?;诖耍婷髦R蒸餾的不正當競爭違法性認定邊界,以促進實現技術創(chuàng)新進步與市場公平競爭的雙贏。

關鍵詞:知識蒸餾;商業(yè)秘密保護;反向工程;搭便車;反不正當競爭法

目次 一、問題的提出 二、知識蒸餾的反不正當競爭法規(guī)制前提 三、知識蒸餾侵犯商業(yè)秘密的違法性認定 四、知識蒸餾構成搭便車的違法性認定 結語

問題的提出

2025年1月20日,杭州深度求索人工智能基礎技術研究有限公司(以下簡稱DeepSeek)發(fā)布開源模型DeepSeek-R1,憑借低訓練成本、高性能的優(yōu)勢在全球范圍內掀起了一場人工智能風暴,而這一顛覆性表現的核心驅動力是其對“知識蒸餾”(knowledge distillation)技術的應用。1月29日,OpenAI公司通過《金融時報》等媒體指控DeepSeek未經許可采取蒸餾技術從OpenAI的專有模型中提取“知識”進行模型訓練,違反了OpenAI服務協(xié)議中關于“禁止復制其任何服務”和“利用其模型輸出開發(fā)競爭模型”的規(guī)定,并涉嫌知識產權侵權。OpenAI目前雖然沒有啟動進一步的法律訴訟程序,但表示未來會采取更加積極主動的策略保護其技術。2025年8月,Mistral公司的Mistral-small-3.2模型被質疑直接蒸餾自DeepSeek-v3模型,且未披露模型蒸餾的事實、刻意歪曲基準測試結果。截至目前,Mistral公司還未對蒸餾一事作出回應。

上述事件引發(fā)了國內外學者對于知識蒸餾技術在著作權法和反不正當競爭法層面的合法性探討。在著作權法層面,持肯定論的學者從著作權法保護客體的范疇、“三步檢驗法”和“轉換性使用”等角度論證了蒸餾技術的法律正當性,持否定論的學者則認為基于數據核心集的蒸餾行為侵害了單個數據所有者的著作權。在反不正當競爭法層面,有學者認為知識蒸餾技術降低了模型的再訓練成本,涉嫌“搭便車”(free-riding)行為,面臨構成不正當競爭的風險。也有學者提出若知識蒸餾未侵犯知識產權、未導致消費者混淆且未實質性替代教師模型(teacher model),該行為則不應被反不正當競爭法規(guī)制。

學者對知識蒸餾技術合法性的探討,促使對爭議根源進行檢視。首先,學者對知識蒸餾的技術邏輯存在認知模糊,導致部分風險推斷結論出現偏差。例如,對于蒸餾的對象是模型參數還是“知識”、蒸餾是否必然利用教師模型、蒸餾是否需要訪問原始數據等問題,均存在不同認識。其次,研究中存在將著作權法和反不正當競爭法割裂分析的傾向,導致對知識蒸餾合法性的探討呈碎片化、孤立化特征。這些爭議實則并非全然相互獨立——知識產權專門法和反不正當競爭法在維護競爭秩序目標上的互動關系,影響對知識蒸餾合法性的認定。針對既有研究存在的問題,本研究將充分拆解知識蒸餾的底層技術邏輯,在此基礎上審視技術的法律風險。從商品與銷售方式二分思路出發(fā),知識蒸餾既涉嫌侵犯商業(yè)秘密行為,也存在是否構成阻礙教師模型提供服務的“搭便車”行為的爭議,可分別采取修正的“權益—損害”范式和行為中心主義分析框架,對知識蒸餾的違法性邊界予以認定。

知識蒸餾的反不正當競爭法規(guī)制前提

規(guī)制的選擇需要以對技術和法律關系的充分認識為基礎。在對知識蒸餾的法律規(guī)制進行探討前,須澄清知識蒸餾的技術邏輯和規(guī)制思路等基礎問題,知識蒸餾技術的合法性爭議均與對上述問題的認識相關。

(一)知識蒸餾的技術邏輯

知識蒸餾作為一種新型模型壓縮與知識遷移技術,與權重剪枝、量化、低秩分解等傳統(tǒng)壓縮技術相比,具有顯著降低計算負載且維持模型性能的優(yōu)勢。蒸餾的核心邏輯既包含對不同類型“知識”的處理和傳遞,也涉及多元的蒸餾方式。基于此,從技術本質、“知識”分類、蒸餾方式三個層次解析知識蒸餾的技術邏輯,有助于在充分理解知識蒸餾技術的基礎上展開進一步的法律分析。

1. 知識蒸餾的本質

從卷積網絡到深層寬層網絡和大型預訓練模型,高性能模型的發(fā)展面臨著如何在有限計算資源和儲存空間里解決龐大參數量和計算需求的問題,因此模型的復雜設計與輕量化模型部署之間的矛盾不斷深化。2006年,為緩解該問題,克里斯蒂安·布奇盧阿(Cristian Buciluǎ)等提出了模型壓縮技術,即利用復雜模型大規(guī)模標注偽數據(pseudo data),并在此數據集的基礎上訓練輕量級替代模型,使小模型的輸出函數接近復雜模型的映射關系。2015年,杰弗里·辛頓(Geoffrey Hinton)等持續(xù)拓展模型壓縮和遷移方法,正式提出“知識蒸餾”概念。其邏輯在于,開發(fā)者向教師模型輸入數據樣本后,該模型的隱藏層生成概率分布形成軟標簽(soft targets),并將該輸入樣本給學生模型(student model)生成軟性預測值(soft prediction),將教師模型的軟標簽作為假定的真實值設置損失函數,通過調整溫度參數、損失權重等超參數優(yōu)化學生模型,直至其預測分布與軟標簽的差異收斂至預設閾值。概言之,知識蒸餾的本質即通過訓練更小、更輕量的學生模型以充分接近參數規(guī)模較大的、高性能的教師模型。

2. “知識”的分類

通過知識蒸餾技術,學生模型學習的內容是“知識”而非模型參數,這意味著知識蒸餾并不會將教師模型的參數直接復制至學生模型中,而是利用教師模型在推理過程中產生的輸出特征、中間特征或關系來引導學生模型學習?!爸R”本質上是一種函數映射關系,主要包括三種類型。第一,基于輸出特征的“知識”,即利用教師模型最后一層神經元的輸出指導學生模型訓練,經過softmax層激活的“知識”是概率分布輸出,未經過softmax層激活的“知識”為Logits輸出。其關注的是類別層面的預測概率分布,結構簡單,便于學生模型學習,最經典的方法便是杰弗里·辛頓在2015年提出的軟標簽式蒸餾。第二,基于中間特征的“知識”,即利用神經網絡中間層特征圖中的“知識”指導學生模型訓練。該類型更為豐富,關注到模型內部的表征能力,而不僅僅是最終預測結果,但可能存在維度和語義不匹配的問題。第三,基于關系的“知識”,其關注樣本之間或者特征之間的關聯關系,而不是單個輸出或單個特征值。這些關系內容有助于學生模型在模仿教師模型輸出的同時,理解其內部的推理邏輯,但同時伴隨著實現復雜、計算量大的問題。簡言之,學生模型旨在學習的并非教師模型的輸出結論,而是其生成結論所依據的“推理過程”和“思維范式”。

3. 知識蒸餾的學習方式

知識蒸餾的學習方式通??梢苑譃殡x線蒸餾(offline distillation)、在線蒸餾(online distillation)、自蒸餾(self-distillation)、無數據蒸餾(data-free distillation)、多教師蒸餾(multi-teacher distillation)和助理蒸餾(assistant distillation)。離線蒸餾是在完成對教師模型預訓練的基礎上,從該模型中提取“知識”以指導學生模型的訓練,近年來發(fā)展出標準蒸餾和跨任務跨模態(tài)蒸餾等方式。該訓練流程較為簡單,師生模型可分別進行離線訓練。在線蒸餾能夠同時訓練師生模型,訓練過程動態(tài)更新,從而提升模型適配性。自蒸餾通過模型內部不同層之間的互相蒸餾(layer-to-layer distillation),實現模型性能的自我提升,并降低計算和存儲負擔,但其蒸餾效果取決于模型本身的潛力。無數據蒸餾可以在不訪問原始數據的情況下,通過生成數據或其他輔助數據進行蒸餾,常適用于數據隱私敏感場景。多教師蒸餾即學生模型可以從多個教師模型中學習“知識”,提升適配和泛化能力。助理蒸餾指的是在教師與學生模型之間引入一個或多個助理模型(assistant model),由該模型逐步將“知識”從教師模型傳遞至學生模型,類似于“多級壓縮”。

由此可見,一方面,并非所有的知識蒸餾都涉及對教師模型的利用。例如,自蒸餾并不借助外部教師模型,而是通過模型自身不同層次之間的內部遷移實現知識傳遞。另一方面,并非所有的知識蒸餾均須依賴原始訓練數據。無數據蒸餾通過生成或合成數據的方式,降低了對原始數據的依賴。關于知識蒸餾的違法性爭議多現于離線蒸餾、在線蒸餾、多教師蒸餾和助理蒸餾的方式。

(二)“知識”是著作權法未覆蓋的商業(yè)成果

在探討知識蒸餾在著作權法上的合法性問題之前,應先判斷“知識”是否落入著作權法的覆蓋范疇和保護范圍,進而考量其是否達到保護條件。根據我國《著作權法》第3條的規(guī)定,著作權法所稱的作品是文學、藝術和科學領域內具有獨創(chuàng)性并能以一定形式表現的智力成果。然而,“知識”中雖然包含部分表達的屬性,但其并非具備表現形式的人類智力成果,“知識”是著作權法未覆蓋的商業(yè)成果。

1. “知識”中思想和表達共存

著作權法的保護范圍為表達而非思想,這是現代著作權法的核心原則。雖然學者將想法、涵義、抽象內容等明確劃入思想的范疇,但思想和表達本身難以被抽象概括和區(qū)分。目前,著作權法理論和實踐中常用“抽象—過濾—對比法”界分思想與表達,即承認思想和表達在作品的不同抽象層次中處于混合狀態(tài),進而根據抽象程度的不同,逐級排除各種涵義的思想。抽象過濾步驟需要回溯知識蒸餾的整體過程,思想與表達共同存在于“知識”中不同抽象程度的層次中。

首先,作為抽象過程之終點的數值輸出(包括概率分布、特征表示等)可以被直接排除,這是與表達完全無涉的事物,屬于思想的范疇。利用思想而非表達的技術性使用在司法實踐中已有較為豐富的體現。1992年,法院在“世嘉訴雅可萊德案”(Sega v. Accolade)中首次提出非表達性使用(non-expressive use)。在該案中,被告雅可萊德公司通過反向工程手段將世嘉公司的程序代碼復制到計算機內存里進行反編譯,從而使其游戲能夠兼容世嘉公司的主機。法院認為,雅可萊德實施反編譯的目的并非照搬世嘉的表達性創(chuàng)作,而是為進行非表達性使用。非表達性使用未破壞作品的原始價值,也未以再現訓練作品的獨創(chuàng)性表達為目的,因此不具備侵權可能性。學生模型對教師模型的概率分布、特征表示的蒸餾僅利用了教師模型的思想而未利用其表達,同樣是一種非表達性使用,其蒸餾過程不會再現或復制教師模型的原創(chuàng)性表達,而是傳遞模型的決策模式,以便在更輕量的模型中保留性能,因而這部分“知識”屬于思想的范疇。

其次,激活函數(如softmax輸出)將教師模型輸出向量轉換為概率分布,該生成過程依賴于教師模型的具體參數排列和輸入數據,是一種具體的計算表達。換言之,給定教師模型參數與輸入樣本,softmax的輸出結果具有確定性和可再現性,那么學生模型在學習后可能會輸出與教師模型相似的表達結果。這部分“知識”屬于足夠具體的結構層級而應納入表達的范圍。

2. “知識”不是具備表現形式的人類智力成果

即便認可“知識”中包含有表達的屬性,其也不屬于著作權法意義上“作品”的范疇。首先,知識蒸餾中的“知識”不是人類智力成果。創(chuàng)作作品的自然人是作者,毋庸置疑系該作品的著作權人。但是,大模型輸出內容是否是人類智力成果頗具爭議。部分學者主張人工智能生成內容是人類智力活動的產物,其在外在表現形式上能夠達到獨創(chuàng)性要求,應給予著作權法層面的保護,以促進人工智能產業(yè)發(fā)展。但有更多學者認為人工智能生成內容并非由人類以人工智能為工具創(chuàng)作的作品,雖然其輸出內容在很大程度上依賴于使用者的輸入指令,但人工智能研發(fā)者和使用者都無法直接決定人工智能生成的具體內容,輸出內容難以具備獨創(chuàng)性,故其無法受到我國著作權法的保護。從比較法視野來看,美國版權局于2025年1月29日發(fā)布《版權與人工智能 第二部分:可版權性》報告,強調版權保護必須建立在人類創(chuàng)作的基礎上,意即只有人類創(chuàng)作的作品才能獲得版權法的保護,而純粹由人工智能生成的內容無法受到法律保護。在我國“菲林案”中,法院認為自然人創(chuàng)作應是著作權法上作品成立的必要條件之一,即便人工智能生成作品在內容、形態(tài)等方面都無限接近于自然人創(chuàng)作的作品,亦不能構成著作權法意義上的作品。知識蒸餾通過教師模型的輸出來訓練學生模型,人類的智力活動體現于設計蒸餾程序、設定超參數等技術性操作中,而蒸餾所提取的“知識”并非由人類直接創(chuàng)作產生,而是模型生成的結果。因此,知識蒸餾中的“知識”并非人類的智力成果。

其次,“知識”不具備著作權法意義上的表現形式。著作權法意義上的表現形式通常為文字、圖像、音樂等可被感知的形態(tài),從這一點出發(fā),如果人工智能生成內容是能夠被人類客觀理解的外在表達,即在表達方式、敘事框架、表述結構等形式上高度類似人類創(chuàng)作的文本、圖像或音視頻,則構成具備表現形式的智力成果。在“AI文生圖第一案”中,北京互聯網法院將人工智能生成圖片認定為作品的前提條件之一即該圖片是由線條、色彩構成的具有審美意義的視覺呈現。但是,知識蒸餾中的“知識”常表現為概率分布、軟標簽、特征圖等,并非一般意義上可以被人類理解的表達方式,因此“知識”不具備著作權法意義上的表現形式。

(三)知識蒸餾的反不正當競爭法規(guī)制思路

知識蒸餾在著作權法上的規(guī)制困境,促使學者將規(guī)制視角轉向反不正當競爭法。知識產權專門法與反不正當競爭法之間發(fā)展出了“冰山”與“海水”、兜底保護與有限的補充保護三種主流關系。“冰山”與“海水”的關系曾廣為流傳,即知識產權專門法被視為海面上的“冰山”,反不正當競爭法則被視為“冰山”下的“海水”以彌補專門法之“漏”。由“冰山”與“海水”關系延伸出了“兜底保護說”,其認為反不正當競爭法是知識產權專門法的兜底法,當出現知識產權單行法無法保護的客體時,由反不正當競爭法提供兜底保護。該說在司法實踐中影響深遠,然而其不適當地擴張了知識產權的保護范圍。

為避免對知識產權保護的泛化,司法政策逐漸轉向強調“有限補充保護說”,即反不正當競爭法對知識產權專門法僅發(fā)揮有限的補充作用,而非承擔寬泛的兜底功能。目前,“有限補充保護說”在理論和實務界占據較為主流的地位,原因在于該說認可知識產權法維系權利保護和自由競爭功能的獨立性,在不抵觸知識產權專門立法的同時,避免過度侵占公有領域,使知識產權權利保護和激勵增量創(chuàng)新之間實現盡可能的平衡。在“有限補充保護說”下,反不正當競爭法保護知識產權的邊界為:對于落入知識產權專門法保護范圍且符合保護條件的對象,反不正當競爭法不再予以考慮;對于落入專門法保護范圍而不符合保護條件的,也不再以反不正當競爭法進行補充保護;而對于專門法未覆蓋的商業(yè)成果,則可以借助反不正當競爭法進行保護,但需要側重考察行為是否落入反不正當競爭法的規(guī)制范圍且符合其規(guī)制邏輯。近年來,在科技發(fā)展催生的新型法益領域,常通過全新的利益衡量,以反不正當競爭法實施過渡性保護。

根據前述,由于知識蒸餾的“知識”是著作權法未覆蓋的商業(yè)成果,這為反不正當競爭法的有限介入提供了契機。然而,目前對不正當競爭行為的認定缺乏能夠彌合抽象與具體的共識性框架。我國反不正當競爭法采取“具體列舉+一般條款”的立法結構,立法本意在于通過列舉類型和彈性兜底的結合,在降低法條適用成本的同時也能應對復雜多變的市場環(huán)境,從而構建起對反不正當競爭行為的全面規(guī)制。但是,由于各具體條款的分析要件不通約、缺乏價值指引,一般條款的適用也未形成共性的分析框架,導致法官在司法實踐中要么機械套用具體條款的構成要件、要么寬泛適用一般條款。以此為背景,學者致力于構建反不正當競爭法的一般性分析框架。

反不正當競爭法的分析路徑從對“權益—損害”范式的廣泛批判,到近年來涌現出行為中心主義范式、修正的構成要件范式、綜合評估模式等多種分析框架,但并未達成共識性結論。商品與銷售方式二分視角為反不正當競爭法的一般性分析提供了新的思路,司法實踐中廣泛適用的“法益說”能夠較好地解釋技術成果的商業(yè)秘密保護、未注冊知名商標的反混淆保護等趨近絕對權保護的行為,故采取原則保護、公益例外不保護的態(tài)度;而對于特定的虛假宣傳、商業(yè)賄賂等銷售型行為,遵循原則允許、公益例外禁止的態(tài)度。

因此,從商品與銷售方式二分視角審視知識蒸餾行為,可以發(fā)現其既涉嫌侵犯類似絕對權利的商業(yè)秘密,也深陷蒸餾是否阻礙教師模型提供服務的搭便車行為爭議。前者是反不正當競爭法補充保護的趨近絕對權利的傳統(tǒng)型知識產權法益,強調對商品或服務本身價值的保護。對于這類法益,可以采取修正式的“權益—損害”范式提供較高標準的保護。后者不必然造成教師模型的產品價值無法實現,須以行為中心主義思路對特定搭便車行為的違法性作進一步認定。

知識蒸餾侵犯商業(yè)秘密的違法性認定

在厘清知識蒸餾的反不正當競爭法規(guī)制前提和思路后,可進入對知識蒸餾違法性認定邊界的討論。目前對該問題的探討聚焦于其是否構成侵犯商業(yè)秘密的不正當競爭行為。以不正當手段侵犯商業(yè)秘密屬于反不正當競爭法規(guī)制的法定形態(tài),對于符合行為要件的基本可以認定為不正當行為。延續(xù)傳統(tǒng)“權益—損害”范式的可取之處在于其蘊含著諸多司法經驗,但該范式往往忽視對違法阻卻事由的考慮。因此,在知識蒸餾中,首先須分析“知識”作為商業(yè)秘密的邊界,以及學生模型在蒸餾過程中是否以不正當手段獲取或使用了教師模型中的商業(yè)秘密;其次,探討是否存在形式上符合侵犯商業(yè)秘密行為構成但實質上未造成競爭扭曲的違法阻卻機制,這是修正“權益—損害”范式和傳統(tǒng)范式的主要差異所在。

(一)“知識”作為商業(yè)秘密的邊界

知識蒸餾中,“知識”如果滿足商業(yè)秘密的構成要件,即不為公眾所知、具有商業(yè)價值、采取相應保密措施、屬于技術信息或經營信息等商業(yè)信息,那么“知識”屬于商業(yè)秘密。

1. “知識”的商業(yè)價值性

反不正當競爭法中的“商業(yè)價值”不僅包含具有明確市場交換價格的經濟利益,還涵蓋能帶來競爭優(yōu)勢、效率提升或市場機會的潛在價值。在知識蒸餾中,“知識”毋庸置疑具備商業(yè)價值。在“B612特效模型案”中,法院比對了原被告模型在結構、卷積層數據、分辨率、激活函數等方面的差異,認為模型的結構和參數是經大量人力、物力、財力投入所形成的成果,應屬于反不正當競爭法所保護的競爭利益。學生模型從教師模型蒸餾出的“知識”雖然不是直觀的模型參數,而是人類不易理解的概率分布、向量和相似度矩陣等內容,但能夠讓學生模型“站在教師模型的肩膀上”,極大地節(jié)約模型研發(fā)成本。同時,更輕量化且高性能的學生模型可以在更多終端實現高效部署,拓展更多商業(yè)場景,為蒸餾后的模型帶來競爭優(yōu)勢。

2. “知識”的秘密性

從教師模型蒸餾出的“知識”具備秘密性。秘密性所指的“信息不為公眾所知悉”,強調信息不為所屬領域的相關人員普遍知悉且難以以低成本手段獲取。換言之,秘密性要求信息不能從公開渠道直接獲取,并且所屬領域的相關人員要付出較高成本才能取得。一方面,蒸餾的“知識”具有非公開性。模型分為開源模型(open-source model)和閉源模型(closed-source model)兩類,開源模型即全部或部分公開模型權重、代碼、訓練方法等內容,常見協(xié)議如MIT、Apache 2.0、GPL等,其規(guī)定了用戶使用、修改和再分發(fā)模型的條件。閉源模型不公開前述信息,通常以API接口或商業(yè)許可的方式提供服務,這意味著用戶需要通過訂閱或購買API調用次數來使用閉源模型。然而,不論是開源還是閉源模型,知識蒸餾的方法和邏輯以及學生模型蒸餾出的概率分布、特征圖和關系結構,均為模型內部加工的結果,不會自然進入公共領域。另一方面,知識蒸餾的實現依賴復雜的程序設計、參數設定、高成本的算力資源與資金,即便是所屬領域的相關人員,也難以通過低成本手段獲取“知識”。因此,從教師模型蒸餾出的“知識”具備秘密性。

3. “知識”的保密性

商業(yè)秘密相關法律制度的規(guī)范目的在于為商業(yè)秘密提供專有保護的同時,保護信息的流動利益,鼓勵以合理的替代渠道謹慎分享商業(yè)秘密的行為。合理的保密措施應與預期成本平衡,而非要求信息持有人采取超出合理限度的方式維持信息秘密性。因此,一般認為保密措施無需實施至“萬無一失”的程度。盡管理論層面對該規(guī)范目的已達成基本共識,但實踐中對合理保密措施的認定仍有顯著分歧。法院通常從主客觀兩個維度對保密措施的合理性進行認定,要求信息持有人必須有將信息作為商業(yè)秘密進行保護的主觀意圖,且實施了客觀的保密措施(如客觀上可以被識別、有具體的秘密范圍等)。然而,關于客觀的保密措施應實施至何種程度,目前并無定論?!蹲罡呷嗣穹ㄔ宏P于審理侵犯商業(yè)秘密民事案件適用法律若干問題的規(guī)定》(法釋〔2020〕7號)指出該程度應“與商業(yè)秘密的商業(yè)價值”相符合,有法院認為保密措施應當達到“嚴格且全面”的程度或足以抵抗反向工程,也有法院對保密措施的程度采取較寬松的標準。判斷教師模型是否采取了合理的保密措施應綜合考慮保密成本和主客觀目的,并從服務協(xié)議和保密技術兩個層面進行認定。

其一,教師模型提供者應在服務協(xié)議中明確禁止用戶實施反向工程等類似行為。目前,部分模型提供者已將“禁止反向工程”寫入服務協(xié)議。例如,OpenAI公司在其服務協(xié)議中規(guī)定,用戶不得試圖或協(xié)助他人對服務(包括模型、算法或系統(tǒng))進行反向工程、反向編譯、不得使用ChatGPT的輸出內容開發(fā)與ChatGPT存在競爭關系的模型等。Kimi模型同樣禁止用戶對服務進行反向工程。盡管有學者認為,通過服務協(xié)議設定保密措施是在模型開放使用與防止數據泄露之間取得平衡的合理選擇,可視為已采取合理的保密措施,但本文認為,僅依賴服務協(xié)議并不足以達到合理的保密程度。一方面,服務協(xié)議只能體現信息持有人保護商業(yè)秘密的主觀意圖。假設模型提供者在服務協(xié)議中規(guī)定相關限制的同時,仍允許通過API大規(guī)模調用模型輸出結果,則說明對“知識”缺乏有效的保密措施。另一方面,教師模型的服務協(xié)議大多未明確商業(yè)秘密的范圍。在司法實踐中,為避免保密制度被濫用,法院傾向于將寬泛描述商業(yè)秘密范圍的競業(yè)協(xié)議認定為未采取合理保密措施。因此,現有服務協(xié)議籠統(tǒng)禁止反向工程的條款易被視為對正常使用的過度限制,進而導致保密措施不符合“合理性”標準。

其二,在技術層面,通常認為高價值數據應當匹配高水平的保密技術,但不應以迫使信息持有人支付高昂的保密措施成本為代價。針對知識蒸餾的保密措施,不要求信息持有方徹底杜絕蒸餾的發(fā)生。在蓋茨訴坂東案中,法院強調即便部分信息能夠通過反向工程獲取,也不否認其作為商業(yè)秘密的地位。當前,部分教師模型提供者會采取限制每個賬戶的調用頻率、加密模型的權重文件、檢測并阻止異常調用等手段,防止用戶大規(guī)模收集模型輸出用于蒸餾。例如,OpenAI公司對模型的RPM(每分鐘請求數)和TPM(每分鐘tokens數)均有所限制。因此,對于教師模型的合理保密措施的認定,應當同時考慮合同和技術兩個層次,即通過服務協(xié)議明確禁止蒸餾且明確界定禁止范圍,并在技術上采取防止過度調用API等保密措施。

綜上,并非所有被蒸餾的“知識”均構成商業(yè)秘密。理論上,“知識”具備商業(yè)價值性和秘密性,而其是否符合保密性要件須從服務協(xié)議和保密技術兩個層面進行綜合認定。

(二)知識蒸餾構成侵犯商業(yè)秘密行為的邊界

知識蒸餾被認定為構成侵犯商業(yè)秘密行為的主要理由在于其通常采取繞開API調用限制等不正當手段,或違反信息持有人關于保守商業(yè)秘密的要求,且蒸餾后的學生模型在性能上無限接近教師模型,從而對教師模型造成實質替代。在阻卻違法性上,學生模型開發(fā)者將尋求合理的抗辯理由,該理由通常是現實中存在替代成本低的獲取訴爭商業(yè)秘密的路徑。因為當存在低成本的替代獲取手段時,意味著該商業(yè)秘密處于“容易獲取的狀態(tài)”,從而不具備秘密性或采取的保密措施不合理。常見抗辯包括替代信息源、反向工程等。

知識蒸餾本質上是一種反向工程,反向工程即公眾通過觀察和分析現有產品、技術和信息,反向推導出其背后的工作原理從而獲取商業(yè)秘密的行為。從全球范圍來看,反向工程常被認定為合法獲取商業(yè)秘密的行為。歐盟《商業(yè)秘密保護指令》[Directive (EU) 2016/943]第3條第1項將“反向工程”視為正當獲取和使用商業(yè)秘密的行為。美國法院也曾明確反向工程的合法性,企業(yè)不能通過協(xié)議條款禁止反向工程。我國《最高人民法院關于審理侵犯商業(yè)秘密民事案件適用法律若干問題的規(guī)定》第14條第1款規(guī)定,通過反向工程獲得被訴侵權信息不屬于侵犯商業(yè)秘密行為。從各國司法實踐來看,唯有當行為人對承載商業(yè)秘密的載體有合法處分權,且反向工程替代成本較低時,反向工程才會被視作未扭曲競爭的行為,從而成為合理的抗辯理由。

1. 對“知識”載體的合法處分權

行為人實施反向工程的前提是其對承載商業(yè)秘密的載體有合法處分權(包括實施觀察、測試、分析等行為),這是正當的反向工程與技術盜用的重要區(qū)別。但是,對“知識”載體的判斷將會影響處分權合法性的認定。

一方面,有學者認為在該語境下,反向工程的載體是人工智能生成物。根據OpenAI、Google等公司的服務協(xié)議,訓練者通常具備對生成物的處分權(如使用、轉讓、復制、再訓練等),而教師模型在法律上對輸出內容不享有任何權利。另一方面,如果認定“知識”的載體是模型,而非數據集,對于開源模型而言,由于模型已開放權重和訓練代碼,除違反開源協(xié)議外不存在處分權障礙,用戶可以合法地蒸餾、微調模型。因此,對開源模型進行蒸餾時即便“知識”中含有商業(yè)秘密,也屬于正當的反向工程。相反,學生模型對閉源教師模型的蒸餾往往因為缺乏合法處分權而導致反向工程缺乏正當性。通常認為,對于非公開數據,一切未經數據保有者同意的數據獲取行為均構成不正當競爭。司法實踐常將破壞協(xié)議抓取數據、攻擊API接口等具有攻擊性的技術手段認定為不正當的獲取行為。閉源模型未公開代碼、訓練文檔等信息,而以API接口的方式為用戶提供服務。在知識蒸餾中,學生模型往往會繞過閉源教師模型的API調用限制,大規(guī)模爬取輸出結果,這屬于未經同意獲取“知識”,系不正當獲取行為。因此,對閉源模型進行反向工程的前提是應獲得許可(包括通過談判協(xié)商、簽訂合同等方式分享商業(yè)秘密);在具備對模型的合法處分權后,“禁止反向工程”條款將不再束縛訓練者。

2. 知識蒸餾的替代成本

不同反向工程措施之間具有較大的成本差異。僅需簡單分析即可拆解的、低成本且不費時費力的反向工程被視為合理的侵權抗辯。我國目前對反向工程的認定多現于觀察、測試等人工方式,而尚未對通過人工智能技術反向提取數據的手段進行定性。但是,這并不意味著對該類手段的否認。反向工程的認定不取決于人工或自動化手段本身的區(qū)別,而在于實質性成本的高低。在大模型領域,教師模型通常包含數十億甚至上千億數據,數據數量和復雜性遠超傳統(tǒng)技術產品,人工手段難以實現對其決策邏輯的推導。如果堅持反向工程必須采取人工手段,則近乎否認反向工程在大模型領域中的可能性,這與數字經濟時代技術創(chuàng)新和數據流通的實際需求相悖。知識蒸餾實質上是學生模型通過學習教師模型的輸入輸出關系,模仿其決策過程,而非直接復制其參數或訓練數據,這與傳統(tǒng)反向工程邏輯一致。

然而,理論和實務界對如何判斷替代成本的實質性高低尚未形成統(tǒng)一的標準,仍存在較大爭議。在部分案件中,知識蒸餾等自動化數據提取手段被認定為成本較低的替代性手段。例如在康普萊夫軟件公司訴紐曼案中,被告指使第三方使用爬蟲機器人在網站上獲取數千萬條報價信息,法院認為即便信息源自公開渠道,爬蟲抓取行為獲取數據的規(guī)模和效率遠超人力。因此,不論是針對開源還是閉源的教師模型,知識蒸餾作為效率和能力遠超人力的反向工程似乎并不屬于成本較高的反向工程。尤其與重新訓練一個教師模型相比,知識蒸餾能夠以較低成本獲得性能近似教師模型的輕量模型,這亦是知識蒸餾本身最大的優(yōu)勢。

與此相反,也有學者認為知識蒸餾屬于高成本的反向工程手段。第一,算力成本高。知識蒸餾通常需要上百萬次甚至更多次數地大規(guī)模調用教師模型,且對學生模型進行多輪訓練,其算力消耗遠高于傳統(tǒng)的反匯編技術。第二,資金成本高。學生模型需要獲取教師模型中基于輸出特征、中間特征和關系的“知識”,如果教師模型設置了API調用限額,那么“知識”的獲取將耗費巨額成本。第三,蒸餾的技術難度高。蒸餾的過程涉及選擇匹配的教師模型、準備高質量數據集、訓練學生模型、評估調優(yōu)、部署等步驟,難度遠高于傳統(tǒng)的反向工程。例如,DeepSeek在技術報告中指出其研究團隊整理了80萬個樣本,并對開源模型如Qwen和Llama進行不斷微調以提升小模型的推理能力。故知識蒸餾屬于替代成本較高的獲取信息手段。對知識蒸餾成本的判斷影響其能否構成合理抗辯的認定,而這需要結合個案具體情況、行業(yè)實踐等因素綜合考慮。只有當知識蒸餾被認定為成本較低的替代獲取手段時,方能抗辯知識蒸餾構成侵犯商業(yè)秘密行為。

因此,在修正的“權益—損害”范式下,對已采取合理保密措施的教師模型進行蒸餾可能會構成侵犯商業(yè)秘密的不正當行為,但當學生模型開發(fā)者對“知識”載體具備合法處分權且蒸餾屬于替代成本較低的反向工程時,知識蒸餾將不構成侵犯商業(yè)秘密的不正當行為。

知識蒸餾構成搭便車的違法性認定

知識蒸餾也深陷對教師模型搭便車而以輕量化、高性能優(yōu)勢進入市場的不正當性爭議。從方法角度看,行為中心主義范式下的反不正當競爭法分析大致需要經過以下步驟:首先須判斷知識蒸餾是否構成搭便車行為,若構成則進一步探討該行為的違法性。行為中心主義范式強調損害并不是違法性的主要構成要件,而須從根本上判斷知識蒸餾是否扭曲市場競爭機制。若能夠證成違法性,則進一步從過錯、損害和因果關系等角度判斷行為人是否應當承擔法律責任。

(一)知識蒸餾構成搭便車行為

在對知識蒸餾行為進行違法性判定前,須先澄清搭便車行為在我國反不正當競爭法中作為競爭行為正當性判斷標準的定位,進而判斷知識蒸餾是否構成反不正當競爭法意義上的搭便車行為。

1. 搭便車行為在我國反不正當競爭法中的定位

“搭便車”一詞源于奧爾森于1965年出版的《集體行動的邏輯》一書。由于公共物品具有非排他性和非競爭性,社會成員無論是否對獲取公共物品作出過貢獻,都能選擇不付費而享受公共物品帶來的好處,且成員都不愿付出代價??梢?,經濟學上的“搭便車”源自市場機制的自然缺陷和公共物品的屬性。搭便車行為在競爭法中有獨特的內涵,其并非嚴格意義上的法律概念;學理上對其有多種解讀,但均認為反不正當競爭法上搭便車的本質是行為人自身不投入或以較低成本投入資源開展經營活動,而依附其他經營者積累的技術、智力或商業(yè)成果進而取得競爭優(yōu)勢。在競爭法語境下,搭便車行為不是由公共物品屬性所引發(fā)的,而是對特定市場主體商業(yè)成果的寄生和利用。受不同競爭觀影響,搭便車包含中性和負面評價兩種含義:持效率競爭觀者認為搭便車是不含價值判斷的中性概念,搭便車符合模仿自由、競爭自由原則,只在極端情況下構成不正當競爭;而負面意義上的搭便車則泛指一切不正當利用他人商業(yè)成果的行為,因為其受倫理性競爭觀的影響,認為該行為違背了先來后到、不勞而獲的傳統(tǒng)商業(yè)倫理。

搭便車行為在反不正當競爭法中的定位涉及兩類:其一,將搭便車行為認定為具體的不正當競爭行為類型;其二,將其視為競爭行為正當性的判斷標準。前者的典型代表為瑞士《反不正當競爭法》第5條第(3)項和西班牙《反不正當競爭法》第11條第(2)項,二者均將未經努力而利用他人成果的行為規(guī)定為不正當競爭行為。將搭便車認定為競爭行為正當性判斷標準的國家包括中國、德國、美國等。例如,在國際新聞社訴美聯社案中,美國法院認為新聞事實雖不受版權保護,但新聞機構為收集新聞付出投入形成時效性成果,因此國際新聞社未經投入、直接利用美聯社的勞動成果謀取競爭優(yōu)勢屬于不正當的行為。我國未在《反不正當競爭法》中明確規(guī)定搭便車行為,但司法實踐常在適用一般條款和反假冒條款時將其作為行為不正當性的說理標準,例如認定新產品實質替代原商業(yè)成果、商標或字號攀附商譽等,進而結合被告動機、客觀行為、行業(yè)實踐等因素,論證搭便車行為屬于違背誠實信用原則的不正當競爭行為。

2. 知識蒸餾構成反不正當競爭法上的搭便車行為

知識蒸餾符合利用他人投入的搭便車行為表現。搭便車理論最初適用于保護商標、字號知名度免于被利用的情形,后延伸至避免他人經努力而生成的成果被寄生或利用。我國法院對“他人投入”的認定門檻較低且具有較強的彈性,只要他人對該成果有投入且成果本身具備一定市場價值,即可被認定為被搭便車的對象。司法實踐中如文學作品中的人物名稱等元素、電子游戲玩法、商戶點評信息等均被認定為被搭便車的對象。在知識蒸餾中,模型訓練者通過學習教師模型的輸出蒸餾“知識”,不必投入同樣規(guī)模的算力和研發(fā)成本即可獲得性能接近教師模型的輕量化模型,屬于利用教師模型的成果而非從零投入的搭便車行為。知識蒸餾涉嫌搭便車行為的正當性判斷須適用反不正當競爭法的一般條款。

(二)知識蒸餾未扭曲市場競爭機制

行為中心主義范式與“權益—損害”范式的最大區(qū)別在于對“損害”的態(tài)度不同。傳統(tǒng)上,不正當競爭行為被認為是特殊的“背俗侵權”,故將違背商業(yè)道德和誠實信用造成損害的行為界定為不正當?!皺嘁妗獡p害”范式延續(xù)了侵權法上“不法推定”的認定,只要損害競爭利益,即可證成行為的不正當性。行為中心主義則區(qū)分事實上的損害與法律意義上的損害,認為在具有強烈對抗性和復雜交織性的市場競爭中,存在事實上的損害難以避免,無法僅依據事實上的損害認定行為的不正當性,應被規(guī)制的是以不正當手段扭曲市場競爭導致損害的行為。因此,判斷行為違法性應以是否扭曲市場競爭機制作為判斷不正當的標準。

市場經濟需要市場競爭。一方面,通過價格機制調節(jié)市場供需引導資源流動,實現要素從低效企業(yè)向高效企業(yè)轉移,從而優(yōu)化資源配置效率;另一方面,競爭壓力驅動企業(yè)創(chuàng)新并改進管理,提升企業(yè)的生產效率。我國反不正當競爭法的目標在于保護競爭機制不被扭曲,如果某行為阻礙效率信號傳遞或干擾資源要素合理流動,則意味著行為扭曲了優(yōu)勝劣汰的市場機制,進而構成不正當競爭行為。非效能競爭理論中的“阻礙競爭對手標準”,是判斷某行為是否扭曲市場競爭機制的重要標準。在競爭者之間,這主要表現為通過行為干擾、排擠或操縱競爭對手等方式,阻礙競爭對手在公平條件下依據效能存續(xù)或退出。易言之,如果競爭者的行為并非依據效能,而是通過設置障礙、排擠或惡意干擾對手參與競爭,則構成對市場優(yōu)勝劣汰機制的扭曲。在德國法實務中,其通常需要滿足存在競爭關系、屬于商業(yè)行為、對象針對性、阻礙程度達到實質妨礙、手段相稱性以及行為和阻礙結果之間具備因果關系等條件。如果行為介于效能和非效能之間,則需借助“動態(tài)競爭分析”來判斷行為的違法性。

對搭便車行為的多種評價態(tài)度決定了其在違法性判定上無法一概而論,持模仿自由立場者傾向于將搭便車認定為效能競爭或具備介于效能競爭與非效能競爭之間的性質,而持負面評價者則將其歸為非效能競爭的范疇。由實踐觀之,知識蒸餾行為屬于未扭曲市場競爭機制的效能競爭。

首先,知識蒸餾不滿足“阻礙競爭對手標準”。一方面,知識蒸餾本質上是一種模仿學習行為,通過訓練更輕量的學生模型充分接近高性能的教師模型,蒸餾過程中并不會直接阻礙或干擾教師模型獨立運行。蒸餾得到的學生模型如果能以更低算力、更高性能滿足市場需求,即便其有損于教師模型的在先利益,但因其在“效能”維度上具備競爭優(yōu)勢,符合優(yōu)勝劣汰邏輯,故不構成不正當競爭行為。事實上,OpenAI作為閉源模型代表者也并未完全排斥知識蒸餾技術;相反,其認為蒸餾是個多步驟、容易出錯的過程,并主動為用戶提供使用GPT-4o等教師模型合成的訓練數據幫助學生模型創(chuàng)建數據集的方法,為其他訓練者進行知識蒸餾創(chuàng)設支持性環(huán)境。另一方面,知識蒸餾在推動市場競爭的同時有效降低模型訓練成本,而由此節(jié)約的成本可以用于投入模型壓縮技術的迭代優(yōu)化。長期觀之,增量的利益最終會向消費者一端轉移?;诖?,知識蒸餾本身并不會扭曲優(yōu)勝劣汰的市場機制。

其次,知識蒸餾憑借相對低成本、輕量化和高性能的優(yōu)勢,已逐漸成為人工智能領域常見的模型壓縮和知識遷移技術,其正當性也得到行業(yè)慣例的支持,產生創(chuàng)新激勵效果,而非單純的學術想象。目前,知識蒸餾已廣泛應用于模型壓縮與輕量化、計算機視覺(主要為視覺檢測和視覺分類)、自然語言處理(natural language process, 簡稱NLP)、推薦系統(tǒng)(recommender system, 簡稱RS)等領域。例如,微軟旗下的Phi系列模型蒸餾自GPT-4教師模型,以更小的參數規(guī)模獲取極強的數學推理能力。阿里云研發(fā)的通義千問-7B(Qwen-7B)以DeepSeek-R1為教師模型,專注于中文場景的優(yōu)化。再如,BERT模型作為自然語言處理領域的熱門模型,其具備強大的編碼表示能力但參數量巨大,近年來蒸餾自BERT模型生成的Distilled BiLSTM、BERT-PKD等模型,在有效減少模型尺寸的同時基本保留了教師模型的語言理解能力,并顯著提升運行速度。因此,知識蒸餾不僅有助于平衡模型性能表現與資源消耗之間的矛盾,還能推動人工智能技術的普及應用和生態(tài)構建,具備顯著的適用性與延展?jié)摿Α?/p>

最后,知識蒸餾符合公平非歧視原則,契合消除數字鴻溝的全球時代命題。一方面,知識蒸餾幫助促進資源公平。教師模型通常因規(guī)模大導致運行成本高,僅少數具備先進算力資源的頭部企業(yè)和技術先發(fā)國家能直接部署。知識蒸餾通過壓縮模型降低了計算資源和存儲需求,使更多主體能夠以較低成本使用高性能的模型,為算力資源短缺地區(qū)輸送了普惠性的技術紅利。另一方面,知識蒸餾能夠提升資源運用效率。與從零開始的重復性模型訓練相比,知識蒸餾高效遷移教師模型的“知識”,減少消耗重復算力,促進實現公平利用有限資源的可持續(xù)發(fā)展目標。

在激烈的市場競爭中,競爭損害極為普遍,而市場具備強大的自我修復能力,法律為化解市場失靈的干預應當保持謙抑。從行為中心主義范式出發(fā),作為搭便車行為的知識蒸餾技術未扭曲市場競爭機制,行為違法性難以證成。唯有從商品視角考量的,對已采取合理保密措施的教師模型進行蒸餾的行為,會涉及侵犯商業(yè)秘密,進而應予以規(guī)制。

結語

中國人工智能法治以“發(fā)展”和“治理”為核心支點,旨在為我國在全球科技競爭格局中贏得戰(zhàn)略主動。知識蒸餾技術折射出人工智能時代創(chuàng)新激勵與競爭秩序維護之間的張力,其作為人工智能領域中普遍采用的模型壓縮與知識遷移技術,是影響全球數字競爭格局的關鍵節(jié)點,如何妥善認定并處理其違法性問題關系到行業(yè)發(fā)展的重大利益。因此,在知識蒸餾違法性認定上應秉持包容審慎的態(tài)度,辨明其不正當競爭違法性的認定邊界。一方面,在涉嫌侵犯商業(yè)秘密行為的認定上,須著重辨明“知識”作為商業(yè)秘密的邊界,以及合理的反向工程這一違法阻卻因素;另一方面,在對教師模型搭便車的不正當性爭議上,應將行為是否扭曲優(yōu)勝劣汰的市場競爭機制作為判斷違法性的標準。據此,在厘清知識蒸餾的不正當競爭違法性邊界的基礎上推動實現創(chuàng)新激勵、技術保護和普惠應用的多元價值目標。

-向上滑動,查看完整目錄-

《知識產權》2025年第11期目錄

【專題評述】

1.試論生成式人工智能服務提供者的合理注意義務

吳漢東、樊賽爾

2.人工智能算法專利保護的制度機理與實現進路

寧立志、楊瑩瑩

3.純指令類人工智能生成內容的競爭法保護

胡開忠、江璐迪

4.轉介視域下生成式人工智能服務提供者版權注意義務的教義學展開

呂炳斌、李雋姝

【實踐探討】

5.反不正當競爭法下知識蒸餾違法性的認定

詹韞如

6.從備案回歸公開:集成電路布圖設計權登記取得制邏輯反思

潘柏華

《知識產權》是由國家知識產權局主管,中國知識產權研究會主辦的學術期刊,是中國中文法律類核心期刊、中文社會科學引文索引(CSSCI)擴展版來源期刊和AMI綜合評價(A刊)擴展期刊。

點擊進入下方小程序

獲取專屬解決方案~

責任編輯 | 郭晴晴

審核人員 | 張文碩 韓爽

本文聲明 | 本文章僅限學習交流使用,如遇侵權,我們會及時刪除。本文章不代表北大法律信息網(北大法寶)和北京北大英華科技有限公司的法律意見或對相關法規(guī)/案件/事件等的解讀。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

北大法律信息網 incentive-icons
北大法律信息網
法律綜合性網站
11095文章數 17492關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版