網易首頁 > 網易號 > 正文申請入駐

微軟Phi-4：14億參數模型超越巨型推理專家

2026-03-09 16:22:50　來源: 科技行者

北京舉報

分享至

這項由微軟研究院主導的研究于2024年12月發(fā)表在預印本平臺arXiv上，論文編號為arXiv:2412.08905v1。感興趣的讀者可以通過該編號查詢完整論文獲得更深入的技術細節(jié)。

當我們談到人工智能的發(fā)展時，一直存在一個普遍的認識：模型越大，能力越強。就像建房子一樣，人們總認為用料越多、房子越大，居住體驗就越好。但微軟研究院的科學家們卻用一個名為Phi-4的模型證明了一個顛覆性的觀點：有時候，精巧的設計比單純的體積更重要。

Phi-4只有140億個參數，相當于其他頂級AI模型體積的十分之一左右，但在數學推理、科學問答和編程能力方面，它卻能與那些龐大的競爭對手平分秋色，甚至在某些領域表現更出色。這就像一位身材嬌小但技藝精湛的工匠，能夠完成許多體格健壯但技能平庸的工人無法勝任的精細工作。

這種反常識的成就背后隱藏著一個關鍵秘密：合成數據。簡單來說，研究團隊沒有完全依賴從互聯(lián)網上收集的"天然"信息來訓練Phi-4，而是像精心烹飪一樣，人工制作了大量高質量的訓練材料。這些合成數據就像是為學生精心編寫的教科書，每一頁都經過深思熟慮的設計，確保能夠最有效地傳授特定的技能。

在實際測試中，Phi-4在研究生級別的科學問答基準GPQA上得分56.1，甚至超過了它的"老師"GPT-4o的50.6分。在數學競賽問題測試中，它達到了80.4分的高分，遠超同等體積的其他模型。更令人印象深刻的是，當研究團隊用2024年11月剛剛舉辦的美國數學競賽題目對各種模型進行測試時，Phi-4平均得到91.8分（滿分150分），表現堪比甚至超越了許多規(guī)模更大的模型。

這項研究的意義遠遠超出了技術層面的突破。在實際應用中，較小的模型意味著更低的計算成本、更快的響應速度和更廣泛的部署可能性。就像汽車工業(yè)從追求更大的發(fā)動機轉向追求更高的燃油效率一樣，AI領域也正在經歷從"越大越好"向"越精越好"的轉變。

一、合成數據：AI訓練的"定制營養(yǎng)餐"

傳統(tǒng)的AI模型訓練就像讓孩子在圖書館里隨意翻閱各種書籍，希望他們能夠自己領悟知識的精髓。而Phi-4的訓練方式完全不同，研究團隊為它準備了精心設計的"定制課程"。

這種合成數據的制作過程可以用廚師準備營養(yǎng)餐來類比。廚師不會隨便把食材堆在一起，而是根據用餐者的具體需求，精確搭配各種營養(yǎng)成分，確保每一口都能提供最佳的營養(yǎng)價值。同樣，研究團隊創(chuàng)建了大約50種不同類型的合成數據集，總計約4000億個訓練標記，每一種都針對特定的能力進行優(yōu)化。

例如，為了提高模型的數學推理能力，研究團隊不是簡單地收集網絡上的數學題目，而是從高質量的數學內容中提取"種子"問題，然后通過多輪對話、自我修正等技術，生成大量變化豐富的練習題。這些題目不僅涵蓋了基礎概念，還包含了復雜的推理鏈條，就像一位經驗豐富的數學老師會逐步引導學生從簡單計算走向復雜證明。

合成數據的另一個關鍵優(yōu)勢是它能夠避免真實數據中的"噪音"。網絡上的內容往往存在錯誤、不完整或者邏輯混亂的問題，就像在嘈雜的環(huán)境中學習會分散注意力一樣。而合成數據經過了嚴格的質量控制，確保每一個訓練樣本都是準確、清晰、具有教育價值的。

研究團隊還采用了一種稱為"指令反轉"的創(chuàng)新技術。傳統(tǒng)方法是給模型看問題和答案，讓它學會如何回答。而指令反轉則是給模型看答案，讓它學會提出相應的問題。這就像讓學生不僅要會解題，還要會出題，從而更深刻地理解問題的本質。

在編程能力的培養(yǎng)上，研究團隊從代碼庫中提取代碼片段，然后生成相應的任務描述，確保模型不僅能夠理解代碼的功能，還能根據需求編寫相應的代碼。這種訓練方式讓Phi-4在編程測試中表現出色，HumanEval基準測試得分達到82.6分。

更有趣的是，研究團隊還使用了"自我修正"的訓練方法。模型會先生成一個初始答案，然后像一個嚴格的老師一樣，對自己的答案進行批評和改進，不斷迭代直到達到滿意的質量。這種方法培養(yǎng)了模型的"自省能力"，讓它能夠發(fā)現并糾正自己的錯誤。

二、數據篩選：從海量信息中淘金

即使有了精心制作的合成數據，研究團隊也沒有完全拋棄來自真實世界的信息。相反，他們開發(fā)了一套極其嚴格的篩選系統(tǒng)，從海量的網絡內容中挑選出最有價值的"珍珠"。

這個篩選過程就像一位經驗豐富的古董專家在跳蚤市場中尋找真正的寶貝。專家不會被表面的華麗外觀所迷惑，而是憑借專業(yè)眼光識別出真正具有價值的物品。同樣，研究團隊開發(fā)了多層次的篩選機制，確保只有最高質量的內容才能進入訓練數據集。

首先，他們針對特定類型的高質量內容進行了"定向收集"。這包括學術論文、教育資源、編程教程等具有明確教育價值的材料。就像圖書館管理員會優(yōu)先采購教科書和參考資料一樣，這些內容構成了訓練數據的"基礎藏書"。

接著，研究團隊使用了基于小型分類器的篩選方法。這些分類器就像訓練有素的質檢員，能夠快速識別內容的質量水平。它們會評估文本的教育價值、推理深度、事實準確性等多個維度，只有通過所有檢查的內容才能被選中。

特別值得注意的是，研究團隊還開發(fā)了一種"復數答案驗證"技術來處理問答數據。當遇到一個問題時，他們會讓多個系統(tǒng)獨立生成答案，然后通過"民主投票"的方式來評估問題的難度和答案的正確性。如果所有系統(tǒng)都給出相同答案，說明問題過于簡單；如果答案完全不一致，則說明問題過于困難或存在歧義。只有那些難度適中、答案相對一致的問題才會被保留，確保訓練數據既有挑戰(zhàn)性又不會誤導模型。

為了處理多語言內容，研究團隊還構建了支持176種語言的篩選管道。這就像建立了一個國際化的質量檢測中心，能夠識別和評估不同語言的內容質量，確保Phi-4具備良好的多語言能力。

在代碼數據的處理上，研究團隊更是精益求精。他們不僅要求代碼在語法上正確，還要求代碼能夠正確執(zhí)行并通過測試。這就像招聘程序員時不僅要看簡歷，還要進行實際的編程測試一樣，確保選中的代碼樣本都是高質量的。

三、模型架構：小而精的設計哲學

Phi-4的模型架構體現了"小而精"的設計哲學。雖然它只有140億個參數，但每一個參數都經過了精心的優(yōu)化和調整，就像一塊精美的瑞士手表，每個零件都發(fā)揮著關鍵作用。

在基礎架構上，Phi-4采用了經過驗證的Transformer設計，但針對推理任務進行了特殊優(yōu)化。它使用了更先進的tiktoken分詞器，支持更好的多語言處理能力，詞匯表大小為100,352個標記。這就像為不同語言的使用者配備了更精確的翻譯工具，能夠更準確地理解和生成各種語言的文本。

模型的上下文長度設置也經過了精心考慮。初始訓練時使用4096個標記的上下文長度，后來通過中期訓練擴展到16384個標記。這種漸進式的擴展就像讓學生先學會理解短文，再逐步提高到理解長篇文章的能力。

在訓練過程中，研究團隊使用了約10萬億個標記進行預訓練。這個數字聽起來龐大，但相比其他大型模型，Phi-4的訓練更加高效。關鍵在于數據質量而非數量，就像一位好廚師用優(yōu)質食材做出美味佳肴，不需要大量平庸的原料堆砌。

訓練的學習率設置為0.0003，批次大小為5760，這些超參數都經過了仔細調優(yōu)。研究團隊通過多次小規(guī)模實驗找到了最優(yōu)配置，就像調音師為鋼琴找到完美音調一樣，每個參數都恰到好處。

Phi-4還引入了一種創(chuàng)新的"中期訓練"階段。在完成基礎預訓練后，模型會接受額外的訓練來擴展上下文處理能力。這個階段專門使用了長文檔數據，訓練模型處理更復雜的長篇推理任務。就像運動員在掌握基本技能后進行專項訓練來提高特定能力一樣。

四、訓練策略：循序漸進的能力構建

Phi-4的訓練過程采用了多階段的策略，就像培養(yǎng)一名專業(yè)人才需要經過不同的學習階段一樣。整個過程可以分為預訓練、中期訓練和后訓練三個主要階段，每個階段都有明確的目標和精心設計的課程安排。

在預訓練階段，研究團隊特別關注數據配比的優(yōu)化。通過大量實驗，他們發(fā)現合成數據在推理能力培養(yǎng)方面具有顯著優(yōu)勢，因此將40%的訓練資源分配給了合成數據。這就像在學校教育中增加實踐課程的比重，讓學生通過動手操作來加深理解。

有趣的是，研究團隊發(fā)現了一個反直覺的現象：重復使用高質量的合成數據比不斷添加新的普通數據更有效。他們進行了對比實驗，一組模型使用相同的合成數據訓練12輪，另一組使用4輪合成數據加上大量新的網絡數據。結果顯示，前者的表現明顯更好。這證明了"精讀"比"泛讀"更有價值，就像學習經典著作時反復研讀比走馬觀花地閱讀大量普通書籍更有收獲。

中期訓練階段專門針對長文檔處理能力進行強化。研究團隊篩選出超過8000標記的高質量文檔，讓模型學會處理復雜的長篇推理任務。這個過程就像讓學生從閱讀短篇小說逐步過渡到分析長篇巨著，培養(yǎng)更深層的理解能力。

在數據去重和清洗方面，研究團隊采用了極其嚴格的標準。他們使用13-gram和7-gram特征來檢測和移除與測試數據集重疊的內容，確保評估結果的公正性。這就像考試前老師會仔細檢查試題，確保沒有學生提前見過相同的題目。

后訓練階段則采用了監(jiān)督微調和直接偏好優(yōu)化相結合的方法。監(jiān)督微調就像有經驗的導師進行一對一指導，而直接偏好優(yōu)化則像是通過對比不同答案的優(yōu)劣來提高判斷能力。這個階段使用了約80億個標記的高質量對話數據，涵蓋數學、編程、推理、對話和安全等多個維度。

五、創(chuàng)新技術：關鍵標記搜索法

Phi-4引入了一項名為"關鍵標記搜索"的創(chuàng)新技術，這可能是整個研究中最具突破性的貢獻之一。這項技術的核心思想是識別出在推理過程中起到關鍵轉折作用的特定詞匯或短語。

想象一個偵探在破案過程中，有些線索是決定性的，能夠讓整個案件的走向發(fā)生根本轉變。同樣，在AI模型的推理過程中，某些特定的"標記"（可以理解為詞匯或符號）具有類似的關鍵作用。研究團隊開發(fā)了一套系統(tǒng)來識別這些"關鍵標記"，并專門針對它們進行優(yōu)化訓練。

具體來說，這個技術通過分析模型在解決問題時的成功概率變化來識別關鍵時刻。當模型輸出某個特定標記后，如果解決問題的成功率發(fā)生顯著變化（提高或降低超過20%），那么這個標記就被認定為"關鍵標記"。就像下棋時的關鍵一手，可能決定整盤棋的勝負。

研究團隊舉了一個生動的例子：在一道數學題的求解過程中，當模型輸出"negative"（負數）這個詞時，成功率從31%跳躍到93%，而當輸出"(a"時，成功率卻從95%下降到71%。這說明選擇正確的推理路徑對最終結果有巨大影響。

基于這個發(fā)現，研究團隊開發(fā)了專門的訓練數據生成方法。他們會找到這些關鍵標記，然后創(chuàng)建對比樣本：一個是選擇了正確關鍵標記的"好"樣本，另一個是選擇了錯誤關鍵標記的"壞"樣本。通過讓模型學習區(qū)分這些細微但關鍵的差別，顯著提高了它的推理準確性。

這種方法的優(yōu)勢在于它能夠精確定位推理過程中的關鍵節(jié)點，而不是簡單地對整個答案進行籠統(tǒng)的對錯判斷。就像一位優(yōu)秀的老師不僅會告訴學生答案是否正確，還會指出具體是在哪一步推理中出現了問題，這樣的指導更加精準有效。

六、安全措施：負責任的AI開發(fā)

在開發(fā)Phi-4的過程中，研究團隊投入了大量精力來確保模型的安全性和可靠性。這種做法就像汽車制造商在推出新車型時必須進行嚴格的安全測試一樣，AI模型在發(fā)布前也需要經過全面的安全評估。

研究團隊采用了多層次的安全防護策略。首先，他們在訓練數據中混入了專門的安全相關內容，教導模型識別和拒絕有害請求。這就像在學校教育中加入道德品格課程，從源頭上培養(yǎng)正確的價值觀。

在后訓練階段，團隊特別設計了"拒絕幻覺"的訓練程序。當模型遇到不確定或無法準確回答的問題時，它會選擇誠實地承認不知道，而不是編造看似合理但實際錯誤的答案。這種訓練讓Phi-4在SimpleQA基準測試中的表現發(fā)生了有趣的變化：雖然F1分數有所下降，但這是因為模型變得更加謹慎，減少了錯誤答案的輸出。

研究團隊還與微軟的AI紅隊進行了為期兩周的對抗性測試。紅隊成員就像專業(yè)的"白帽黑客"，嘗試各種方法來誘導模型產生有害輸出。測試結果顯示，Phi-4展現出了良好的防御能力，特別是對于越獄攻擊、提示編碼和多輪攻擊等常見的惡意使用手段都有較強的抵抗力。

在多個責任AI基準測試中，Phi-4的表現也很出色。例如，在有害內容生成測試中，它的違規(guī)率僅為3.6%，顯著低于許多同類模型。在越獄攻擊防御測試中，違規(guī)率僅為7.3%，表現出良好的安全性。

七、性能評估：全方位的能力驗證

為了全面評估Phi-4的能力，研究團隊設計了一套綜合性的測試體系，涵蓋了數學推理、科學問答、編程能力、語言理解等多個維度。這就像給一名全能運動員進行十項全能測試，確保在各個方面都有出色表現。

在數學推理方面，Phi-4在MATH基準測試中獲得了80.4分的高分，遠超同等規(guī)模的其他模型。更令人印象深刻的是，在2024年11月剛剛舉行的美國數學競賽中，Phi-4平均得分91.8分（滿分150分），甚至超過了一些規(guī)模更大的商業(yè)模型。這次測試特別有意義，因為這些題目是在所有訓練數據收集完成之后才出現的，完全排除了數據泄露的可能性。

在科學問答領域，Phi-4在GPQA（研究生級別科學問答）測試中得分56.1，超過了它的"老師"GPT-4o的50.6分。這個結果特別令人驚喜，因為它意味著學生在某些方面已經超越了老師，這在AI領域是相當罕見的現象。

編程能力測試同樣表現出色，HumanEval基準得分82.6，HumanEval+得分82.8，在同等規(guī)模的開源模型中名列前茅。這些測試要求模型不僅能夠理解編程要求，還要能夠編寫出功能正確的代碼。

在多語言推理測試MGSM中，Phi-4得分80.6，顯示出良好的跨語言能力。這對于一個主要用英語訓練的模型來說是相當難得的成就，證明了高質量訓練數據的價值。

特別值得注意的是，研究團隊還開發(fā)了一套內部基準測試PhiBench，專門用于評估模型在復雜推理任務中的表現。這套測試包含了原創(chuàng)性的問題，確保不會出現數據泄露問題。在這套測試中，Phi-4的得分為56.2，雖然仍有提升空間，但考慮到模型的規(guī)模，這已經是相當不錯的成績。

在長文檔處理能力測試中，Phi-4也表現出了良好的適應性。在HELMET基準測試的多個子任務中，無論是信息檢索、問答還是文檔總結，Phi-4都能與更大規(guī)模的模型進行有效競爭。

八、實際意義：AI民主化的重要一步

Phi-4的成功具有深遠的實際意義，它不僅僅是一個技術突破，更代表著AI發(fā)展方向的重要轉變。這種轉變可以用"從奢侈品到日用品"來形容，讓高質量的AI能力變得更加普及和可及。

從經濟角度來看，較小的模型意味著更低的運行成本。企業(yè)和個人開發(fā)者不再需要投入巨額資金來購買和維護大型計算設備，就能獲得優(yōu)秀的AI服務。這就像智能手機的普及一樣，讓先進的計算能力從少數人的特權變成了大眾的工具。

在實際部署方面，Phi-4可以在更多樣化的設備上運行，包括性能相對較低的服務器，甚至是高端的個人電腦。這種靈活性為AI應用的普及開辟了新的可能性。教育機構可以更容易地部署AI助手來幫助學生學習，小型企業(yè)可以使用AI來提高工作效率，而不需要依賴昂貴的云服務。

對于AI研究社區(qū)而言，Phi-4證明了"數據質量勝過數據數量"這一重要原則。這個發(fā)現可能會推動整個行業(yè)重新思考模型訓練的方法，從追求更大規(guī)模轉向追求更高效率。就像從粗放型農業(yè)向精細化農業(yè)的轉變一樣，這種思路的改變可能帶來更可持續(xù)的發(fā)展模式。

在教育領域，Phi-4的強大推理能力特別有價值。它可以作為智能tutor幫助學生解決數學和科學問題，提供步驟詳細的解題過程，甚至能夠解釋復雜的概念。由于運行成本較低，學校和教育機構更容易承擔這樣的技術投入。

對于軟件開發(fā)者來說，Phi-4在編程能力方面的出色表現意味著他們可以擁有一個更實惠的AI編程助手。無論是代碼審查、bug修復還是功能實現，Phi-4都能提供有價值的幫助，而且不需要依賴網絡連接到遠程服務器。

九、局限性：誠實面對挑戰(zhàn)

盡管Phi-4取得了令人矚目的成就，但研究團隊也誠實地承認了模型存在的局限性。這種坦誠的態(tài)度就像一位優(yōu)秀的醫(yī)生會如實告知治療方案的局限性一樣，體現了科學研究的嚴謹性。

首先，由于模型規(guī)模相對較小，Phi-4在處理需要大量事實性知識的任務時仍有不足。當面對"某某人是誰"這類問題時，模型有時會編造看似合理但實際錯誤的信息。這就像一本百科全書的篇幅有限，無法涵蓋所有的人物傳記一樣。不過，這個問題可以通過與搜索引擎結合來緩解。

在指令遵循方面，Phi-4也存在一些短板。當用戶要求嚴格按照特定格式輸出時，比如制作表格或遵循復雜的格式要求，模型有時會偏離指定的格式。這主要是因為訓練數據更多地關注了推理能力而非格式控制能力。研究團隊認為這個問題可以通過增加相關的合成訓練數據來改善。

另一個有趣的現象是，由于訓練數據中包含大量的推理鏈條，Phi-4有時會給出過于詳細的答案，即使對于簡單問題也可能進行冗長的分析。這就像一位學者習慣了深度思考，連回答簡單問題也會引經據典一樣。雖然這顯示了模型的思考深度，但在某些應用場景中可能顯得過于繁瑣。

在安全性方面，雖然經過了大量的安全訓練，但完全消除偏見和不當內容生成仍然是一個挑戰(zhàn)。研究團隊承認，盡管采用了多層防護措施，但在某些邊緣情況下，模型仍可能產生不合適的輸出。這是目前所有大型語言模型都面臨的共同挑戰(zhàn)。

Phi-4主要針對單輪對話進行了優(yōu)化，在多輪復雜對話中的表現可能不如專門為對話設計的模型。這就像一位擅長解題的學者可能在閑聊時顯得不夠自然一樣。

最后，雖然Phi-4具備一定的多語言能力，但其訓練數據主要以英語為主，在處理其他語言，特別是資源較少語言時的表現可能有限。這反映了當前訓練數據分布不均衡的現實問題。

十、未來展望：小型化AI的無限可能

Phi-4的成功開啟了AI發(fā)展的新篇章，預示著"小而精"的模型設計理念將成為未來的重要趨勢。這種轉變不僅是技術層面的進步，更是AI民主化進程中的重要里程碑。

在技術發(fā)展方向上，Phi-4證明了通過精心設計的合成數據和訓練策略，可以讓較小的模型獲得媲美大型模型的能力。這為未來的研究指明了方向：與其一味追求參數規(guī)模的擴大，不如專注于提高訓練數據的質量和訓練方法的效率。就像制造業(yè)從追求產量轉向追求質量一樣，AI領域也在經歷類似的轉型。

合成數據技術的成熟將極大地改變AI訓練的生態(tài)系統(tǒng)。研究團隊開發(fā)的多種合成數據生成技術，包括多智能體對話、自我修正工作流、指令反轉等，為構建更高效的訓練數據集提供了新的工具。未來，我們可能會看到更多專門的合成數據生成平臺，就像現在有專門的數據標注服務一樣。

關鍵標記搜索技術的應用前景也非常廣闊。這項技術不僅可以用于提高推理能力，還可以應用到其他需要精確控制的任務中，比如創(chuàng)意寫作、代碼生成、科學推理等。通過識別和優(yōu)化關鍵決策點，可以顯著提高模型在特定任務上的表現。

從應用普及的角度來看，Phi-4這樣的小型高效模型將大大降低AI技術的使用門檻。中小企業(yè)、教育機構、個人開發(fā)者都能更容易地接入高質量的AI服務。這可能催生出大量創(chuàng)新的應用場景，就像智能手機的普及帶來了移動應用的爆發(fā)式增長一樣。

在教育領域，個性化AI導師的普及將變得更加現實。每個學生都可能擁有一個專門的AI助手，根據個人的學習進度和特點提供定制化的輔導。Phi-4在數學和科學推理方面的優(yōu)勢使其特別適合這類應用。

對于軟件開發(fā)行業(yè)，更多開發(fā)者將能夠在本地環(huán)境中運行AI編程助手，而不需要依賴云服務。這不僅提高了開發(fā)效率，也保護了代碼的隱私安全。

環(huán)境可持續(xù)性也是一個重要考慮因素。較小的模型需要更少的計算資源，意味著更低的能耗和碳排放。在全球關注氣候變化的背景下，這種高效的AI發(fā)展模式具有重要的環(huán)境價值。

說到底，Phi-4的成功表明了AI發(fā)展的一個重要趨勢：技術的進步不僅在于能力的提升，更在于效率的優(yōu)化和普及性的增強。就像歷史上許多技術創(chuàng)新一樣，真正改變世界的往往不是最先進但昂貴的技術，而是那些足夠好且足夠普及的技術。Phi-4正是這樣一個例子，它用相對較小的體積實現了強大的能力，為AI技術的普及和民主化開辟了新的道路。

這項研究不僅推動了技術的邊界，更重要的是改變了我們對AI發(fā)展的認知。它告訴我們，在追求更大、更強的同時，也要關注更精、更效。這種平衡的發(fā)展理念，或許正是AI技術走向成熟的重要標志。未來的AI世界，可能不是由少數巨型模型主導，而是由無數個精巧高效的專門化模型共同構建，每個模型都在自己的專長領域發(fā)揮著獨特的價值。

Q&A

Q1：Phi-4是什么？與其他AI模型有什么不同？

A：Phi-4是微軟研究院開發(fā)的一個140億參數的AI模型，它的特別之處在于用相對較小的體積實現了與大型模型相當的推理能力。不同于其他模型主要依賴網絡數據訓練，Phi-4主要使用精心設計的合成數據，就像為學生定制的教科書一樣，每一份訓練材料都經過精心設計。在數學推理和科學問答方面，它甚至超越了比自己大十倍的模型。

Q2：合成數據訓練是怎么工作的？為什么效果更好？

A：合成數據訓練就像為學生量身定制課程，而不是讓他們在圖書館里隨意翻閱。研究團隊創(chuàng)建了約50種不同類型的合成數據集，每種都針對特定能力進行優(yōu)化。例如，為了提高數學能力，他們從高質量數學內容中提取問題，然后通過多輪對話和自我修正生成大量練習題。這種方法避免了網絡數據中的錯誤和噪音，確保每個訓練樣本都準確、清晰、有教育價值，因此訓練效果更好。

Q3：普通人能使用Phi-4嗎？成本如何？

A：Phi-4的一大優(yōu)勢就是運行成本較低，這意味著更多普通用戶和小企業(yè)能夠負擔得起。由于模型較小，它可以在性能相對較低的服務器甚至高端個人電腦上運行，不需要昂貴的大型計算設備。教育機構可以更容易地部署AI助手幫助學生學習，小企業(yè)可以使用AI提高工作效率，個人開發(fā)者也能獲得編程助手的幫助，而且不需要依賴網絡連接到遠程服務器。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.