網易首頁 > 網易號 > 正文申請入駐

從大語言模型到幻覺現(xiàn)象，一文讀懂常見AI術語

什么是AI幻覺

2026-04-13 23:59:10　來源: 至頂AI實驗室

北京舉報

分享至

人工智能是一個龐雜而深奧的領域，從事這一領域研究的科學家們通常依賴專業(yè)術語來描述自己的工作。因此，在報道人工智能行業(yè)時，我們也不可避免地需要頻繁使用這些技術詞匯。為此，我們整理了一份常見術語詞匯表，希望幫助讀者更好地理解相關文章中出現(xiàn)的重要概念。隨著研究人員不斷探索人工智能的新邊界、發(fā)現(xiàn)新興安全風險，我們也將持續(xù)更新這份詞匯表，補充更多新詞條。

AGI（通用人工智能）

通用人工智能（AGI）是一個定義相對模糊的概念，但通常指在大多數任務上超越普通人類水平的人工智能。OpenAI首席執(zhí)行官Sam Altman曾將AGI描述為"相當于你可以雇用的一名普通水平同事"。OpenAI的章程則將AGI定義為"在大多數具有經濟價值的工作中超越人類的高度自主系統(tǒng)"。谷歌DeepMind的理解略有不同，該機構認為AGI是"在大多數認知任務上至少與人類同等能力的AI"。對于這些不同的定義感到困惑？不必擔心——就連人工智能研究前沿的專家們也同樣存在分歧。

AI智能體

AI智能體是指利用人工智能技術代替用戶執(zhí)行一系列任務的工具，其能力遠超普通AI聊天機器人，例如可以幫你報銷費用、預訂機票或餐廳座位，甚至編寫和維護代碼。不過，這一領域仍處于發(fā)展初期，各方對"AI智能體"的理解可能不盡相同，相關基礎設施也在持續(xù)建設中。但其核心理念在于：這是一種自主系統(tǒng)，能夠調用多個AI系統(tǒng)來完成多步驟任務。

思維鏈

面對簡單問題，人類大腦無需過多思考便能作出回答，比如"長頸鹿和貓哪個更高？"但遇到復雜問題時，往往需要借助紙筆來梳理中間步驟。例如，一個農場主養(yǎng)了雞和牛，共有40個頭、120條腿，要算出雞和牛各有多少只，就需要列方程來求解（答案是各20只）。

在人工智能領域，大語言模型的思維鏈推理是指將問題拆解為若干較小的中間步驟，以提升最終答案的質量。這種方式通常需要更長的處理時間，但得出的答案更為準確，尤其在邏輯推理和代碼編寫方面表現(xiàn)突出。推理模型是在傳統(tǒng)大語言模型基礎上，通過強化學習對思維鏈思維方式進行優(yōu)化后得到的。

算力

算力通常指支撐AI模型運行所需的關鍵計算能力，是驅動整個人工智能行業(yè)進行模型訓練與部署的核心資源。這一術語有時也作為提供計算能力的硬件設備的簡稱，涵蓋GPU、CPU、TPU等各類構成現(xiàn)代AI行業(yè)基礎設施的硬件形式。

深度學習

深度學習是機器學習的一個子領域，其算法采用多層人工神經網絡（ANN）結構設計，能夠建立比線性模型或決策樹等簡單機器學習系統(tǒng)更為復雜的關聯(lián)關系。深度學習算法的結構設計靈感來源于人腦神經元之間相互連接的傳導路徑。

深度學習AI模型能夠自主識別數據中的重要特征，無需人工工程師手動定義這些特征。這種結構還支持算法從錯誤中學習，并通過反復迭代和調整來優(yōu)化自身輸出。然而，深度學習系統(tǒng)需要海量數據（通常達到數百萬條以上）才能取得良好效果，且與簡單機器學習算法相比，訓練時間更長，開發(fā)成本也相對更高。

擴散模型

擴散模型是許多圖像、音樂和文本生成類AI模型的核心技術。受物理學啟發(fā)，擴散系統(tǒng)通過持續(xù)向數據（如圖片、音頻等）中添加噪聲，逐步"破壞"數據結構，直至數據完全消失。在物理學中，擴散過程是自發(fā)且不可逆的——溶入咖啡中的糖無法還原為方糖。而AI中的擴散系統(tǒng)則致力于學習一種"逆向擴散"過程，從噪聲中還原被破壞的數據，從而具備從噪聲生成內容的能力。

蒸餾

蒸餾是一種從大型AI模型中提取知識的技術，采用"教師-學生"模型的方式實現(xiàn)。開發(fā)者向教師模型發(fā)送請求并記錄其輸出結果，有時會將這些答案與數據集進行比對以評估準確性，隨后將這些輸出用于訓練學生模型，使其學會近似模擬教師模型的行為。

蒸餾技術可以在蒸餾損失極小的情況下，基于大型模型創(chuàng)建出更小、更高效的模型。OpenAI的GPT-4 Turbo（GPT-4的加速版本）很可能就是通過這一方式開發(fā)的。

雖然所有AI公司都會在內部使用蒸餾技術，但也有一些公司可能借助蒸餾對手的模型來追趕前沿水平。對競爭對手的模型進行蒸餾通常違反AI API及聊天助手的服務條款。

微調

微調是指對已有AI模型進行進一步訓練，以優(yōu)化其在特定任務或領域上的表現(xiàn)——通常通過輸入新的專業(yè)化（即面向特定任務的）數據來實現(xiàn)。

許多AI初創(chuàng)公司以大語言模型為基礎開發(fā)商業(yè)產品，并通過基于自身領域知識和專業(yè)經驗的微調來提升產品在目標行業(yè)或任務上的實用價值。

GAN（生成對抗網絡）

GAN，即生成對抗網絡，是一種機器學習框架，是生成式AI在生成逼真數據（包括但不限于深度偽造工具）方面的重要技術基礎。GAN由一對神經網絡組成：一個網絡根據訓練數據生成輸出，并將結果傳遞給另一個網絡進行評估；后者作為判別器，對生成器的輸出進行分類判斷，從而推動其不斷改進。

GAN的結構建立在"對抗"競爭機制之上——兩個模型相互博弈：生成器努力讓自己的輸出通過判別器的審查，而判別器則持續(xù)識別人工生成的數據。這種競爭機制無需額外人工干預，就能優(yōu)化AI輸出，使其更加逼真。不過，GAN更適合較為垂直的應用場景（如生成逼真的圖片或視頻），而非通用型AI任務。

幻覺

幻覺是AI行業(yè)對模型"憑空捏造"信息這一現(xiàn)象的專業(yè)術語，即模型生成了錯誤的信息內容，這顯然是影響AI質量的重大問題。

幻覺現(xiàn)象會導致生成式AI輸出具有誤導性的內容，甚至可能引發(fā)現(xiàn)實風險——例如，對健康問題的查詢返回了有害的醫(yī)療建議。正因如此，大多數生成式AI工具的使用條款中都會提示用戶核實AI生成的答案，盡管這類免責聲明往往遠不如AI輸出內容本身顯眼。

AI憑空捏造信息的問題，被認為是訓練數據存在缺口所導致的。對于通用型生成式AI（也稱為基礎模型）而言，這一問題尤為難以解決——現(xiàn)有數據量根本不足以訓練AI模型來全面應對人類可能提出的所有問題。簡言之，我們尚未創(chuàng)造出"全知全能"的系統(tǒng)。

幻覺現(xiàn)象正在推動越來越多的垂直化、專業(yè)化AI模型的涌現(xiàn)——即聚焦于特定領域的AI，以減少知識盲區(qū)、降低錯誤信息風險。

推理（Inference）

推理是運行AI模型的過程，即讓模型基于已學習的數據做出預測或得出結論。需要注意的是，推理必須建立在訓練的基礎之上——模型必須先從數據中學習規(guī)律，才能有效地進行推斷。

許多類型的硬件都可以執(zhí)行推理任務，從智能手機處理器到高性能GPU，再到專為AI設計的加速芯片，不一而足。但不同硬件的推理能力差異顯著——在筆記本電腦上運行超大模型可能極為緩慢，而在配備高端AI芯片的云服務器上則能流暢運行。

大語言模型（LLM）

大語言模型是ChatGPT、Claude、谷歌Gemini、Meta的Llama、微軟Copilot、Mistral的Le Chat等主流AI助手所采用的核心AI模型。當你與AI助手對話時，實際上是在與一個大語言模型交互，它會直接處理你的請求，或借助網頁瀏覽、代碼解釋器等工具來響應。

AI助手與大語言模型可能有不同的名稱，例如GPT是OpenAI的大語言模型，而ChatGPT則是面向用戶的AI助手產品。

大語言模型是由數十億數值參數（即權重）構成的深度神經網絡，能夠學習詞匯和短語之間的關系，構建出一種語言的多維度表征——類似于詞語的多維地圖。

這些模型通過對數十億本書籍、文章和文字記錄中的規(guī)律進行編碼來構建而成。當你向大語言模型發(fā)出提示時，模型會生成最符合該提示的模式，并基于上下文不斷預測下一個最可能出現(xiàn)的詞語，如此循環(huán)往復。

內存緩存

內存緩存是一種重要的優(yōu)化機制，用于提升推理效率（即AI生成用戶查詢響應的過程）。AI運算本質上依賴大量數學計算，每次計算都會消耗計算資源。緩存技術通過保存特定計算結果以供后續(xù)查詢復用，減少模型重復運算的次數。常見的緩存方式之一是KV緩存（鍵值緩存），它適用于基于Transformer的模型，通過減少生成答案所需的計算量和時間，顯著提升推理效率。

神經網絡

神經網絡是深度學習的多層算法結構基礎，也是大語言模型興起后整個生成式AI浪潮的技術根基。

受人腦密集互聯(lián)神經通路的啟發(fā)，將其作為數據處理算法設計結構的構想最早可追溯至20世紀40年代。然而，真正釋放這一理論潛力的，是通過游戲產業(yè)發(fā)展成熟的圖形處理單元（GPU）的興起。這類芯片非常適合訓練層數遠超以往的算法，使基于神經網絡的AI系統(tǒng)在語音識別、自動駕駛、藥物研發(fā)等眾多領域取得了顯著的性能提升。

RAMageddon（內存危機）

RAMageddon是業(yè)界為一個嚴峻趨勢新創(chuàng)的詞匯——隨機存取存儲器（RAM）芯片的持續(xù)短缺正席卷整個科技行業(yè)。隨著人工智能產業(yè)的蓬勃發(fā)展，各大科技公司和AI實驗室為了打造更強大、更高效的AI，爭相大量采購RAM用于數據中心建設，導致市場上剩余供應嚴重不足，價格也隨之節(jié)節(jié)攀升。

這一短缺波及多個行業(yè)：游戲領域的主要廠商不得不提高游戲主機售價；消費電子領域的內存短缺可能引發(fā)十余年來最大規(guī)模的智能手機出貨量下滑；企業(yè)計算領域的公司也因無法獲得足夠的RAM而面臨數據中心擴容難題。預計只有當短缺問題得到緩解，價格上漲才會停止——但目前來看，這一局面短期內難以改變。

訓練

開發(fā)機器學習AI涉及一個稱為"訓練"的過程——簡單來說，就是向模型輸入數據，讓它從中學習規(guī)律并生成有用的輸出。

在這一階段，事情往往變得有些耐人尋味：訓練之前，用于構建學習系統(tǒng)的數學結構不過是一堆層次和隨機數字，真正賦予AI模型形態(tài)和能力的，正是訓練過程本身。本質上，這是一個系統(tǒng)響應數據特征、不斷調整輸出以趨近目標的過程——無論目標是識別貓的圖片，還是按需生成一首俳句。

需要注意的是，并非所有AI都需要訓練。基于規(guī)則、依照人工預定義指令運行的AI系統(tǒng)（如線性聊天機器人）無需訓練，但這類系統(tǒng)的能力通常不及經過充分訓練的自學習系統(tǒng)。

訓練的成本往往較高，因為需要大量輸入數據，且模型所需的數據量總體呈上升趨勢。有時可以采用混合方法來加速模型開發(fā)并控制成本，例如對基于規(guī)則的AI進行數據驅動的微調——與從零開始構建相比，這種方式所需的數據量、算力、能耗和算法復雜度都更低。

Token

在人機交流中，存在一些顯而易見的挑戰(zhàn)：人類使用自然語言溝通，而AI程序則通過由數據驅動的復雜算法流程來執(zhí)行任務和響應查詢。簡而言之，Token是人機交互的基本構建單元，代表大語言模型已處理或生成的離散數據片段。

Token通過"分詞"（tokenization）過程生成——該過程將原始數據拆分并細化為大語言模型可消化的獨立單元。這與軟件編譯器將人類語言轉換為計算機可讀二進制代碼的原理類似，分詞過程將用戶查詢中的自然語言轉化為AI程序可理解的形式，以便生成響應。

Token主要分為幾種類型：輸入Token（響應用戶查詢時生成的Token）、輸出Token（大語言模型回復用戶請求時生成的Token）以及推理Token（涉及用戶請求中更復雜、更耗時任務和流程的Token）。

在企業(yè)AI應用中，Token用量直接決定使用成本。由于Token等同于模型處理的數據量，它已成為AI行業(yè)服務變現(xiàn)的計量單位——大多數AI公司按Token數量收取大語言模型的使用費用。因此，企業(yè)使用AI程序（如ChatGPT）消耗的Token越多，需要向AI服務提供商（如OpenAI）支付的費用也就越高。

遷移學習

遷移學習是一種以已訓練好的AI模型為起點，針對不同但通常相關的任務開發(fā)新模型的技術，使此前訓練周期中積累的知識得以復用。

遷移學習能夠通過縮短模型開發(fā)流程來提升效率，在目標任務的可用數據較為有限時尤為實用。但需要注意的是，這一方法也存在局限性——依賴遷移學習獲取通用能力的模型，通常還需要針對其專注領域進行額外的數據訓練，才能在該領域取得良好表現(xiàn)。

權重

權重是AI訓練的核心要素，決定了訓練數據中不同特征（輸入變量）所被賦予的重要程度，從而影響AI模型的輸出結果。

換句話說，權重是一組數值參數，定義了數據集中哪些內容對于給定訓練任務最為關鍵，并通過與輸入值相乘來實現(xiàn)其功能。模型訓練通常從隨機分配的權重開始，隨著訓練過程的推進，權重會不斷調整，引導模型輸出越來越接近目標結果。

以預測房價的AI模型為例：基于目標地區(qū)歷史房地產數據進行訓練時，模型會為臥室數量、衛(wèi)生間數量、是否為獨立住宅、是否有停車位和車庫等特征賦予相應權重——這些權重反映了各項因素對房產價值的影響程度。

本文將持續(xù)更新，不斷補充新內容。

Q&A

Q1：什么是AI幻覺？為什么會出現(xiàn)這個問題？

A：AI幻覺是指AI模型生成錯誤或虛假信息的現(xiàn)象。這一問題被認為源于訓練數據的缺口——現(xiàn)有數據量不足以覆蓋人類可能提出的所有問題。幻覺現(xiàn)象可能導致生成式AI輸出具有誤導性的內容，甚至帶來現(xiàn)實風險，例如對健康查詢返回有害的醫(yī)療建議。目前大多數生成式AI工具都會在使用條款中提示用戶核實AI生成的內容。

Q2：大語言模型的Token是怎么計費的？

A：Token是大語言模型處理和生成內容的基本單位，相當于模型處理的數據量。大多數AI公司按Token數量收取服務費用，分為輸入Token（用戶發(fā)送的查詢內容）和輸出Token（模型生成的回復內容）兩類。企業(yè)使用AI程序消耗的Token越多，需要支付的費用也就越高，因此Token用量是企業(yè)控制AI使用成本的重要指標。

Q3：AGI和普通AI有什么區(qū)別？

A：普通AI通常只能在特定任務上表現(xiàn)出色，而AGI（通用人工智能）則指在大多數任務上達到或超越人類水平的AI系統(tǒng)。目前各方對AGI的定義不盡相同：OpenAI將其描述為"相當于可雇用的普通水平同事"，谷歌DeepMind則認為AGI是"在大多數認知任務上至少與人類同等能力的AI"。目前AGI尚未真正實現(xiàn)，連AI研究前沿的專家們對其定義也存在分歧。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.