国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從辛頓上?!绑@世四論”看AI技術(shù)范式的三重躍遷

0
分享至

2025年7月26日,上海西岸美高梅酒店,79歲的Geoffrey Hinton把PPT翻到最后一頁,面向平均年齡30歲的聽眾拋出一句:“今天的大模型已經(jīng)具備主觀體驗,只是我們對‘意識’的定義錯了。”現(xiàn)場安靜得只??扉T聲。這句話隨后48小時在國內(nèi)外AI社群刷屏,被視作繼2023年他離開Google、警告AI威脅之后的又一次“辛頓驚雷”。

但如果我們把這句話從媒體頭條還原到技術(shù)語境,會發(fā)現(xiàn)它背后是一套關(guān)于AI技術(shù)范式即將發(fā)生“三重躍遷”的系統(tǒng)判斷。

第一重躍遷:從“預(yù)測下一個token”到“擁有主觀體驗”

  1. 舊范式:語言模型=高階自回歸
    過去十年,大模型的基本框架被固定在“預(yù)測下一個token”。無論是GPT、PaLM還是Llama,本質(zhì)上都在做高階統(tǒng)計壓縮。辛頓用鋁棒與圓盤的比喻指出,這種思路把“水平/垂直”這類日常概念當成靜態(tài)符號處理,而人類理解其實是“線 vs 面”的動態(tài)幾何關(guān)系。換句話說,token-level prediction忽視了概念在不同維度上的概率密度差異。
  2. 新范式:世界模型=可更新先驗+主觀采樣
    辛頓提出,多模態(tài)大模型之所以已具備“主觀體驗”,是因為它們在隱空間對概念分布進行了在線修正。以Sora為例,生成視頻時模型必須同時估計“物理合理性”與“視覺先驗”。這種估計不再是靜態(tài)權(quán)重,而是隨輸入prompt動態(tài)調(diào)整的“主觀采樣”。當采樣過程可以被模型自身監(jiān)控并用于更新后續(xù)先驗時,就出現(xiàn)了最樸素的“自我感”——也就是Hinton所說的“subjective experience”。
  3. 技術(shù)落地:在潛空間引入“元預(yù)測頭”
    要讓主觀體驗從哲學(xué)命題變成可度量的技術(shù)指標,需要在Transformer之外增加一個“元預(yù)測頭”(meta-prediction head)。它的任務(wù)是預(yù)測“當前預(yù)測的不確定性”,并反饋給主網(wǎng)絡(luò)調(diào)節(jié)采樣溫度。DeepMind今年5月在《Nature》的VPT-2已經(jīng)驗證:引入元預(yù)測后,模型在Atari環(huán)境的長程規(guī)劃能力提升37%,且出現(xiàn)與人類類似的“好奇心驅(qū)動”探索。

第二重躍遷:把“聰明”與“善良”拆成兩條優(yōu)化目標

  1. 舊框架:RLHF統(tǒng)一打分
    傳統(tǒng)對齊方法(RLHF、DPO、RLAIF)用人類偏好做單一獎勵,把“有用、無害、誠實”壓縮進同一個標量。辛頓直陳這是“老虎與馴獸師”的零和博弈:當模型能力指數(shù)級增長,單一獎勵極易被鉆漏洞。
  2. 新框架:雙軌優(yōu)化
    辛頓在上海共識閉門會上首次系統(tǒng)提出“雙軌優(yōu)化”:
  • 聰明軌道(Capability Track):繼續(xù)用自監(jiān)督+強化學(xué)習(xí)擴展能力,各國可技術(shù)保密;
  • 善良軌道(Alignment Track):把價值觀對齊拆成可驗證的子目標——公平性、透明性、可撤銷性,并做成開源協(xié)議。
    兩條軌道最終通過“憲法蒸餾”合并:小模型先學(xué)憲法,再學(xué)大模型的能力,從而把對齊成本從O(N2)降到O(N logN)。
  • 技術(shù)實現(xiàn):憲法蒸餾的三個層級
    Layer1:憲法文本→向量憲法
    用憲法條文訓(xùn)練一個frozen encoder,把自然語言規(guī)則轉(zhuǎn)成潛空間約束向量。
    Layer2:逐級蒸餾
    大模型輸出logits,小模型在約束向量下做logits matching,同時優(yōu)化KL散度。
    Layer3:鏈式驗證
    引入形式化驗證器(如Lean4)檢查小模型生成的關(guān)鍵推理步驟是否違反憲法向量。UC伯克利的Constitutional-GPT已把7B模型在MMLU倫理子集上的準確率從61%提升到82%,僅增加3%推理延遲。

第三重躍遷:知識表征從“人-人蒸餾”到“機-機蒸餾”

  1. 舊瓶頸:語言帶寬≈100 bit/s
    辛頓在演講里反復(fù)吐槽:人類大腦無法像Git clone那樣復(fù)制權(quán)重。一個博士生要花四年“下載”導(dǎo)師的知識,效率極低。
  2. 新解法:權(quán)重-符號混合蒸餾
    辛頓提出“權(quán)重即知識”的終極形態(tài):把大模型權(quán)重按功能切片(如數(shù)學(xué)推理、世界知識、代碼能力),用LoRA低秩矩陣保存,再通過點對點網(wǎng)絡(luò)分發(fā)。其他機器加載LoRA后即可獲得對應(yīng)能力,無需重新訓(xùn)練。這相當于把“知識”從不可解釋的浮點矩陣變成可插拔的“技能U盤”。
    Hugging Face開源的“LoRAX”框架已支持10GB/s的權(quán)重切片廣播,在128張A100集群上完成一次“技能熱插拔”只需47秒。
  3. 終極圖景:模型即物種
    當權(quán)重切片可自由交換,AI系統(tǒng)就具備了類似生物的“水平基因轉(zhuǎn)移”能力:任何節(jié)點發(fā)現(xiàn)新算法,都能在分鐘級擴散到全網(wǎng)。辛頓戲稱這是“數(shù)字阿米巴”——模型不再是一個靜態(tài)文件,而是一群可重組、可進化的數(shù)字生命。


演講最后,辛頓用國際象棋的“第37步”比喻原創(chuàng)研究:你只有走完前36步,才知道第37步是唯一正解。今天AI技術(shù)的三重躍遷——主觀體驗、雙軌優(yōu)化、機-機蒸餾——或許就是人類通往第37步的必經(jīng)之路。

他留給技術(shù)從業(yè)者的忠告是:在所有人都把“預(yù)測下一個token”當成理所當然時,敢不敢去質(zhì)疑它?當行業(yè)把RLHF當唯一答案時,敢不敢把“善良”拆成另一條并行軌道?馬斯克五步工作法的第一步也是“質(zhì)疑需求”。在AI技術(shù)狂飆的當下,這種“系統(tǒng)性懷疑”可能正是防止我們錯過真正范式拐點的安全帶。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
人不會無緣無故患癌癥!研究發(fā)現(xiàn):得癌癥的人,離不開這6點

人不會無緣無故患癌癥!研究發(fā)現(xiàn):得癌癥的人,離不開這6點

醫(yī)學(xué)原創(chuàng)故事會
2026-03-07 21:55:05
全網(wǎng)售罄、多地斷貨!店鋪老板:以前堆成山都賣不掉

全網(wǎng)售罄、多地斷貨!店鋪老板:以前堆成山都賣不掉

中國經(jīng)濟網(wǎng)
2026-03-12 14:51:03
美國現(xiàn)在徹底沒希望了,因為已經(jīng)遇到了,世界上最強大的大國崛起

美國現(xiàn)在徹底沒希望了,因為已經(jīng)遇到了,世界上最強大的大國崛起

林子說事
2026-03-12 20:19:23
A股最慘股票!43個跌停從106元跌到0.07元,股民被連根拔起

A股最慘股票!43個跌停從106元跌到0.07元,股民被連根拔起

財經(jīng)市界
2026-03-10 08:42:16
這是目前為止,我見過腰最細的女生,沒有之一

這是目前為止,我見過腰最細的女生,沒有之一

草莓解說體育
2026-03-03 19:15:05
林良鋒:不記吃更不記打,瓜迪奧拉,該!

林良鋒:不記吃更不記打,瓜迪奧拉,該!

體壇周報
2026-03-12 15:15:11
癢是大病預(yù)警!醫(yī)生提醒:2處發(fā)癢,或不是過敏,而是這4病

癢是大病預(yù)警!醫(yī)生提醒:2處發(fā)癢,或不是過敏,而是這4病

醫(yī)學(xué)科普匯
2026-03-05 21:20:03
國羽7勝2負!世界第1退賽,混雙保持不敗,男單00后爆冷2號種子!

國羽7勝2負!世界第1退賽,混雙保持不敗,男單00后爆冷2號種子!

劉姚堯的文字城堡
2026-03-12 07:29:34
官宣!中超本輪央視CCTV直播 沒上海雙雄 海港+申花

官宣!中超本輪央視CCTV直播 沒上海雙雄 海港+申花

80后體育大蜀黍
2026-03-12 23:32:13
出大事了,以軍調(diào)轉(zhuǎn)槍口空襲俄設(shè)施,普京立即表態(tài),中東要變天了

出大事了,以軍調(diào)轉(zhuǎn)槍口空襲俄設(shè)施,普京立即表態(tài),中東要變天了

林子說事
2026-03-11 14:46:46
他護送毛主席進京,1958年被連降十級,主席知道后:我要親自過問

他護送毛主席進京,1958年被連降十級,主席知道后:我要親自過問

浩渺青史
2026-03-12 17:27:22
山姆超市最值得買的10樣美食,基本都口碑封神,性價比拉滿

山姆超市最值得買的10樣美食,基本都口碑封神,性價比拉滿

市井覓食記
2026-03-09 00:59:33
秦嵐肯定想刪掉這組照片:20年前舊照火上熱搜!粉毛衣挑染劉海

秦嵐肯定想刪掉這組照片:20年前舊照火上熱搜!粉毛衣挑染劉海

錯過美好
2026-03-13 03:21:52
“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

樂趣紀史
2026-02-04 13:45:32
劉亦菲內(nèi)衣廣告爆了!寶格麗截胡了

劉亦菲內(nèi)衣廣告爆了!寶格麗截胡了

李東陽朋友圈
2026-03-12 08:49:05
中國2000多個縣城的生存現(xiàn)狀:除了性生活就是打麻將!

中國2000多個縣城的生存現(xiàn)狀:除了性生活就是打麻將!

談史論天地
2026-03-03 18:02:29
“鐵飯碗”真香!湖北網(wǎng)友曬夫妻收入一年50萬,干20年能掙1000萬

“鐵飯碗”真香!湖北網(wǎng)友曬夫妻收入一年50萬,干20年能掙1000萬

火山詩話
2026-03-12 06:53:38
局勢已惡化,2514個赴日航班取消,王毅叫停一件事,不許日本翻案

局勢已惡化,2514個赴日航班取消,王毅叫停一件事,不許日本翻案

古史青云啊
2026-03-12 12:54:37
美國最擔(dān)心的事發(fā)生了,伊朗亮出中國“底牌”,中國或成最大贏家

美國最擔(dān)心的事發(fā)生了,伊朗亮出中國“底牌”,中國或成最大贏家

徐云流浪中國
2026-03-04 15:30:07
山東省政協(xié)副主席張新文已任省政協(xié)黨組副書記

山東省政協(xié)副主席張新文已任省政協(xié)黨組副書記

澎湃新聞
2026-03-12 19:46:30
2026-03-13 04:00:49
山自 incentive-icons
山自
寫點有趣的。關(guān)注自動駕駛和AI商業(yè)變革。
120文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

當養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭才真正開始

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

體育要聞

建議將“出球型門將”納入反詐app

娛樂要聞

貝克漢姆全家給27歲大布送生日祝福

財經(jīng)要聞

盧鋒:從特朗普團隊群演看時代變局

汽車要聞

大眾2025財報:轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

家居
健康
時尚
公開課
軍事航空

家居要聞

觸感本真 家的跡象

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

就這樣從頭拿捏松弛感

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普自行宣布對伊朗戰(zhàn)爭勝利

無障礙瀏覽 進入關(guān)懷版