国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

圖靈獎得主楊立昆加盟,全球首家能量模型商業(yè)化公司誕生

0
分享至

去年底剛從 Meta 離職的圖靈獎得主楊立昆(Yann Lecun),在他宣布創(chuàng)辦自己的世界模型公司 AMI Labs 后還不到兩個月,就以另一重身份出現(xiàn)在公眾視野里。本周三,硅谷初創(chuàng)公司 Logical Intelligence 宣布楊立昆出任其技術(shù)研究委員會主席。與此同時,這家成立僅六個月的公司發(fā)布了名為 Kona 1.0 的旗艦產(chǎn)品,據(jù)稱是首個正式進(jìn)入商業(yè)化的能量推理模型(Energy-Based Reasoning Model,EBRM)。


圖丨相關(guān)推文(來源:X)

關(guān)于大語言模型能否實現(xiàn) AGI,業(yè)界的質(zhì)疑從未停止。如果答案是否定的,替代方案在哪里?Logical Intelligence 給出的答案是:能量模型(EBM)。在該公司創(chuàng)始人 Eve Bodnia 看來,LLM 本質(zhì)上是一場猜詞游戲。你給它一個提示,它就預(yù)測下一個詞出現(xiàn)的概率,循環(huán)往復(fù),直到生成一段貌似通順的回答。問題在于,“貌似通順”和邏“輯正確”之間隔著一道深淵。

Bodnia 在接受《金融時報》采訪時打了個比方:你教會一只貓像狗一樣叫,它也不會因此變成一只狗。LLM 能寫出像模像樣的數(shù)學(xué)證明或代碼,但它并不真正理解這些符號背后的推理鏈條。一旦任務(wù)復(fù)雜度提升,或者約束條件增多,它就開始犯錯,而且往往錯得毫無章法。

楊立昆也反復(fù)表達(dá)過類似的觀點。事實上,他在過去幾年反復(fù)強(qiáng)調(diào),僅靠擴(kuò)展 LLM 的規(guī)模不可能實現(xiàn)真正的人類水平智能。他在此前的播客中直言,那些認(rèn)為只需要不斷做大模型就能通向超級智能的想法是“扯淡”(原話是 bullshit)。

楊立昆的核心論點是:LLM 缺乏對物理世界的真實理解,它們只是在文本空間里做模式匹配,無法像人類或動物那樣通過與環(huán)境互動來學(xué)習(xí)因果關(guān)系。他甚至說過,一只家貓擁有的常識都比 GPT-4 多。

于是,當(dāng)楊立昆的名字出現(xiàn)在 Logical Intelligence 的公告里時,毫無疑問這也是他用行動為 EBM 模型站臺。楊立昆本人也在聲明中說,他一直認(rèn)為真正的推理應(yīng)該被表述為優(yōu)化問題,這正是能量模型的基礎(chǔ),即通過最小化一個能量函數(shù)來完成推理和推斷。他評價 Logical Intelligence 是“第一家將基于 EBM 的推理從研究概念推向產(chǎn)品的公司”。

那么,EBM 的具體工作原理是什么?為什么它被認(rèn)為可能彌補(bǔ) LLM 的短板?

簡單來說,EBM 會為每個候選狀態(tài)分配一個“能量”分?jǐn)?shù)。能量越低,意味著這個狀態(tài)越符合約束條件和目標(biāo);能量越高,說明有什么地方出了問題。而這種評分機(jī)制可以施加在部分完成的推理鏈條上,而不必等到最終答案出來才知道對錯。這就像下棋時能評估每一步棋的優(yōu)劣,而不是非要等到終局才知道輸贏。

Logical Intelligence 聲稱,他們的模型 Kona 在三個層面解決了 LLM 推理的固有缺陷。第一,Kona 是非自回歸的。LLM 逐詞生成文本,要想修正前面的錯誤,往往需要重新生成一大段前綴,效率很低。Kona 則可以同時生成完整的推理軌跡,并根據(jù)約束直接進(jìn)行優(yōu)化。

第二,Kona 使用全局評分而非局部評分。LLM 的預(yù)訓(xùn)練目標(biāo)是預(yù)測下一個詞,與長鏈條推理的整體正確性無關(guān)。Kona 學(xué)到的能量函數(shù)可以端到端地評估推理軌跡的質(zhì)量。

第三,Kona 在連續(xù)潛在空間中推理。LLM 的輸出是離散的 token 序列,很難通過梯度信息做細(xì)粒度的局部修正。Kona 輸出的是稠密向量,可以利用近似梯度進(jìn)行可控的編輯,逐步提升推理的一致性。

Logical Intelligence 同時發(fā)布了名為 Aleph 的智能體編排層,專門用于協(xié)調(diào) Kona、LLM 和其他工具的調(diào)用。該公司將 Aleph 與 OpenAI 的 GPT-5.2 配對,在 PutnamBench 上取得了 99.4% 的正確率。

PutnamBench 是一個以 Putnam 數(shù)學(xué)競賽題目為基礎(chǔ)的形式化推理基準(zhǔn),包含來自該競賽過去 50 多年的 672 道難題,每道題都需要用 Lean 等證明語言寫出形式化證明,并由外部編譯器驗證正確性。

根據(jù)公開的排行榜信息,這一成績把 Logical Intelligence 推到了該基準(zhǔn)的榜首位置。據(jù)公司披露,在此次評測中,Aleph 還自動發(fā)現(xiàn)了 15 道題目的形式化描述存在錯誤,并提出了修正建議,這些修正均得到 PutnamBench 團(tuán)隊的核實確認(rèn)。


圖丨Putnam Bench 測試結(jié)果(來源:PutnamBench)

不過要強(qiáng)調(diào)的是,Aleph 本身是基于 LLM 的(它用的是 GPT-5.2),其亮點在于編排和協(xié)調(diào)能力,而不是完全拋開 LLM 另起爐灶。按照 Bodnia 的說法,Aleph 是一個“內(nèi)部工具”,用于測試公司正在構(gòu)建的數(shù)學(xué)環(huán)境的嚴(yán)謹(jǐn)性;真正代表公司技術(shù)核心的是 Kona 這個 EBRM。她在去年 12 月的一次采訪中直言:Aleph 的表現(xiàn)證明了我們的基礎(chǔ)是堅實的,但它只是我們核心模型能力的一個零頭。

Kona 1.0 于 2026 年 1 月 21 日正式公開演示,第一個展示的能力是解數(shù)獨(dú)。在公司網(wǎng)站的實時對比中,Kona 與 OpenAI、Google、Anthropic 等公司的領(lǐng)先 LLM 正面對決,Kona 在速度和能耗上都展現(xiàn)出明顯優(yōu)勢。公司表示后續(xù)還會加入國際象棋和圍棋的演示,目標(biāo)是讓公眾直觀理解“基于能量的推理”與“基于概率的猜測”之間的區(qū)別。

在一篇題為《認(rèn)知的藝術(shù)》的博客文章中,Bodnia 寫道,LLM 讓很多人感到興奮,因為它們很擅長回答個人問題,互動起來很自然,很容易讓人幻想它們能處理更難的問題。

但仔細(xì)想想,我們每天面對的任務(wù)大多數(shù)并不是純粹的語言問題,有的需要空間推理,有的依賴邏輯、規(guī)劃或情緒感知,還有很多根本無法用語言完全表達(dá)。智能不是靜態(tài)的,而是適應(yīng)性的。LLM 在某些事情上做得很好,但它們只是一種智能,許多問題需要另一種路徑。

而這種觀點也與 Eve Bodnia 的獨(dú)特背景不無關(guān)系,她出生于哈薩克斯坦,18 歲移民美國,先在社區(qū)大學(xué)就讀,后轉(zhuǎn)入加州大學(xué)伯克利分校,又在加州大學(xué)圣芭芭拉分校攻讀博士。她的研究方向包括暗物質(zhì)探測、量子力學(xué)和粒子物理,發(fā)表過 22 篇相關(guān)論文,還與 Google Quantum AI 有過合作。

她個人網(wǎng)站上的自我介紹顯示,她對代數(shù)拓?fù)浜屠钊涸趯W(xué)習(xí)系統(tǒng)形式化中的應(yīng)用很感興趣。這種數(shù)學(xué)物理背景使她對可驗證性有一種近乎執(zhí)念式的追求。

除了 Bodnia 和楊立昆,Logical Intelligence 還拉來菲爾茲獎得主 Michael Freedman 出任首席數(shù)學(xué)官,前 Facebook 工程師、國際大學(xué)生程序設(shè)計競賽(ICPC)世界冠軍 Vlad Isenbaev 擔(dān)任首席 AI 官,曾任幣安首席戰(zhàn)略官和通用電氣高管的 Patrick Hillmann 則負(fù)責(zé)戰(zhàn)略規(guī)劃。


圖丨Logical Intelligence 創(chuàng)始團(tuán)隊(來源:Logical Intelligen)

根據(jù)《金融時報》等媒體報道,Logical Intelligence 正在籌備新一輪融資,目標(biāo)估值在 10 億至 20 億美元之間。公司計劃在本季度晚些時候與能源、先進(jìn)制造和半導(dǎo)體行業(yè)的部分合作伙伴啟動 Kona 1.0 的試點項目。

當(dāng)然,這個領(lǐng)域并非只有 Logical Intelligence 一家在探索。Robinhood 聯(lián)合創(chuàng)始人 Vlad Tenev 投資的 Harmonic 同樣專注于形式化推理,其旗艦?zāi)P?Aristotle 在 2025 年國際數(shù)學(xué)奧林匹克競賽中達(dá)到金牌水平。

不過,Harmonic 走的是數(shù)學(xué)超級智能(Mathematical Superintelligence)路線,仍在 LLM 框架內(nèi)通過形式化驗證來消除幻覺;而 Logical Intelligence 則明確標(biāo)榜自己是“語言無關(guān)的”(language-free),直接繞過 token,在結(jié)構(gòu)化狀態(tài)空間中推理。兩者的技術(shù)路徑存在本質(zhì)差異。

楊立昆本人的布局更是多線并行。他創(chuàng)辦的 AMI Labs 專注于世界模型,據(jù)報道正以約 35 億美元的估值融資 5 億歐元,總部將設(shè)在巴黎。世界模型的目標(biāo)是讓 AI 理解物理世界的因果關(guān)系,通過視頻和空間數(shù)據(jù)學(xué)習(xí),而不只是消化文本。

據(jù)報道,楊立昆和 Bodnia 都認(rèn)為真正的人類水平 AI 需要組合多種模型。從楊立昆同時參與世界模型公司 AMI Labs 和能量型推理公司 Logical Intelligence 來看,他顯然也是在多個技術(shù)方向同時下注。

也有人持懷疑態(tài)度。一位匿名 AI 投資人在接受 Upstarts 采訪時表示,他懷疑大多數(shù) AI 生成的代碼最終是否真的需要形式化驗證。畢竟,形式化方法在狹義的、高度規(guī)范化的領(lǐng)域效果最好,能否推廣到更廣泛的應(yīng)用場景仍是未知數(shù)。

更何況,OpenAI、Google 等大型實驗室也在大力改進(jìn)自家推理模型的可靠性。Harmonic 的 CEO Tudor Achim 承認(rèn),形式化證明系統(tǒng)在精確度上無可挑剔,但要轉(zhuǎn)化為可持續(xù)的商業(yè)收入,還需要證明自己在學(xué)術(shù)競賽之外的實際價值。

參考資料:

1.https://www.ft.com/content/157bb0e3-9d6c-47ac-afc5-6944981e10ef

2.https://www.upstartsmedia.com/p/math-ai-startups-push-new-models

3.https://finance.yahoo.com/news/logical-intelligence-achieves-76-percent-141500227.html

4.https://logicalintelligence.com/blog/energy-based-models-for-reasoning

運(yùn)營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
第一個捐款的明星出現(xiàn)了!苗圃現(xiàn)身嫣然醫(yī)院捐款,更多名人發(fā)聲了

第一個捐款的明星出現(xiàn)了!苗圃現(xiàn)身嫣然醫(yī)院捐款,更多名人發(fā)聲了

萌神木木
2026-01-21 17:18:03
僅用35分鐘判定無罪!美聯(lián)邦重拳打空:關(guān)鍵時刻陪審團(tuán)緊急出手

僅用35分鐘判定無罪!美聯(lián)邦重拳打空:關(guān)鍵時刻陪審團(tuán)緊急出手

阿器談史
2026-01-21 21:15:34
別再買錯了!網(wǎng)購時“旗艦店”和“官方店”差2字,背后差別不小

別再買錯了!網(wǎng)購時“旗艦店”和“官方店”差2字,背后差別不小

復(fù)轉(zhuǎn)這些年
2026-01-20 08:10:05
國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

像夢一場a
2026-01-21 20:10:16
沒有陽剛之氣就別演“大俠”,《鏢人》中謝霆鋒,給內(nèi)娛上了一課

沒有陽剛之氣就別演“大俠”,《鏢人》中謝霆鋒,給內(nèi)娛上了一課

糊咖娛樂
2026-01-22 11:48:48
與西貝剛好相反,薩莉亞生怕你不知道它用預(yù)制菜

與西貝剛好相反,薩莉亞生怕你不知道它用預(yù)制菜

狐貍先森講升學(xué)規(guī)劃
2026-01-20 13:41:33
字母哥爆了!正式和里弗斯翻臉,拒絕溝通不理教練!想走就別裝了

字母哥爆了!正式和里弗斯翻臉,拒絕溝通不理教練!想走就別裝了

嘴炮體壇
2026-01-22 14:19:10
10國簽字加入特朗普和平委員會,特意給中俄留的位置,現(xiàn)在還空著

10國簽字加入特朗普和平委員會,特意給中俄留的位置,現(xiàn)在還空著

素年文史
2026-01-22 08:58:28
伊朗官媒:3117人在近期騷亂事件中死亡

伊朗官媒:3117人在近期騷亂事件中死亡

澎湃新聞
2026-01-22 02:39:03
牢A事件發(fā)酵!第一代在吸中國爹媽的血,斬殺線離他們后代很近…

牢A事件發(fā)酵!第一代在吸中國爹媽的血,斬殺線離他們后代很近…

火山詩話
2026-01-22 06:10:32
彭總錯殺袁文才后,毛主席是何態(tài)度?有人透露:主席一生都沒釋懷

彭總錯殺袁文才后,毛主席是何態(tài)度?有人透露:主席一生都沒釋懷

南書房
2026-01-22 06:00:09
曝嫣然醫(yī)院房東張毅:履歷被扒,漲租金或想收回來自己搞醫(yī)美

曝嫣然醫(yī)院房東張毅:履歷被扒,漲租金或想收回來自己搞醫(yī)美

古希臘掌管月桂的神
2026-01-21 12:41:44
曾不顧恩師反對,常昊執(zhí)意娶大8歲師姑為妻,后來兩人過得怎樣?

曾不顧恩師反對,常昊執(zhí)意娶大8歲師姑為妻,后來兩人過得怎樣?

秋姐居
2026-01-19 22:01:43
越南數(shù)萬名球迷街頭圍觀“中越之戰(zhàn)”,鄭州球迷“混入”其中:中國隊進(jìn)球時,周圍是寂靜的、我內(nèi)心是沸騰的

越南數(shù)萬名球迷街頭圍觀“中越之戰(zhàn)”,鄭州球迷“混入”其中:中國隊進(jìn)球時,周圍是寂靜的、我內(nèi)心是沸騰的

極目新聞
2026-01-21 12:05:57
拳王鄒市明創(chuàng)業(yè)失敗后,妻子自曝家庭節(jié)儉開支:水費(fèi)每月100元,兒子午飯39.5元

拳王鄒市明創(chuàng)業(yè)失敗后,妻子自曝家庭節(jié)儉開支:水費(fèi)每月100元,兒子午飯39.5元

紅星新聞
2026-01-21 17:10:09
武統(tǒng)、和統(tǒng)都沒戲了?臺軍事專家:中國大陸已經(jīng)在走第三條路

武統(tǒng)、和統(tǒng)都沒戲了?臺軍事專家:中國大陸已經(jīng)在走第三條路

近史博覽
2026-01-18 16:23:54
寶馬越野車被困汝河,60歲于東來跳入冰水施救,目擊者:他很熱心腸,專門返程救援

寶馬越野車被困汝河,60歲于東來跳入冰水施救,目擊者:他很熱心腸,專門返程救援

極目新聞
2026-01-22 13:19:50
李心月曝黃曉明baby離婚原因!baby婚內(nèi)出軌鄧某,車內(nèi)運(yùn)動被發(fā)現(xiàn)

李心月曝黃曉明baby離婚原因!baby婚內(nèi)出軌鄧某,車內(nèi)運(yùn)動被發(fā)現(xiàn)

八卦王者
2026-01-21 15:52:49
上海一女子崩潰!頭發(fā)大面積脫落,已嚴(yán)重潰爛,理發(fā)師:別再折騰了……

上海一女子崩潰!頭發(fā)大面積脫落,已嚴(yán)重潰爛,理發(fā)師:別再折騰了……

環(huán)球網(wǎng)資訊
2026-01-20 21:13:24
牛鬼神蛇現(xiàn)原形!聶衛(wèi)平去世僅一天,私生活被扒,王剛郎平被牽連

牛鬼神蛇現(xiàn)原形!聶衛(wèi)平去世僅一天,私生活被扒,王剛郎平被牽連

春露秋霜
2026-01-16 06:27:20
2026-01-22 16:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16163文章數(shù) 514518關(guān)注度
往期回顧 全部

財經(jīng)要聞

申通快遞創(chuàng)始人被前夫索要股份

頭條要聞

特朗普邀請普京加入和平委員會:他辦實事 影響力巨大

頭條要聞

特朗普邀請普京加入和平委員會:他辦實事 影響力巨大

體育要聞

珍妮回應(yīng)爆料:湖人不感激詹姆斯付出絕非事實

娛樂要聞

鐘麗緹土耳其高空落淚 與張倫碩擁吻

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

汽車要聞

今年集中上市 旅行車的春天可能真要來了

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
本地
公開課

藝術(shù)要聞

一場雪,飄進(jìn)了唐詩

親子要聞

程曉玥曬挺大孕肚澳洲產(chǎn)檢!二胎高鼻梁顏值高,孕晚期還喝冰咖啡

家居要聞

法式風(fēng)情 南洋中古居

本地新聞

云游中國|格爾木的四季朋友圈,張張值得你點贊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版