国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI 什么時(shí)候才算能用?3 億估值團(tuán)隊(duì)給出兩個(gè)字:“驗(yàn)收”

0
分享至

全文 3,000字 | 閱讀約 8 分鐘


(對(duì)話 Axiom Math 創(chuàng)始人:AI 最重要的品質(zhì))

2025 年,幾乎每一場(chǎng) AI 發(fā)布會(huì)都在說“我們能做什么”。

但企業(yè)真正卡住的,是另一個(gè)問題:AI 做出來的結(jié)果,怎么證明是對(duì)的?

很多 AI 產(chǎn)品上線前 demo 演示得很好,一上線就出問題:

錯(cuò)誤定位不了,

責(zé)任追不清楚,

結(jié)果復(fù)現(xiàn)不了。

最后只能說:沒法驗(yàn)收。

Axiom Math,一家總部在舊金山的 AI 初創(chuàng)公司,換了個(gè)思路:不是追求 AI 能做什么,而是證明它做對(duì)了什么。

這家剛在 2025 年 10 月完成種子輪融資(6400 萬美元,估值 3 億美元,B Capital 領(lǐng)投)的公司,在做一個(gè) AI 數(shù)學(xué)家,能獨(dú)立給出答案,也能自己驗(yàn)證對(duì)錯(cuò)

也因此,這個(gè)團(tuán)隊(duì)吸引了一批技術(shù)背景極深的人: Meta FAIR、Google Brain的前核心研究員, 還有創(chuàng)始人Carina Hong 在 MIT 的導(dǎo)師、知名數(shù)學(xué)家Ken Ono。

Carina Hong,24歲。

2025 年 12 月 21日,有媒體問她如何招人,她的回答很簡(jiǎn)單:

問題夠難,人自然會(huì)聚過來。

這不是空話。她的方法就是找到一個(gè)值得花十年去解的難題,然后等那些真正的高手主動(dòng)找上門。

24 歲,6400 萬美元,估值 3 億。

她在賭的不是一個(gè)產(chǎn)品,而是 AI 的下一個(gè)及格線。

第一節(jié)|24歲,3億估值,她要讓 AI 學(xué)會(huì)自證

她叫 Carina Hong,出生在廣州。

小時(shí)候做奧數(shù)題的時(shí)候,她并不知道未來會(huì)站在硅谷講 AI。但她記得,每解決一道題,就像小孩通關(guān)游戲,停不下來。

她一路從廣州考到MIT,再拿到羅德獎(jiǎng)去牛津?qū)W神經(jīng)科學(xué), 最后跑去斯坦福讀數(shù)學(xué)博士+法學(xué)博士聯(lián)合項(xiàng)目。

在MIT,她修了 20 門研究生數(shù)學(xué)課程,發(fā)表了9篇論文,還研究過神經(jīng)網(wǎng)絡(luò)如何理解函數(shù)。在牛津,她待在UCL蓋茨比研究所(DeepMind 的誕生地),第一次近距離看到 AI 在解決真實(shí)問題:圖像、序列、控制模型。

她開始問自己:如果 AI 能玩游戲、能寫代碼,為什么不能做數(shù)學(xué)?

真正的轉(zhuǎn)折發(fā)生在硅谷。

她在斯坦福念博時(shí),常去一家咖啡館寫論文。 一次偶然的機(jī)會(huì),她認(rèn)識(shí)了 Meta FAIR團(tuán)隊(duì)的 AI 科學(xué)家Shubho Sengupta。

一個(gè)是數(shù)學(xué)家,想讓 AI 理解數(shù)學(xué)。

一個(gè)是工程師,想找到 AI 真正值得解決的問題。

他們聊了兩個(gè)小時(shí),沒談項(xiàng)目,也沒講融資。只是圍繞一個(gè)假設(shè)展開:能不能造一個(gè)AI 數(shù)學(xué)家?

那次對(duì)話之后,她開始認(rèn)真思考這件事。不久后,她退學(xué)了。

她說:有些問題,在學(xué)校解決太慢了。

她要做的,不是聊天機(jī)器人,也不是代碼助手,而是一個(gè)能驗(yàn)證定理、甚至提出新猜想的 AI 系統(tǒng)。

這個(gè)系統(tǒng)叫 Axiom,公理的意思,也就是數(shù)學(xué)理論最基本的起點(diǎn)。

從這個(gè)起點(diǎn)出發(fā),開發(fā)一整套系統(tǒng),讓 AI 也能探索數(shù)學(xué)的邊界。

第二節(jié)|Putnam考試9/12,但重點(diǎn)不是分?jǐn)?shù)

大多數(shù)人理解 AI 學(xué)數(shù)學(xué),想到的可能是考試、給答案。

但 Carina說,那只是第一步。真正重要的,是它知不知道自己答得對(duì)不對(duì)。

這不僅是數(shù)學(xué)問題,也是工程問題。 AI 的答案如果不能被驗(yàn)證,就沒法用在關(guān)鍵場(chǎng)景。

人類做數(shù)學(xué)題,有個(gè)天然優(yōu)勢(shì):我們能回頭檢查, 證明有沒有邏輯漏洞,推理有沒有跳步,細(xì)節(jié)前后一不一致。

Carina 把這個(gè)檢查的過程,叫做“驗(yàn)收”。

但大模型不行。

它們會(huì)生成很多內(nèi)容,卻很難自己確認(rèn)這些內(nèi)容是不是對(duì)的。尤其在數(shù)學(xué)里,哪怕多一個(gè)字母出錯(cuò),整個(gè)結(jié)論就不成立。

要解決這個(gè)問題,就要靠形式化語言。

Carina 的團(tuán)隊(duì)用的是一種叫 Lean 的數(shù)學(xué)編程語言。 所有的公式、步驟、證明,必須像程序一樣寫清楚,而且要能被機(jī)器驗(yàn)證通過。

這意味著,不是 AI 說對(duì)就對(duì),而是它每走一步都要留下可檢查的痕跡,最后像軟件測(cè)試一樣通過驗(yàn)證。

為了證明這套方法可行,他們做了個(gè)測(cè)試。

2025 年 12月,美國(guó) Putnam 數(shù)學(xué)競(jìng)賽剛結(jié)束,這是全美最難的本科生數(shù)學(xué)競(jìng)賽,參賽者約 4000 人。Carina 團(tuán)隊(duì)在 X 上發(fā)布結(jié)果:AxiomProver 自主解決了其中 9 道題,在 Lean 語言中給出形式化證明,并全部通過了驗(yàn)證。

這不僅僅是做對(duì)了 9 題,而是 AI 自己做題、自己檢查、自己確認(rèn)通過。

Carina 說:

“我們不是追求一個(gè)能抄答案的 AI,而是一個(gè)能完成所有數(shù)學(xué)細(xì)節(jié)的合作者?!?/p>

驗(yàn)收的真正含義是什么?

就是 AI 不僅要給出答案,還要證明答案是對(duì)的。

在芯片設(shè)計(jì)、科學(xué)研究、金融系統(tǒng)這些容錯(cuò)率低的場(chǎng)景里,模糊的答案沒有任何價(jià)值。AI 得能給出過程、解釋思路、接受檢查。

能被驗(yàn)收,才意味著能被信任。

第三節(jié)|Meta、Google的人為什么離職來這里

要做到這一點(diǎn),需要什么樣的團(tuán)隊(duì)?

這個(gè)團(tuán)隊(duì)不大,現(xiàn)在也只有 17 人,但每一個(gè)加入的人,都是各自領(lǐng)域的頂尖研究者。

CTO Shubho Sengupta,是 Carina 在斯坦福附近的咖啡館偶遇的。 他原本在Meta FAIR,帶隊(duì)開發(fā)過OpenGo和CrypTen,也參與過早期的CUDA GPU架構(gòu)。他知道大模型的問題,也知道數(shù)學(xué)領(lǐng)域?yàn)槭裁措y。

但在大公司,目標(biāo)太分散。他想找一個(gè)地方,專注解決一個(gè)極限難題。

另一位核心成員 Fran?ois Charton,早在 2019 年就在研究怎么用 Transformer解決積分問題。他不放過任何一個(gè)細(xì)節(jié),不看大模型能寫出多少,而是看它會(huì)不會(huì)走錯(cuò)哪一步。

還有Hugh Leather,做的是深度學(xué)習(xí)與編譯器的結(jié)合。 他不是傳統(tǒng)意義上的數(shù)學(xué)家,但在用代碼表達(dá)復(fù)雜邏輯上,他有深厚的積累。

他們都從 Meta、Google 這樣的地方走出來,放棄了更穩(wěn)定的研究路徑。

Carina 提供的不是職位,而是一種愿景: 用 AI 做出可驗(yàn)證的數(shù)學(xué)成果,每一步清晰,每個(gè)結(jié)論都能站得住。

而這個(gè)愿景吸引來的,不只是業(yè)界的 AI 研究員。

2025 年 12 月初,57 歲的數(shù)學(xué)家 Ken Ono 也辭掉了弗吉尼亞大學(xué)的終身教職,全職加入 Axiom 。

他曾是 Carina 的導(dǎo)師,領(lǐng)導(dǎo)過多個(gè)數(shù)學(xué)奧林匹克研究項(xiàng)目,是拉馬努金理論的專家,也上過超級(jí)碗的廣告,是個(gè)把數(shù)論帶進(jìn)大眾文化的人。

他說,作為純數(shù)學(xué)家,他很少有機(jī)會(huì)參與改變世界的事。 這一次,他不想錯(cuò)過,帶著家人搬到硅谷, 成了 Axiom 的第15位成員, 身份是創(chuàng)始數(shù)學(xué)家。

他的任務(wù)不是寫代碼, 而是設(shè)計(jì)難題,測(cè)試模型推理的極限。

Carina 說,這些人之所以愿意來,并不是為了趕熱潮,而是想做一件真正值得做的事

“我們不是在做一個(gè)產(chǎn)品,是在定義一套新標(biāo)準(zhǔn):每個(gè)公式都可檢查,每道推理過程都可追溯。AI 不是生成一個(gè)答案,而是展示完整的思考過程?!?/p>

這就是他們 17 個(gè)人正在做的事。

第四節(jié)|不是解題,而是教 AI 提問

定義新標(biāo)準(zhǔn),只是 Carina 的第一步。

她真正想做的,是讓 AI 學(xué)會(huì)發(fā)現(xiàn)問題本身。

他們最近在研究一個(gè)數(shù)學(xué)界著名的未解難題:Collatz 猜想。 這個(gè)問題簡(jiǎn)單得像小學(xué)生游戲,卻困住了研究者幾十年。

Axiom 的研究員用 Transformer 模型去學(xué)這個(gè)問題, 模型沒能直接給出證明, 但展現(xiàn)出了另一種能力:

它在預(yù)測(cè) Collatz 序列時(shí),對(duì)萬億級(jí)數(shù)字的準(zhǔn)確率達(dá)到了99.8%。

更重要的是,它為什么錯(cuò)、錯(cuò)在哪,都能被清楚地解釋。這些錯(cuò)誤背后有明確的規(guī)律,而不是隨機(jī)的幻覺。

這意味著什么?

意味著 AI 不是在記憶答案,而是在學(xué)習(xí)數(shù)學(xué)思維。

在 Carina 看來,他們不是讓 AI 找已知答案,而是訓(xùn)練它像一個(gè)真正的數(shù)學(xué)家一樣去思考,去探索。

她所說的探索,主要分成三個(gè)階段:

  • 第一步,用形式語言表達(dá)定理,模仿已有的邏輯結(jié)構(gòu)。

  • 第二步,驗(yàn)證舊問題的不同解法,提出新的證明路線。

  • 第三步,提出新猜想,創(chuàng)造從未出現(xiàn)過的問題并給出數(shù)學(xué)依據(jù)。

整個(gè)過程,不是 ChatGPT 式的隨機(jī)對(duì)話,而是在證明空間里有規(guī)則地探索,不斷嘗試,直到找到新的路徑。

這種探索為什么重要?

因?yàn)閿?shù)學(xué)是人類最嚴(yán)密的語言,也是現(xiàn)實(shí)世界運(yùn)轉(zhuǎn)的底層邏輯。每一個(gè)數(shù)學(xué)突破,都可能帶來這些領(lǐng)域的飛躍。

Carina 相信,數(shù)學(xué)研究曾經(jīng)以十年一進(jìn)展的速度運(yùn)行, 現(xiàn)在 AI 可以把這個(gè)周期縮短到幾個(gè)月。

而 AI 數(shù)學(xué)家未來能做的,不只是解題,更是和人一起重新定義問題本身。

這不只是數(shù)學(xué)領(lǐng)域的事。無論是密碼學(xué)、芯片結(jié)構(gòu)、物理建模,背后都依賴于能被精確描述與檢驗(yàn)的數(shù)學(xué)原理。一旦 AI 能做到可驗(yàn)證,它就能從“只能試試看”的輔助工具,變成“可以放心用”的合作者。

這,正是 Carina 在押注的那條線:

AI 的下一個(gè)及格線,不是能力,是可信度。

結(jié)語|能被驗(yàn)收的,才叫AI

Carina 的想法很簡(jiǎn)單。

她只給出一個(gè)判斷標(biāo)準(zhǔn):AI 說得對(duì)不對(duì),不是看有沒有人信,而是看它能不能自己交代清楚。

Axiom Math 在做的,就是讓 AI 必須講明白。 不是讓模型更像人,而是讓它能被信任。

真正能用的 AI,不靠 Demo,靠驗(yàn)收。

這個(gè)標(biāo)準(zhǔn)一旦成立,AI 走進(jìn)科研、金融、芯片、法律,才算真正開始。

而她,只是把這扇門推開了一點(diǎn)點(diǎn)。

識(shí)自AI

本文由AI深度研究院出品,內(nèi)容基于Carina Hong公開采訪視頻翻譯整理,并結(jié)合公開報(bào)道進(jìn)行分析解讀。翻譯力求準(zhǔn)確傳達(dá)原意,分析內(nèi)容為編輯部觀點(diǎn)。未經(jīng)授權(quán),不得轉(zhuǎn)載。

星標(biāo)公眾號(hào), 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)

https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s

https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html

https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12

https://www.turingpost.com/p/carina

來源:官方媒體/網(wǎng)絡(luò)新聞,

排版:Atlas

編輯:深思

主編:圖靈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大潰??!中國(guó)網(wǎng)貸公司,在印度全軍覆沒

大潰敗!中國(guó)網(wǎng)貸公司,在印度全軍覆沒

首席品牌評(píng)論
2026-01-07 18:20:00
萬萬沒想到,小國(guó)朝鮮霸占四個(gè)世界第一,至今無人能破?

萬萬沒想到,小國(guó)朝鮮霸占四個(gè)世界第一,至今無人能破?

素年文史
2026-01-20 20:05:03
千人相送只是冰山一角,看了向華炎的葬禮,才知何謂真正的大佬!

千人相送只是冰山一角,看了向華炎的葬禮,才知何謂真正的大佬!

青橘罐頭
2026-01-21 19:34:14
退錢哥:經(jīng)中國(guó)使館與沙特足協(xié)協(xié)商,中國(guó)球迷決賽將免票入場(chǎng)

退錢哥:經(jīng)中國(guó)使館與沙特足協(xié)協(xié)商,中國(guó)球迷決賽將免票入場(chǎng)

懂球帝
2026-01-21 22:21:07
98年瀘定縣慘案:690元引發(fā)血案,24歲民警遭圍毆后槍殺10名村民

98年瀘定縣慘案:690元引發(fā)血案,24歲民警遭圍毆后槍殺10名村民

談史論天地
2026-01-21 23:20:03
女子違停豎中指被撞,疑似撞人車主發(fā)聲,不是故意原因披露

女子違停豎中指被撞,疑似撞人車主發(fā)聲,不是故意原因披露

阿纂看事
2026-01-21 18:41:21
原來王菲沒撒謊!公開求助、哽咽落淚的李亞鵬,證實(shí)了她當(dāng)年評(píng)價(jià)

原來王菲沒撒謊!公開求助、哽咽落淚的李亞鵬,證實(shí)了她當(dāng)年評(píng)價(jià)

芳芳?xì)v史燴
2026-01-22 12:58:18
“甘肅一拆遷工地被曝有人挖寶”,官方回應(yīng):現(xiàn)場(chǎng)已管控,文保部門已介入,“沒見到銀元”

“甘肅一拆遷工地被曝有人挖寶”,官方回應(yīng):現(xiàn)場(chǎng)已管控,文保部門已介入,“沒見到銀元”

揚(yáng)子晚報(bào)
2026-01-22 15:01:21
奧迪Q5L降11.88萬!老車主哭到:早知道不買那么早了

奧迪Q5L降11.88萬!老車主哭到:早知道不買那么早了

汽車網(wǎng)評(píng)
2026-01-19 19:30:35
-14℃!新一輪雨雪要來!江蘇天氣最新預(yù)測(cè)!

-14℃!新一輪雨雪要來!江蘇天氣最新預(yù)測(cè)!

句容發(fā)布
2026-01-22 05:02:08
高盛:AI有望引爆PCB大周期

高盛:AI有望引爆PCB大周期

財(cái)聞
2026-01-21 19:56:32
極氪8X內(nèi)飾圖首次曝光 今年上半年上市

極氪8X內(nèi)飾圖首次曝光 今年上半年上市

答答買車
2026-01-22 15:22:29
娛樂圈又丟人!嫣然醫(yī)院捐款名單曝光,年入上億明星一個(gè)都不吭聲

娛樂圈又丟人!嫣然醫(yī)院捐款名單曝光,年入上億明星一個(gè)都不吭聲

君笙的拂兮
2026-01-21 07:19:36
換帥的前奏?廣東“七冠教頭”霸氣放話,朱芳雨施壓杜鋒!

換帥的前奏?廣東“七冠教頭”霸氣放話,朱芳雨施壓杜鋒!

緋雨兒
2026-01-21 14:29:47
國(guó)手常昊:不顧恩師聶衛(wèi)平的反對(duì),娶大8歲的二婚師姑,如今成了典范

國(guó)手常昊:不顧恩師聶衛(wèi)平的反對(duì),娶大8歲的二婚師姑,如今成了典范

動(dòng)物奇奇怪怪
2026-01-22 10:44:21
【美股收盤】大逆轉(zhuǎn)!特朗普宣布取消關(guān)稅 道指暴漲588點(diǎn)、英偉達(dá)飆升11.7%

【美股收盤】大逆轉(zhuǎn)!特朗普宣布取消關(guān)稅 道指暴漲588點(diǎn)、英偉達(dá)飆升11.7%

FX168美股聚焦
2026-01-22 06:05:11
上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

一方聊市
2026-01-19 13:13:48
誰說詹姆斯已被厭惡?珍妮巴斯火速發(fā)文澄清,湖人想奪冠離不開他

誰說詹姆斯已被厭惡?珍妮巴斯火速發(fā)文澄清,湖人想奪冠離不開他

小路看球
2026-01-22 15:28:50
贏了官司卻虧到吐血!嫣然醫(yī)院搬家,房東成年度最大笑話!

贏了官司卻虧到吐血!嫣然醫(yī)院搬家,房東成年度最大笑話!

達(dá)文西看世界
2026-01-20 13:35:51
10億王者級(jí)肉簽發(fā)申購,打新收益高,但股民中簽很難!

10億王者級(jí)肉簽發(fā)申購,打新收益高,但股民中簽很難!

數(shù)據(jù)挖掘分析
2026-01-22 07:48:41
2026-01-22 16:19:00
AI深度研究員 incentive-icons
AI深度研究員
AI時(shí)代剛剛到來,一切才剛開始,我們正當(dāng)其時(shí)!
366文章數(shù) 158關(guān)注度
往期回顧 全部

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

頭條要聞

特朗普邀請(qǐng)普京加入和平委員會(huì):他辦實(shí)事 影響力巨大

頭條要聞

特朗普邀請(qǐng)普京加入和平委員會(huì):他辦實(shí)事 影響力巨大

體育要聞

珍妮回應(yīng)爆料:湖人不感激詹姆斯付出絕非事實(shí)

娛樂要聞

鐘麗緹土耳其高空落淚 與張倫碩擁吻

財(cái)經(jīng)要聞

申通快遞創(chuàng)始人被前夫索要股份

汽車要聞

今年集中上市 旅行車的春天可能真要來了

態(tài)度原創(chuàng)

教育
游戲
健康
旅游
手機(jī)

教育要聞

無數(shù)家長(zhǎng)踩坑:你的反復(fù)"提醒",正在摧毀孩子自信和動(dòng)力...

老玩家才懂!看似普通的種族技能,竟然統(tǒng)治了魔獸幾個(gè)時(shí)代?

打工人年終總結(jié)!健康通關(guān)=贏麻了

旅游要聞

洱海邊的八母寺和虛無圣寺很神秘,緊挨在一起,堪稱“大理之迷”

手機(jī)要聞

小米澎湃OS 3 Beta第二期招募開啟:小米17系列等8款機(jī)型搶先適配

無障礙瀏覽 進(jìn)入關(guān)懷版