国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陶哲軒親測Claude跑崩電腦,全靠這份保姆級指令清單翻盤

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】從電腦崩潰到半小時拿下Lean形式化證明,數(shù)學(xué)大神陶哲軒用親身踩坑經(jīng)歷警告:AI越強(qiáng)大,人類越不能偷懶,應(yīng)時刻保持「人類在環(huán)」的絕對清醒。

連跑45分鐘,燒光Token,最后電腦直接死機(jī)。

你可能很難想象,這竟是全球頂尖數(shù)學(xué)家陶哲軒在實(shí)測最新AI編程工具時,遭遇的一次真實(shí)翻車現(xiàn)場。

九個月前,他曾在一個視頻中向大家展示如何將一段復(fù)雜的數(shù)學(xué)證明形式化。

九個月后,面對被業(yè)界瘋狂追捧的新一代AI助手Claude Code,他本以為這會是一場降維打擊。

沒想到,第一次完全放權(quán)給AI,不僅沒有完成數(shù)學(xué)證明,還把自己的電腦搞崩潰了。

在接到一句宏大的指令后,AI陷入了瘋狂的回溯與試錯,狂跑了45分鐘,不僅沒寫出一行可用代碼,龐大的計算過載還把電腦弄死機(jī)了。

眼下整個科技圈都在狂熱地討論AI智能體。

仿佛只要隨手拋出一句話,AI就能替你打理好全部工作。陶哲軒這場硬核實(shí)測,卻像一劑清醒劑,終結(jié)了這種技術(shù)幻覺:

即使面對再強(qiáng)大的AI,人類也不能完全「關(guān)掉大腦」。

保持參與,才是最好的使用AI的方式。

「一波流」幻想破滅

AI智能體的「過載陷阱」

故事要從九個月前說起。

在當(dāng)時的Equations of Theories項(xiàng)目里,為了證明等式1689能夠推導(dǎo)出等式2(即singleton law),陶哲軒使用GitHub Copilot和一個名叫conical的輔助工具,靠著人類的智慧和輕度的AI輔助,一步步手動完成了證明的形式化。

如今,全面升級的智能體來了。

由于對AI的過度信任,陶哲軒在第一次嘗試Claude時進(jìn)入了一個極其普遍的誤區(qū),他給Claude下達(dá)了一個大而籠統(tǒng)的指令:「請把整個事情都做完?!?/p>

他原本以為,AI會自動拆解任務(wù)、理清邏輯、輸出完美代碼。

然而這句不加限制的指令,直接觸發(fā)了機(jī)器的「過載陷阱」。面對復(fù)雜的邏輯鏈條,Claude在底層引理的證明泥潭里迷失了方向。

它花了大把時間去猜測該怎么做,接著犯錯,然后瘋狂回溯、推倒重做。





就這樣,在燒掉大量Token之后,AI狂跑了整整45分鐘仍然一無所獲。而且,龐大的計算壓力,也讓陶哲軒的電腦崩潰了。




事實(shí)證明,當(dāng)人類下達(dá)給AI的任務(wù)指令缺乏清晰邊界時,AI的勤奮只會像無頭蒼蠅式的亂撞,最終演變成一場徒勞無益的消耗。

這次慘痛的教訓(xùn),也戳破了當(dāng)下人們對AI的一個幻覺:認(rèn)為有了智能體,自己就可以當(dāng)「甩手掌柜」了。

「保姆級」指令的勝利

真正的轉(zhuǎn)折,發(fā)生在第二次和第三次嘗試?yán)铩?/p>

第二次,其實(shí)已經(jīng)成功了。

陶哲軒把任務(wù)拆開,不再要求Claude Code一次完成全部證明,而是先形式化引理1、引理2、引理3,再逐步把證明補(bǔ)進(jìn)去。

最后大約用了25分鐘,完整證明做出來了。

在第三次,他還摸索出了一套防AI「暴走」的干貨步驟,核心秘訣,就是專門建一個Markdown文件,把所有指令按步驟寫清楚,再交給Claude Code執(zhí)行。

只是這次他并沒這么做,而是把這些步驟直接寫進(jìn)Lean文件的注釋里。




這套流程的精髓,不在于復(fù)雜,而在于克制。

第零步,先形式化S和F這兩個記號。先把符號系統(tǒng)立住,別急著證明。

第一步,創(chuàng)建證明骨架。把引理1、引理2、引理3的陳述都形式化出來,但這個階段嚴(yán)禁AI嘗試證明,一律用「sorry」占位。

這一步看似保守,實(shí)際上非常高明。因?yàn)樗呀?jīng)從第一次失敗里看明白了:

一旦讓Claude Code過早進(jìn)入「我要把它證出來」的狀態(tài),它就會在證明細(xì)節(jié)里瘋狂打轉(zhuǎn),反復(fù)試、反復(fù)錯、反復(fù)回退,最后什么都做不完

與其讓它一上來就沖刺,不如先讓它把結(jié)構(gòu)搭好。

然后才是第二步:把非形式化證明里的每一行,逐行轉(zhuǎn)成Lean代碼。

理由先不補(bǔ),能用「sorry」的地方先用「sorry」。

這個動作特別像搭腳手架。先把房子的梁柱立起來,再慢慢砌墻,而不是抱著一堆磚頭就想直接蓋完。

也是在這里,陶哲軒點(diǎn)出了Claude Code一個很有意思的弱點(diǎn):它在最底層、最機(jī)械的步驟上,反而容易「想太多」。

本來人類可能覺得「這一步一兩行就該結(jié)束了」,它卻會繞出更長的路徑。

在陶哲軒的第一次嘗試時,AI甚至不愿意沿用S和F這些簡寫,而是把式子不斷展開,導(dǎo)致證明越來越難讀。

這正是很多人今天會誤判AI的地方。

你以為它最擅長的是細(xì)活,它偏偏會在最該老實(shí)執(zhí)行的時候,突然開始「發(fā)揮創(chuàng)造力」。

而在形式化證明這類任務(wù)中,過度發(fā)揮,往往不是加分項(xiàng),反而可能是事故源頭。

在這套「保姆級」指令的約束下,Claude終于不再像脫韁的野馬。它老老實(shí)實(shí)地跟著人類給定的證明,幾秒鐘就吐出了規(guī)整的代碼框架。

「人機(jī)并行協(xié)作」

你做你的填空,我修我的Bug

真正讓這次實(shí)踐變得好看的,是中間那段非常絲滑的人機(jī)配合感。

做到一半,電腦又崩了一次。

但這一次,崩潰沒有毀掉進(jìn)度。

原因很簡單:因?yàn)槿蝿?wù)已經(jīng)被拆成了一段一段的小步驟,所以恢復(fù)起來并不痛苦。

分步推進(jìn),不只是為了防止AI暴走,也是為了人類后期修改方便。

更精彩的戲碼是在修Bug階段。

在填補(bǔ)細(xì)節(jié)時,Claude卡在了某個底層步驟上。陶哲軒發(fā)現(xiàn),AI把記號SA展開了兩次,而實(shí)際上只需展開一次。

面對這個邏輯死結(jié),AI試圖換一種極其復(fù)雜的思路去繞過它,甚至給出了一段冗長代碼。


這個時候,人類的作用顯現(xiàn)了。

陶哲軒果斷出手,他調(diào)出Info View面板,親自接管了這行邏輯。

面對多余的展開項(xiàng),他直接使用congruence(消掉同類項(xiàng)),瞬間清空了報錯信息。連他自己都忍不住感慨:「這也太強(qiáng)了,居然直接就成了?!?/p>

隨后,他又意識到,這里其實(shí)可以把H1抽出來,單獨(dú)作為一個關(guān)鍵方程引理,因?yàn)楹竺鎯蓚€地方都能復(fù)用它。

此時,全場高潮的「人機(jī)結(jié)對編程」畫面出現(xiàn)了。

當(dāng)陶哲軒在前方手動修復(fù)復(fù)雜邏輯、提取引理時,Claude Code根本沒有閑著。

它在后臺默默同步,聰明地把過去代碼里的H1替換成了一行簡練的證明,并自動給后續(xù)的引理三搭好了骨架。

這才是這次實(shí)驗(yàn)最舒服的一幕:不是你命令,我執(zhí)行;也不是你放手,我亂跑;而是兩者在同一個代碼庫里獨(dú)立運(yùn)轉(zhuǎn),互不干擾卻又完美配合。

像一場真正的結(jié)對編程,只不過你的搭檔,不是另一個人類,而是一個需要被約束、但又確實(shí)能干活的智能體。

拒絕「多智能體焦慮」

要把手放在方向盤上

最后,這份證明完成了。

總耗時大約半小時,里面還算上了一次系統(tǒng)崩潰。對比第一次45分鐘空轉(zhuǎn)到電腦死機(jī),這個結(jié)果已經(jīng)足夠說明問題。

但在復(fù)盤階段,這位數(shù)學(xué)大神給出的,不是某種神話式結(jié)論,而是一種很清醒的技術(shù)態(tài)度。

他顯然看到了自動化的誘惑。

Claude Code足夠強(qiáng),大多數(shù)人很容易生出一種沖動:干脆讓它全包,我少操點(diǎn)心。

可問題在于,一旦你真這么做,它很可能直接扔掉你原本已經(jīng)很好的非形式化思路,按它自己的方式重寫一遍。

結(jié)果,就是代碼變得晦澀難懂,一旦跑不通,你連調(diào)試都無從下手。

他還順手吐槽了當(dāng)下很流行的一種趨勢:

讓多個智能體同時跑,再用另一個智能體去管理前面那幾個智能體。

理論上當(dāng)然可以。

可至少在這次任務(wù)里,他已經(jīng)對單個、聽話、受控的Agent非常滿意了。再往上疊,不一定是效率提升,也可能只是另一種形式的復(fù)雜化焦慮。



此外,在這場技術(shù)洪流中,人類必須保持參與感。

最頂級的AI工作流,不是關(guān)掉大腦,而是始終把手放在方向盤上。

因?yàn)橐坏┩耆蕾嚬ぞ撸隽藛栴},你能做的往往只剩下一遍遍重新調(diào)用,像是在對一個黑箱許愿。

而當(dāng)你把「人類在環(huán)」這件事堅(jiān)持到底,局面就完全不同了。

這時候,AI不是替你思考的大腦,而是你手里那把越來越鋒利的劍。真正決定它往哪兒揮的人,仍然還得是你。

參考資料:

https://mathstodon.xyz/@tao/116190707979654536%20

https://github.com/teorth/analysis/blob/main/analysis/Analysis/Misc/equational.lean%20

https://www.youtube.com/watch?v=JHEO7cplfk8

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2026年就業(yè)有多難,有HR一個崗位放上去沒多久,上百人就來咨詢了

2026年就業(yè)有多難,有HR一個崗位放上去沒多久,上百人就來咨詢了

映射生活的身影
2026-03-10 17:05:43
于東來發(fā)文稱死后不辦任何儀式,骨灰找就近河流撒完,近日他現(xiàn)身多地并分享旅游動態(tài)

于東來發(fā)文稱死后不辦任何儀式,骨灰找就近河流撒完,近日他現(xiàn)身多地并分享旅游動態(tài)

大風(fēng)新聞
2026-03-10 18:42:55
伊朗提出?;饤l件,中俄兩大國都已經(jīng)介入,特朗普已別無選擇

伊朗提出?;饤l件,中俄兩大國都已經(jīng)介入,特朗普已別無選擇

領(lǐng)略快樂真諦
2026-03-11 02:13:08
在醫(yī)院做檢查的尷尬瞬間!網(wǎng)友:在護(hù)士眼里那就是塊肉

在醫(yī)院做檢查的尷尬瞬間!網(wǎng)友:在護(hù)士眼里那就是塊肉

帶你感受人間冷暖
2026-03-09 00:05:09
中國臺北小組第三,越南淘汰,8強(qiáng)對陣出爐,中國有望進(jìn)決賽

中國臺北小組第三,越南淘汰,8強(qiáng)對陣出爐,中國有望進(jìn)決賽

凡人說體育
2026-03-10 20:09:14
1942年,抗日名將周彪見副手雙手久插兜中,結(jié)合預(yù)警驚出冷汗

1942年,抗日名將周彪見副手雙手久插兜中,結(jié)合預(yù)警驚出冷汗

嘮叨說歷史
2026-03-10 17:01:45
3只一字跌停的油氣股,盤中同時打開,博反包的進(jìn)去后瞬間封板!

3只一字跌停的油氣股,盤中同時打開,博反包的進(jìn)去后瞬間封板!

丁丁鯉史紀(jì)
2026-03-10 16:34:40
文旅部部長:7名外國游客到上海旅游,買了40箱中國貨

文旅部部長:7名外國游客到上海旅游,買了40箱中國貨

中國日報
2026-03-07 16:52:36
羽毛球世界冠軍至今未婚,投百萬創(chuàng)業(yè)成老板,如今徒弟又給她長臉

羽毛球世界冠軍至今未婚,投百萬創(chuàng)業(yè)成老板,如今徒弟又給她長臉

往史過眼云煙
2026-03-10 19:36:35
別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

不似少年游
2026-02-24 19:46:25
韓媒解讀平壤馬拉松取消原因:擔(dān)心大量外國人入境,禁用GPS功能

韓媒解讀平壤馬拉松取消原因:擔(dān)心大量外國人入境,禁用GPS功能

楊華評論
2026-03-10 16:45:29
親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

親戚可以無恥到什么地步?網(wǎng)友:張口八十萬,說做生意缺資金

另子維愛讀史
2026-03-09 22:04:42
女子相親要5萬彩禮,被小伙嫌棄長相一般,網(wǎng)友直言 10 萬跟我走

女子相親要5萬彩禮,被小伙嫌棄長相一般,網(wǎng)友直言 10 萬跟我走

一盅情懷
2026-02-26 15:16:28
世體:埃里克-加西亞身體不適,基本無緣出戰(zhàn)紐卡

世體:埃里克-加西亞身體不適,基本無緣出戰(zhàn)紐卡

懂球帝
2026-03-11 01:00:07
北美防空司令部:緊急出動多架軍機(jī),應(yīng)對進(jìn)入美阿拉斯加和加拿大“防空識別區(qū)”的俄軍機(jī)

北美防空司令部:緊急出動多架軍機(jī),應(yīng)對進(jìn)入美阿拉斯加和加拿大“防空識別區(qū)”的俄軍機(jī)

環(huán)球網(wǎng)資訊
2026-03-06 17:00:14
一美國警官在執(zhí)行對伊軍事行動支援任務(wù)時身亡!卡塔爾:遭12枚伊朗導(dǎo)彈襲擊!伊朗軍方公布“家底”:具備打至少六個月高強(qiáng)度戰(zhàn)爭能力

一美國警官在執(zhí)行對伊軍事行動支援任務(wù)時身亡!卡塔爾:遭12枚伊朗導(dǎo)彈襲擊!伊朗軍方公布“家底”:具備打至少六個月高強(qiáng)度戰(zhàn)爭能力

每日經(jīng)濟(jì)新聞
2026-03-08 15:26:11
走路=續(xù)命!研究:每天2小時步行量,讓預(yù)期壽命直接+11年

走路=續(xù)命!研究:每天2小時步行量,讓預(yù)期壽命直接+11年

時光派健康抗衰
2026-01-13 16:51:51
美油主力合約跌破87美元/桶

美油主力合約跌破87美元/桶

每日經(jīng)濟(jì)新聞
2026-03-10 06:15:04
伊朗伊斯蘭革命衛(wèi)隊(duì)稱實(shí)施“真實(shí)承諾4”第34輪打擊行動

伊朗伊斯蘭革命衛(wèi)隊(duì)稱實(shí)施“真實(shí)承諾4”第34輪打擊行動

財聯(lián)社
2026-03-10 20:44:42
內(nèi)娛“頂流”地位大洗牌:楊穎受冷落,倪妮邊緣化,他卻殺出重圍

內(nèi)娛“頂流”地位大洗牌:楊穎受冷落,倪妮邊緣化,他卻殺出重圍

洲洲影視娛評
2026-03-02 15:13:19
2026-03-11 03:36:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14689文章數(shù) 66680關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

頭條要聞

伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

財經(jīng)要聞

“龍蝦補(bǔ)貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

手機(jī)
本地
健康
公開課
軍事航空

手機(jī)要聞

M5 Max 版 16 英寸 MacBook Pro 體驗(yàn):算力巔峰與專業(yè)視界

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

剛說完戰(zhàn)爭很快結(jié)束 特朗普改口

無障礙瀏覽 進(jìn)入關(guān)懷版