国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI賽博活佛Andrej Karpathy最新訪談:我學(xué)到了他最核心的思維方式

0
分享至


Andrej Karpathy有個Github項目,叫Micrograd。

100行Python代碼,就把神經(jīng)網(wǎng)絡(luò)訓(xùn)練的核心講清楚了。

別人需要幾百頁教科書、幾十個小時的課程才能講明白的反向傳播,他用100行代碼就讓你看懂。

為什么他能把復(fù)雜講簡單?

因為他是物理學(xué)出身,且具備查理芒格所說的「多元思維模型」,善于找到問題的本質(zhì)。

我一直從Andrej Karpathy這獲益良多,他的YouTube頻道的每次更新再長我都會看。我一直很好奇他平時是怎么思考的,以及,作為一個AI領(lǐng)域走在前沿的科學(xué)家,為什么會愿意放棄在Tesla和OpenAI的工作,轉(zhuǎn)身做一個AI教育者。
10月17日的Dwarkesh播客訪談里,Karpathy分享了他的思維方式,他對AI現(xiàn)階段發(fā)展的思考,以及他做AI教育的思路。

這些想法AI研究能用,學(xué)AI編程能用,學(xué)任何東西都能用。

今天聊聊這些方法。

第一性原理:找到"一階項"

物理學(xué)有個概念叫"一階項"(first order terms)。

來自泰勒級數(shù)展開(Taylor series)。

當你要分析一個復(fù)雜系統(tǒng),可以把函數(shù)展開成:常數(shù)項 + 一階項 + 二階項 + 三階項...

一階近似就是:只保留前兩項,忽略后面所有高階項。

這樣做,精度夠用(通常能達到10%以內(nèi)),但計算簡單很多。

簡單說,就是找到系統(tǒng)中最重要的那一項。其他的都是次要的。

Karpathy做研究、寫代碼、教學(xué)的時候,一直在用這個思維。

案例1:神經(jīng)網(wǎng)絡(luò)的核心是什么?

Karpathy說,神經(jīng)網(wǎng)絡(luò)訓(xùn)練的核心是反向傳播。

其他的——優(yōu)化算法、正則化、數(shù)據(jù)增強——都是效率問題。

反向傳播才是"一階項"。

所以Micrograd項目,100行代碼,只講反向傳播。

其他的,都省略了。

這就是抓住"一階項"的威力。

案例2:AI的本質(zhì)是什么?

訪談里,Karpathy說了個挺有意思的觀點。

他說,AI不是"動物",是"幽靈"(ghosts or spirit entities)。

什么意思?

動物是通過進化產(chǎn)生的。進化會在神經(jīng)網(wǎng)絡(luò)的權(quán)重里內(nèi)置大量"硬件"。

但AI是完全數(shù)字化的,通過模仿人類在互聯(lián)網(wǎng)上發(fā)布的數(shù)據(jù)訓(xùn)練出來的。

這是兩種根本不同的智能。

所以,不要用進化的思路去理解AI。

這就是抓住"一階項"——AI的訓(xùn)練方式,而不是AI的表現(xiàn)。

案例3:為什么編碼是LLM的完美切入點?

Karpathy說,代碼本身就是文本。

而且有大量的文本數(shù)據(jù)可供訓(xùn)練。

再加上,我們有現(xiàn)成的基礎(chǔ)設(shè)施(VS Code、Diff工具)來處理代碼。

這就是"一階項"。

其他應(yīng)用(客服、寫作、翻譯)都是次要的。

LLM最先在編碼領(lǐng)域爆發(fā),不是偶然。

怎么應(yīng)用?

學(xué)新東西的時候,問自己:

  • 核心是什么?

  • 其他是什么?

  • 如果只能學(xué)一個東西,我學(xué)什么?

這就是第一性原理的思考方式。

這讓我想到芒格說的多元思維模型——從不同學(xué)科借鑒思維方式來解決問題。

Karpathy就是把物理學(xué)的"一階項"思維應(yīng)用到AI研究。馬斯克推崇的第一性原理也是類似的——找到問題的本質(zhì),而不是被表面現(xiàn)象迷惑。

不同領(lǐng)域的頂尖思考者,用的其實是同一套底層邏輯。

"先痛苦,再解決"

Karpathy說,他教學(xué)的時候有個原則:

先讓學(xué)生經(jīng)歷問題,再給出解決方案。

為什么?

因為這樣學(xué)生才會真正理解和欣賞這個解決方案。

舉個例子。

教神經(jīng)網(wǎng)絡(luò)的時候,很多老師會直接講反向傳播。

公式、推導(dǎo)、代碼,一氣呵成。

但學(xué)生聽完,可能還是一臉懵。

Karpathy的做法不一樣。

他會先讓學(xué)生嘗試手動調(diào)參數(shù)。

你會發(fā)現(xiàn),手動調(diào)參數(shù)超級慢,而且完全調(diào)不準。

這時候,你會開始思考:有沒有更好的方法?

然后,Karpathy才引入反向傳播。

這時候,學(xué)生就會有種"臥槽,原來可以這樣"的頓悟感。

這就是"先痛苦,再解決"的威力。

為什么有效?

因為人類的大腦天生就是"問題導(dǎo)向"的。

你沒有痛苦,就不會珍惜解決方案。

你沒有嘗試過失敗,就不會理解成功的價值。

怎么應(yīng)用?

學(xué)習(xí)新東西的時候,別直接看答案。

先自己嘗試解決問題。

碰壁了,再去看教程、看文檔。

這時候,你會發(fā)現(xiàn),理解速度快很多。

這也是為什么"做項目"是最好的學(xué)習(xí)方式。

你先遇到問題(痛苦),然后去找解決方案。

這個過程,就是學(xué)習(xí)。

我自己就是這么過來的。

之前我在即刻上說過:邊學(xué)、邊做、邊分享,是我的事業(yè)飛輪。

當你嘗試分享的時候,費曼學(xué)習(xí)法的邏輯會逼你把東西梳理得更清楚。

表達是檢驗理解的過程。你能不能流暢地講出來,就能驗證你是不是真的懂了。

這跟Karpathy的"先痛苦再解決"是一個道理。

"構(gòu)建知識坡道"

Karpathy現(xiàn)在在做Eureka Labs,一個AI教育公司。

他的愿景很簡單:打造"星際艦隊學(xué)院"(Starfleet Academy)。

什么意思?

就是讓AI成為完美的導(dǎo)師。

他說,理想的AI導(dǎo)師應(yīng)該能:

  • 立即理解學(xué)生的水平

  • 精確探查學(xué)生的知識模型

  • 提供持續(xù)、恰當?shù)奶魬?zhàn)(既不太難,也不太簡單)

他把這叫做 "構(gòu)建知識坡道"(building ramps to knowledge)。

目標是優(yōu)化 "每秒頓悟次數(shù)"(Eurekas per second)。

這個概念我很喜歡。

學(xué)習(xí)最怕什么?

太難了,聽不懂,放棄。

太簡單了,沒挑戰(zhàn),無聊。

最好的狀態(tài)是:有點難,但努把力能搞定。

這就是"知識坡道"。

Karpathy說,如果有一個完美的AI導(dǎo)師,學(xué)習(xí)任何東西都會變得"微不足道且令人向往"。

人們會為了樂趣而學(xué)習(xí),就像現(xiàn)在去健身房一樣。

怎么應(yīng)用?

學(xué)習(xí)的時候,找到合適的"坡道"。

不要一上來就挑戰(zhàn)Hard難度。

從Easy開始,慢慢提升難度。

比如學(xué)編程,不要一上來就寫分布式系統(tǒng)。

先寫個To-Do List,再寫個博客,再寫個小工具。

每一步都有點挑戰(zhàn),但又不會太難。

這就是"知識坡道"。

克服"知識的詛咒"

Karpathy說,專家不擅長解釋東西。

為什么?

因為他們把某些概念視為理所當然。

這叫"知識的詛咒"(curse of knowledge)。

你知道得太多,反而忘了新手的困惑。

舉個例子。

一個資深程序員可能覺得"變量"、"函數(shù)"、"循環(huán)"這些概念很簡單。

但對新手來說,這些概念可能很抽象。

專家會跳過這些"顯而易見"的解釋,直接講更高級的內(nèi)容。

結(jié)果,新手聽不懂。

Karpathy的解決方法:

通過與他人(或LLM)分享"愚蠢的問題",來理解新手的困惑。

他會主動問一些很基礎(chǔ)的問題。

"為什么要用反向傳播?"

"損失函數(shù)到底是什么?"

"梯度下降為什么有效?"

這些問題,對專家來說可能"太簡單了"。

但對新手來說,這才是最需要弄清楚的。

怎么應(yīng)用?

如果你要教別人(或?qū)懡坛?、做分享),先問自己?/p>

  • 什么是"理所當然"的?

  • 新手可能在哪里卡???

  • 我能不能解釋得更簡單?

甚至,可以找個完全不懂的人,試著給他講一遍。

他聽不懂的地方,就是你需要改進的地方。

"認知核心":知識可能拖累模型

訪談里,Karpathy提了個挺反直覺的觀點。

他說,知識可能拖累模型。

什么意思?

預(yù)訓(xùn)練的時候,模型既學(xué)到了知識,也學(xué)到了智能。

但知識可能會讓模型過度依賴已知數(shù)據(jù),無法探索數(shù)據(jù)分布之外的可能性。

Karpathy提出了一個概念:"認知核心"(cognitive core)

就是剝離知識,只保留智能算法、問題解決能力和策略。

他預(yù)測,這個核心可能只需要約十億參數(shù)。

然后,他說了個更有意思的觀點:

人類記憶差,反而是優(yōu)勢。

為什么?

因為記憶力不好,迫使人類去尋找模式。

人類不會記住所有細節(jié),只會記住可以泛化的規(guī)律。

而LLM的問題是:過度記憶,反而忽略了可以泛化的規(guī)律。

怎么應(yīng)用?

學(xué)習(xí)的時候,少記憶,多理解。

別死記硬背公式、代碼、知識點。

試著理解背后的原理。

問自己:

  • 這個公式為什么成立?

  • 這個代碼為什么這樣寫?

  • 這個概念的核心是什么?

理解了原理,知識就有了泛化能力。

可以應(yīng)用到其他場景。

這才是真正的學(xué)習(xí)。

最后

Karpathy在訪談里說了很多技術(shù)細節(jié)。

但我覺得,最有價值的是他的思維方式。

物理學(xué)家的思維,就是抓住"一階項"。

找到最核心的東西,其他的都是次要的。

教育家的思維,就是"構(gòu)建知識坡道"。

讓學(xué)習(xí)變得既有挑戰(zhàn),又不至于太難。

研究者的思維,就是"先痛苦,再解決"。

經(jīng)歷過問題,才會珍惜答案。

這些思維方式,不只適用于AI研究。

它們適用于任何領(lǐng)域的學(xué)習(xí)和思考。

Karpathy說,AI時代,知識會過時。

但思維方式不會。

這套物理學(xué)思維,是可以用一輩子的框架。

  • 基于:Andrej Karpathy在Dwarkesh播客的2小時訪談(2025年10月17日)

  • 播客鏈接:https://www.dwarkesh.com/p/andrej-karpathy

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
63歲的男子到武漢成功植入了17.5公分的陰莖假體,妻子很支持

63歲的男子到武漢成功植入了17.5公分的陰莖假體,妻子很支持

西樓知趣雜談
2026-03-03 12:30:37
發(fā)現(xiàn)沒?凡是男人帶女人出去玩,女的都會穿裙子,你知道為什么嗎

發(fā)現(xiàn)沒?凡是男人帶女人出去玩,女的都會穿裙子,你知道為什么嗎

老好人的憤怒
2026-01-15 18:52:47
“大年初五回家”成最后留言!重慶男子春節(jié)前赴迪拜旅游,失聯(lián)已超十天

“大年初五回家”成最后留言!重慶男子春節(jié)前赴迪拜旅游,失聯(lián)已超十天

封面新聞
2026-03-03 21:31:07
不愧是全球第一“綠帽”國家!女性出軌率60%,男人出軌零容忍?

不愧是全球第一“綠帽”國家!女性出軌率60%,男人出軌零容忍?

夢史
2026-01-12 14:42:54
僅播6集就口碑大爆,評分高達9.6,終于又有好劇可以追了

僅播6集就口碑大爆,評分高達9.6,終于又有好劇可以追了

藍莓影視推薦
2026-03-02 20:43:55
聽說,很多人已經(jīng)靠網(wǎng)貸過日子了

聽說,很多人已經(jīng)靠網(wǎng)貸過日子了

黯泉
2025-09-11 12:29:08
重磅:美國考慮派遣地面部隊攻打伊朗!德黑蘭核設(shè)施遇襲

重磅:美國考慮派遣地面部隊攻打伊朗!德黑蘭核設(shè)施遇襲

項鵬飛
2026-03-03 18:27:21
國家杰青,被撤銷全國政協(xié)委員資格!

國家杰青,被撤銷全國政協(xié)委員資格!

高分子科學(xué)前沿
2026-03-03 19:57:28
方案公告!去蘇州南站更方便了!

方案公告!去蘇州南站更方便了!

天氣觀察站
2026-03-03 15:41:15
亞太股市重挫,大家都在擔(dān)心什么?

亞太股市重挫,大家都在擔(dān)心什么?

萌生財經(jīng)
2026-03-03 15:10:45
中東戰(zhàn)火升級!特朗普緊急對臺做出安排,賴清德兩張牌一夜全崩?

中東戰(zhàn)火升級!特朗普緊急對臺做出安排,賴清德兩張牌一夜全崩?

阿庫財經(jīng)
2026-03-04 00:12:43
岳父過壽沒通知我,我關(guān)機釣魚,岳母怒吼:你咋不來買單?我笑了

岳父過壽沒通知我,我關(guān)機釣魚,岳母怒吼:你咋不來買單?我笑了

千秋文化
2026-01-18 18:50:14
如何才能一輩子遠離腦梗?記好這5個不花錢的方法,養(yǎng)出健康血管

如何才能一輩子遠離腦梗?記好這5個不花錢的方法,養(yǎng)出健康血管

藥師方健
2026-01-28 21:51:09
教了那么多孩子,才敢告訴你,成績中等的孩子跟學(xué)渣沒什么區(qū)別!

教了那么多孩子,才敢告訴你,成績中等的孩子跟學(xué)渣沒什么區(qū)別!

好爸育兒
2026-03-03 17:54:20
轟37分6助攻!中國女籃31歲王牌后衛(wèi)滿血復(fù)活:宮魯鳴該帶上她?

轟37分6助攻!中國女籃31歲王牌后衛(wèi)滿血復(fù)活:宮魯鳴該帶上她?

李喜林籃球絕殺
2026-03-03 10:17:17
西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

樂天閑聊
2025-12-20 10:59:49
這就是公開辱華的后果!取消冠軍頭銜只是開始,職業(yè)生涯也全毀了

這就是公開辱華的后果!取消冠軍頭銜只是開始,職業(yè)生涯也全毀了

阿鳧愛吐槽
2025-12-17 17:24:39
利物浦國米醞釀 3 筆交易!永久 + 租借 + 免簽,核心要被挖走?

利物浦國米醞釀 3 筆交易!永久 + 租借 + 免簽,核心要被挖走?

奶蓋熊本熊
2026-03-03 05:56:01
中以通話!王毅外長正面交底,說了別國想說但不敢說的話,不一般

中以通話!王毅外長正面交底,說了別國想說但不敢說的話,不一般

冒泡泡的魚兒
2026-03-03 23:20:05
宗馥莉解散公司,娃哈哈員工被清算!網(wǎng)友力挺:這步棋下的真精準

宗馥莉解散公司,娃哈哈員工被清算!網(wǎng)友力挺:這步棋下的真精準

離離言幾許
2026-03-03 14:17:14
2026-03-04 03:11:00
AI進化論花生 incentive-icons
AI進化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
149文章數(shù) 66關(guān)注度
往期回顧 全部

科技要聞

擁抱AI的"牛馬":邊提效邊自嘲"自費"上班

頭條要聞

美國突發(fā)史無前例撤離令引外界擔(dān)憂:終極空襲或來臨

頭條要聞

美國突發(fā)史無前例撤離令引外界擔(dān)憂:終極空襲或來臨

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護夫:喊話薛之謙給張杰道歉

財經(jīng)要聞

特朗普“不惜一切”!全球股債齊崩

汽車要聞

第一梯隊輔助駕駛加持 iCAR V27定檔3月13日上市

態(tài)度原創(chuàng)

游戲
藝術(shù)
家居
親子
手機

獵魂世界:當前版本最亟需增強的隊伍是?這支真可算是首當其沖!

藝術(shù)要聞

柔滑裙裝女神出場,驚艷程度超乎想象!

家居要聞

萬物互聯(lián) 享科技福祉

親子要聞

寶媽懷抱五個月大嬰兒站在扶梯上,突然背后滑下一輛玩具車,被鏟倒后孩子脫手飛出頭部多處受傷!

手機要聞

榮耀Magic V6下周見,開啟折疊屏7000mAh時代

無障礙瀏覽 進入關(guān)懷版