国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek OCR論文引爆網(wǎng)絡!Andrej Karpathy:,我很喜歡;馬斯克:未來99%都是光子

0
分享至


剛剛,AI大神Andrej Karpathy表示非常喜歡DeepSeek OCR 論文,原話:

我相當喜歡新的DeepSeek-OCR論文。它是一個很好的OCR模型(可能比dots稍微差一點),是的,數(shù)據(jù)收集等等,但無論如何都不重要。對我來說更有趣的部分(尤其是作為一個以計算機視覺為核心,暫時偽裝成自然語言的人)是像素是否比文本更適合作為LLM的輸入。文本標記是否浪費且糟糕,作為輸入。

還不知什么情況的看我這篇文章

Karpathy認為,拋開模型本身不談,deepseek這篇論文引出了一個更值得深思的問題:對于LLM來說,像素是否是比文本更優(yōu)越的輸入形式?文本Token是否既浪費又糟糕?

他進一步設想,或許所有LLM的輸入都只應該是圖像。即便是純文本內(nèi)容,也應該先渲染成圖片再輸入給模型

Karpathy給出了支持這一構(gòu)想的四大核心理由:

1. 更高的信息壓縮效率

將文本渲染成圖像,可以實現(xiàn)更高的信息壓縮,這意味著更短的上下文窗口和更高的運行效率

2. 更通用的信息流

像素是一種遠比文本更通用的信息流。它不僅能表示純文本,還能輕松捕捉粗體、彩色文本,甚至是任意的圖表和照片

3. 默認實現(xiàn)強大的雙向注意力

像素化的輸入可以很自然、很輕松地默認使用雙向注意力進行處理,這種處理方式比自回歸注意力更為強大

4. 徹底淘汰Tokenizer

Karpathy毫不掩飾自己對Tokenizer的嫌棄。他認為Tokenizer是一個丑陋、獨立、非端到端的階段。它引入了Unicode和字節(jié)編碼的所有丑陋之處,繼承了大量歷史包袱,并帶來了安全和越獄風險(例如連續(xù)字節(jié)問題)

他舉例說,Tokenizer會導致兩個在人眼看來完全相同的字符,在網(wǎng)絡內(nèi)部被表示為兩個完全不同的Token。一個笑臉emoji,在模型看來只是一個奇怪的Token,而不是一個由像素構(gòu)成的、真實的笑臉,這導致模型無法利用其視覺信息帶來的遷移學習優(yōu)勢。Tokenizer必須消失,他強調(diào)

Karpathy總結(jié)道,OCR只是眾多視覺到文本(vision -> text)任務中的一種。而傳統(tǒng)的文本到文本(text -> text)任務,完全可以被重構(gòu)成視覺到文本任務,反之則不行

他設想的未來交互模式可能是:用戶的輸入(Message)是圖像,而解碼器(Assistant的響應)的輸出仍然是文本。因為如何真實地輸出像素,或者是否有必要這樣做,目前還不明確

核心爭議:雙向注意力與圖像分塊

對于Karpathy的觀點,AI學者Yoav Goldberg提出了兩個疑問:


1.為什么說圖像能輕松獲得雙向注意力,而文本不能?

2.雖然沒有了Tokenization,但將輸入圖像切分成圖塊(Patches),難道不是一種類似且可能更丑陋的處理方式嗎?

Karpathy對此進行了解釋。

他回應說,原則上沒有任何東西阻止文本使用雙向注意力。但為了效率,文本通常都是以自回歸的方式進行訓練的。他設想,可以在訓練中期加入一個微調(diào)階段,用雙向注意力來處理作為條件的信息(比如用戶的輸入消息,因為這些Token不需要模型去生成)。但他不確定在實踐中是否有人這樣做。理論上,為了預測下一個Token,甚至可以對整個上下文窗口進行雙向編碼,但這將導致訓練無法并行化

最后他補充道,或許這個方面(雙向注意力)嚴格來說并非像素與Token的本質(zhì)區(qū)別,更多是像素通常被編碼(encoded),而Token通常被解碼(decoded)(借用原始Transformer論文的術(shù)語)

馬斯克:未來99%是光子

在這場討論的最后,Elon Musk也現(xiàn)身評論區(qū),并給出了一個更具未來感的判斷:


從長遠來看,AI模型超過99%的輸入和輸出都將是光子。沒有其他任何東西可以規(guī)?;?/p>

馬斯克的這條評論并非隨口一說。他進一步補充了一段堪稱硬核的宇宙學科普,來解釋為什么他認為“光子”是終極的規(guī)?;桨?/p>

簡單來說,宇宙中絕大多數(shù)的粒子都是光子

而這些光子最主要的來源,是宇宙微波背景(CMB)。根據(jù)測算,CMB的光子密度約為每立方厘米410個。將這個密度乘以可觀測宇宙的巨大體積(半徑約465億光年),可以得出僅CMB貢獻的光子數(shù)量就達到了一個驚人的數(shù)字:約1.5 x 10??個

相比之下,所有恒星發(fā)出的光子(星光)以及其他來源(如中微子背景、黑洞輻射等)貢獻的數(shù)量,則完全可以忽略不計

這背后揭示的物理事實是:光子在數(shù)量級上擁有無與倫比的優(yōu)勢。這或許就是馬斯克認為AI的未來輸入輸出將由光子主宰的底層邏輯

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
一場直播吸金1億!這個中國品牌闖入頂豪衣櫥,年銷超10億

一場直播吸金1億!這個中國品牌闖入頂豪衣櫥,年銷超10億

天下網(wǎng)商
2025-12-03 13:58:00
日本議員竄臺,外交部回應8個字,話音剛落,稀土對日全面斷供

日本議員竄臺,外交部回應8個字,話音剛落,稀土對日全面斷供

素年文史
2026-01-07 13:20:26
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點
2025-11-22 10:36:39
最討厭的演員排名,潘長江僅第五,閆學晶第二,第一毋庸置疑

最討厭的演員排名,潘長江僅第五,閆學晶第二,第一毋庸置疑

林雁飛
2026-01-04 19:29:51
為什么紅軍到了陜北,就安全了?原因很現(xiàn)實,6個原因

為什么紅軍到了陜北,就安全了?原因很現(xiàn)實,6個原因

沈言論
2026-01-01 15:40:03
廣州小學生被抽血事件:告訴爸媽就扣小紅花

廣州小學生被抽血事件:告訴爸媽就扣小紅花

每日一見
2026-01-02 12:21:28
雇傭兵之王:30年干掉了4任總統(tǒng),娶6個老婆,還竊取一國

雇傭兵之王:30年干掉了4任總統(tǒng),娶6個老婆,還竊取一國

近史談
2026-01-07 13:45:59
浙江兩座海島掛牌出讓 3.7萬當島主

浙江兩座海島掛牌出讓 3.7萬當島主

大象新聞
2026-01-06 13:25:12
全球首富榜揭曉:美首富造火箭,俄首富搞天然氣,中國首富在干啥

全球首富榜揭曉:美首富造火箭,俄首富搞天然氣,中國首富在干啥

策略述
2025-12-19 12:39:06
千萬不要過度體檢?醫(yī)生再三提醒:55歲后,這5種體檢能不做就不做

千萬不要過度體檢?醫(yī)生再三提醒:55歲后,這5種體檢能不做就不做

神奇故事
2025-12-30 23:09:45
腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

腳是心梗的放大鏡?忠告:腳部出現(xiàn)這幾種表現(xiàn),要盡快就醫(yī)!

岐黃傳人孫大夫
2025-12-25 09:56:07
委代總統(tǒng)投降,美國政府已接盤,王毅通知各國,中方甩出一紙憲章

委代總統(tǒng)投降,美國政府已接盤,王毅通知各國,中方甩出一紙憲章

墨印齋
2026-01-06 11:38:54
越南揭幕戰(zhàn)2-0驚艷,U23亞洲杯走向或改變

越南揭幕戰(zhàn)2-0驚艷,U23亞洲杯走向或改變

夢的微塵
2026-01-07 13:21:17
雙腿出現(xiàn)這3種異常,可能是肺部已經(jīng)開始癌變,別以為只是不舒服

雙腿出現(xiàn)這3種異常,可能是肺部已經(jīng)開始癌變,別以為只是不舒服

DrX說
2026-01-07 14:14:14
曝林俊杰女友七七去派出所報案,疑要抓出造謠者,劉海太搶眼

曝林俊杰女友七七去派出所報案,疑要抓出造謠者,劉海太搶眼

好賢觀史記
2026-01-07 13:42:59
2026開年反腐第一槍!呼和浩特廳官郭炳勝落馬,深耕名校30年翻車,教育系統(tǒng)再曝重磅驚雷

2026開年反腐第一槍!呼和浩特廳官郭炳勝落馬,深耕名校30年翻車,教育系統(tǒng)再曝重磅驚雷

呼市呼事
2026-01-07 12:27:03
詹姆斯51000分倒計時,41歲重鑄偉大定義

詹姆斯51000分倒計時,41歲重鑄偉大定義

主宰穩(wěn)場
2026-01-06 20:31:26
某光伏公司把員工往死里逼:全員大降薪!

某光伏公司把員工往死里逼:全員大降薪!

黯泉
2026-01-06 22:37:59
交鋒11戰(zhàn)全勝!周琦18+6北京險勝寧波 曾凡博15分杰曼25+7+7

交鋒11戰(zhàn)全勝!周琦18+6北京險勝寧波 曾凡博15分杰曼25+7+7

醉臥浮生
2026-01-06 21:41:10
事件升級!司曉迪曬開房記錄,16個男頂流被錘!內(nèi)娛徹底玩完

事件升級!司曉迪曬開房記錄,16個男頂流被錘!內(nèi)娛徹底玩完

卷史
2026-01-05 18:35:29
2026-01-07 15:16:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領(lǐng)域
1025文章數(shù) 393關(guān)注度
往期回顧 全部

科技要聞

豪擲世界第一"球" 楊元慶亮出聯(lián)想AI護城河

頭條要聞

古巴公布32名陣亡軍人姓名和照片 年齡介于26歲至67歲

頭條要聞

古巴公布32名陣亡軍人姓名和照片 年齡介于26歲至67歲

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

2026年央視春晚彩排:沈騰確定回歸

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔憂蔬菜農(nóng)殘

汽車要聞

蔚來2025百萬臺收官 一場遲到的自我修復

態(tài)度原創(chuàng)

教育
手機
家居
房產(chǎn)
時尚

教育要聞

初二這一年,差不多就能看出孩子將來上什么大學了

手機要聞

消息稱三星2月25日發(fā)布Galaxy S26系列手機

家居要聞

寧靜不單調(diào) 恰到好處的美

房產(chǎn)要聞

海珠雙冠王!中交天翠以強兌現(xiàn)力+生活溫度,筑就長期主義產(chǎn)品

冬天穿衣既要有溫度又要有風度!看看這些穿搭,優(yōu)雅又顯瘦

無障礙瀏覽 進入關(guān)懷版