国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek革了Adobe們的命

0
分享至

(文/陳濟(jì)深 編輯/張廣凱)

當(dāng)開年以來AI界都在討論智能體和AI員工的話題時,DeepSeek在1月27日悄無聲息地發(fā)布了一項(xiàng)看似"無聊"的更新——DeepSeek-OCR2。


作為2025年10月20日DeepSeek-OCR1發(fā)布后時隔三個月的最新更新,盡管看似并不如傳說中的V4讓人期待,但是DeepSeek-OCR2的公布可能直接敲響了OCR(文檔識別)這個千億級市場的喪鐘。

過去十年,OCR一直是一門隱秘而暴利的生意。從Adobe的PDF編輯器,到掃描全能王的會員費(fèi),再到亞馬遜AWS Textract昂貴的API調(diào)用,無數(shù)公司靠著"教機(jī)器認(rèn)字"賺取了豐厚的利潤。

以全能掃描王的母公司合合信息為例,其財報顯示公司毛利率常年以來維持在85%的水平。但一夜之間,DeepSeek告訴市場:識圖認(rèn)字可以不需要這么貴。

從機(jī)械掃描到智能閱讀

DeepSeek-OCR2的核心創(chuàng)新在于引入了名為DeepEncoder-V2的新型編碼器結(jié)構(gòu),它能夠根據(jù)圖像語義動態(tài)調(diào)整視覺信息的處理順序,使模型在進(jìn)行文字識別前先對視覺內(nèi)容進(jìn)行智能排序。

傳統(tǒng)OCR就像一個"勤奮但死板的抄寫員",它通常按從左到右、從上到下的順序機(jī)械地掃描圖片。

這種模式的死穴在于"不懂邏輯"。遇到報紙的跨欄排版,它會把兩篇無關(guān)的文章拼在一起;面對扭曲的發(fā)票,就找不到對齊線;對于密集的小字財報,只能看到模糊化的文本。

而DeepSeek-OCR2引入了"視覺因果流"的概念。在DeepEncoder-V2中,研究團(tuán)隊(duì)用一種類語言模型結(jié)構(gòu)替代了原先基于CLIP的視覺編碼模塊,并在編碼器內(nèi)部引入可學(xué)習(xí)的"因果流查詢token"。

其編碼器同時包含雙向注意力與因果注意力兩種處理模式,原始視覺信息通過雙向注意力進(jìn)行全局感知,而新增的查詢標(biāo)記則通過因果注意力逐步建立語義順序。

這相當(dāng)于給AI戴上了"自適應(yīng)顯微鏡"。它不再暴力壓縮圖片,而是根據(jù)內(nèi)容密度動態(tài)切片。哪里字多,就切細(xì)點(diǎn)看;哪里是空白,就跳過。

理解力的革命

在OmniDocBench v1.5基準(zhǔn)上的測試結(jié)果顯示,在視覺token上限更低的情況下,DeepSeek-OCR2的整體得分達(dá)到91.09%,相較DeepSeek-OCR提升了3.73%。特別是在閱讀順序準(zhǔn)確度方面,編輯距離從0.085降至0.057。

但性能提升只是表象,真正革命性的是其背后的理解能力。

DeepSeek-OCR2不是簡單地把圖變成文字,而是直接輸出Markdown或JSON格式。它看到的不是線條和墨水,而是"鍵值對"。

這意味著企業(yè)原本需要雇傭工程師編寫大量正則表達(dá)式來清洗數(shù)據(jù)的工作,瞬間失去了價值。更關(guān)鍵的是它自帶質(zhì)量控制功能。如果你給它一張沾了油漬的超市小票,污漬擋住了"總價",傳統(tǒng)OCR會誠實(shí)地輸出一堆亂碼。DeepSeek會讀取上面的所有單價和數(shù)量,在"心里"做一遍加法,然后推理出:"雖然這里看不清,但根據(jù)計(jì)算邏輯,總價應(yīng)該是108.5元"。

這種自帶邏輯校驗(yàn)的能力,是銀行流水審核、保險理賠錄入夢寐以求的"圣杯"。

同時,人類商業(yè)文檔充滿了潛臺詞:加粗意味著強(qiáng)調(diào),紅色意味著虧損,箭頭意味著流程。傳統(tǒng)OCR會丟掉這些信息,而DeepSeek能保留這些"情緒和重點(diǎn)"。

未來的AI分析師,不僅能讀懂財報里的數(shù)字,還能讀懂管理層試圖用排版掩蓋的壞消息。

200倍價差的降維打擊

除了性能上的進(jìn)化,DeepSeek再次給了OCR行業(yè)一點(diǎn)價格震撼。

根據(jù)AWS官方定價,使用Textract的Analyze Document API處理表格,在美國西部(俄勒岡)地區(qū)的價格為每頁0.015美元(前100萬頁),超過100萬頁后為每頁0.010美元。如果使用Custom Queries功能,價格更是高達(dá)每頁0.025美元(前100萬頁),超過100萬頁后為每頁0.015美元。使用Pretrained Forms和Custom Queries的組合,價格達(dá)到每頁0.065美元(前100萬頁)。

這意味著,處理1000頁帶有復(fù)雜表格的金融文檔,使用AWS Textract大約需要65美元(約合人民幣470元)。

而DeepSeek的Token計(jì)費(fèi)模型,處理同樣信息量的文檔,成本約為0.28美元(約合人民幣2元)。如果命中緩存,成本甚至低至0.028美元。從65美元到0.28美元,這是超過200倍的成本差距。

在任何商業(yè)競爭中,當(dāng)挑戰(zhàn)者的成本只有你的1/200時,原本引以為傲的"獨(dú)家算法"、"私有數(shù)據(jù)集"都變得毫無意義。

誰在顫抖,誰在狂歡

DeepSeek-OCR2的出現(xiàn)直接讓以合合信息、漢王科技、ABBYY為代表的傳統(tǒng)OCR廠商"我們積累了十年的票據(jù)模板,大模型做不好這些長尾場景"的敘事邏輯直接崩塌。

不過對于不同類型的OCR廠商而言,DeepSeek對他們的沖擊顯而易見。

合合信息的C端產(chǎn)品主要是掃描全能王、名片全能王、啟信寶等APP,B端產(chǎn)品主要是面向各行業(yè)客戶提供的智能文字識別、商業(yè)大數(shù)據(jù)的產(chǎn)品和服務(wù)。當(dāng)DeepSeek證明了:大模型不僅能做,而且不需要專門訓(xùn)練就能做得更好。當(dāng)通用模型的泛化能力覆蓋了垂直模型的專業(yè)能力,這些公司的技術(shù)壁壘就消失了,只剩下脆弱的客戶關(guān)系。

而Adobe Acrobat作為PDF時代的王者,其邏輯是"編輯"。在AI時代,用戶不需要"編輯"PDF,需要的是"重構(gòu)"內(nèi)容。如果DeepSeek能直接讀懂PDF并將其完美轉(zhuǎn)化為可編輯的Word,甚至直接提取數(shù)據(jù)進(jìn)入數(shù)據(jù)庫,那么"PDF編輯器"這個工具本身就失去了存在的意義。

AWS Textract的定價從基礎(chǔ)文字檢測的每頁0.0015美元,到表格提取的每頁0.015美元,再到表單處理的每頁0.05美元。云廠商習(xí)慣了將每一個功能封裝成昂貴的API出售。DeepSeek的開源策略讓企業(yè)發(fā)現(xiàn):原來我不需要交這筆"過路費(fèi)"。

開發(fā)者可以在本地部署一個開源的DeepSeek模型,既保護(hù)了隱私,又省下了巨額預(yù)算。但對于更廣泛的商業(yè)世界,當(dāng)機(jī)器"讀書"不再昂貴,新的機(jī)會正在涌現(xiàn)。

原本因?yàn)镺CR成本高昂而無法實(shí)現(xiàn)的小微企業(yè)征信服務(wù)變得可行;大規(guī)模的試卷批改和學(xué)習(xí)資料數(shù)字化成為現(xiàn)實(shí);病歷、檢查報告的自動化處理和分析得以普及;合同審查、案例檢索的智能化升級也將加速。

開源生態(tài)的勝利

值得注意的是,DeepSeek-OCR2采用了阿里巴巴輕量級千問Qwen2-0.5b模型取代架構(gòu)中關(guān)鍵組件之一,展現(xiàn)了中國開源生態(tài)系統(tǒng)推動人工智能發(fā)展的日益重要性。

DeepSeek團(tuán)隊(duì)認(rèn)為,這為邁向統(tǒng)一的全模態(tài)編碼器提供了一條有希望的路徑。未來,單一編碼器可能通過配置特定模態(tài)的可學(xué)習(xí)查詢,在同一參數(shù)空間內(nèi)實(shí)現(xiàn)對圖像、音頻和文本的特征提取與壓縮。

這種開源協(xié)作模式帶來的不僅是技術(shù)迭代的加速,不同團(tuán)隊(duì)的技術(shù)成果可以快速整合;更重要的是成本的大幅降低,避免重復(fù)造輪子,研發(fā)成本得以分?jǐn)?;最終帶來的是整個生態(tài)系統(tǒng)的繁榮,更多開發(fā)者可以基于開源模型構(gòu)建應(yīng)用。

DeepSeek-OCR2的發(fā)布,不僅僅是一個技術(shù)新聞。它標(biāo)志著OCR這一伴隨了計(jì)算機(jī)行業(yè)幾十年的技術(shù),正式完成了歷史使命——從一種需要高價購買的"服務(wù)",變成了水電煤一樣的"基礎(chǔ)設(shè)施"。

根據(jù)DeepSeek公布的技術(shù)報告,該模型在保持極高精度的同時,嚴(yán)格控制了計(jì)算成本,其視覺Token數(shù)量被限制在256至1120之間。這種極致的效率優(yōu)化,正是基礎(chǔ)設(shè)施化的典型特征。

對于Adobe和合合信息們來說,凜冬已至;但對于更廣泛的商業(yè)世界,當(dāng)機(jī)器"讀書"不再昂貴,海量沉睡在紙張、PDF和圖片里的數(shù)據(jù)資產(chǎn),才真正迎來了被喚醒的時刻。

DeepSeek革掉的不是某一家公司的命,它革掉的是舊時代關(guān)于"獲取信息需要高昂成本"的命。

在這個AI重塑一切的時代,任何建立在信息不對稱和技術(shù)門檻上的商業(yè)模式,都將面臨來自開源世界的降維打擊。而這,或許只是開始。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
金刻羽高調(diào)高相,正夫人隱身退網(wǎng),風(fēng)雨不同天……

金刻羽高調(diào)高相,正夫人隱身退網(wǎng),風(fēng)雨不同天……

家傳編輯部
2026-01-28 16:38:08
退休老干部頻繁“聯(lián)系”女幼師,聊天記錄被公開,網(wǎng)友看上癮了

退休老干部頻繁“聯(lián)系”女幼師,聊天記錄被公開,網(wǎng)友看上癮了

烏娛子醬
2026-01-28 16:52:21
上海女主播出個差,回來家被張雨綺端了?

上海女主播出個差,回來家被張雨綺端了?

一莎觀察
2026-01-28 18:04:27
孫濤含淚告別春晚!背后原因太扎心,此前落淚發(fā)布辟謠視頻!

孫濤含淚告別春晚!背后原因太扎心,此前落淚發(fā)布辟謠視頻!

烏娛子醬
2026-01-28 17:03:53
楊冪不愧是大冪冪!真的挺大的,讓人血脈僨張,難怪有些人接受不了

楊冪不愧是大冪冪!真的挺大的,讓人血脈僨張,難怪有些人接受不了

八星人
2026-01-21 09:25:57
7場12球,姆巴佩超越C羅單賽季歐冠小組/聯(lián)賽階段進(jìn)球紀(jì)錄

7場12球,姆巴佩超越C羅單賽季歐冠小組/聯(lián)賽階段進(jìn)球紀(jì)錄

懂球帝
2026-01-29 04:43:09
解放軍上將在京不幸去世:立戰(zhàn)功、扳倒谷俊山,其親弟弟身份曝光

解放軍上將在京不幸去世:立戰(zhàn)功、扳倒谷俊山,其親弟弟身份曝光

博士觀察
2026-01-27 14:10:13
1月23日深夜!解放軍上將在京逝世:曾扳倒谷俊山,胞弟身份曝光

1月23日深夜!解放軍上將在京逝世:曾扳倒谷俊山,胞弟身份曝光

博士觀察
2026-01-28 19:16:28
華西村那頭1噸金牛,15年后竟成最成功的投資?

華西村那頭1噸金牛,15年后竟成最成功的投資?

比利
2026-01-28 20:15:42
北京輸球揪出最大毒瘤!他上場9分鐘,球隊(duì)輸19分,打的太差了

北京輸球揪出最大毒瘤!他上場9分鐘,球隊(duì)輸19分,打的太差了

籃球?qū)^(qū)
2026-01-28 22:30:34
涉及133億!深圳水貝一珠寶平臺疑卷款跑路,大量投資客欲哭無淚

涉及133億!深圳水貝一珠寶平臺疑卷款跑路,大量投資客欲哭無淚

火山詩話
2026-01-28 14:36:53
大S雕像正式完工!具俊曄設(shè)計(jì)太巧妙,做兩個決定,恐回韓國!

大S雕像正式完工!具俊曄設(shè)計(jì)太巧妙,做兩個決定,恐回韓國!

古希臘掌管月桂的神
2026-01-28 11:09:10
高學(xué)歷“巨嬰”惡臭聊天引2億人怒罵:病態(tài)欲望正在蔓延…

高學(xué)歷“巨嬰”惡臭聊天引2億人怒罵:病態(tài)欲望正在蔓延…

不二表姐
2026-01-27 22:44:09
中國甩出“王炸”!5000萬人直接改命!已進(jìn)入最后倒計(jì)時

中國甩出“王炸”!5000萬人直接改命!已進(jìn)入最后倒計(jì)時

毛豆論道
2026-01-27 17:51:43
歐冠1-0大冷門,第31掀翻第13,意甲勁旅遭遇2連敗

歐冠1-0大冷門,第31掀翻第13,意甲勁旅遭遇2連敗

側(cè)身凌空斬
2026-01-29 06:06:44
武漢理工畢業(yè)生當(dāng)保安被母校約談后,被開除了

武漢理工畢業(yè)生當(dāng)保安被母校約談后,被開除了

半島晨報
2026-01-28 19:47:13
熱搜爆了,阿富汗在作死的道路上越走越遠(yuǎn)

熱搜爆了,阿富汗在作死的道路上越走越遠(yuǎn)

林中木白
2026-01-28 18:31:38
深度 | 眾院選戰(zhàn)打響,高市早苗選前再發(fā)涉臺狂言,政治豪賭能否保住相位?

深度 | 眾院選戰(zhàn)打響,高市早苗選前再發(fā)涉臺狂言,政治豪賭能否保住相位?

上觀新聞
2026-01-28 21:39:16
伊朗副外長:做好200%的自衛(wèi)準(zhǔn)備

伊朗副外長:做好200%的自衛(wèi)準(zhǔn)備

界面新聞
2026-01-28 23:48:14
章澤天父母離婚內(nèi)幕曝光!家里有五六個工人,還有個同父異母妹妹

章澤天父母離婚內(nèi)幕曝光!家里有五六個工人,還有個同父異母妹妹

李健政觀察
2026-01-28 14:21:41
2026-01-29 06:56:49
觀察者網(wǎng) incentive-icons
觀察者網(wǎng)
全球視野,中國關(guān)懷
133389文章數(shù) 1849757關(guān)注度
往期回顧 全部

科技要聞

它是神也是毒!Clawdbot改名卷入千萬詐騙

頭條要聞

中國代表:支持伊朗國家穩(wěn)定 武力解決不了問題

頭條要聞

中國代表:支持伊朗國家穩(wěn)定 武力解決不了問題

體育要聞

沒天賦的CBA第一小前鋒,秘訣只有一個字

娛樂要聞

金子涵拉黑蔡徐坤,蔡徐坤工作室回應(yīng)

財經(jīng)要聞

從萬科退休20天后,郁亮疑似失聯(lián)

汽車要聞

新手必看!冰雪路面不敢開?記住這4點(diǎn) 關(guān)鍵時刻真能保命

態(tài)度原創(chuàng)

游戲
家居
旅游
手機(jī)
公開課

《怪獵荒野》PC性能大提升!Steam掌機(jī)也終于能玩了

家居要聞

躍式別墅 包絡(luò)石木為生

旅游要聞

萬鷗翔集撈漁河:昆明冬日里的雙向奔赴,藏著40年生態(tài)共生密碼!

手機(jī)要聞

HyperOS 3.1淘汰名單:REDMI K60、POCO F5在列,有你的手機(jī)嗎

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版