国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

國產大模型同日轉向:參數(shù)競賽結束,工程化時代開啟

0
分享至



1 月 27 日,兩家最受關注的國內大模型初創(chuàng)公司,幾乎同時放出了各自最新、也是分量最重的一次開源更新:

DeepSeek 發(fā)布并開源了 DeepSeek-OCR 2,這是其在去年震動行業(yè)的 DeepSeek-OCR 基礎上的一次關鍵升級;Kimi 同樣發(fā)布并開源了 K2.5,繼續(xù)推進其超長上下文、多模態(tài)與「智能體化」路線。

表面看,這是兩次方向不同的模型迭代。

DeepSeek-OCR 2 重新回答「模型究竟該如何『讀』信息」,通過新的視覺編碼機制,讓大模型學習人類的視覺邏輯,把原本昂貴、冗長的文本輸入壓縮為更高密度的「視覺語義」。

簡單來說,它試圖改變 AI「讀文檔」的方式,讓模型不用再把一整本文件拆成成千上萬個字「硬讀」,而是像人一樣先看版面、抓重點,再理解含義。這意味著,將來讓 AI 幫你讀長文檔、查資料、扒表格,可能會更快、更便宜,也更靠譜。



圖片來源:DeepSeek

Kimi K2.5 則走向另一個方向:不只回答問題,而是把 AI 往「能干活」的方向再推一步。更長的記憶、更強的多模態(tài)理解,再加上對復雜任務的拆解和執(zhí)行能力,指向的是一種更接近「數(shù)字助理」的體驗,而不是一個只會對話的聊天窗口。

Kimi 就宣稱其為迄今最智能、最全能的模型,同時支持視覺與文本輸入、思考與非思考模式、對話與 Agent 任務。



圖片來源:Kimi

一個聚焦語言模型輸入效率的變革,一個聚焦通用智能與復雜任務協(xié)作能力。但放在同一時間點,它們共同指向了一個更重要的問題:大模型的能力升級,正在從「參數(shù)和對話能力」,轉向更底層、更工程化的能力重構。

AI 正在升級的,已經不只是更聰明的大腦。

從輸入到干活的進化,國產 AI 的兩條升級路線

去年發(fā)布的 DeepSeek-OCR,第一次讓行業(yè)意識到,大模型基于單詞和 Token 逐個輸入的方式本身可以被重做。到了最新發(fā)布的 DeepSeek-OCR 2,更是解決了一個更具體、也更困難的問題:模型到底該怎么「讀」一份復雜文檔。

過去,AI 處理文檔的方式非常機械。無論是 PDF、合同還是財報,本質上都是先被拆成一段段文字,再按順序塞進模型里。這種方式的問題很明顯:

一方面,長文檔會迅速消耗上下文窗口,成本高、效率低;另一方面,表格、多欄排版、注釋和正文之間的關系,經常在「拆字」的過程中被破壞。

DeepSeek 在 OCR-2 中給出的答案,是進一步強化其「視覺編碼」思路,不再把文檔當作一串文字,而是當作一個需要被「閱讀」的視覺對象。

相比一代,OCR 2 的關鍵變化不只是壓縮率,而是引入了更接近人類閱讀習慣的邏輯,從上一代的 CLIP(切片)架構轉向以 Qwen2 為基礎的 LM(語言模型)視覺編碼器。模型不再是同時、平均地處理整頁內容,而是學會區(qū)分結構:

哪里是標題,哪里是表格,哪些信息彼此相關,哪些需要先讀、哪些可以后看。



運作示意圖,圖片來源:DeepSeek

換句話說,它開始理解「版面本身就是信息的一部分」。

這種變化帶來的直接價值,并不體現(xiàn)在「模型更聰明」這樣的抽象評價上,而是體現(xiàn)在一系列非常具體的體驗提升上。比如,當你讓 AI 幫你快速看完一份幾十頁的報告時,它不再需要把每一個字都讀完,才能給出結論;在處理復雜表格時,也不再頻繁出現(xiàn)列錯位、字段錯配的問題。

更重要的是,由于輸入被高度壓縮,同樣的任務可以用更低的成本、更短的時間完成。這也是為什么 DeepSeek-OCR 2 對真正的 AI 應用來說意義更大,它有潛力讓 AI 更適合被放進真實的文檔流程里,無論是檢索、比對、摘要,還是結構化信息抽取。

在這個意義上,OCR 2 解決的不是一個模型能力問題,而是一個長期存在的「用起來不順」的問題。

而相比 DeepSeek-OCR 2 把 AI 的「輸入端」重做了一遍,Kimi K2.5 關注的,則是 AI 代理完成復雜任務的能力。

事實上,今天問題問得再復雜,AI 也能回答;可一旦涉及多步驟、多材料、需要反復引用上下文的任務,模型就很容易「忘前忘后」,或者停留在建議層面。AI 的能力已經相當成熟,不過很多用戶還都是類似的體驗。

Kimi 在 K2.5 中,繼續(xù)把重心放在「長記憶 + 多模態(tài) + 智能體」這條路線上,本質上是在嘗試讓 AI 從「答題模式」,走向「執(zhí)行模式」。

一方面,超長上下文讓模型可以在更長時間內記住對話、資料和中間結論,減少反復解釋的成本;另一方面,多模態(tài)能力讓 AI 不只處理文字,還能理解圖片、界面截圖甚至更復雜的輸入形式。

更關鍵的,是對「智能體」能力的持續(xù)強化。Kimi 不再只是回答你「應該怎么做」,而是嘗試把任務拆解成多個步驟,并且實現(xiàn)了「Agent 集群」,能在不同階段調用不同能力,最終給出一個相對完整的結果。這種能力,決定了 AI 能否真正進入工作流,而不是只停留在咨詢助手的位置。



圖片來源:Kimi

這也是 Kimi K2.5 強調自己「更全能」的原因所在。它追求的,并不是某一個能力點的極限,而是能否承接更長、更復雜、更接近真實工作的任務鏈條。

大模型這一輪,開始卷「能不能真的用起來」

從 DeepSeek-OCR 2 和 Kimi K2.5 往外看,會發(fā)現(xiàn)最近半年的一批主流大模型,升級方向其實異常一致。無論是 OpenAI 的 GPT-5.2、Anthropic 的 Claude 4.5,還是 Google 的 Gemini 3,再到字節(jié)跳動的豆包 1.8、阿里巴巴的千問 Qwen3-Max-Thinking,它們不約而同地把重心從「模型有多強」,挪到了一個更現(xiàn)實的問題上:

讓 AI 更深一步進入真實的工作環(huán)境。

這也是為什么,這一輪升級很少再強調參數(shù)規(guī)模和單點能力,而是反復圍繞幾件事打磨:記得住、看得懂、接得住流程、干得完事情。

首先被集體拉高的,是「記憶」這件事。

過去,大模型更像是短期對話高手,擅長當下回答,卻很難長期協(xié)作。一旦任務變長、材料變多,就需要用戶不斷重復背景。最近這一批模型的升級,幾乎都在解決這個痛點:更長的上下文、更穩(wěn)定的狀態(tài)保持,讓模型能夠跟著任務一路往前走,而不是走兩步就「失憶」。

GPT-5.2 把長上下文和不同推理模式直接產品化,Kimi K2.5 則把超長上下文嵌進智能體流程,讓模型在多步驟執(zhí)行中記住中間結果。這些變化都在讓 AI 不再只是回答一個問題,而是有能力幫用戶做好一件事。

其次,是對「看」這件事的重新理解。

如果說過去的多模態(tài)更多是「能識圖」,那么現(xiàn)在的升級重點,是「能不能看懂」。DeepSeek-OCR 2 代表的,是一種更激進也更務實的方向:不再把視覺當成文字的前置步驟,而是直接把視覺當作信息本身,讓模型像人一樣先理解結構、版面和關系,再進入語義層。

這種變化并不只發(fā)生在文檔場景。無論是 GPT、Claude 還是 Gemini,都在強化對截圖、界面、復雜圖像的理解能力。



圖片來源:Gemini

現(xiàn)實世界的信息,本來就不是一行一行排好的文本。當模型開始真正理解「圖像里信息是怎么組織的」,AI 才可能更自然地嵌入真實環(huán)境,而不是只活在純文本的對話框里。

再往下,是這一輪升級里最容易被忽視、卻最關鍵的變化:AI 的角色轉移。

過去,大模型更像是「顧問」,給建議、給答案,但不負責結果。而現(xiàn)在,越來越多模型開始被設計成「執(zhí)行者」。Kimi K2.5 強調智能體,本質上是在讓模型學會拆任務、接工具、跑流程;GPT-5.2 把不同推理模式與工具調用結合,也是在降低「從建議到執(zhí)行」的斷層。

當 AI 開始接手的是一整段流程,而不是某一個問題,對它的價值判斷標準也隨之改變,關鍵在于「說得對不對」,而在于能不能跑完、穩(wěn)不穩(wěn)。這也是為什么,這一輪升級中,「工程化」的重要性被反復提到。

國內 AI 在這一點上動作尤為明顯。DeepSeek、Kimi、千問、豆包,都在強調模型是否好部署、是否好接入現(xiàn)有系統(tǒng)、是否能跑在真實業(yè)務里。另一方面,國內外 AI 過去一年都在強調通過更強的產品封裝,把復雜能力隱藏在界面和服務之下。實際上目標一致,都是讓 AI 不再停留在「演示」,而是「可用」「好用」。

寫在最后

沒有哪個模型做到了「通用智能(AGI)」,但把時間線再拉長一點看,更多變化發(fā)生在不那么「奪目」的地方:輸入方式被重新設計,任務開始被拆解和接管,模型被要求在更長時間、更復雜流程中保持穩(wěn)定。

當模型開始被認真地放進真實的日常生活和工作環(huán)境中,被反復驗證、反復調用,它的價值衡量標準也隨之改變。不再是誰的參數(shù)更大、回答更驚艷,而是誰更省成本、更少出錯、更值得長期依賴。

從這個角度看,DeepSeek-OCR 2 和 Kimi K2.5 的意義,并不只在于它們各自解決了什么問題,而在于它們代表了一種更現(xiàn)實的共識:AI 邁入真實世界的下一步,必須邁出問答。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
郵報:斯特林何錯之有?揮霍無度的切爾西才是足壇反面教材

郵報:斯特林何錯之有?揮霍無度的切爾西才是足壇反面教材

懂球帝
2026-01-29 02:46:03
一把輸光3億元!躲過兩次調查的山西前首富,這次終于逃不掉了

一把輸光3億元!躲過兩次調查的山西前首富,這次終于逃不掉了

芊芊子吟
2026-01-24 19:05:03
這一次,哈梅內伊真的怕了。!

這一次,哈梅內伊真的怕了!!!

山河路口
2026-01-27 12:42:53
遠華集團老總賴昌星,在獄中對董文華的回憶,讓無數(shù)人咋舌

遠華集團老總賴昌星,在獄中對董文華的回憶,讓無數(shù)人咋舌

曉艾故事匯
2025-01-09 22:01:49
9歲進世界前八,打哭同齡人,林丹兒子進步揭開歐少年網球有多卷

9歲進世界前八,打哭同齡人,林丹兒子進步揭開歐少年網球有多卷

網球之家
2026-01-01 12:33:37
動態(tài) | 印西孟加拉邦爆發(fā)尼帕病毒疫情,會失控嗎?

動態(tài) | 印西孟加拉邦爆發(fā)尼帕病毒疫情,會失控嗎?

南亞研究通訊
2026-01-27 22:33:35
加拿大是怎么被特魯多在9年里“玩崩”的?

加拿大是怎么被特魯多在9年里“玩崩”的?

蕭遙笙
2026-01-15 12:25:03
賈玲巴黎周“一臉男相”!不愛笑也沒梨渦眼神犀利,梳大背頭好酷

賈玲巴黎周“一臉男相”!不愛笑也沒梨渦眼神犀利,梳大背頭好酷

軒逸阿II
2026-01-20 07:54:29
輸天津許利民引眾怒!迷信杰曼,末節(jié)死用三后衛(wèi)+棄大外想干嘛?

輸天津許利民引眾怒!迷信杰曼,末節(jié)死用三后衛(wèi)+棄大外想干嘛?

籃球資訊達人
2026-01-28 21:31:52
宋喆直播賣棗社死!10萬圍觀零成交

宋喆直播賣棗社死!10萬圍觀零成交

阿廢冷眼觀察所
2026-01-12 14:33:54
澳網女單4強全出爐附賽程,佩古拉vs萊巴金娜!大概率以下2人爭冠

澳網女單4強全出爐附賽程,佩古拉vs萊巴金娜!大概率以下2人爭冠

小火箭愛體育
2026-01-28 12:34:11
結婚23年她的內衣都是丈夫洗,在丈夫入獄后,她為夫還債三千萬

結婚23年她的內衣都是丈夫洗,在丈夫入獄后,她為夫還債三千萬

琨玉秋霜
2026-01-27 14:10:08
太平天國打不過曾國藩,是因為它不論軍事、政治、外交、執(zhí)政能力,都是全面落后于晚清中央政府

太平天國打不過曾國藩,是因為它不論軍事、政治、外交、執(zhí)政能力,都是全面落后于晚清中央政府

歷史按察使司
2025-12-22 12:04:22
對越反擊戰(zhàn)撤退傷亡幾何?鄧小平 “小虧” 之言藏戰(zhàn)略深意

對越反擊戰(zhàn)撤退傷亡幾何?鄧小平 “小虧” 之言藏戰(zhàn)略深意

嘮叨說歷史
2026-01-05 10:16:46
美論壇:若中國決定對臺灣進行統(tǒng)一,美國為什么不對其使用核武器

美論壇:若中國決定對臺灣進行統(tǒng)一,美國為什么不對其使用核武器

可愛大王呼
2026-01-27 15:45:11
真實案例!我國1名軍長叫來200人,火拼河北黑社會老大

真實案例!我國1名軍長叫來200人,火拼河北黑社會老大

馬爾科故事會
2024-02-20 17:16:20
李顯龍:奧巴馬上任時,美國對中國的態(tài)度就開始發(fā)生變化

李顯龍:奧巴馬上任時,美國對中國的態(tài)度就開始發(fā)生變化

小武世界
2026-01-27 21:33:12
中國春節(jié)赴日2376班航班取消!中國游客消費2萬億被嫌棄,日網友:歐美游客多了,不虧!

中國春節(jié)赴日2376班航班取消!中國游客消費2萬億被嫌棄,日網友:歐美游客多了,不虧!

東京新青年
2026-01-27 17:56:04
噩耗傳來!53歲閆學晶,涼了

噩耗傳來!53歲閆學晶,涼了

深析古今
2026-01-10 11:15:05
浙江第三座萬億GDP城市來了

浙江第三座萬億GDP城市來了

21世紀經濟報道
2026-01-27 22:53:36
2026-01-29 03:32:49
雷科技 incentive-icons
雷科技
專注AI硬科技
35960文章數(shù) 811792關注度
往期回顧 全部

科技要聞

它是神也是毒!Clawdbot改名卷入千萬詐騙

頭條要聞

俄總統(tǒng)助理:澤連斯基若愿與普京會晤 可來莫斯科

頭條要聞

俄總統(tǒng)助理:澤連斯基若愿與普京會晤 可來莫斯科

體育要聞

沒天賦的CBA第一小前鋒,秘訣只有一個字

娛樂要聞

金子涵拉黑蔡徐坤,蔡徐坤工作室回應

財經要聞

從萬科退休20天后,郁亮疑似失聯(lián)

汽車要聞

新手必看!冰雪路面不敢開?記住這4點 關鍵時刻真能保命

態(tài)度原創(chuàng)

房產
家居
本地
藝術
公開課

房產要聞

實景兌現(xiàn)在即!綠城,在海棠灣重新定義終極旅居想象!

家居要聞

躍式別墅 包絡石木為生

本地新聞

云游中國|撥開云霧,巫山每幀都是航拍大片

藝術要聞

沙特醒悟,“全球最大單體建筑”停止施工!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版