国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型不再是壁壘,高質(zhì)量文檔解析正成為AI落地的“生死線”

0
分享至

最近,辦公軟件圈的風(fēng)向徹底變了。如果說兩年前的“百模大戰(zhàn)”讓大家還沉浸在參數(shù)量級(jí)、算力競(jìng)賽的狂歡中,甚至產(chǎn)生了一種“只要模型足夠強(qiáng),萬事皆可靈”的幻覺,那么現(xiàn)在的市場(chǎng)信號(hào)已經(jīng)冷酷且直白:用戶對(duì)AI的新鮮感正在耗盡,單純的聊天陪聊撐不起AI的下半場(chǎng)。



(圖為:中金公司研究部執(zhí)行總經(jīng)理、計(jì)算機(jī)行業(yè)首席分析師于鐘海)

在1月27日的WPS 365 AI協(xié)同辦公上海峰會(huì)上,中金公司研究部執(zhí)行總經(jīng)理、計(jì)算機(jī)行業(yè)首席分析師于鐘海拋出了一個(gè)引人深思的觀察:頂尖AI實(shí)驗(yàn)室的模型更新周期已縮短至數(shù)月。這意味著,企業(yè)試圖通過自研或深度綁定某一模型來建立競(jìng)爭(zhēng)優(yōu)勢(shì),不僅成本高昂,且“保鮮期”極短。他提出了一個(gè)關(guān)鍵斷言:數(shù)據(jù)才是AI時(shí)代企業(yè)唯一可持續(xù)的護(hù)城河。這一觀點(diǎn)折射出一個(gè)行業(yè)共識(shí)——企業(yè)級(jí)AI的競(jìng)爭(zhēng)重心,正在從“比拼模型有多聰明”,全面轉(zhuǎn)向“比拼數(shù)據(jù)治理有多深”。

很多企業(yè)在做AI轉(zhuǎn)型時(shí),都會(huì)遇到一個(gè)尷尬的困境:AI在演示寫周報(bào)、潤(rùn)色郵件時(shí)表現(xiàn)驚艷,可一旦進(jìn)入真實(shí)的業(yè)務(wù)深水區(qū),面對(duì)那些積攢了十幾年的合同、設(shè)計(jì)圖紙、工藝手冊(cè),AI就開始“間歇性胡言亂語”。這種“演示很牛,落地就走”的癥結(jié)往往不在于模型不夠聰明,而在于業(yè)務(wù)數(shù)據(jù)的“沉睡”與“無序”。

企業(yè)中80%以上的數(shù)據(jù)是以文檔、報(bào)表、郵件等形式存在的非結(jié)構(gòu)化數(shù)據(jù)。它們散落在不同的煙囪式系統(tǒng)里,格式五花八門,充滿了只有內(nèi)部人才懂的“黑話”和復(fù)雜的邏輯嵌套。如果你喂給模型的“原材料”是亂序、低質(zhì)、甚至邏輯斷裂的,那么產(chǎn)出的只能是誤導(dǎo)。



(圖為:金山辦公副總裁吳慶云)

金山辦公副總裁吳慶云在現(xiàn)場(chǎng)給出了一個(gè)極其直接的判斷:建設(shè)企業(yè)級(jí)AI的首要任務(wù),不再是盲目尋找更先進(jìn)的模型,而是優(yōu)先完成對(duì)企業(yè)非結(jié)構(gòu)化數(shù)據(jù)的收集和治理。如果把大模型比作心臟,數(shù)據(jù)就是血液。血液里如果全是雜質(zhì),心臟再?gòu)?qiáng)也帶不動(dòng)身體。而目前大多數(shù)企業(yè)面臨的現(xiàn)狀是,由于缺乏有效的數(shù)據(jù)治理,AI在面對(duì)復(fù)雜業(yè)務(wù)文檔時(shí)會(huì)產(chǎn)生嚴(yán)重的“幻覺”,導(dǎo)致決策參考價(jià)值歸零。

想要治理好這些數(shù)據(jù),最難的一關(guān)其實(shí)是被行業(yè)長(zhǎng)期忽視的硬手藝——文檔解析。外界往往認(rèn)為解析文檔就是簡(jiǎn)單的OCR文字識(shí)別,但在真實(shí)的辦公場(chǎng)景中,這卻是一道極高的技術(shù)天花板。能不能精準(zhǔn)解析一份跨頁(yè)的嵌套表格,能不能看懂技術(shù)手冊(cè)里的手寫批注,甚至能不能在復(fù)雜的排版中準(zhǔn)確提取出核心要素,直接決定了后續(xù)AI應(yīng)用的效果上限。



(圖為:華中科技大學(xué)教授、博士生導(dǎo)師劉禹良)

在這次峰會(huì)上,華中科技大學(xué)劉禹良教授分享了一個(gè)細(xì)節(jié):他們與金山辦公聯(lián)合研發(fā)的MonkeyOCR模型,在3B的小參數(shù)規(guī)模下,其文檔解析性能竟然超越了GPT-4o、Gemini-2.5 Pro等大參數(shù)閉源模型,在國(guó)際權(quán)威榜單OmniDocBench上拿下綜合性能全球第一。

這背后反映了一個(gè)真相:通用大模型雖然“博學(xué)”,但對(duì)中國(guó)企業(yè)極其復(fù)雜的文檔格式——尤其是那些充滿行業(yè)壁壘的非標(biāo)準(zhǔn)文檔——缺乏深度理解。而金山辦公憑借38年在文檔領(lǐng)域的底層積淀,對(duì)上萬種文檔格式有著解構(gòu)級(jí)的拆解能力。這種對(duì)復(fù)雜文檔的精準(zhǔn)解析與知識(shí)化能力,正是金山辦公在AI新賽道上構(gòu)建的降維打擊。當(dāng)別的廠商還在卷對(duì)話框的交互UI時(shí),金山辦公正在死磕怎么把一份復(fù)雜的醫(yī)藥不良事件報(bào)告里的表格識(shí)別準(zhǔn)確率做到99%,這種“苦活累活”才是真正拉開差距的護(hù)城河。

這種深厚的數(shù)據(jù)治理能力,直接決定了企業(yè)“大腦”是否真的懂業(yè)務(wù)。金山辦公提出的KAG(知識(shí)增強(qiáng)生成)新范式,本質(zhì)上就是讓AI從單純的“看到文檔”進(jìn)階到“掌握知識(shí)”。它不再是簡(jiǎn)單的關(guān)鍵詞檢索,而是通過多模態(tài)、多結(jié)構(gòu)的知識(shí)提取,讓AI理解企業(yè)知識(shí)間的內(nèi)在邏輯關(guān)聯(lián)。

這種技術(shù)進(jìn)階正在真實(shí)的生產(chǎn)力場(chǎng)景中產(chǎn)生質(zhì)變。在上海金融圈,申萬宏源證券依托這套全域知識(shí)治理方案,將原本散落在不同系統(tǒng)、格式迥異的精算報(bào)告和制度文檔進(jìn)行了集中上云與結(jié)構(gòu)化解析。這讓財(cái)富經(jīng)理在面對(duì)客戶咨詢時(shí),可以通過AI問答替代傳統(tǒng)的人工搜索,平均對(duì)客延時(shí)縮短了3倍以上,整體知識(shí)獲取效率提升了80%。

而在船舶制造這種重工業(yè)領(lǐng)域,中船動(dòng)力正利用這套體系將原本依賴?yán)蠋煾祵<医?jīng)驗(yàn)傳承的工藝手冊(cè)、研發(fā)筆記轉(zhuǎn)化成可流轉(zhuǎn)的知識(shí)圖譜。供應(yīng)鏈團(tuán)隊(duì)借此實(shí)現(xiàn)了原本極其依賴人工的市場(chǎng)價(jià)格分析與政策變動(dòng)追蹤的自動(dòng)化,不僅大幅縮短了審查周期,更顯著降低了人為疏漏帶來的風(fēng)險(xiǎn)。即使在規(guī)則極其嚴(yán)苛的汽車研發(fā)領(lǐng)域,聯(lián)合汽車電子也通過將數(shù)千頁(yè)的復(fù)雜制度規(guī)范喂給AI,讓員工不再需要翻閱厚重的手冊(cè),通過精準(zhǔn)的問答即刻獲得業(yè)務(wù)支撐,確保了制度執(zhí)行的準(zhǔn)確性。

這些真實(shí)的業(yè)務(wù)反饋說明了一個(gè)趨勢(shì):AI正從“好玩的工具”變成“好用的員工”。它不再是辦公軟件的一個(gè)點(diǎn)綴,而是成為了企業(yè)的業(yè)務(wù)中樞和決策大腦。WPS 365所構(gòu)建的這種“懂?dāng)?shù)據(jù)、懂組織、懂業(yè)務(wù)”的能力,實(shí)際上是在幫助企業(yè)將沉睡的數(shù)字資產(chǎn)轉(zhuǎn)化為活躍的生產(chǎn)力要素。

站在科技產(chǎn)研的角度看,企業(yè)級(jí)AI的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了下半場(chǎng)。當(dāng)模型本身逐漸變成像水電一樣的基礎(chǔ)設(shè)施,企業(yè)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的治理深度,就成了AI落地成敗的唯一變量。



(圖為:金山辦公助理總裁朱熠鍔)

金山辦公的策略非常清晰:與其參與虛無的模型參數(shù)大戰(zhàn),不如死磕“文檔解析”與“知識(shí)治理”這兩項(xiàng)基本功。這種“先修內(nèi)功,再出招”的打法,源于其幾十年在國(guó)產(chǎn)化適配和復(fù)雜辦公場(chǎng)景中的厚積薄發(fā)。正如金山辦公助理總裁朱熠鍔所強(qiáng)調(diào)的,讓大模型真正“掌握”企業(yè)真正的知識(shí)資產(chǎn),才是WPS 365的核心愿景。

在這個(gè)浮躁的、動(dòng)輒談?wù)擃嵏驳臅r(shí)代,與其追逐飄在云端的風(fēng)口,不如像金山辦公這樣,在自己最擅長(zhǎng)的領(lǐng)域里把護(hù)城河筑得更深、更寬。畢竟,在AI的漫長(zhǎng)競(jìng)賽里,最后能留在桌上的,往往是那些真正理解用戶痛點(diǎn)、并愿意在基礎(chǔ)技術(shù)上長(zhǎng)期深耕的“長(zhǎng)期主義者”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
B-52重返戰(zhàn)場(chǎng):當(dāng)美軍開始用二戰(zhàn)式轟炸,戰(zhàn)爭(zhēng)其實(shí)已經(jīng)結(jié)束了一半

B-52重返戰(zhàn)場(chǎng):當(dāng)美軍開始用二戰(zhàn)式轟炸,戰(zhàn)爭(zhēng)其實(shí)已經(jīng)結(jié)束了一半

斌聞天下
2026-03-07 07:30:03
央視怒批!“絕望的文盲”丟臉到國(guó)外,馮遠(yuǎn)征的話終于有人信了

央視怒批!“絕望的文盲”丟臉到國(guó)外,馮遠(yuǎn)征的話終于有人信了

老呶侃史
2026-03-09 20:03:39
董潔這張臉,當(dāng)年把劉亦菲都襯得像個(gè)丫鬟,那兩位誰認(rèn)識(shí)?

董潔這張臉,當(dāng)年把劉亦菲都襯得像個(gè)丫鬟,那兩位誰認(rèn)識(shí)?

東方不敗然多多
2026-03-09 11:05:37
明星在景區(qū)錄綜藝,將消費(fèi)游客趕走?景區(qū)回應(yīng):未影響正常游覽

明星在景區(qū)錄綜藝,將消費(fèi)游客趕走?景區(qū)回應(yīng):未影響正常游覽

半島晨報(bào)
2026-03-09 20:01:20
尼克松晚年坦言:他很后悔當(dāng)初訪華,只因毛主席識(shí)破的訪華計(jì)謀!

尼克松晚年坦言:他很后悔當(dāng)初訪華,只因毛主席識(shí)破的訪華計(jì)謀!

冰語歷史
2026-03-07 06:23:39
你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

另子維愛讀史
2026-01-22 18:21:09
趕緊關(guān)窗!已提前到來!

趕緊關(guān)窗!已提前到來!

羊城攻略
2026-03-08 22:54:35
迪拜“地獄”監(jiān)獄:一間牢房20人,強(qiáng)奸是家常便飯,隨時(shí)會(huì)被電擊

迪拜“地獄”監(jiān)獄:一間牢房20人,強(qiáng)奸是家常便飯,隨時(shí)會(huì)被電擊

哄動(dòng)一時(shí)啊
2026-03-09 19:26:44
重慶街頭遇75歲劉曉慶,頭上簪花身材前凸后翹,上樓梯抬手有人攙

重慶街頭遇75歲劉曉慶,頭上簪花身材前凸后翹,上樓梯抬手有人攙

小徐講八卦
2026-03-09 12:31:42
兄弟們,聊聊暗黑界“凡爾賽”天花板 —— 通野未帆

兄弟們,聊聊暗黑界“凡爾賽”天花板 —— 通野未帆

碧波萬覽
2026-03-10 00:55:20
日本果然擅長(zhǎng)背后捅刀,趁美伊激戰(zhàn)時(shí),宣布拋售價(jià)值6200億美債

日本果然擅長(zhǎng)背后捅刀,趁美伊激戰(zhàn)時(shí),宣布拋售價(jià)值6200億美債

我心縱橫天地間
2026-03-06 23:01:27
鬧大了!鄭州8歲女孩買了5支鮮花送給媽媽,爸爸拉著女孩憤怒退款

鬧大了!鄭州8歲女孩買了5支鮮花送給媽媽,爸爸拉著女孩憤怒退款

火山詩(shī)話
2026-03-10 05:41:34
字節(jié)“龍蝦” ArkClaw上線!網(wǎng)頁(yè)點(diǎn)開就用,4個(gè)適合普通人的賺錢路

字節(jié)“龍蝦” ArkClaw上線!網(wǎng)頁(yè)點(diǎn)開就用,4個(gè)適合普通人的賺錢路

商悟社
2026-03-09 23:12:05
演都不演了,剛復(fù)出就開演唱會(huì),票價(jià)賣到1280,到底誰給的自信?

演都不演了,剛復(fù)出就開演唱會(huì),票價(jià)賣到1280,到底誰給的自信?

一娛三分地
2026-03-03 13:51:03
原來我們錯(cuò)怪康熙了,讓容妃刷臟馬桶27年,其實(shí)是一種“保護(hù)”?

原來我們錯(cuò)怪康熙了,讓容妃刷臟馬桶27年,其實(shí)是一種“保護(hù)”?

銘記歷史呀
2026-03-09 14:13:03
快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

FM93浙江交通之聲
2025-10-28 00:01:43
俄羅斯強(qiáng)制中國(guó)留學(xué)生服役是謠言,但可自愿簽署合同參軍

俄羅斯強(qiáng)制中國(guó)留學(xué)生服役是謠言,但可自愿簽署合同參軍

映射生活的身影
2026-03-09 22:19:07
農(nóng)業(yè)農(nóng)村部部長(zhǎng)喊話全國(guó)人:少吃點(diǎn)油!你家吃對(duì)了嗎?

農(nóng)業(yè)農(nóng)村部部長(zhǎng)喊話全國(guó)人:少吃點(diǎn)油!你家吃對(duì)了嗎?

達(dá)文西看世界
2026-03-09 21:09:29
歷史第1人!38歲德約2-1逆轉(zhuǎn)+第113次進(jìn)大師賽16強(qiáng) 現(xiàn)場(chǎng)拉小提琴

歷史第1人!38歲德約2-1逆轉(zhuǎn)+第113次進(jìn)大師賽16強(qiáng) 現(xiàn)場(chǎng)拉小提琴

風(fēng)過鄉(xiāng)
2026-03-10 06:42:41
南寧一校長(zhǎng)開會(huì)時(shí)說“呦西”,事后公開道歉

南寧一校長(zhǎng)開會(huì)時(shí)說“呦西”,事后公開道歉

麥杰遜
2026-03-08 13:13:41
2026-03-10 09:39:00
技術(shù)領(lǐng)導(dǎo)力 incentive-icons
技術(shù)領(lǐng)導(dǎo)力
Mr.K,出過書,做過CTO
70文章數(shù) 583關(guān)注度
往期回顧 全部

科技要聞

“龍蝦”狂歡,賣“飼料”的先掙錢了

頭條要聞

業(yè)主舉報(bào)違建次日接"鄰居"電話:連我媽在哪打拳都知道

頭條要聞

業(yè)主舉報(bào)違建次日接"鄰居"電話:連我媽在哪打拳都知道

體育要聞

韓國(guó)女足羨慕的奢侈品,為何選擇中國(guó)女足

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產(chǎn)檢心情愉快

財(cái)經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮出水面

汽車要聞

對(duì)標(biāo)奔馳小號(hào)G級(jí) 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

藝術(shù)
教育
數(shù)碼
時(shí)尚
公開課

藝術(shù)要聞

30000畝杏花開了,才知道原來新疆的春天這么美!

教育要聞

《校長(zhǎng)峰會(huì)》聚焦:學(xué)校質(zhì)量快速提升的具體路徑與方法邀請(qǐng)函

數(shù)碼要聞

三星Odyssey 3D Hub年底將支持120款游戲

今年最流行的5條半裙,怎么搭都好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版