国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

開源權(quán)重模型崛起:填補(bǔ)企業(yè)級與前沿AI之間的鴻溝

0
分享至


春季如約而至,谷歌、微軟、阿里巴巴和英偉達(dá)等科技巨頭再度掀起開源權(quán)重AI模型的新浪潮。但這一次,感覺有些不同尋常。

過去,這些模型更像是"玩具":雖然在規(guī);騽(chuàng)新性上令人印象深刻,但本質(zhì)上仍是研究項(xiàng)目或概念驗(yàn)證,與OpenAI、Anthropic或谷歌的頂級模型相比仍有相當(dāng)大的差距。

然而,Qwen 3.5、谷歌的Gemma 4,以及微軟的MAI語音與圖像模型,卻呈現(xiàn)出截然不同的面貌。這些模型不再只是概念驗(yàn)證,而更像是真正面向企業(yè)的產(chǎn)品。

IDC高級研究總監(jiān)安德魯·巴斯(Andrew Buss)向媒體表示:"我們已經(jīng)從'令人感興趣'邁入了'真正嚴(yán)肅的企業(yè)級平臺'階段。"

這批模型揭示了一個(gè)清晰的現(xiàn)實(shí):企業(yè)級AI與前沿AI之間的鴻溝在過去幾年中愈發(fā)明顯,而那些功能最強(qiáng)大的前沿模型,已經(jīng)超出了許多企業(yè)的承受能力。

巴斯說:"我認(rèn)為我們正在目睹一種分化趨勢。一方面,出現(xiàn)了那些體量龐大、追求全能的綜合性模型;另一方面,針對特定場景或查詢類型的小型專用模型也在快速崛起。"

前沿模型的主權(quán)AI盲區(qū)

使用OpenAI或Anthropic的頂級模型,意味著企業(yè)需要將潛在的敏感客戶數(shù)據(jù)或知識產(chǎn)權(quán)暴露給API接口或聊天機(jī)器人。

盡管兩家公司均聲稱不會將企業(yè)或API數(shù)據(jù)用于模型訓(xùn)練,但這些公司此前已多次因版權(quán)問題被訴諸法庭。

企業(yè)或許愿意借助Gemini或Copilot來起草郵件或銷售提案,但絕不會輕易將核心專有數(shù)據(jù)交由其處理。

另一條路也并非坦途。來自DeepSeek、阿里巴巴、Moonshot AI和MiniMax等中國廠商的大型模型,在性能上已能接近OpenAI或Anthropic,但這些模型仍需要相當(dāng)規(guī)模的基礎(chǔ)設(shè)施投入。即便是英偉達(dá)和AMD面向企業(yè)的系統(tǒng),單臺售價(jià)也在25萬至50萬美元之間。

不過,巴斯指出,根據(jù)具體應(yīng)用場景,企業(yè)未必需要前沿級別的模型——真正重要的是模型能否足夠出色地完成預(yù)期任務(wù)。

就規(guī)模而言,谷歌、阿里巴巴、微軟和英偉達(dá)最新推出的開源模型不僅競爭力相當(dāng)出色,運(yùn)行成本也相對低廉。

在Arena AI的文本排行榜上(該榜單允許公眾投票評選最佳輸出模型),谷歌的Gemma 4 31B(31B指其包含310億個(gè)參數(shù))目前排名第四,僅次于Z.AI的GLM-5和Moonshot AI的Kimi 2.5 Thinking——后兩者參數(shù)量分別高達(dá)7440億和1萬億,體量要大出數(shù)個(gè)數(shù)量級。

巴斯表示:"各類規(guī)模的企業(yè)對AI都有著強(qiáng)烈的需求,我們認(rèn)為中端市場同樣存在巨大機(jī)遇。為此,我們需要多樣化的基礎(chǔ)設(shè)施硬件,以及能夠在其上運(yùn)行的各類模型。"

谷歌最新發(fā)布的310億參數(shù)模型可輕松在單張RTX Pro 6000 Blackwell顯卡上以完整的16位精度運(yùn)行,同時(shí)仍有充裕的資源支撐合理數(shù)量的并發(fā)請求和交互操作。

這款顯卡的市場售價(jià)通常在8000至10000美元之間。Qwen 3.5的情況與此類似——除兩個(gè)最大規(guī)格的版本外,其余模型均可在單張GPU上輕松運(yùn)行。

巴斯還指出,在許多場景下,這些小型企業(yè)級模型甚至無需大量算力支持。他表示:"很多時(shí)候我們并不需要GPU加速,相當(dāng)一部分AI工作負(fù)載完全可以在一臺配置較新的CPU服務(wù)器上加載并運(yùn)行。"

這些更小巧、更專注的模型意味著,使用QLoRA微調(diào)或強(qiáng)化學(xué)習(xí)等技術(shù)對其進(jìn)行定制時(shí),幾乎不需要額外的資源投入。

究竟發(fā)生了什么變化?

是什么讓這些模型的能力實(shí)現(xiàn)了如此大幅的提升?其實(shí),背后發(fā)生的變化相當(dāng)深遠(yuǎn)。

過去一年間,不僅模型訓(xùn)練技術(shù)取得了一系列突破,驅(qū)動這些模型實(shí)際落地應(yīng)用的框架也得到了顯著完善。

不少人還記得DeepSeek R1引發(fā)的市場轟動——這是最早采用強(qiáng)化學(xué)習(xí)(RL)復(fù)現(xiàn)GPT-o1思維鏈推理能力的開源權(quán)重前沿模型之一,通過以時(shí)間換質(zhì)量的方式提升輸出水平。

這種如今被稱為"測試時(shí)擴(kuò)展"(test-time scaling)的方法,讓小型模型得以通過"更長時(shí)間的思考"來彌補(bǔ)參數(shù)量不足的局限。

與此同時(shí),過去一年中越來越多的模型開始支持視覺和音頻處理,具備了分析圖像數(shù)據(jù)的能力;更智能的架構(gòu)設(shè)計(jì)和更先進(jìn)的壓縮技術(shù),則進(jìn)一步降低了運(yùn)行這些模型所需的算力和內(nèi)存資源。

但最為關(guān)鍵的變化,或許在于用于驅(qū)動這些模型完成實(shí)際任務(wù)的軟件框架已經(jīng)走向成熟。

這些框架使模型不再局限于訓(xùn)練數(shù)據(jù)——它們能夠從互聯(lián)網(wǎng)、數(shù)據(jù)庫和API中檢索信息,并通過工具調(diào)用基于檢索結(jié)果采取行動。

谷歌和英偉達(dá)的模型在訓(xùn)練之初便將函數(shù)調(diào)用(function calling)納入核心考量。換言之,這些模型并非設(shè)計(jì)為獨(dú)立運(yùn)行的系統(tǒng)。部分模型(如微軟的MAI)更進(jìn)一步,針對語音識別和圖像生成等特定領(lǐng)域進(jìn)行了深度優(yōu)化。

巴斯指出,如何為具體任務(wù)選擇合適的模型,隨之成為一大挑戰(zhàn),并認(rèn)為某種形式的推薦系統(tǒng)可能不可或缺。

模型開發(fā)者能從中獲得什么?

在本地運(yùn)行可訪問專有數(shù)據(jù)的智能體,本身具備獨(dú)特的商業(yè)價(jià)值。一方面,盡管這些模型是開源的,但其中仍存在一定程度的生態(tài)綁定——基于這些模型構(gòu)建的智能體,其系統(tǒng)提示詞和工具配置都是針對特定架構(gòu)深度調(diào)優(yōu)的。

巴斯解釋道,這背后的邏輯是觸達(dá)那些大型模型無法覆蓋的市場。

"如果有人選擇基于你的技術(shù)、方法和知識產(chǎn)權(quán)進(jìn)行開發(fā),他們就更有可能向上遷移并留在你的生態(tài)系統(tǒng)中。這本質(zhì)上是在入口處布局產(chǎn)品……從早期就吸引用戶,隨著他們的成長,他們往往會持續(xù)留在你的陣營。"

除了生態(tài)布局層面的考量,這些本地化模型還有助于降低數(shù)據(jù)中心的能耗。這一思路與OpenAI的GPT-5有異曲同工之處——后者并非單一模型,而是由多個(gè)子模型組成,系統(tǒng)會根據(jù)請求的復(fù)雜程度和不同策略動態(tài)進(jìn)行路由分發(fā)。

類似的邏輯同樣可以以分布式方式落地:本地運(yùn)行的路由模型將涉及專有數(shù)據(jù)的請求定向至本地大語言模型處理,而對敏感度要求較低的請求則卸載至外部API提供商。

巴斯表示:"我認(rèn)為可選方案是一個(gè)完整的譜系,涵蓋從完全私有的本地部署、托管在同址數(shù)據(jù)中心的專用節(jié)點(diǎn)、公有云中的專屬實(shí)例,到針對非敏感負(fù)載的共享環(huán)境以節(jié)省成本——各種選擇應(yīng)有盡有。"

Q&A

Q1:開源權(quán)重AI模型和前沿AI模型有什么區(qū)別?

A:前沿AI模型(如OpenAI、Anthropic的頂級模型)參數(shù)規(guī)模更大、能力更強(qiáng),但使用成本高昂,且需要將企業(yè)數(shù)據(jù)暴露給外部API,存在數(shù)據(jù)安全隱患。開源權(quán)重模型(如谷歌Gemma 4、阿里巴巴Qwen 3.5)參數(shù)量相對較小,可在企業(yè)本地部署,運(yùn)行成本低,數(shù)據(jù)不必外傳,且隨著技術(shù)進(jìn)步,性能已大幅提升,足以滿足多數(shù)企業(yè)實(shí)際需求。

Q2:Gemma 4 31B模型需要什么硬件才能運(yùn)行?

A:谷歌Gemma 4 31B模型可在單張RTX Pro 6000 Blackwell顯卡上以完整16位精度運(yùn)行,該顯卡市場售價(jià)通常在8000至10000美元之間。對于部分AI工作負(fù)載,甚至不需要GPU加速,使用配置較新的CPU服務(wù)器即可加載并運(yùn)行,大幅降低了企業(yè)的硬件投入門檻。

Q3:企業(yè)部署本地大語言模型有哪些優(yōu)勢?

A:企業(yè)在本地部署開源權(quán)重大語言模型,主要有以下幾點(diǎn)優(yōu)勢:第一,數(shù)據(jù)安全,專有數(shù)據(jù)無需上傳至外部服務(wù);第二,成本可控,小型模型對算力要求低,運(yùn)行成本遠(yuǎn)低于前沿模型;第三,靈活定制,可使用QLoRA微調(diào)或強(qiáng)化學(xué)習(xí)等技術(shù)進(jìn)行低成本定制;第四,支持智能體,可結(jié)合工具調(diào)用框架訪問數(shù)據(jù)庫和API,完成實(shí)際業(yè)務(wù)任務(wù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
油價(jià)暴跌!92、95號汽油立降420元/噸,4月21日再迎大調(diào)整!

油價(jià)暴跌!92、95號汽油立降420元/噸,4月21日再迎大調(diào)整!

沙雕小琳琳
2026-04-14 10:39:24
iPhone18 Pro被曝不會漲價(jià),準(zhǔn)入門檻將依然為8999元,星宇橙配色將被全新的深紅色取代

iPhone18 Pro被曝不會漲價(jià),準(zhǔn)入門檻將依然為8999元,星宇橙配色將被全新的深紅色取代

魯中晨報(bào)
2026-04-15 09:24:20
秦楓為什么死磕到底?從王石事件來看看這位“爆料女王”的底氣

秦楓為什么死磕到底?從王石事件來看看這位“爆料女王”的底氣

童叔不飆車
2026-04-14 00:01:43
字字扎心!王曉晨發(fā)文內(nèi)涵俞灝明,多年付出全被嫌棄,根本看不上

字字扎心!王曉晨發(fā)文內(nèi)涵俞灝明,多年付出全被嫌棄,根本看不上

八斗小先生
2026-04-14 14:42:10
手麻是大病的前兆?告誡:經(jīng)常手麻的人,可能是潛藏了這5種疾病

手麻是大病的前兆?告誡:經(jīng)常手麻的人,可能是潛藏了這5種疾病

芹姐說生活
2026-04-14 14:10:45
廣東最新速報(bào)!焦泊喬已正式歸隊(duì),即將開始恢復(fù)訓(xùn)練!

廣東最新速報(bào)!焦泊喬已正式歸隊(duì),即將開始恢復(fù)訓(xùn)練!

多特體育說
2026-04-14 22:30:07
國際油價(jià)急跌!4月15日汽油柴油價(jià)格,國內(nèi)油價(jià)調(diào)整將迎今年首降

國際油價(jià)急跌!4月15日汽油柴油價(jià)格,國內(nèi)油價(jià)調(diào)整將迎今年首降

有料財(cái)經(jīng)
2026-04-15 02:26:06
許家印大兒子月領(lǐng)4100萬躺平,二兒子替父頂罪蹲號子,女兒開跑車

許家印大兒子月領(lǐng)4100萬躺平,二兒子替父頂罪蹲號子,女兒開跑車

歷史偉人錄
2026-03-15 20:20:22
石油博弈:西方操控能源霸權(quán)戲碼

石油博弈:西方操控能源霸權(quán)戲碼

烽火瞭望者
2026-04-15 06:17:24
廣東一保安抓老鼠時(shí)被其咬傷出血,用白酒沖洗傷口,10天后高燒超40°C!

廣東一保安抓老鼠時(shí)被其咬傷出血,用白酒沖洗傷口,10天后高燒超40°C!

佛山電視臺小強(qiáng)熱線
2026-04-14 19:30:30
登上人民日報(bào)!318國道撞車,藏民借500元賠償,女孩舉動暖哭全網(wǎng)

登上人民日報(bào)!318國道撞車,藏民借500元賠償,女孩舉動暖哭全網(wǎng)

夢史
2026-04-15 09:28:14
多校鼓勵(lì)博士生讀碩士,釋放了什么信號

多校鼓勵(lì)博士生讀碩士,釋放了什么信號

第一財(cái)經(jīng)資訊
2026-04-13 19:55:20
畫面曝光!烏方證實(shí)使用“風(fēng)暴陰影”導(dǎo)彈和GBU-39炸彈襲擊俄方無人機(jī)儲存設(shè)施

畫面曝光!烏方證實(shí)使用“風(fēng)暴陰影”導(dǎo)彈和GBU-39炸彈襲擊俄方無人機(jī)儲存設(shè)施

環(huán)球網(wǎng)資訊
2026-04-14 20:48:10
演員文章開面館引關(guān)注,代排隊(duì)價(jià)格被炒到500元

演員文章開面館引關(guān)注,代排隊(duì)價(jià)格被炒到500元

界面新聞
2026-04-14 10:04:47
4月15日起,四川第二波春假開放!

4月15日起,四川第二波春假開放!

綿學(xué)堂
2026-04-14 19:56:44
廣州街坊注意!暴雨+9級強(qiáng)風(fēng)殺到!

廣州街坊注意!暴雨+9級強(qiáng)風(fēng)殺到!

廣州筍嘢益街坊
2026-04-15 08:23:50
乒乓球界有個(gè)最難破的紀(jì)錄,就連張怡寧都沒能實(shí)現(xiàn)!

乒乓球界有個(gè)最難破的紀(jì)錄,就連張怡寧都沒能實(shí)現(xiàn)!

小光侃娛樂
2026-04-13 06:50:05
中國已無退路了!美軍為中美選好了主戰(zhàn)場,決心要跟中國打場大戰(zhàn)

中國已無退路了!美軍為中美選好了主戰(zhàn)場,決心要跟中國打場大戰(zhàn)

余塩搞笑段子
2026-04-03 10:21:46
主動放棄,張本智和官宣決定,喊話為擊敗中國愿做犧牲,日本批準(zhǔn)

主動放棄,張本智和官宣決定,喊話為擊敗中國愿做犧牲,日本批準(zhǔn)

東球貓貓
2026-04-15 08:47:06
鄭麗文明明沒有實(shí)權(quán),大陸為什么還要公布惠臺政策?

鄭麗文明明沒有實(shí)權(quán),大陸為什么還要公布惠臺政策?

阿龍聊軍事
2026-04-14 09:36:48
2026-04-15 10:16:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
3213文章數(shù) 169關(guān)注度
往期回顧 全部

科技要聞

手機(jī)無死角上網(wǎng)?亞馬遜砸百億硬剛馬斯克

頭條要聞

遼寧車牌號帶8888奔馳疑作為陪葬品下葬 當(dāng)?shù)卦侔l(fā)聲

頭條要聞

遼寧車牌號帶8888奔馳疑作為陪葬品下葬 當(dāng)?shù)卦侔l(fā)聲

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊(duì)道歉”

娛樂要聞

網(wǎng)曝鐘麗緹代孕要了個(gè)男孩 備孕近10年

財(cái)經(jīng)要聞

特朗普稱美國對伊朗的戰(zhàn)爭已經(jīng)結(jié)束

汽車要聞

售12.99萬起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

房產(chǎn)
旅游
時(shí)尚
家居
數(shù)碼

房產(chǎn)要聞

改善標(biāo)桿,1.5w+起橫掃國興!海口樓市,打出最猛一張牌!

旅游要聞

漫步成都市武侯區(qū)街巷 看繁花次第盛開

壞事做盡的瘋女人,集體翻紅了

家居要聞

現(xiàn)代融合 自然靈動

數(shù)碼要聞

NVIDIA 2025年的保修支出同比飆升至10倍 接近9億美元

無障礙瀏覽 進(jìn)入關(guān)懷版