国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

商湯發(fā)布 NEO 架構(gòu),重新定義多模態(tài)模型效能邊界

0
分享至

勇礪商業(yè)評論 白麗

商湯科技正式發(fā)布并開源了與南洋理工大學(xué) S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) ——NEO,為日日新 SenseNova 多模態(tài)模型奠定了新一代架構(gòu)的基石。



作為行業(yè)首個可用的、實(shí)現(xiàn)深層次融合的原生多模態(tài)架構(gòu)(Native VLM),NEO 從底層原理出發(fā),打破了傳統(tǒng)“模塊化”范式的桎梏,以“專為多模態(tài)而生”的創(chuàng)新設(shè)計,通過核心架構(gòu)層面的多模態(tài)深層融合,實(shí)現(xiàn)了性能、效率和通用性的整體突破,重新定義了多模態(tài)模型的效能邊界,標(biāo)志著人工智能多模態(tài)技術(shù)正式邁入“原生架構(gòu)”的新時代。

打破瓶頸:告別“拼湊”,擁抱“原生”



當(dāng)前,業(yè)內(nèi)主流的多模態(tài)模型大多遵循“視覺編碼器+投影器+語言模型”的模塊化范式。這種基于大語言模型(LLM)的擴(kuò)展方式,雖然實(shí)現(xiàn)了圖像輸入的兼容,但本質(zhì)上仍以語言為中心,圖像與語言的融合僅停留在數(shù)據(jù)層面。這種“拼湊”式的設(shè)計不僅學(xué)習(xí)效率低下,更限制了模型在復(fù)雜多模態(tài)場景下(比如涉及圖像細(xì)節(jié)捕捉或復(fù)雜空間結(jié)構(gòu)理解)的處理能力。

商湯 NEO 架構(gòu)正是為了解決這一痛點(diǎn)而生。早在2024 年下半年,商湯便在國內(nèi)率先突破多模態(tài)原生融合訓(xùn)練技術(shù),以單一模型在 SuperCLUE 語言評測 和 OpenCompass 多模態(tài)評測中奪冠,并基于這一核心技術(shù)打造了日日新 SenseNova 6.0,實(shí)現(xiàn)多模態(tài)推理能力領(lǐng)先。之后,在2025 年 7 月發(fā)布日日新 SenseNova 6.5 通過實(shí)現(xiàn)編碼器層面的早期融合,把多模態(tài)模型性價比提升 3 倍,并在國內(nèi)率先推出商用級別的圖文交錯推理。商湯此次更進(jìn)一步,徹底摒棄了傳統(tǒng)的模塊化結(jié)構(gòu),從底層原理出發(fā),推出了從零設(shè)計的 NEO 原生架構(gòu)。

三大內(nèi)核創(chuàng)新:實(shí)現(xiàn)視覺和語言的深層統(tǒng)一



NEO 架構(gòu)以極致效率和深度融合為核心理念,通過在注意力機(jī)制、位置編碼和語義映射三個關(guān)鍵維度的底層創(chuàng)新,讓模型天生具備了統(tǒng)一處理視覺與語言的能力:

  • 原生圖塊嵌入 (Native Patch Embedding):摒棄了離散的圖像 tokenizer,通過獨(dú)創(chuàng)的 Patch Embedding Layer (PEL) 自底向上構(gòu)建從像素到詞元的連續(xù)映射。這種設(shè)計能更精細(xì)地捕捉圖像細(xì)節(jié),從根本上突破了主流模型的圖像建模瓶頸。
  • 原生三維旋轉(zhuǎn)位置編碼 (Native-RoPE):創(chuàng)新性地解耦了三維時空頻率分配,視覺維度采用高頻、文本維度采用低頻,完美適配兩種模態(tài)的自然結(jié)構(gòu)。這使得 NEO 不僅能精準(zhǔn)捕獲圖像的空間結(jié)構(gòu),更具備向視頻處理、跨幀建模等復(fù)雜場景無縫擴(kuò)展的潛力。
  • 原生多頭注意力 (Native Multi-Head Attention):針對不同模態(tài)特點(diǎn),NEO 在統(tǒng)一框架下實(shí)現(xiàn)了文本 token 的自回歸注意力和視覺 token 的雙向注意力并存。這種設(shè)計極大地提升了模型對空間結(jié)構(gòu)關(guān)聯(lián)的利用率,從而更好地支撐復(fù)雜的圖文混合理解與推理。

此外,配合創(chuàng)新的 Pre-Buffer & Post-LLM 雙階段融合訓(xùn)練策略,NEO 能夠在吸收原始 LLM 完整語言推理能力的同時,從零構(gòu)建強(qiáng)大的視覺感知能力,徹底解決了傳統(tǒng)跨模態(tài)訓(xùn)練中語言能力受損的難題。

實(shí)測表現(xiàn):十分之一的數(shù)據(jù),追平旗艦級性能



在架構(gòu)創(chuàng)新的驅(qū)動下,NEO 展現(xiàn)出了驚人的數(shù)據(jù)效率與性能優(yōu)勢:

極高數(shù)據(jù)效率:僅需業(yè)界同等性能模型 1/10 的數(shù)據(jù)量(3.9億圖像文本示例),NEO 便能開發(fā)出頂尖的視覺感知能力。無需依賴海量數(shù)據(jù)及額外視覺編碼器,其簡潔的架構(gòu)便能在多項視覺理解任務(wù)中追平 Qwen2-VL、InternVL3 等頂級模塊化旗艦?zāi)P汀?/p>

性能卓越且均衡:在 MMMU、MMB、MMStar、SEED-I、POPE 等多項公開權(quán)威評測中,NEO 架構(gòu)均斬獲高分,展現(xiàn)出優(yōu)于其他原生 VLM 的綜合性能,真正實(shí)現(xiàn)了原生架構(gòu)的“精度無損”。

極致推理性價比:特別是在 0.6B-8B 的參數(shù)區(qū)間內(nèi),NEO 在邊緣部署方面優(yōu)勢顯著。它不僅實(shí)現(xiàn)了精度與效率的雙重躍遷,更大幅降低了推理成本,將多模態(tài)視覺感知的“性價比”推向了極致。

開源共建:構(gòu)建下一代 AI 基礎(chǔ)設(shè)施

架構(gòu)是模型的“骨架”,只有骨架扎實(shí),才能支撐起多模態(tài)技術(shù)的未來。NEO 架構(gòu)的早期融合設(shè)計支持任意分辨率與長圖像輸入,能夠無縫擴(kuò)展至視頻、具身智能等前沿領(lǐng)域,實(shí)現(xiàn)了從底層到頂層、端到端的真正融合。從應(yīng)用角度,端到端的“原生一體化”設(shè)計,為機(jī)器人具身交互、智能終端多模態(tài)響應(yīng)、視頻理解、3D交互及具身智能等多元化場景的應(yīng)用,提供了堅實(shí)的技術(shù)支撐。

目前,商湯已正式開源基于 NEO 架構(gòu)的2B 與 9B兩種規(guī)格模型,以推動開源社區(qū)在原生多模態(tài)架構(gòu)上的創(chuàng)新與應(yīng)用。商湯科技表示,致力于通過開源協(xié)作與場景落地雙輪驅(qū)動,將 NEO 打造為可擴(kuò)展、可復(fù)用的下一代 AI 基礎(chǔ)設(shè)施,推動原生多模態(tài)技術(shù)從實(shí)驗(yàn)室走向廣泛的產(chǎn)業(yè)化應(yīng)用,加速構(gòu)建下一代產(chǎn)業(yè)級原生多模態(tài)技術(shù)標(biāo)準(zhǔn)。(白麗)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美以空襲伊朗,阿拉伯國家聯(lián)盟發(fā)聲:“阿拉伯-以色列沖突升級為全面地區(qū)戰(zhàn)爭的時刻”

美以空襲伊朗,阿拉伯國家聯(lián)盟發(fā)聲:“阿拉伯-以色列沖突升級為全面地區(qū)戰(zhàn)爭的時刻”

環(huán)球網(wǎng)資訊
2026-03-01 11:00:18
真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

曹說體育
2026-03-01 22:16:15
高興太早,中國男籃大勝中國臺北隊,卻收壞消息,打日本隊要小心

高興太早,中國男籃大勝中國臺北隊,卻收壞消息,打日本隊要小心

宗介說體育
2026-03-01 18:19:54
一個U盤裝走180億,200萬人的血汗錢48小時人間蒸發(fā)

一個U盤裝走180億,200萬人的血汗錢48小時人間蒸發(fā)

流蘇晚晴
2026-03-01 16:54:18
伊朗建議民眾離開德黑蘭

伊朗建議民眾離開德黑蘭

財聯(lián)社
2026-02-28 21:58:42
胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

胡塞武裝、黎巴嫩真主黨和哈馬斯就哈梅內(nèi)伊遇害發(fā)聲

參考消息
2026-03-01 20:06:21
超20000名旅客滯留!“迪拜機(jī)場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費(fèi)用

超20000名旅客滯留!“迪拜機(jī)場已經(jīng)沒有航班了”,阿聯(lián)酋宣布:承擔(dān)所有旅客滯留費(fèi)用

江西工人報
2026-03-01 22:27:25
伊朗稱襲擊致美軍傷亡560人

伊朗稱襲擊致美軍傷亡560人

財聯(lián)社
2026-03-02 00:54:12
美軍公布傷亡情況

美軍公布傷亡情況

環(huán)球時報國際
2026-03-02 00:10:13
48小時送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭的形態(tài)變了

48小時送走哈梅內(nèi)伊:令人恐怖的技術(shù)代差,現(xiàn)代戰(zhàn)爭的形態(tài)變了

黑企鵝觀察
2026-03-01 14:40:34
“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

每日經(jīng)濟(jì)新聞
2026-02-28 14:37:58
大滿貫不和諧一幕:王曼昱2-4孫穎莎 比輸球可怕是觀眾一邊倒支持

大滿貫不和諧一幕:王曼昱2-4孫穎莎 比輸球可怕是觀眾一邊倒支持

侃球熊弟
2026-03-01 20:27:26
中國軍號:對于那一天我們不期待,但絕不懼怕!

中國軍號:對于那一天我們不期待,但絕不懼怕!

瀟湘晨報
2026-03-01 15:18:15
女單頒獎!王曼昱領(lǐng)獎杯開心,孫穎莎獲全程歡呼,展可愛一幕!

女單頒獎!王曼昱領(lǐng)獎杯開心,孫穎莎獲全程歡呼,展可愛一幕!

籃球資訊達(dá)人
2026-03-01 20:51:07
回家了!張云鵬已抵達(dá)老家吉林!認(rèn)完親還將回加拿大高洋回應(yīng)原因

回家了!張云鵬已抵達(dá)老家吉林!認(rèn)完親還將回加拿大高洋回應(yīng)原因

離離言幾許
2026-03-01 23:21:02
創(chuàng)紀(jì)錄!外資,突然大拋售!全球“最?!惫墒?,發(fā)生了什么?

創(chuàng)紀(jì)錄!外資,突然大拋售!全球“最牛”股市,發(fā)生了什么?

數(shù)據(jù)寶
2026-03-01 18:36:28
同事借我的奧迪回老家,我拔了ETC卡,果然,2小時后他就打來電話

同事借我的奧迪回老家,我拔了ETC卡,果然,2小時后他就打來電話

小李子體育
2026-03-02 01:20:40
伊朗代表直接警告美方:我建議你保持禮貌!

伊朗代表直接警告美方:我建議你保持禮貌!

看看新聞Knews
2026-03-01 17:11:05
哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會接受美國為烏克蘭提供的安全保證 | 狼叔看世界

哈梅內(nèi)伊身亡,布達(dá)諾夫:俄羅斯會接受美國為烏克蘭提供的安全保證 | 狼叔看世界

狼叔看世界
2026-03-01 11:40:52
為全球股市打樣,沙特埃及股市開盤大跌5%,但很快反彈

為全球股市打樣,沙特埃及股市開盤大跌5%,但很快反彈

上觀新聞
2026-03-01 20:07:17
2026-03-02 06:35:00
曾憲勇 incentive-icons
曾憲勇
有趣的科技互聯(lián)網(wǎng)原創(chuàng)自媒體
694文章數(shù) 62關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普警告伊朗“不要報復(fù)” 伊朗外長回應(yīng)

頭條要聞

特朗普警告伊朗“不要報復(fù)” 伊朗外長回應(yīng)

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

數(shù)碼
本地
手機(jī)
時尚
公開課

數(shù)碼要聞

曝蘋果WWDC 26將推Core AI框架取代Core ML并公布多項AI功能

本地新聞

津南好·四時總相宜

手機(jī)要聞

現(xiàn)場直擊!榮耀Robot Phone機(jī)器人手機(jī)長啥樣

今年春天最流行的4件衛(wèi)衣,照著穿就很好看

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版