国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

拿下9榜第一!優(yōu)必選開源新基座模型,要破解具身智能落地最大難題

0
分享至


機器人前瞻(公眾號:robot_pro)
作者 程茜
編輯 漠影

機器人前瞻2月5日報道,人形機器人第一股優(yōu)必選近期開源了最新的自研具身智能大模型Thinker,一舉拿下9個權(quán)威基準(zhǔn)測試榜第一。Thinker參數(shù)規(guī)模僅4B,就在多項基準(zhǔn)測試超過10B以上參數(shù)規(guī)模模型,成為大模型領(lǐng)域“以小搏大”的又一典型代表。


此前具身智能落地真實工業(yè)產(chǎn)線,始終存在難以突破的技術(shù)門檻,核心癥結(jié)便是機器人空間度量失準(zhǔn)、時間響應(yīng)遲滯,這也成為其從實驗室技術(shù)走向產(chǎn)業(yè)化應(yīng)用的關(guān)鍵瓶頸。

開源的Thinker模型,正是優(yōu)必選在具身智能規(guī)模化應(yīng)用的前夜,交出的一份全新高分答卷,而該模型的性能突破,正源于優(yōu)必選的兩大核心優(yōu)勢:

作為人形機器人第一股,優(yōu)必選是國內(nèi)深耕人形機器人領(lǐng)域的先行者,不僅率先實現(xiàn)人形機器人的工廠落地應(yīng)用,更在具身智能的場景理解、數(shù)據(jù)積累與模型能力打磨上形成了深厚積淀;

其研發(fā)目標(biāo)瞄準(zhǔn)的是支撐人形機器人從感知、認(rèn)知、決策到執(zhí)行的全閉環(huán)能力,可以應(yīng)對工業(yè)、服務(wù)等不同場景的多樣化需求,構(gòu)建通用的具身智能基座模型。

如今最為直接的例證就是,優(yōu)必選已在自研的Thinker基座模型上進行模型的二次開發(fā),真實應(yīng)用于Walker S2,并在工廠中進行小批量應(yīng)用,為其具身智能生態(tài)發(fā)展邁出關(guān)鍵一步。

一、刷榜9大權(quán)威榜單,讓機器人突破落地限制

Thinker要解決的核心問題是,讓機器人不僅能在各項測試中“考高分”,還能在真實業(yè)務(wù)場景里快速落地、真干活。

先來看下這一模型的性能表現(xiàn)。

與多個10B參數(shù)規(guī)模以下模型相比,Thinker在全球的具身智能大腦模型權(quán)威榜中拿下了9項第一。

規(guī)劃與視覺定位能力中,Thinker在全部5個測評中均排名第一。這主要考察的是模型理解空間關(guān)系、定位物體和執(zhí)行規(guī)劃的能力,其結(jié)果說明Thinker在面對看哪里、將物品放到哪里等空間規(guī)劃與視覺理解相關(guān)任務(wù)上有優(yōu)勢。

此外是考察模型對三維空間、立體結(jié)構(gòu)的感知與推理能力的3D空間理解能力維度,Thinker拿下其中三項第一。

還有在多模態(tài)綜合理解方面,Thinker在RealWorldQA基準(zhǔn)測試集上排名第一,證明其在真實世界的場景問答中的能力,在通用學(xué)術(shù)評測MMMU中,其表現(xiàn)略遜于更大參數(shù)量模型。這進一步說明,優(yōu)必選此次開源的新模型在真實世界應(yīng)用場景的理解上會優(yōu)于通用大模型。


面對參數(shù)規(guī)模更大的10B以上模型,Thinker的表現(xiàn)并不遜色。

其拿下了7項第一,在規(guī)劃與視覺定位、3D空間理解上,Thinker面對機器人核心感知能力相關(guān)的物體空間關(guān)系理解、目標(biāo)定位、任務(wù)規(guī)劃等測試,表現(xiàn)仍優(yōu)于通用大模型。

不過在多模態(tài)綜合理解上,該模型排名靠后,這或許是因為其在知識儲備上無法與32B、72B級別的大模型抗衡。


綜合來看,Thinker的表現(xiàn)證明了其能讓機器人在自主看懂所處環(huán)境、規(guī)劃好做事步驟,以及精準(zhǔn)感知周邊情況、搞懂空間關(guān)系、完成物理互動方面的真本事。

二、手握真實場景資源,構(gòu)建數(shù)據(jù)飛輪與技術(shù)應(yīng)用正向閉環(huán)

優(yōu)必選選擇打造Thinker通用基座模型,背后有著貼合自身發(fā)展優(yōu)勢與行業(yè)生態(tài)布局的獨特考量,體現(xiàn)在兩大核心維度:

首先,優(yōu)必選手握大量高質(zhì)量真實場景數(shù)據(jù),能夠在模型訓(xùn)練中充分釋放數(shù)據(jù)價值。

其次,Thinker以通用基座能力為基礎(chǔ),可高效適配具身智能與真實世界場景,實現(xiàn)更廣泛的產(chǎn)品與生態(tài)落地。

這背后的關(guān)鍵前提就是高質(zhì)量的訓(xùn)練數(shù)據(jù)。一般而言,模型訓(xùn)練的原始數(shù)據(jù)需要經(jīng)過嚴(yán)格的清洗、標(biāo)注與篩選,才能有效驅(qū)動模型性能提升。

面對20B、含噪聲、難對齊、模態(tài)缺失的原始數(shù)據(jù),優(yōu)必選構(gòu)建全流程自動化“精煉提純”流水線。通過“數(shù)據(jù)篩選”與“質(zhì)量評分”兩步,將其提純?yōu)?0M級別的高質(zhì)量數(shù)據(jù)。

為了找到高質(zhì)量數(shù)據(jù),其制定了規(guī)則快速從20B數(shù)據(jù)中過濾出約1%的候選數(shù)據(jù)池,然后引入大模型構(gòu)建多維度評分模塊,再次篩選出約1%的最高質(zhì)量數(shù)據(jù)。

基于此,優(yōu)必選為Thinker構(gòu)建了四種數(shù)據(jù)集,涵蓋空間和時間理解、自我視角推理、機器人操作規(guī)劃以及其內(nèi)部開發(fā)的工業(yè)數(shù)據(jù)集Industroplan。其中,Industroplan專注于工業(yè)環(huán)境中的多物體操作和運輸任務(wù)。


▲模型訓(xùn)練數(shù)據(jù)分布

接著是數(shù)據(jù)標(biāo)注環(huán)節(jié),其痛點在于人工標(biāo)注成本居高不下,且因具身智能的場景特性和數(shù)據(jù)本身的多維復(fù)雜性使得標(biāo)注難度不小,因此優(yōu)必選搭建了“弱監(jiān)督+自監(jiān)督+少量人工校驗”的自動化標(biāo)注體系。

其通過大模型輔助標(biāo)注疊加多模型交叉驗證,實現(xiàn)視覺場景分割、動作序列分類、指令意圖解析等任務(wù)的端到端自動化標(biāo)注。同時,其會將人工參與率控制在1%以下, 僅對標(biāo)注置信度低于閾值的樣本進行人工復(fù)核。最后,該機制還包括建立動態(tài)迭代優(yōu)化體系,把模型訓(xùn)練后的誤差反饋至標(biāo)注流水線,持續(xù)優(yōu)化標(biāo)注算法參數(shù)。

這樣一來,其就可以形成自動化標(biāo)注閉環(huán),且相較全人工標(biāo)注方案成本降低99%,標(biāo)注效率提升超百倍。

這一方案的核心價值在于,既依托高質(zhì)量數(shù)據(jù)筑牢大模型訓(xùn)練的核心根基,更讓Thinker模型的能力打磨深度貼合具身智能的實際落地場景,使其具備更強的實用價值與商業(yè)化落地潛力。


Thinker模型的意義遠(yuǎn)不止于此,基于其技術(shù)積淀,優(yōu)必選還打通了數(shù)據(jù)回流機制,構(gòu)建起具身智能領(lǐng)域的數(shù)據(jù)飛輪:通過將技術(shù)方案深度部署于工廠搬運、工件分揀等真實工業(yè)場景,把核心技術(shù)優(yōu)勢切實轉(zhuǎn)化為場景落地能力,同時讓場景端產(chǎn)生的真實數(shù)據(jù)持續(xù)反哺模型迭代進化。

以工廠搬運為例,系統(tǒng)持續(xù)收集實際作業(yè)中的長尾案例數(shù)據(jù),如料箱識別失敗、抓取軌跡動態(tài)調(diào)整等。這些真實場景數(shù)據(jù)直接反哺Thinker模型的訓(xùn)練,推動其自主進化,不斷增強基礎(chǔ)性能與場景適應(yīng)能力。最終基于Thinker大模型,Walker S2可在箱體搬運、工件分揀等下游應(yīng)用場景中實現(xiàn)99.99%的作業(yè)準(zhǔn)確率

三、全鏈路優(yōu)化,訓(xùn)練策略適配具身智能通用需求

盡管獲取高質(zhì)量數(shù)據(jù)是訓(xùn)練具身智能大模型的關(guān)鍵,但優(yōu)必選之所以能憑借優(yōu)質(zhì)數(shù)據(jù)訓(xùn)出超越一眾主流模型的Thinker,核心還在于一套科學(xué)系統(tǒng)的模型訓(xùn)練策略。

更重要的是,其模型始終圍繞通用基座模型的定位展開,從源頭適配先進且廣闊的具身智能生態(tài)建設(shè)需求。

Thinker的技術(shù)報告提到,該模型架構(gòu)包括四個模塊,文本分詞器、視覺編碼器、用于對齊視覺空間和語言空間的多層感知器以及大語言模型主干。

在具體的訓(xùn)練過程中,研究人員分成了兩個訓(xùn)練階段,以讓模型在復(fù)雜場景下也能有穩(wěn)定的規(guī)劃能力。

第一階段是專注于構(gòu)建模型的基礎(chǔ)感知和推理能力。研究人員結(jié)合通用數(shù)據(jù)集、空間理解數(shù)據(jù)集和大規(guī)模規(guī)劃數(shù)據(jù)集對Thinker進行微調(diào),使其具備空間感知和推理能力為后續(xù)復(fù)雜場景下的任務(wù)對齊和長遠(yuǎn)規(guī)劃奠定基礎(chǔ)。

值得一提的是,研究人員還會視頻理解訓(xùn)練過程中將每個視頻片段的最后一幀作為輔助輸入,以進一步提升模型性能。


第二階段的重點是,對下游規(guī)劃任務(wù)進行監(jiān)督式微調(diào),使模型推理能力與特定任務(wù)目標(biāo)保持一致。

研究人員對Industroplan-200K數(shù)據(jù)集進行監(jiān)督式微調(diào),這一過程使模型能夠?qū)⑵鋸牡谝浑A段繼承的推理能力應(yīng)用于順序依賴關(guān)系、多樣化的對象布局以及糾錯反饋。

這使得Thinker能夠在真實的工業(yè)場景中生成可執(zhí)行的規(guī)劃方案,有效將空間理解與實際任務(wù)執(zhí)行聯(lián)系起來。

不論從訓(xùn)練數(shù)據(jù)的選擇、標(biāo)注還是到訓(xùn)練策略的設(shè)計,Thinker均服務(wù)于其具身智能基座模型的核心定位。不同于單一功能型模型,優(yōu)必選憑借模塊化架構(gòu)、高效訓(xùn)練策略打造的模型具備通用化、高適配、強性能的核心能力。

并且基于這一通用底座,開發(fā)者可靈活進行二次開發(fā)、按需拓展,為搭建更先進、更廣闊的具身智能生態(tài),筑牢可復(fù)用、可拓展、可協(xié)同的智能底座。

根據(jù)當(dāng)前行業(yè)發(fā)展的趨勢,Thinker這樣以開源為核心支撐的具身智能生態(tài)建設(shè)正穩(wěn)步推進,為人形機器人自主化水平的提升打開新的發(fā)展空間。

結(jié)語:瞄準(zhǔn)具身智能通用底座,優(yōu)必選加速打破技術(shù)壁壘

優(yōu)必選打造并開源的Thinker基座模型,相當(dāng)于為行業(yè)提供了一個通用、開放的技術(shù)底座,不同的科研團隊可以基于這個底座,針對不同場景做個性化的模型開發(fā);不同的企業(yè)可以將自身的硬件、場景數(shù)據(jù)與基座模型對接,快速實現(xiàn)具身智能技術(shù)的落地應(yīng)用。

這種模式打破了技術(shù)之間的壁壘,讓行業(yè)資源得以高效整合。

具身智能的終極愿景是讓機器人走進千行百業(yè)、融入人類生活,實現(xiàn)與人類的高效協(xié)作,這一目標(biāo)絕非單一功能模型、單一企業(yè)能實現(xiàn),也需要技術(shù)的持續(xù)迭代和形態(tài)的不斷進化。而基座模型的生態(tài)化布局,恰好為這一長遠(yuǎn)愿景預(yù)留了充足的技術(shù)空間。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國中央司令部透露對伊朗動武全部武器裝備清單

美國中央司令部透露對伊朗動武全部武器裝備清單

參考消息
2026-03-02 19:38:24
伊朗開展“真實承諾-4”行動第13輪攻擊

伊朗開展“真實承諾-4”行動第13輪攻擊

財聯(lián)社
2026-03-03 05:30:06
媒體人:不了解楊瀚森場下訓(xùn)練情況,但英語進步速度讓人憂慮

媒體人:不了解楊瀚森場下訓(xùn)練情況,但英語進步速度讓人憂慮

懂球帝
2026-03-02 13:29:16
美軍新型彈道導(dǎo)彈首次投入實戰(zhàn)

美軍新型彈道導(dǎo)彈首次投入實戰(zhàn)

觀察者網(wǎng)
2026-03-02 16:42:09
外媒:美軍出動B-1戰(zhàn)略轟炸機攻擊伊朗

外媒:美軍出動B-1戰(zhàn)略轟炸機攻擊伊朗

參考消息
2026-03-02 21:46:39
拉里賈尼:不會與美國進行談判,美以不可能打了伊朗就一走了之!美官員承認(rèn):無情報顯示伊朗計劃“先發(fā)制人”打擊美軍

拉里賈尼:不會與美國進行談判,美以不可能打了伊朗就一走了之!美官員承認(rèn):無情報顯示伊朗計劃“先發(fā)制人”打擊美軍

每日經(jīng)濟新聞
2026-03-02 14:22:17
女足亞洲杯太瘋狂:韓國3-0制造首個慘案!中國隊衛(wèi)冕首秀5-0起步

女足亞洲杯太瘋狂:韓國3-0制造首個慘案!中國隊衛(wèi)冕首秀5-0起步

侃球熊弟
2026-03-02 19:10:46
明日元宵節(jié),“打死”都不能吃的6種食物,正月十五別犯忌諱

明日元宵節(jié),“打死”都不能吃的6種食物,正月十五別犯忌諱

阿天愛旅行
2026-03-03 01:06:22
谷愛凌現(xiàn)身德云社 和母親一起聽相聲 郭德綱:我只負(fù)責(zé)中國人的快樂

谷愛凌現(xiàn)身德云社 和母親一起聽相聲 郭德綱:我只負(fù)責(zé)中國人的快樂

阿廢冷眼觀察所
2026-03-03 01:15:27
演都不演了!剛復(fù)出就開演唱會,票價賣到1280,到底誰給的自信

演都不演了!剛復(fù)出就開演唱會,票價賣到1280,到底誰給的自信

樂悠悠娛樂
2026-03-01 10:27:25
德國總理訪華回國后第一件事,讓8千萬德國人,認(rèn)清了殘酷真相

德國總理訪華回國后第一件事,讓8千萬德國人,認(rèn)清了殘酷真相

孤城落日
2026-03-03 06:56:34
航天材料爆發(fā)!商業(yè)航天小金屬三大賽道,8家企業(yè)深度解析!

航天材料爆發(fā)!商業(yè)航天小金屬三大賽道,8家企業(yè)深度解析!

Thurman在昆明
2026-03-02 20:18:17
華國鋒擔(dān)任中央主席時,中央先后任命了15位開國將帥輔佐他

華國鋒擔(dān)任中央主席時,中央先后任命了15位開國將帥輔佐他

雍親王府
2026-03-02 15:55:03
美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營銷號騙了

美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營銷號騙了

互聯(lián)網(wǎng)大觀
2026-03-01 19:29:49
前港姐邱晴,富國島濕身誘惑,泥漿浴照盡顯尤物身段?

前港姐邱晴,富國島濕身誘惑,泥漿浴照盡顯尤物身段?

娛樂領(lǐng)航家
2026-03-03 00:00:03
民政部門正式公布:2026年3月30日起全國統(tǒng)一執(zhí)行,老墳有新規(guī)定

民政部門正式公布:2026年3月30日起全國統(tǒng)一執(zhí)行,老墳有新規(guī)定

南方健哥
2026-03-02 12:42:15
550億美元砸進炮火:一場工業(yè)體系的極限對沖

550億美元砸進炮火:一場工業(yè)體系的極限對沖

七分日記
2026-02-26 23:01:48
神似柳巖?新晉女神!天賦異稟啊…

神似柳巖?新晉女神!天賦異稟啊…

碧波萬覽
2026-01-11 00:24:54
WTT新加坡大滿貫收官不到24小時,國乒傳來3大重磅消息,2大調(diào)整

WTT新加坡大滿貫收官不到24小時,國乒傳來3大重磅消息,2大調(diào)整

羅納爾說個球
2026-03-02 23:06:07
美軍瞞不住了!航母基地被炸、11 億雷達(dá)報廢、幾十萬噸燃油燒穿

美軍瞞不住了!航母基地被炸、11 億雷達(dá)報廢、幾十萬噸燃油燒穿

史行途
2026-03-03 05:24:15
2026-03-03 07:32:49
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
378文章數(shù) 8關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

頭條要聞

媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

親子
本地
藝術(shù)
手機
教育

親子要聞

開學(xué)了!珠海香洲:筑牢安全防線,保障托育機構(gòu)順利開園復(fù)托

本地新聞

津南好·四時總相宜

藝術(shù)要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

手機要聞

小米17 Ultra徠卡版全新黑銀配色預(yù)售:7999元起,10日發(fā)售

教育要聞

畢業(yè)大游戲-譚劍-2026年3月2日 (游戲AI設(shè)計第1次課第1節(jié))

無障礙瀏覽 進入關(guān)懷版