国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

我用Meta“華人天團”打造的新模型,一張圖復(fù)刻了一個“豆包App”

0
分享至


智東西
作者 陳駿達
編輯 云鵬

Meta的“牛油果”模型,終于熟了!

智東西4月9日報道,今天,在成立9個月后,Meta超級智能實驗室(MSL)發(fā)布了其首款模型Muse Spark(內(nèi)部代號牛油果)。這是一個原生的多模態(tài)推理模型,支持工具使用、視覺思維鏈和多智能體編排。

在大模型測評平臺Artificial Analysis上,Muse Spark的智能指數(shù)直接從Llama 4 Maverick的18分,跳到了52分,介于Claude Sonnet 4.6和Claude Opus 4.6之間,算是進入第一梯隊了。


我們第一時間對模型做了體驗,上傳了一張豆包App的截圖,要求Muse Spark復(fù)刻?梢钥吹組use Spark的回復(fù)風(fēng)格比較口語化,甚至有一股“豆包味兒”,這可能是因為這一模型主要面向C端用戶。


Muse Spark的生成速度很快,效果也不錯,基本1:1復(fù)刻了豆包的頁面,連圖像都還原了。


Muse Spark還通過了小球彈跳測試。有網(wǎng)友感嘆道,時隔1年多,Meta終于發(fā)了一款能通過六邊形小球彈跳測試的大模型,這一歷史性時刻值得記錄。


Muse Spark是ScaleAI創(chuàng)始人、Meta首席AI官汪滔(Alexandr Wang)加入Meta 10個月后,交出的首份答卷。


這一結(jié)果來的并不容易,此前,在Llama 4遭遇史詩級滑鐵盧后,Meta大刀闊斧地重組了AI團隊,唱衰大語言模型的楊立昆也最終離開。

汪滔稱,Meta在過去9個月從零開始打造AI技術(shù)棧,基礎(chǔ)設(shè)施、架構(gòu)、數(shù)據(jù)管線都是全新的,Muse Spark正是這些努力的成果。

加入Meta的不少華人AI大牛紛紛轉(zhuǎn)發(fā)了這一成果,包括趙晟佳、畢樹超、余家輝、Jason Wei等等。值得一提的是,MSL團隊的華人濃度很高,在轉(zhuǎn)發(fā)新模型的Meta研究員中,從領(lǐng)導(dǎo)到基層員工,許多都是華人。


另據(jù)Top華人科創(chuàng)社的報道,Meta還迎來了一位新的華人大牛,前螞蟻集團RL實驗室首席科學(xué)家吳翼加盟了Meta MSL,直接向Meta副總裁和MSL聯(lián)合負責(zé)人Nat Friedman匯報。


Muse Spark是MSL Muse系列模型中的首款,未來還會有更多該系列模型發(fā)布。目前Muse Spark已開始逐步推送至Meta旗下的應(yīng)用和Meta.ai網(wǎng)頁端,不過仍有用戶反映自己使用的模型仍是Llama 3。


同時,“開源”兩個字在相關(guān)博客中,一次也未被提及。

體驗鏈接:meta.ai

一、多模態(tài)、醫(yī)療健康表現(xiàn)突出,智能體和編程仍是短板

從基準(zhǔn)測試結(jié)果來看,Muse Spark在多模態(tài)感知、推理、醫(yī)療健康和智能體等領(lǐng)域的表現(xiàn)處于行業(yè)第一梯隊。不過,MSL承認(rèn)這一模型在長程智能體系統(tǒng)和編程工作流方面性能尚有差距。

以下是Muse Spark完整的基準(zhǔn)測試成績。需要注意的是,Meta在這里采用了一些有“圖表詐騙”嫌疑的數(shù)據(jù)呈現(xiàn)方式。乍一看,Muse Spark的所有成績都被標(biāo)藍,似乎全面領(lǐng)先,但實際上這一模型在圖中的20項基準(zhǔn)測試中,拿到的SOTA數(shù)量為4個


在多模態(tài)能力維度,Muse Spark的表現(xiàn)較有競爭力,在美國大模型圈沒有被拉開明顯代差,基本和GPT-5.4處在同一水平線上。Muse Spark的表現(xiàn)也符合其原生多模態(tài)大模型的定位。

作為一款將部署于Meta旗下眾多社交媒體、面向廣大個人用戶的模型,Muse Spark在用戶高頻關(guān)注的醫(yī)療健康領(lǐng)域同樣沒有掉隊。在HealthBench Hard與MedXpertQA(多模態(tài))兩項評測中均斬獲SOTA,顯然對此進行了重點優(yōu)化。

Muse Spark本次還發(fā)布了“沉思模式(Contemplating mode)”,該模式可協(xié)調(diào)多個智能體并行推理。這使得Muse Spark能夠與Gemini Deep Think和GPT Pro等前沿模型的極限推理模式相媲美。

開啟“沉思模式”后,Muse Spark在復(fù)雜任務(wù)中的能力得以提升,比如它在HLE“人類最后的考試”基準(zhǔn)測試中,取得了58%的正確率在“前沿科學(xué)研究”基準(zhǔn)測試中取得了38%的正確率。


二、所需算力資源比Llama 4少一個量級,采用新型強化學(xué)習(xí)技術(shù)棧

跑分之外,這一模型的新定位和背后技術(shù),也值得關(guān)注。

Meta稱,Muse Spark是邁向個人超級智能的第一步,它能夠理解用戶所處的世界,多模態(tài)能力和醫(yī)療健康就是當(dāng)前的兩個重點。

Muse Spark從底層架構(gòu)層面,整合了跨領(lǐng)域和工具的視覺信息,在識別、定位方面的能力不錯。這些功能結(jié)合起來,可以實現(xiàn)各種交互式體驗。

例如,用戶可以上傳一張游戲畫面截圖,然后讓Muse Spark把它變成一個能真正互動的游戲。


或是告知Muse Spark自己有高膽固醇的問題,并讓Muse Spark基于多模態(tài)能力和醫(yī)療知識,做一個動態(tài)的食物推薦頁面。


Meta在博客中分享的demo也僅僅涉及多模態(tài)和醫(yī)療健康領(lǐng)域,這或許意味著Muse系列模型最終的用途,仍然是服務(wù)于扎克伯格的個人超級智能愿景,而不是單純地追求智能上限。

在技術(shù)方面,MSL大幅度提升了算力利用率,與之前的模型Llama 4 Maverick相比,Muse Spark用少一個數(shù)量級以上的計算資源就能達到相同的性能。


同時,MSL還在強化學(xué)習(xí)階段采用了新技術(shù)棧,在大規(guī)模強化學(xué)習(xí)中帶來平穩(wěn)、可預(yù)測的性能提升。


三、一手實測:精準(zhǔn)識別食物熱量,還給Meta AI眼鏡造了個新品

Muse Spark發(fā)布后,我們進行了更多實測。

Muse Spark的多模態(tài)能力確實不錯,我們上傳了一個啤酒瓶的照片,讓它分析熱量。Muse Spark一眼就看出了啤酒的品牌、大小,甚至連原圖中肉眼都難以分辨的酒精度都準(zhǔn)確識別出來了。


它對于熱量的分析則來自搜索,還把熱量轉(zhuǎn)換成了我們?nèi)粘3缘氖澄,并給出要消耗這些熱量對應(yīng)的運動量,是比較實用的。


我們緊接著讓Muse Spark給Meta的AI眼鏡做一個宣傳網(wǎng)頁,沒給任何參考?梢钥吹,在思考過程中Muse Spark主動調(diào)用AI生圖模型打造了對應(yīng)的產(chǎn)品圖片,然后編寫完整頁面代碼,整個過程耗時2分鐘左右,效果如下:


這一網(wǎng)頁的完成度不錯,直接給Meta設(shè)計出了一款搭載Muse Spark的新品AI眼鏡。模型還自夸道,這是一個旗艦級的官網(wǎng),不是普通的落地頁,是按Apple Vision Pro發(fā)布會標(biāo)準(zhǔn)做的。

Muse Spark還可用于購物推薦。我們試著讓它搜索一款汽車雨刮器,幾秒鐘就拿到了好幾個選項,并且有對每款產(chǎn)品優(yōu)勢劣勢的分析和最終購買建議。


結(jié)語:牛油果熟了,但Meta的“個人超級智能”仍需耐心

作為Meta超級智能實驗室的首秀,Muse Spark已經(jīng)展現(xiàn)出躋身第一梯隊的水準(zhǔn),足夠讓人期待未來的Muse系列后續(xù)產(chǎn)品。

不過,扎克伯格想要的“個人超級智能”,目前還停留在醫(yī)療健康問答、網(wǎng)頁復(fù)刻、購物推薦這些相對可控的場景里。距離真正改變數(shù)億用戶的交互方式,還有很長的路要走。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張雪公布自己設(shè)計的跨界踏板車設(shè)計圖,最新回應(yīng):正在制作踏板摩托,這款踏板偏運動越野風(fēng)格,售價可能比傳統(tǒng)的貴一點

張雪公布自己設(shè)計的跨界踏板車設(shè)計圖,最新回應(yīng):正在制作踏板摩托,這款踏板偏運動越野風(fēng)格,售價可能比傳統(tǒng)的貴一點

魯中晨報
2026-04-07 17:13:05
伊朗軍方發(fā)言人稱擊落敵方一架先進戰(zhàn)斗機

伊朗軍方發(fā)言人稱擊落敵方一架先進戰(zhàn)斗機

財聯(lián)社
2026-04-09 14:01:11
陳麗華長子身份曝光:北大畢業(yè),31歲成為富華掌舵人

陳麗華長子身份曝光:北大畢業(yè),31歲成為富華掌舵人

李橑在北漂
2026-04-09 11:48:49
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
只差1場:文班亞馬的肋骨,與NBA最荒誕的規(guī)則

只差1場:文班亞馬的肋骨,與NBA最荒誕的規(guī)則

茅塞盾開本尊
2026-04-09 12:42:15
安徽6歲童遇害案:兇手殘忍程度超乎想象

安徽6歲童遇害案:兇手殘忍程度超乎想象

李侽在北漂
2026-04-09 00:53:33
14.2萬富豪大遷徙:他們用腳投票,資本流向告訴你未來20年去哪

14.2萬富豪大遷徙:他們用腳投票,資本流向告訴你未來20年去哪

蘇格拉高
2026-04-08 07:40:00
大風(fēng)+雷電!目前申城“一黃一藍”雙預(yù)警高掛

大風(fēng)+雷電!目前申城“一黃一藍”雙預(yù)警高掛

上觀新聞
2026-04-09 12:20:13
彭偉國:33歲退役,坐寶馬開酒樓,財富自由,每天在約球和找美食

彭偉國:33歲退役,坐寶馬開酒樓,財富自由,每天在約球和找美食

白面書誏
2026-04-08 13:59:47
為什么全國有這么多“交大”?一木生四枝,百載共芳華

為什么全國有這么多“交大”?一木生四枝,百載共芳華

上觀新聞
2026-04-08 18:40:05
別走錯!深圳地鐵最新公告:這里臨時關(guān)閉!

別走錯!深圳地鐵最新公告:這里臨時關(guān)閉!

深圳晚報
2026-04-09 18:49:33
俄媒這句話直接封神,“只有把中國惹急了,世界才會安靜!

俄媒這句話直接封神,“只有把中國惹急了,世界才會安靜!

流史歲月
2026-04-09 13:55:03
廣東男籃新大外援基本確定,崔永熙被用成工具人,黃明依有意離隊

廣東男籃新大外援基本確定,崔永熙被用成工具人,黃明依有意離隊

中國籃壇快訊
2026-04-09 17:28:18
陳麗華告別儀式于北京八寶山殯儀館舉辦,六小齡童、馬德華、白巖松等人到場悼念;馬德華:遲重瑞心里很難過,希望他節(jié)哀

陳麗華告別儀式于北京八寶山殯儀館舉辦,六小齡童、馬德華、白巖松等人到場悼念;馬德華:遲重瑞心里很難過,希望他節(jié)哀

大象新聞
2026-04-09 11:45:05
“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

大風(fēng)新聞
2026-04-06 15:06:12
WTT太原賽爆冷!中日6場對決,日本冠軍被逆轉(zhuǎn),溫瑞博硬剛強敵

WTT太原賽爆冷!中日6場對決,日本冠軍被逆轉(zhuǎn),溫瑞博硬剛強敵

八斗小先生
2026-04-09 16:59:12
“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

千言娛樂記
2026-04-09 09:17:50
“副縣長蘇某飛被舉報出軌致孕”最新進展:已免職降級調(diào)往鄉(xiāng)鎮(zhèn),女方發(fā)聲:要求他當(dāng)面道歉

“副縣長蘇某飛被舉報出軌致孕”最新進展:已免職降級調(diào)往鄉(xiāng)鎮(zhèn),女方發(fā)聲:要求他當(dāng)面道歉

極目新聞
2026-04-09 10:05:25
日本醫(yī)院發(fā)聲明致歉!中國籍女護士或?qū)⒚媾R巨額賠償,這事千萬別干!

日本醫(yī)院發(fā)聲明致歉!中國籍女護士或?qū)⒚媾R巨額賠償,這事千萬別干!

東京在線
2026-04-08 20:35:54
三位唐僧現(xiàn)狀:一位已是大學(xué)教授,一位已是富豪,只有他混的最慘

三位唐僧現(xiàn)狀:一位已是大學(xué)教授,一位已是富豪,只有他混的最慘

青橘罐頭
2026-04-08 17:11:46
2026-04-09 19:27:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11544文章數(shù) 117027關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財經(jīng)要聞

;鹗兹眨魻柲酒潈H有4艘船通過

汽車要聞

文飛的回歸 給神行者帶來什么?

態(tài)度原創(chuàng)

時尚
手機
教育
公開課
軍事航空

ED網(wǎng)紅病,正在掏空年輕女性

手機要聞

Find X9 Ultra影像實力揭曉 打造專業(yè)口袋哈蘇

教育要聞

被嚴(yán)重低估!全市唯一有招生代碼的公辦高中國際部

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

黎真主黨發(fā)射火箭彈 回應(yīng)以違反;饏f(xié)議

無障礙瀏覽 進入關(guān)懷版