国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

文心一言4.5只是頭菜,百度想做的大概率還是平臺(tái)

0
分享至

我看了下 Github 上發(fā)布詳情,發(fā)現(xiàn)這次百度這次的開源模型反而不是重點(diǎn),它的胃口主要在于生態(tài)。

簡(jiǎn)單來說,AI大模型必定會(huì)有一代更比一代強(qiáng),但是生態(tài)基礎(chǔ)不一樣,它更像是挖金礦的鏟子,用戶忠誠(chéng)度極高。

文心 4.5 的 Github 鏈接: https://github.com/PaddlePaddle/ERNIE

文心 Ernie4.5 ,這次一共發(fā)布了 10 款大模型,但實(shí)際上涵蓋了三個(gè)品類:

  • LLM :傳統(tǒng)的大語(yǔ)言模型,也就是純文字的那種,主流的 MoE 混合專家模型,有兩個(gè) size ,一個(gè)大的 300B ,一個(gè)小的 21B ,跨度很大。

  • VLM :視覺語(yǔ)言模型,也就是現(xiàn)在主流的多模態(tài)模型,可以無縫的處理文字 / 圖片 / 視頻,但是目前只能輸出文字,比如讓它描述個(gè)圖片視頻什么的。

  • Dense Model :這個(gè)是跟 MoE 相對(duì)的稠密模型,也就是這種模型每推理一次,就會(huì)用到所有的參數(shù),代價(jià)就是消耗的計(jì)算量大,所以這個(gè)類目只有 0.3B 的模型,非常適合跑在端側(cè)。



異構(gòu)MoE

單純從發(fā)布的 10 個(gè)大模型來看,可以很清晰地看到百度在盡可能的探索 AI 大模型的所有主流方向, Reasoning 推理, MoE , Dense ,端側(cè)等等。

但是它這個(gè) MoE 有亮點(diǎn),那就是 Multimodal Heterogeneous MoE Pre-Training , MoE 我們大家應(yīng)該都不陌生,像 DeepSeek R1 就是一個(gè) MoE 的混合專家模型,也就是大模型,但是推理的時(shí)候只執(zhí)行一部分,所以兼?zhèn)淞速|(zhì)量和速度。

而 Ernie 的這個(gè) MoE ,首先它是多模態(tài)的,可以處理除了文本之外的圖片和視頻,這就要求在訓(xùn)練的時(shí)候適配多模態(tài),其次更重要的是 Heterogeneous 異構(gòu)這個(gè)詞,一般來說,之前的多模態(tài)大模型,訓(xùn)練的時(shí)候就像是一口 “ 大熔爐 ” ,所有的內(nèi)容進(jìn)行都先 encoding ,換句話說,各種模型的數(shù)據(jù)最終都會(huì)轉(zhuǎn)換成數(shù)學(xué)里面的向量。

再簡(jiǎn)單一點(diǎn)兒,那就是不管你是普通話還是什么方言,最終都要轉(zhuǎn)換成英文表達(dá)。


這里面就有問題了,因?yàn)閳D像和文字本來就是兩種不同的表達(dá)方式,那么用這種 “ 一鍋燴 ” 的方式,為了學(xué)好圖像,可能會(huì)犧牲一些語(yǔ)言的精細(xì)度;為了更好地理解語(yǔ)法,可能會(huì)忽略圖像的細(xì)節(jié)。最終得到的可能是一個(gè) “ 折中 ” 的模型,而不是一個(gè) “ 雙料冠軍 ” 。

文心 4.5 做的事其實(shí)直覺上很簡(jiǎn)單,它不再是簡(jiǎn)單地將圖像和文本數(shù)據(jù) “ 攪拌 ” 在一起喂給模型,而是設(shè)計(jì)了一個(gè) 分工明確、調(diào)度智能、訓(xùn)練有方 的 “ 專家委員會(huì) ” 系統(tǒng)。通過 異構(gòu)結(jié)構(gòu) 實(shí)現(xiàn)物理隔離,通過 隔離路由 實(shí)現(xiàn)任務(wù)的精準(zhǔn)分配,再通過 兩種特殊的損失函數(shù) 從數(shù)學(xué)上保證了專家團(tuán)隊(duì)的專業(yè)性和學(xué)習(xí)過程的公平性。

最終達(dá)到的效果是 “ 相互促進(jìn) (mutual reinforcement)” ,即文本知識(shí)的學(xué)習(xí)可以幫助模型更好地理解圖像,反過來也一樣。

性能

性能大家可以自己去對(duì)比,畢竟都是些打榜的 benchmark 結(jié)果,不能當(dāng)成使用效果來看,具體怎么樣,得看自己的需求,沒有什么模型十全十美。


生態(tài)

我甚至覺得這部分才是大頭,因?yàn)榘俣绕鋵?shí)一直做的深度學(xué)習(xí)框架 飛槳( PaddlePaddle ) ,在國(guó)內(nèi)還是挺有基礎(chǔ)的,因?yàn)槟P涂赡軙?huì)過時(shí),但是生態(tài)可是一個(gè)長(zhǎng)期主義的典型代表。


這次隨模型一同發(fā)布的,還有文心大模型開發(fā)套件 ERNIEKit 和高效部署套件 FastDeploy 。 ERNIEKit 覆蓋了從微調(diào)( SFT )、對(duì)齊( DPO )到量化的全流程開發(fā),而 FastDeploy 則解決了多硬件平臺(tái)(如各種芯片)的高效推理部署問題。

這一整套 “ 全家桶 ” 式的解決方案,極大地降低了開發(fā)者使用文心大模型的門檻。

對(duì)于百度來說,我一直是跟 Google 對(duì)標(biāo)的,畢竟大家都是做搜索引擎出身,再加上本身有的大量語(yǔ)料資源,計(jì)算資源,是可以下盤大棋的,如果一旦習(xí)慣了這套從開發(fā)到部署的流暢體驗(yàn),就會(huì)自然而然地被留在飛槳的生態(tài)系統(tǒng)中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
扣了中國(guó)油輪還不算,美方一回頭,發(fā)現(xiàn)海上風(fēng)向全變了

扣了中國(guó)油輪還不算,美方一回頭,發(fā)現(xiàn)海上風(fēng)向全變了

陳博世財(cái)經(jīng)
2025-12-28 10:35:13
看到這些明星才知道啥叫斷崖式衰老!張子健和陳小春就像換了個(gè)人

看到這些明星才知道啥叫斷崖式衰老!張子健和陳小春就像換了個(gè)人

陸盼盼
2025-12-26 04:18:30
美軍要撤離沖繩?日方求見美防長(zhǎng),高市兩個(gè)舉動(dòng)旨在備戰(zhàn)

美軍要撤離沖繩?日方求見美防長(zhǎng),高市兩個(gè)舉動(dòng)旨在備戰(zhàn)

書中自有顏如玉
2025-12-28 10:39:31
中國(guó)女排聯(lián)賽最新排名!上海降至第二,天津第五,遼寧穩(wěn)坐副班長(zhǎng)

中國(guó)女排聯(lián)賽最新排名!上海降至第二,天津第五,遼寧穩(wěn)坐副班長(zhǎng)

跑者排球視角
2025-12-28 09:09:13
廣州天河最新提醒:非必要勿駕車前往

廣州天河最新提醒:非必要勿駕車前往

羊城攻略
2025-12-27 23:37:28
破億!廣東外經(jīng)貿(mào)大廈戶外廣告位置使用權(quán)高價(jià)成交

破億!廣東外經(jīng)貿(mào)大廈戶外廣告位置使用權(quán)高價(jià)成交

南方都市報(bào)
2025-12-25 21:46:07
四川省1088萬退休老人,人均養(yǎng)老金能達(dá)到3109元嗎?一起算一算

四川省1088萬退休老人,人均養(yǎng)老金能達(dá)到3109元嗎?一起算一算

暖心人社
2025-12-27 21:15:22
賈國(guó)龍40天安眠藥入睡,預(yù)制菜風(fēng)波100天后反思不要硬剛消費(fèi)者

賈國(guó)龍40天安眠藥入睡,預(yù)制菜風(fēng)波100天后反思不要硬剛消費(fèi)者

據(jù)說說娛樂
2025-12-28 10:22:33
湘超冠軍教練是小學(xué)體育老師+退伍軍人 月薪2000元 17名學(xué)生球員

湘超冠軍教練是小學(xué)體育老師+退伍軍人 月薪2000元 17名學(xué)生球員

念洲
2025-12-28 10:47:14
中南大學(xué)老校長(zhǎng)黃伯云陷入尷尬境地:他力薦的院士候選人出事了

中南大學(xué)老校長(zhǎng)黃伯云陷入尷尬境地:他力薦的院士候選人出事了

Delete丨CC
2025-12-27 20:26:04
廣東消失的10大品牌,曾火遍全國(guó),如今難覓其蹤!

廣東消失的10大品牌,曾火遍全國(guó),如今難覓其蹤!

金哥說新能源車
2025-12-28 00:19:48
出嫁前3天彩禮漲到28.8萬后續(xù):男方堅(jiān)持退婚,女子曝光已社死

出嫁前3天彩禮漲到28.8萬后續(xù):男方堅(jiān)持退婚,女子曝光已社死

千言?shī)蕵酚?/span>
2025-12-13 18:34:13
中國(guó)首批大規(guī)模L3級(jí)自動(dòng)駕駛車輛正式上路行駛

中國(guó)首批大規(guī)模L3級(jí)自動(dòng)駕駛車輛正式上路行駛

封面新聞
2025-12-28 10:27:12
王皓不參加競(jìng)聘,這事看著平靜,其實(shí)比他參加更讓人心里發(fā)緊。

王皓不參加競(jìng)聘,這事看著平靜,其實(shí)比他參加更讓人心里發(fā)緊。

小光侃娛樂
2025-12-27 20:45:02
5艘航母云集中國(guó)近海,中美巔峰對(duì)陣,特朗普明牌,逼著中國(guó)接招

5艘航母云集中國(guó)近海,中美巔峰對(duì)陣,特朗普明牌,逼著中國(guó)接招

現(xiàn)代小青青慕慕
2025-12-26 14:42:10
安徽一地干部任前公示

安徽一地干部任前公示

黃河新聞網(wǎng)呂梁頻道
2025-12-28 08:02:48
2025“三農(nóng)”成績(jī)單|精耕良田提質(zhì)效 厚植沃野育新機(jī)

2025“三農(nóng)”成績(jī)單|精耕良田提質(zhì)效 厚植沃野育新機(jī)

新華社
2025-12-27 17:21:25
1976年周總理追悼會(huì),宋慶齡中途憤怒離場(chǎng),隨后鬧出一年辭職風(fēng)波

1976年周總理追悼會(huì),宋慶齡中途憤怒離場(chǎng),隨后鬧出一年辭職風(fēng)波

冰雅憶史
2025-12-24 10:35:55
蒙面男子茶樓偷走4萬元,成都警方一小時(shí)抓捕歸案

蒙面男子茶樓偷走4萬元,成都警方一小時(shí)抓捕歸案

封面新聞
2025-12-28 08:01:04
特斯拉在華招聘Robotaxi工程師,自動(dòng)駕駛網(wǎng)約車服務(wù)有望落地中國(guó)

特斯拉在華招聘Robotaxi工程師,自動(dòng)駕駛網(wǎng)約車服務(wù)有望落地中國(guó)

IT之家
2025-12-28 06:57:08
2025-12-28 12:19:00
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

AR眼鏡第一案,究竟在爭(zhēng)什么?

頭條要聞

非機(jī)動(dòng)車道設(shè)20余個(gè)"臺(tái)階"市民吐槽路太顛簸 官方回應(yīng)

頭條要聞

非機(jī)動(dòng)車道設(shè)20余個(gè)"臺(tái)階"市民吐槽路太顛簸 官方回應(yīng)

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

姚晨打卡絕版機(jī)位 高崎機(jī)場(chǎng)背后的遺憾

財(cái)經(jīng)要聞

英偉達(dá)的收購(gòu)史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

教育
旅游
藝術(shù)
公開課
軍事航空

教育要聞

山東藝術(shù)統(tǒng)考平均分

旅游要聞

又聞寒冬臘梅香

藝術(shù)要聞

薩金特風(fēng)景畫精選

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

與特朗普會(huì)晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進(jìn)入關(guān)懷版