国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

連續(xù)發(fā)布兩款萬(wàn)億參數(shù)模型,螞蟻 AI 來(lái)勢(shì)洶洶

0
分享至



大模型開(kāi)源生態(tài)有了新變化。

作者丨齊鋮湧

編輯丨陳彩嫻

剛剛過(guò)去的國(guó)慶,各行各業(yè)進(jìn)入放假模式,但大模型行業(yè)卻一刻也沒(méi)閑著。

過(guò)去的半個(gè)月,國(guó)內(nèi)外大模型的頭部團(tuán)隊(duì)有十余款重磅產(chǎn)品發(fā)布,但每個(gè)團(tuán)隊(duì)的產(chǎn)品側(cè)重不同。

其中,九月下旬,阿里發(fā)布以 Qwen3-Max 為代表的全家桶產(chǎn)品,大秀了一把肌肉;九月末,DeepSeek 和 Anthropic 瞄準(zhǔn)真實(shí)編程場(chǎng)景,先后發(fā)布了 DeepSeek V3.2-Exp 和 Claude Sonnet 4.5,此外,智譜也拿出 GLM-4.6,目標(biāo)沖擊國(guó)內(nèi)最強(qiáng)代碼模型。

有人全盤(pán)布局,也有人專攻精尖,在大模型領(lǐng)域競(jìng)爭(zhēng)駛向深水區(qū)后,各個(gè)公司戰(zhàn)略路線出現(xiàn)了分野。

10 月 9 日凌晨,螞蟻百靈大模型團(tuán)隊(duì)奇襲般官宣了一款自家最新語(yǔ)言大模型 Ling-1T,參數(shù)量達(dá)到 1000B(即 1萬(wàn)億參數(shù))。然而,就在十天前,百靈團(tuán)隊(duì)才將自研 Ring-1T-preview 大模型開(kāi)源。

短短十天內(nèi),發(fā)布并開(kāi)源兩款萬(wàn)億參數(shù)模型,如此密集的產(chǎn)品發(fā)布讓螞蟻百靈大模型成為了行業(yè)熱議對(duì)象。

與此同時(shí),這樣毫無(wú)保留的開(kāi)源動(dòng)作,也讓業(yè)界猜測(cè):螞蟻到底意圖何在?

01

探索智能上限是終極目標(biāo)

據(jù)了解,螞蟻集團(tuán)研發(fā)的基礎(chǔ)大模型取名“百靈”,寓意“百試百靈”,也蘊(yùn)含科技普惠之意,和阿里一樣,螞蟻也是獨(dú)立團(tuán)隊(duì)獨(dú)立研發(fā),Ling-1T 和 Ring-1T-preview 分別是螞蟻百靈團(tuán)隊(duì)研發(fā)的非思考模型和思考模型。

過(guò)去半年時(shí)間里,螞蟻一直在對(duì)百靈大模型進(jìn)行迭代優(yōu)化,并且自上而下形成了三條技術(shù)探索路線:

一條是以 MoE 架構(gòu)為基礎(chǔ)的非思考模型 Ling-Series,另一條是思考模型 Ring-Series,第三條是原生全模態(tài)大模型 Ming-Series 。

如今,螞蟻百靈團(tuán)隊(duì)在 Ling 和 Ring 兩款模型路線上都已經(jīng)將參數(shù)量擴(kuò)大到萬(wàn)億參數(shù)。

萬(wàn)億參數(shù),幾乎等同于人類大腦神經(jīng)元數(shù)量,相當(dāng)于讓 AI 擁有等同于人腦的處理能力,但萬(wàn)億參數(shù)非常難訓(xùn)。目前,國(guó)內(nèi)能達(dá)到萬(wàn)億參數(shù)規(guī)模的大模型也是鳳毛麟角。

除了剛才提到的百靈大模型 Ling-1T 和 Ring-1T-preview ,目前國(guó)內(nèi)公開(kāi)資料可查的萬(wàn)億參數(shù)大模型只有 Kimi K2、阿里 Qwen3-Max 和騰訊混元大模型等少數(shù)幾個(gè)模型,可見(jiàn)大模型領(lǐng)域“萬(wàn)億俱樂(lè)部”的門(mén)檻之高。

雖然今年以來(lái)盛行“數(shù)據(jù)撞墻論”和“預(yù)訓(xùn)練終結(jié)”的觀點(diǎn),但越來(lái)越多科學(xué)家也形成了一個(gè)新的共識(shí):更大的參數(shù),更多的數(shù)據(jù),仍然能帶來(lái)持續(xù)的性能提升。

阿里的算法負(fù)責(zé)人林俊旸公開(kāi)表態(tài):Scaling Law 仍然沒(méi)見(jiàn)頂,訓(xùn)練數(shù)據(jù)的增加,參數(shù)規(guī)模的擴(kuò)大,都還能看到模型性能的提升。

楊植麟的Kimi 團(tuán)隊(duì)更是克服萬(wàn)難悶頭苦干,終于在兩個(gè)月前,拿出了萬(wàn)億參數(shù)的旗艦?zāi)P蚄2。通義千問(wèn)團(tuán)隊(duì)直接提出了“大就是好”的暴論,并且讓 Qwen3 堅(jiān)定不移地沿著“Just Scale it”的擴(kuò)展路徑前進(jìn)。

由此可見(jiàn),大家都還在朝著“探索智能上限”出發(fā)。

02

百靈大模型加速涌現(xiàn)

據(jù)了解,過(guò)去一年里,平均7天就有一款高性能大模型誕生??梢哉f(shuō),國(guó)內(nèi)不缺大模型。

但在參數(shù)和效率之間,能做到完美平衡的大模型卻不多。

就拿萬(wàn)億參數(shù)模型來(lái)說(shuō),模型變大了,往往會(huì)犧牲推理速度,推理速度上去了,準(zhǔn)確率又很難達(dá)到。業(yè)界知名的旗艦款大參數(shù)模型,都能在推理能力和思考效率上做到很不錯(cuò)的平衡。

這個(gè)平衡點(diǎn),被稱之為帕累托最優(yōu),我們經(jīng)常用多維基準(zhǔn)測(cè)試的分?jǐn)?shù)來(lái)量化對(duì)比。這次螞蟻發(fā)布的 Ling-1T 在公開(kāi)的對(duì)比榜單中,表現(xiàn)讓人非常意外。

下圖是 Ling-1T 在部分權(quán)威基準(zhǔn)評(píng)測(cè)的表現(xiàn),紅色加粗代表 Ling-1T 的得分獲得 Top1,黑色加粗下劃線表示 Top2:


我們重點(diǎn)關(guān)注的編程與數(shù)學(xué)推理( Coding & Math )兩個(gè)維度上,Ling-1T 表現(xiàn)非常亮眼,甚至多個(gè)得分超過(guò) DeepSeek。在知識(shí)理解方面,Ling-1T 也比Kimi、GPT-5 主干模型等的得分,高出幾分。

這意味著,Ling-1T 的深度思考能力和泛化能力,以及邏輯推理能力,都非常全面。因此,Ling-1T 會(huì)非常擅長(zhǎng)從事代碼生成、軟件開(kāi)發(fā)、競(jìng)賽數(shù)學(xué)、專業(yè)數(shù)學(xué)、邏輯推理等場(chǎng)景。

但對(duì)于萬(wàn)億參數(shù)模型來(lái)說(shuō),除了綜合性能,還需要考慮一個(gè)問(wèn)題:推理正確率。這就需要引入競(jìng)賽數(shù)學(xué)榜單 AIME 25 競(jìng)賽數(shù)學(xué)榜單 AIME 25 的挑戰(zhàn),Ling-1T 的成績(jī)?nèi)缦拢?/p>


Ling-1T 在 AIME 25 測(cè)試中,與 DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905 (開(kāi)源)以及 GPT-5-main、Gemini-2.5-Pro (閉源)這些旗艦?zāi)P蛯?duì)比,展示出更短的思考路徑和更高的推理準(zhǔn)確率,能做到支持 128K 長(zhǎng)文本窗口處理能力,每個(gè) token 做到約 50B 參數(shù)的激活量。

這樣的成績(jī),源自螞蟻百靈團(tuán)隊(duì)長(zhǎng)時(shí)間的積累與創(chuàng)新。

依托于團(tuán)隊(duì)儲(chǔ)備的二十萬(wàn)億 Token 高質(zhì)量文本語(yǔ)料訓(xùn)練,Ling-1T 吃進(jìn)了大量?jī)?yōu)質(zhì)知識(shí)。在預(yù)訓(xùn)練階段, Ling-1T 的訓(xùn)練團(tuán)隊(duì)讓由 Ling Scaling Laws 自我設(shè)置關(guān)鍵超參,簡(jiǎn)單地說(shuō),就是讓大模型自我優(yōu)化。

同時(shí)在強(qiáng)化訓(xùn)練階段,加入了百靈團(tuán)隊(duì)原創(chuàng)的 LPO 策略優(yōu)化算法,讓模型回答得更對(duì)。

此外,團(tuán)隊(duì)還額外提出了“語(yǔ)法-功能-美學(xué)”的混合獎(jiǎng)勵(lì)機(jī)制,提高模型審美。下面這張是 Ling-1T 工程師繪制的模型架構(gòu)圖:


不止是剛發(fā)布的 Ling-1T 和9月30日發(fā)布的 Ring-1T-preview ,螞蟻實(shí)際上已經(jīng)形成了完整的百靈大模型家族。

從尺寸上,包含從160億總參數(shù)到1萬(wàn)億總參數(shù)的大語(yǔ)言模型產(chǎn)品矩陣;從模態(tài)上,包含了能看能聽(tīng)能說(shuō)能畫(huà)的,從理解到生成能統(tǒng)一的大模型;

從場(chǎng)景上,也形成了包括手機(jī)上可以運(yùn)行的 Ling-mini,還有能在中小企業(yè)服務(wù)器上部署的 Ling-flash,以及云端可調(diào)用的 Ling-1T。


這些模型,在過(guò)去一段時(shí)間,無(wú)論是社區(qū)榜單還是實(shí)際使用上,都得到了很多有效回應(yīng)。

螞蟻百靈團(tuán)隊(duì)開(kāi)發(fā)的全模態(tài)模型 Ming-lite-omni v1.5 甚至在 Hugging Face 模型趨勢(shì)榜(any to any)排到過(guò)第一的位置。

Ring-1T-preview 發(fā)布完的第二天,就沖上了 Hugging Face 模型榜 Text Generation 總榜排名第三,排名第四的也是9月 Ling 團(tuán)隊(duì)發(fā)布的混合架構(gòu)思考模型 Ring-flash-linear-2.0 。


圖靈獎(jiǎng)得主 Yann LeCun(楊立昆)甚至點(diǎn)贊并評(píng)論“Impressive”(了不起),了解這位特立獨(dú)行大佬的網(wǎng)友表示:“ LeCun 愿意給 LLM(大模型)說(shuō)句好話不容易”。


一位蘋(píng)果工程師量化完跑起來(lái)模型,評(píng)價(jià)螞蟻百靈模型的性能“Getting closer to GPT-5 at home”(在本地部署上的性能接近 GPT-5)。


這些技術(shù)從業(yè)者和開(kāi)發(fā)者們的真實(shí)聲音,給予了百靈模型非常正向的反饋。

03

探索 AGI ,亟需參與者們的共建意識(shí)

百靈團(tuán)隊(duì),如此快速地躋身“萬(wàn)億參數(shù)俱樂(lè)部”,背后跟螞蟻的戰(zhàn)略動(dòng)作分不開(kāi)。作為一家成立了20年的互聯(lián)網(wǎng)公司”,螞蟻在 AI 領(lǐng)域的投入一直是非常巨大的。

去年螞蟻20周年時(shí)候,螞蟻集團(tuán)董事長(zhǎng)井賢棟宣布:未來(lái)20年,螞蟻要做一家科技驅(qū)動(dòng)、創(chuàng)新驅(qū)動(dòng)的公司。螞蟻集團(tuán)還提出了 AI First 戰(zhàn)略,并將其與“支付寶雙飛輪”和“加速全球化”一齊,并稱為螞蟻集團(tuán)的三大戰(zhàn)略。

而 Ling-1T 和 Ring-1T-preview 的出現(xiàn),則是螞蟻 AI First 戰(zhàn)略持續(xù)加速的表現(xiàn)。

不選擇閉源道路,而是選擇了開(kāi)源,足以證明,螞蟻想干一件更長(zhǎng)遠(yuǎn)的事:

通過(guò)技術(shù)開(kāi)放的方式,不斷迭代技術(shù),構(gòu)建一個(gè)真正開(kāi)放的 AGI 生態(tài)。

根據(jù) AI 科技評(píng)論了解,目前“萬(wàn)億參數(shù)俱樂(lè)部”里能做到完全開(kāi)源的,只有螞蟻百靈的 Ling-1T 和 Ring-1T-preview ,以及 Kimi 的 K2。

在大模型參數(shù)軍備競(jìng)賽愈演愈烈的 2025 年,投入如此巨大之后,螞蟻選擇直接開(kāi)源,看似讓人費(fèi)解。

但如果了解大模型開(kāi)源背后的意圖,就會(huì)明白,當(dāng) Ling-1T 和 Ring-1T-preview 這樣萬(wàn)億參數(shù)模型,公布了背后的訓(xùn)練數(shù)據(jù)、算法、模型,開(kāi)發(fā)者可以直接利用這些“龐然大物”作為起點(diǎn),快速構(gòu)建復(fù)雜的應(yīng)用程序,無(wú)需關(guān)心底層模型的訓(xùn)練。一個(gè)“使用-反饋-迭代”的正向循環(huán),將極大推動(dòng)技術(shù)共建,加快智能涌現(xiàn)。

這條"技術(shù)平權(quán)化"的道路,我們并不陌生。今年年初,DeepSeek 的橫空出世,已經(jīng)為眾多中國(guó)大模型頭部玩家們指明了道路。

今年接任螞蟻集團(tuán) CEO 的韓歆毅,曾在內(nèi)部技術(shù)日上表達(dá)了螞蟻 AI 的主張:

“大家說(shuō)(螞蟻)聚焦 AI 應(yīng)用,還要不要做基礎(chǔ)大模型,年初討論的時(shí)候我們答案非常堅(jiān)決,一定要,因?yàn)槿绻?AI 做服務(wù)和應(yīng)用,就像訓(xùn)練一個(gè)人去做所有的事,追求智能上限,會(huì)讓這個(gè)人更加聰明,能夠做更多、更好的服務(wù)。我們很堅(jiān)定去探索 AGI 、探索智能上限?!?/p>

螞蟻還專門(mén)成立了 InclusionAI 開(kāi)源組織,建設(shè)了大模型全棧技術(shù),包含強(qiáng)化學(xué)習(xí)推理框架 AReaL、多智能體框架 AWorld 等,這些技術(shù)也已經(jīng)通過(guò)開(kāi)源、開(kāi)放合作的形式與行業(yè)共享共建,讓創(chuàng)作者可以交流共創(chuàng)。

能看得出來(lái),相比于登臺(tái)唱戲,螞蟻更加愿意把戲臺(tái)搭好,AI 的基礎(chǔ)設(shè)施鋪設(shè)好,才能吸引更多的人來(lái)共建,真正邁向 AGI 。


未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
7股尾盤(pán)主力資金凈流入均超1億元

7股尾盤(pán)主力資金凈流入均超1億元

證券時(shí)報(bào)
2025-12-24 19:35:02
鄭州一中學(xué)欄桿斷裂致學(xué)生墜樓重傷,事故調(diào)查報(bào)告7年未公布?官方:成立聯(lián)合調(diào)查組

鄭州一中學(xué)欄桿斷裂致學(xué)生墜樓重傷,事故調(diào)查報(bào)告7年未公布?官方:成立聯(lián)合調(diào)查組

界面新聞
2025-12-24 20:56:59
俄羅斯最高法院:批評(píng)政治人物不構(gòu)成犯罪

俄羅斯最高法院:批評(píng)政治人物不構(gòu)成犯罪

桂系007
2025-12-23 23:13:39
小洛熙事件最新進(jìn)展:衛(wèi)健委通報(bào)手術(shù)過(guò)失,醫(yī)生已被免職

小洛熙事件最新進(jìn)展:衛(wèi)健委通報(bào)手術(shù)過(guò)失,醫(yī)生已被免職

燕梳樓頻道
2025-12-24 20:58:11
火記不滿3負(fù)西部倒數(shù)!杜蜜炮轟火箭爛透了 烏度卡暗示KD不是領(lǐng)袖

火記不滿3負(fù)西部倒數(shù)!杜蜜炮轟火箭爛透了 烏度卡暗示KD不是領(lǐng)袖

顏小白的籃球夢(mèng)
2025-12-24 18:03:10
52年,陳賡大將對(duì)家人說(shuō):我受過(guò)電刑,活不過(guò)60的,后來(lái)果然這樣

52年,陳賡大將對(duì)家人說(shuō):我受過(guò)電刑,活不過(guò)60的,后來(lái)果然這樣

愚鑒
2025-12-22 21:38:32
新進(jìn)展!亞洲周刊曝徐湖平已被帶走,鄰居曝更多細(xì)節(jié),這下玩完了

新進(jìn)展!亞洲周刊曝徐湖平已被帶走,鄰居曝更多細(xì)節(jié),這下玩完了

鋭娛之樂(lè)
2025-12-24 15:46:34
中越戰(zhàn)爭(zhēng)驚人細(xì)節(jié):中國(guó)五日不撤軍,諒山主力覆沒(méi),戰(zhàn)事結(jié)局如何

中越戰(zhàn)爭(zhēng)驚人細(xì)節(jié):中國(guó)五日不撤軍,諒山主力覆沒(méi),戰(zhàn)事結(jié)局如何

磊子講史
2025-12-22 16:29:02
西甲2025年身價(jià)漲幅TOP15:赫伊森上漲5200萬(wàn)第1,姆巴佩第4

西甲2025年身價(jià)漲幅TOP15:赫伊森上漲5200萬(wàn)第1,姆巴佩第4

懂球帝
2025-12-24 05:15:11
湖南發(fā)布《致全省人民的一封信》:減少或不燃放煙花爆竹,用“新年俗”傳遞祝福

湖南發(fā)布《致全省人民的一封信》:減少或不燃放煙花爆竹,用“新年俗”傳遞祝福

瀟湘晨報(bào)
2025-12-24 17:35:17
童瑤胸貼露出來(lái)了

童瑤胸貼露出來(lái)了

手工制作阿殲
2025-12-15 12:20:21
勇士?jī)?nèi)訌原因曝光!追夢(mèng)不想干累活,被罰100萬(wàn),名嘴建議他替補(bǔ)

勇士?jī)?nèi)訌原因曝光!追夢(mèng)不想干累活,被罰100萬(wàn),名嘴建議他替補(bǔ)

你的籃球頻道
2025-12-24 09:21:29
轉(zhuǎn)戰(zhàn)職業(yè)釣魚(yú)!西蒙斯宣布暫停NBA生涯:沒(méi)到最佳狀態(tài)復(fù)出無(wú)意義

轉(zhuǎn)戰(zhàn)職業(yè)釣魚(yú)!西蒙斯宣布暫停NBA生涯:沒(méi)到最佳狀態(tài)復(fù)出無(wú)意義

羅說(shuō)NBA
2025-12-24 05:49:38
臺(tái)灣其實(shí)根本就不用打,打它干什么?只要把臺(tái)灣海峽劃成戰(zhàn)區(qū)

臺(tái)灣其實(shí)根本就不用打,打它干什么?只要把臺(tái)灣海峽劃成戰(zhàn)區(qū)

百態(tài)人間
2025-12-24 16:46:46
當(dāng)我把“有線電視”換成“網(wǎng)絡(luò)電視”后,有些心里話,不吐不快

當(dāng)我把“有線電視”換成“網(wǎng)絡(luò)電視”后,有些心里話,不吐不快

小柱解說(shuō)游戲
2025-12-24 12:53:06
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

古書(shū)記史
2025-12-12 11:21:38
從今天起,中國(guó)不再需要日本道歉!這覺(jué)醒,來(lái)自3500萬(wàn)亡魂的重量

從今天起,中國(guó)不再需要日本道歉!這覺(jué)醒,來(lái)自3500萬(wàn)亡魂的重量

科普100克克
2025-11-30 21:24:29
入獄2年刑滿釋放!秦升:我不會(huì)8國(guó)語(yǔ)言 啥也不會(huì) 和老外各罵各的

入獄2年刑滿釋放!秦升:我不會(huì)8國(guó)語(yǔ)言 啥也不會(huì) 和老外各罵各的

念洲
2025-12-24 10:58:46
交通運(yùn)輸部:實(shí)施新一輪農(nóng)村公路提升行動(dòng)

交通運(yùn)輸部:實(shí)施新一輪農(nóng)村公路提升行動(dòng)

財(cái)聯(lián)社
2025-12-24 10:36:19
媒體詢問(wèn)遼寧某地遼Q車牌是哪的,電D又是誰(shuí)在開(kāi)

媒體詢問(wèn)遼寧某地遼Q車牌是哪的,電D又是誰(shuí)在開(kāi)

遼沈音信
2025-12-24 14:40:12
2025-12-24 22:19:00
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7022文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

韓國(guó)財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

頭條要聞

韓國(guó)財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂(lè)要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購(gòu) 滬深是否會(huì)跟進(jìn)?

汽車要聞

“運(yùn)動(dòng)版庫(kù)里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

游戲
教育
親子
健康
公開(kāi)課

《風(fēng)水喵將》評(píng)測(cè):高自由度構(gòu)筑破傳統(tǒng)

教育要聞

你今天對(duì)女兒的支持,孩子將來(lái)會(huì)懂得!

親子要聞

52歲王小騫淚談早產(chǎn)經(jīng)歷,孕8個(gè)月羊水早破,住院保胎10天剖宮產(chǎn)

這些新療法,讓化療不再那么痛苦

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版