国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

神仙打架+1!訊飛星火X2硬核亮相,行業(yè)深度全面升級(jí)

0
分享至

鷺羽 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

今天,國(guó)產(chǎn)大模型再次迎來硬核進(jìn)階!

科大訊飛小年放出推理王炸——星火大模型X2。

什么概念呢?從星火X1.5到星火X2,僅僅間隔3個(gè)月,推理性能直接飆升50%~

不僅快,而且猛。更重要的是,完全基于國(guó)產(chǎn)算力。



一方面,模型通用能力突出,Benchmark評(píng)測(cè)穩(wěn)居行業(yè)一流水平,即使是和GPT-5.2、Gemini-3-Pro這些國(guó)際頂尖模型同臺(tái)競(jìng)技也毫不遜色。

尤其是在數(shù)學(xué)計(jì)算、邏輯推理等核心能力上表現(xiàn)亮眼;同時(shí)130多種語言綜合能力依舊穩(wěn)穩(wěn)在線,繼續(xù)保持“國(guó)家隊(duì)”水準(zhǔn)。



另一方面,星火X2將升級(jí)的重點(diǎn)放在了場(chǎng)景落地上。

依靠深度優(yōu)化的算法、高質(zhì)量垂域數(shù)據(jù)和行業(yè)專家的參與,三位一體推動(dòng)行業(yè)大模型更進(jìn)一步,為各行各業(yè)提供更精準(zhǔn)、更具實(shí)操性的支持。

正如科大訊飛董事長(zhǎng)劉慶峰在1024開發(fā)者節(jié)所說——做更懂你的AI,滿血?dú)w來的星火X2現(xiàn)在用通用底座+行業(yè)專才雙輪驅(qū)動(dòng),再次印證了其在國(guó)產(chǎn)大模型賽道的實(shí)踐底氣。

通用能力全面升級(jí)

星火大模型作為訊飛AI架構(gòu)的底層基石,按照慣例,每一次升級(jí),都有著顯著的能力躍遷。

這一次更甚:直接將深度推理訓(xùn)練效率再度提升50%

眾所周知,隨著Scaling Laws邊際效益遞減,越到后期,大模型性能提升就越難。即使是1%的能力躍遷,都意味著算力和算法的指數(shù)級(jí)倍增。

而在行業(yè)普遍面臨增長(zhǎng)瓶頸的當(dāng)下,星火X2能夠?qū)崿F(xiàn)50%的性能躍遷實(shí)屬不易。

其背后釋放的信號(hào),比數(shù)字本身更值得深思,這透露出科大訊飛在模型核心架構(gòu)和技術(shù)上有了更深層次的突破。

具體先看核心能力對(duì)比。

橫向?qū)Ρ葋砜?,星火X2 Thinking的各項(xiàng)評(píng)分已經(jīng)穩(wěn)居國(guó)產(chǎn)第一梯隊(duì),在多個(gè)維度上也與GPT-5.2 (xhigh)和Gemini-3-Pro非常接近。

其中,在多語言和翻譯能力上顯著優(yōu)于友商模型,在數(shù)學(xué)和邏輯推理上也緊隨GPT和Gemini其后。



再看星火X2在高難度基準(zhǔn)測(cè)試中的表現(xiàn),可以說含金量杠杠的。

比如在AIME 2025測(cè)試中,星火X2斬獲95.7分,僅次于GPT-5.2 (xhigh),展現(xiàn)出其處理競(jìng)賽級(jí)數(shù)學(xué)的頂尖能力。

在MMLU Pro里,星火X2的87.3分不僅在國(guó)產(chǎn)模型中奪冠,且與GPT-5.2持平,說明其知識(shí)廣度和深度已達(dá)國(guó)際一流水準(zhǔn)。

在代表未來方向的智能體維度上,星火X2也是再度領(lǐng)跑國(guó)產(chǎn)模型,驗(yàn)證了它在理解復(fù)雜指令和調(diào)用工具方面的進(jìn)階。



總的來說,星火X2在數(shù)據(jù)上的亮眼表現(xiàn),不僅彰顯了訊飛在數(shù)學(xué)和邏輯推理領(lǐng)域的領(lǐng)先地位,更標(biāo)志著其通用智力已足以比肩國(guó)際頂尖模型。

接下來咱們還是實(shí)測(cè)見真章。

先來一道去年11月哈佛-麻省理工數(shù)學(xué)錦標(biāo)賽(HMMT)里的英文題目試試水~

之所以選擇這個(gè)題目,一則是避免數(shù)據(jù)污染,題目比較新,能夠避免模型“見”過該題目;其二是HMMT是全球難度最高的數(shù)學(xué)競(jìng)賽之一,能夠更好地考驗(yàn)星火X2的即時(shí)邏輯推理能力。

  • A positive integer n is imbalanced if strictly more than 99 percent of the positive divisors of n are strictly less than 1 percent of n. Given that M is an imbalanced multiple of 2000, compute the minimum possible number of positive divisors of M.



果不其然非常出色,星火X2迅速給出了詳細(xì)的解答過程和正確答案。換言之,它徹底吃透了英文數(shù)學(xué)題目的底層邏輯,而非簡(jiǎn)單依賴中文語境。



再試試西班牙語:



同樣也是流暢給出了正確結(jié)果。



那么它是如何做到的呢?

首先,星火X2在模型架構(gòu)上繼承了星火X1.5的MoE稀疏架構(gòu),參數(shù)同樣為293B。

但與之不同的是,在星火X1.5的基礎(chǔ)之上,星火X2結(jié)合權(quán)重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信進(jìn)行了針對(duì)性技術(shù)創(chuàng)新:

  • 訓(xùn)推采樣校準(zhǔn)強(qiáng)化學(xué)習(xí)算法:

在大模型,尤其是MoE架構(gòu)中,往往存在訓(xùn)推分布不一致的問題,這會(huì)導(dǎo)致模型在訓(xùn)練階段學(xué)到的規(guī)律無法直接適用到實(shí)際推理應(yīng)用中,甚至?xí)霈F(xiàn)模型性能坍塌。

為此,星火X2提出訓(xùn)練與推理概率重采樣自適應(yīng)校準(zhǔn)算法,讓算法能夠根據(jù)訓(xùn)練的實(shí)時(shí)進(jìn)度,自動(dòng)調(diào)整校準(zhǔn)力度,確保專家模型能夠時(shí)刻保持邏輯閉環(huán)。

  • 遞歸式高難數(shù)據(jù)合成方法:

在模型訓(xùn)練中,由于深度推理數(shù)據(jù)極度匱乏,星火X2專門設(shè)計(jì)了多輪迭代式推導(dǎo)的數(shù)據(jù)合成方案。

通過多輪迭代和遞歸修正,能夠最終形成一套從問題到正確推導(dǎo)過程的高質(zhì)量語料,完成對(duì)模型深度推理準(zhǔn)確率的提升。

  • 多階段RL高吞吐采樣方法:

在突破國(guó)產(chǎn)算力瓶頸上,星火X2設(shè)計(jì)了P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案。

他們將大模型推理過程中物理特性完全不同的兩個(gè)階段——Prefill(預(yù)填充)和Decoding(解碼),從硬件執(zhí)行層面進(jìn)行徹底分離,直接解決了國(guó)產(chǎn)化平臺(tái)在高吞吐采樣下的效率干擾,訓(xùn)練效率提升10%。

  • 服務(wù)高性能部署優(yōu)化算法:

這一步是讓星火X2推理性能大幅度提升的關(guān)鍵。

通過對(duì)模型進(jìn)行輕量化壓縮,可實(shí)現(xiàn)單臺(tái)服務(wù)器內(nèi)部的批量專家并行,也就是單機(jī)大EP并行部署。

充分解決了國(guó)產(chǎn)算力平臺(tái)的關(guān)鍵瓶頸——輕量化落地高效推理,讓模型不僅能跑,還能跑得快。

帶動(dòng)行業(yè)大模型實(shí)現(xiàn)突破

除了通用能力的全面釋放,星火大模型此次升級(jí)的重中之重,在于深度場(chǎng)景化。

這是科大訊飛從星火大模型誕生之初,就始終強(qiáng)調(diào)的核心邏輯:要在發(fā)展技術(shù)力的同時(shí),更注重技術(shù)與用戶體驗(yàn)、場(chǎng)景落地的結(jié)合。


圖片源自智能超參數(shù)

具體體現(xiàn)在醫(yī)療、教育、汽車和智能體四個(gè)方面:

賦能醫(yī)療領(lǐng)域,持續(xù)保持業(yè)界領(lǐng)先

依托星火X2底座的算力優(yōu)化與推理躍遷,星火醫(yī)療大模型的核心能力也得到了全面進(jìn)化,繼續(xù)保持行業(yè)翹楚。

在基于居民健康檔案的智能健康分析、智能報(bào)告解讀、運(yùn)動(dòng)飲食建議、輔助診療、智能用藥審核等高精度核心場(chǎng)景中,星火大模型更是顯著優(yōu)于GPT-5.2和另外兩款國(guó)產(chǎn)大模型,樹立了醫(yī)療專業(yè)大模型的新標(biāo)桿。



此外,星火醫(yī)療大模型也已率先通過上海市醫(yī)療大模型應(yīng)用檢測(cè)驗(yàn)證中心評(píng)測(cè)驗(yàn)證。

這是國(guó)內(nèi)首個(gè)專門針對(duì)醫(yī)療大模型的評(píng)測(cè)平臺(tái),代表了目前國(guó)內(nèi)最頂尖、最權(quán)威的標(biāo)準(zhǔn),說明訊飛已經(jīng)在醫(yī)療AI合規(guī)上走到了行業(yè)前列。

而在面向用戶的C端,“訊飛曉醫(yī)”APP也同步完成升級(jí),包括多輪主動(dòng)問診、多輪咨詢問答、問用藥、檢查檢驗(yàn)單解讀、體檢報(bào)告單解讀等多任務(wù)。



可見,“訊飛曉醫(yī)”在星火X2的加持下,已經(jīng)成為了普通用戶可用的且能力業(yè)界頂尖的數(shù)字醫(yī)生。

賦能教育領(lǐng)域,實(shí)現(xiàn)個(gè)性化教學(xué)

而在教育領(lǐng)域,星火大模型也讓原先基礎(chǔ)的搜索工具,進(jìn)化為一對(duì)一特級(jí)老師。

其率先上線錯(cuò)因貫穿的個(gè)性化學(xué)習(xí)能力,能夠通過你的整張卷子、整道題的解題思路,精準(zhǔn)捕捉到你的知識(shí)點(diǎn)黑洞,比如是定理沒記牢呢,還是運(yùn)算粗心大意了。

同時(shí)它能夠像閱卷老師一樣,在錯(cuò)誤之處精準(zhǔn)批注,實(shí)現(xiàn)步驟級(jí)批改。

這種模式下,AI更符合蘇格拉底式的教學(xué)理念,也就是通過不斷提問,引導(dǎo)學(xué)生自己思考并得出結(jié)論。

它不是直接告訴學(xué)生答案,而是教會(huì)學(xué)生如何進(jìn)行思維拆解、如何自己悟出來。而這類啟發(fā)式講解,也是未來AI教育的主導(dǎo)路線。



體現(xiàn)在硬件上,就是科大訊飛的AI學(xué)習(xí)機(jī)。它在1對(duì)1精準(zhǔn)學(xué)、答疑輔導(dǎo)和互動(dòng)課等多功能上,持續(xù)領(lǐng)先同行業(yè),能夠幫助學(xué)生更精準(zhǔn)地提高學(xué)習(xí)效率,以及增強(qiáng)學(xué)習(xí)興趣。

賦能汽車領(lǐng)域,全面升級(jí)智能座艙交互系統(tǒng)

與此同時(shí),星火大模型在多尺寸中小模型上也同步進(jìn)行了升級(jí),并精準(zhǔn)將其應(yīng)用在汽車智能座艙交互系統(tǒng)中。

過去用戶必須說出精準(zhǔn)指令才能實(shí)現(xiàn)交互,比如調(diào)低空調(diào)至24度。但如果說“我有點(diǎn)冷”或者“風(fēng)太大”這類模糊指令,系統(tǒng)往往只會(huì)回復(fù)“對(duì)不起,我沒有聽懂”。

但現(xiàn)在這個(gè)問題隨著星火X2的到來迎刃而解。

模型在人人/人機(jī)對(duì)話判斷、模糊意圖理解、高情商回復(fù)等方面的交互體驗(yàn)顯著提升,尤其是在模糊意圖上實(shí)現(xiàn)了跨越式突破,終于具備了實(shí)際可用的語義聯(lián)想和推理能力。



賦能智能體平臺(tái)和精品智能體新升級(jí)

另外值得關(guān)注的是,智能體的突破。

星火X2從根本上解決了智能體在工作環(huán)境中長(zhǎng)期以來的痛點(diǎn),在長(zhǎng)時(shí)復(fù)雜任務(wù)規(guī)劃、多工具組合調(diào)用以及長(zhǎng)上下文等方面均實(shí)現(xiàn)了顯著提升。

其中星辰Agent平臺(tái),整合了語音識(shí)別、語音交互、圖像理解等百余種能力,集成超130萬個(gè)智能體,在星火X2幫助下,進(jìn)一步強(qiáng)化了智能體在思考和執(zhí)行上的表現(xiàn),更能支撐起復(fù)雜的企業(yè)場(chǎng)景。

比如面向企業(yè)采購(gòu)場(chǎng)景的招采智能體,核心場(chǎng)景效率提升超3倍,還能像搭積木一樣定制專用智能體,開發(fā)時(shí)間從原先的幾天直接縮短至分鐘級(jí)。

目前訊飛開放平臺(tái)已正式上線星火X2 API,平臺(tái)新注冊(cè)開發(fā)者可直接領(lǐng)取100萬Tokens免費(fèi)額度。

在訊飛星火網(wǎng)頁版和APP均可體驗(yàn),星火APP 5.2.0新版本也同步上線~

國(guó)產(chǎn)算力突圍下的訊飛星火

總的來說,星火X2更像是一塊國(guó)產(chǎn)算力的試金石。

在過去幾年里,國(guó)內(nèi)AI行業(yè)發(fā)展受限的根本原因就在于算力。算力被扼住脖子后,模型性能始終無法突破國(guó)際一流水平。

而當(dāng)所有人都在質(zhì)疑國(guó)產(chǎn)算力時(shí),訊飛咬牙給它做成了。而且是國(guó)內(nèi)主流大模型中,唯一基于全國(guó)產(chǎn)算力訓(xùn)練的通用大模型。



模型實(shí)現(xiàn)了完全自主可控,一是算力自主,模型的訓(xùn)練和推理過程完全基于全國(guó)產(chǎn)算力平臺(tái);二是技術(shù)自主,整個(gè)模型框架均由訊飛自研,在此基礎(chǔ)上構(gòu)建起特有的研發(fā)生態(tài)。

核心原因就在于訊飛走了最務(wù)實(shí)的一條路:不再單純追求實(shí)驗(yàn)室里的高分,而是依據(jù)自己深耕多年的行業(yè)經(jīng)驗(yàn)一舉扎根在最難的場(chǎng)景應(yīng)用中。

訊飛順勢(shì)提出了“1+N”戰(zhàn)略,即1個(gè)通用底座大模型,和N個(gè)底座大模型賦能的多領(lǐng)域行業(yè)大模型,然后通過軟硬一體化,讓大模型搭載到硬件上,以看得見摸得著的方式迅速落地轉(zhuǎn)化。

簡(jiǎn)單來說,訊飛的差異化路徑就是底座自主、硬件協(xié)同、場(chǎng)景為王。

而星火X2反向證明了這條路值得繼續(xù)探索,即使是在算力重壓下,單靠算法創(chuàng)新和場(chǎng)景優(yōu)化也能補(bǔ)足當(dāng)中的差距,換來中國(guó)AI在全行業(yè)的先發(fā)優(yōu)勢(shì)。

顯然,國(guó)產(chǎn)大模型已步入應(yīng)用紅利期,而訊飛率先摘到了果實(shí)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1952年鄭洞國(guó)赴京就任,她嫌棄北京苦寒毅然改嫁富商

1952年鄭洞國(guó)赴京就任,她嫌棄北京苦寒毅然改嫁富商

磊子講史
2025-12-29 16:25:39
婚禮當(dāng)日,小舅子堵門要30萬出門費(fèi),新郎看穿他的算計(jì)后直接退婚

婚禮當(dāng)日,小舅子堵門要30萬出門費(fèi),新郎看穿他的算計(jì)后直接退婚

多久情感
2026-02-25 10:35:03
美籍華人回國(guó)撈金遭驅(qū)逐,52歲成笑柄

美籍華人回國(guó)撈金遭驅(qū)逐,52歲成笑柄

王投吃吃喝喝
2026-02-26 11:34:19
買前白月光,買后真垃圾!這6個(gè)家居物品,坑了太多人!

買前白月光,買后真垃圾!這6個(gè)家居物品,坑了太多人!

室內(nèi)設(shè)計(jì)師有料兒
2026-02-24 15:06:49
中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

芭比衣櫥
2026-02-19 21:00:42
周總理為什么不愿在人民大會(huì)堂國(guó)畫《江山如此多嬌》上題詞?

周總理為什么不愿在人民大會(huì)堂國(guó)畫《江山如此多嬌》上題詞?

老杉說歷史
2026-02-16 18:05:07
我國(guó)每年近千萬人做腸鏡!醫(yī)生直言:做一次腸鏡,或管10年無礙?

我國(guó)每年近千萬人做腸鏡!醫(yī)生直言:做一次腸鏡,或管10年無礙?

鬼菜生活
2026-02-10 20:14:46
顧客和商家熟悉后有啥后果?網(wǎng)友:對(duì)你口味了如指掌,比你還懂你

顧客和商家熟悉后有啥后果?網(wǎng)友:對(duì)你口味了如指掌,比你還懂你

解讀熱點(diǎn)事件
2026-02-17 00:05:05
火箭大勝!杜蘭特21+4+5,賽后老范抱住德羅贊,小謝接受采訪

火箭大勝!杜蘭特21+4+5,賽后老范抱住德羅贊,小謝接受采訪

擔(dān)酒
2026-02-26 11:21:36
"豬灣事件"重演?美籍快艇闖入古巴領(lǐng)海開火

"豬灣事件"重演?美籍快艇闖入古巴領(lǐng)海開火

看看新聞Knews
2026-02-26 12:20:10
吳石夫人王碧奎晚年自述,寧在臺(tái)流浪不返大陸,居美國(guó)訴心底真意

吳石夫人王碧奎晚年自述,寧在臺(tái)流浪不返大陸,居美國(guó)訴心底真意

嘮叨說歷史
2026-02-02 18:45:08
山東小廠造出21米鋼環(huán),焊縫沒了,西方慌了,全球規(guī)則悄悄改了!

山東小廠造出21米鋼環(huán),焊縫沒了,西方慌了,全球規(guī)則悄悄改了!

達(dá)文西看世界
2026-02-25 21:26:51
2023年,985女碩士王懿在東京活活餓死,父母拒絕為其收尸

2023年,985女碩士王懿在東京活活餓死,父母拒絕為其收尸

談史論天地
2026-02-18 17:45:40
煮湯圓,有人用開水,用冷水!廚師長(zhǎng):都不對(duì),教您做法,不粘鍋

煮湯圓,有人用開水,用冷水!廚師長(zhǎng):都不對(duì),教您做法,不粘鍋

阿龍美食記
2026-02-23 17:09:09
你祖上有啥很大的機(jī)緣轉(zhuǎn)折點(diǎn)?網(wǎng)友:但凡發(fā)生一下改變,就沒你了

你祖上有啥很大的機(jī)緣轉(zhuǎn)折點(diǎn)?網(wǎng)友:但凡發(fā)生一下改變,就沒你了

帶你感受人間冷暖
2026-02-13 15:23:12
7場(chǎng)造7球!3500萬歐元買來邊路最強(qiáng)爆點(diǎn),馬競(jìng)冬窗撿漏非洲先生

7場(chǎng)造7球!3500萬歐元買來邊路最強(qiáng)爆點(diǎn),馬競(jìng)冬窗撿漏非洲先生

體壇老球迷
2026-02-25 16:10:13
春節(jié)假期結(jié)束一天,鹿哈官宣得女,感謝了鹿晗,曾7個(gè)月賺3500萬

春節(jié)假期結(jié)束一天,鹿哈官宣得女,感謝了鹿晗,曾7個(gè)月賺3500萬

叨嘮
2026-02-25 16:37:17
眾多元帥中毛主席為何喜歡陳毅?陳毅身上這5大優(yōu)點(diǎn),換誰都喜歡

眾多元帥中毛主席為何喜歡陳毅?陳毅身上這5大優(yōu)點(diǎn),換誰都喜歡

南書房
2026-02-26 07:50:04
美國(guó)記者批谷愛凌傲慢,TNT著名主持回?fù)?憑什么要對(duì)成就故作謙虛

美國(guó)記者批谷愛凌傲慢,TNT著名主持回?fù)?憑什么要對(duì)成就故作謙虛

硯底沉香
2026-02-25 21:18:04
前國(guó)乒情侶擦肩而過!陳幸同與周啟豪互相無視 分手后不能做朋友

前國(guó)乒情侶擦肩而過!陳幸同與周啟豪互相無視 分手后不能做朋友

念洲
2026-02-26 08:34:03
2026-02-26 13:03:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12204文章數(shù) 176394關(guān)注度
往期回顧 全部

科技要聞

單季營(yíng)收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

特朗普自詡開啟美國(guó)"黃金時(shí)代" 遭美媒集體"打臉"

頭條要聞

特朗普自詡開啟美國(guó)"黃金時(shí)代" 遭美媒集體"打臉"

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財(cái)經(jīng)要聞

短劇市場(chǎng)風(fēng)云突變!有人投百萬賠得精光

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

房產(chǎn)
親子
家居
時(shí)尚
本地

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價(jià)比標(biāo)桿 海墾·桃花源實(shí)景現(xiàn)房春節(jié)被瘋搶

親子要聞

產(chǎn)后第一周:身體發(fā)出的5個(gè)“正常信號(hào)”,新手媽媽請(qǐng)收藏!

家居要聞

歸隱于都市 慢享自由

倫敦時(shí)裝周|2026秋冬流行趨勢(shì)早知道

本地新聞

津南好·四時(shí)總相宜

無障礙瀏覽 進(jìn)入關(guān)懷版