国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

邁向AI4S 2.0,書生Intern-S1-Pro萬億MoE科學(xué)大模型開源

0
分享至


始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū),始終堅(jiān)持“中立、開放、共建、共創(chuàng)、合作”五項(xiàng)基本原則,歡迎加入共同成長。

2月4日,上海人工智能實(shí)驗(yàn)室開源基于“通專融合”技術(shù)架構(gòu)SAGE打造的萬億參數(shù)科學(xué)多模態(tài)大模型 Intern-S1-Pro,為AI4S從“工具革命”的1.0階段邁向以“革命的工具”驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)的2.0時(shí)代,提供創(chuàng)新的系統(tǒng)性開源基座。

作為當(dāng)前全球開源社區(qū)中參數(shù)規(guī)模最大的科學(xué)多模態(tài)模型,Intern-S1-Pro的核心科學(xué)能力實(shí)現(xiàn)了質(zhì)的躍升,高難度綜合學(xué)科評(píng)測穩(wěn)居AI4S領(lǐng)域國際領(lǐng)先水平,復(fù)雜數(shù)理邏輯推理能力達(dá)奧賽金牌水平,面向真實(shí)科研流程的智能體能力位居開源模型第一梯隊(duì)。

此次發(fā)布的Intern-S1-Pro是通過SAGE實(shí)現(xiàn) “可深度專業(yè)化通用模型” 的關(guān)鍵實(shí)踐。該模型基于混合專家架構(gòu)(MoE),共擁有512個(gè)專家,總參數(shù)達(dá)1T,每次調(diào)用僅激活8個(gè)專家、22B參數(shù)。其通用能力和科學(xué)能力協(xié)同演進(jìn),并在底層架構(gòu)實(shí)現(xiàn)了兩大核心突破:在SAGE的基礎(chǔ)模型層,通過引入傅里葉位置編碼①并重構(gòu)時(shí)序編碼器,賦予模型統(tǒng)一理解從微觀生命信號(hào)到宏觀宇宙波動(dòng)的“物理直覺”;通過高效路由機(jī)制,系統(tǒng)攻克了訓(xùn)練萬億參數(shù)MoE模型在穩(wěn)定性與算力效率上的瓶頸,為超大規(guī)模模型的訓(xùn)練提供了關(guān)鍵的工程基礎(chǔ)。

與此同時(shí),Intern-S1-Pro驗(yàn)證了從原創(chuàng)模型架構(gòu)到國產(chǎn)算力基座自主技術(shù)的完整鏈路,為構(gòu)建開放共享的AGI4S基礎(chǔ)設(shè)施奠定了堅(jiān)實(shí)底座。通過開源開放,Intern-S1-Pro旨在降低全球科研門檻,與學(xué)術(shù)界和產(chǎn)業(yè)界共同推動(dòng)以通用人工智能驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)的范式革命。模型已經(jīng)發(fā)布在始智AI wisemodel開源社區(qū),應(yīng)用空間(wisemodel.cn/apps也將可以直接在線體驗(yàn),歡迎前往了解和嘗試。


模型地址

https://wisemodel.cn/models/Intern/Intern-S1-Pro


01.

創(chuàng)新底層架構(gòu):

突破萬億參數(shù)科學(xué)模型邊界

上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家周伯文提出:可深度專業(yè)化通用模型(Specializable Generalist)是實(shí)現(xiàn)AGI的可行路徑,其關(guān)鍵挑戰(zhàn)在于:專家化模型在訓(xùn)練過程中需要低成本、能規(guī)模化的密集反饋;能夠持續(xù)不斷地學(xué)習(xí)與主動(dòng)探索,并具備為同一個(gè)問題提供多視角、多種解決方案的能力;并能引入對(duì)物理世界規(guī)律的考量,兼顧多項(xiàng)差異化能力的學(xué)習(xí)效率與性能。

Intern-S1-Pro通過多項(xiàng)SAGE基礎(chǔ)模型層的技術(shù)創(chuàng)新,拓寬了模型應(yīng)用邊界、提升了超大規(guī)模訓(xùn)練可行性,推進(jìn)了可深度專業(yè)化通用模型的探索。

為構(gòu)建能更深層次理解物理世界規(guī)律的科學(xué)大模型,研究團(tuán)隊(duì)引入了傅里葉位置編碼(FoPE)重構(gòu)時(shí)序編碼器。FoPE為AI賦予雙重視角:既能像看“粒子”一樣捕捉文字之間的相對(duì)距離,又能像分析“波”一樣把握科學(xué)信號(hào)的整體規(guī)律與頻率??茖W(xué)數(shù)據(jù)與語言的差異還體現(xiàn)在多尺度上,基于能自動(dòng)適應(yīng)數(shù)據(jù)密度的時(shí)序編碼器,模型首次能統(tǒng)一處理從寥寥數(shù)個(gè)到百萬級(jí)采樣的各類信號(hào),支持的分析對(duì)象從天文、地理直接拓展至生理信號(hào)、生物聲學(xué)等領(lǐng)域,從而實(shí)現(xiàn)感知能力的重大躍遷。

為了高效訓(xùn)練承載這些能力的萬億參數(shù)超大規(guī)模模型,研究團(tuán)隊(duì)革新了其內(nèi)部的“路由機(jī)制”。傳統(tǒng)方法存在訓(xùn)練低效和算力浪費(fèi)兩大痛點(diǎn)。新技術(shù)通過 “路由稠密估計(jì)” ,讓模型在高效運(yùn)行的同時(shí)能進(jìn)行更充分的學(xué)習(xí),提升了穩(wěn)定性;進(jìn)而通過 “分組路由”策略,像智能交通系統(tǒng)一樣使海量計(jì)算芯片實(shí)現(xiàn)負(fù)載均衡,避免了資源閑置。通過算法與系統(tǒng)的協(xié)同創(chuàng)新,同時(shí)攻克了超大規(guī)模模型訓(xùn)練在“學(xué)習(xí)效率”和“資源調(diào)度”上的核心瓶頸,為高效、穩(wěn)健地訓(xùn)練下一代萬億參數(shù)模型提供了關(guān)鍵基礎(chǔ)。

通過上述底層架構(gòu)的創(chuàng)新,Intern-S1-Pro不僅在規(guī)模上刷新了科學(xué)多模態(tài)模型的參數(shù)規(guī)模上限,也為SAGE架構(gòu)所提出的“通用能力與專業(yè)能力協(xié)同演進(jìn)”提供了可落地的實(shí)現(xiàn)路徑。

02.

科學(xué)能力再進(jìn)化,通用能力協(xié)同演進(jìn)

得益于創(chuàng)新的底層架構(gòu)設(shè)計(jì)與萬億參數(shù)超大規(guī)模訓(xùn)練策略,Intern-S1-Pro的科學(xué)能力進(jìn)一步升級(jí)。

在國際數(shù)學(xué)奧林匹克IMO-Answer-Bench和國際物理奧林匹克IPhO2025兩大權(quán)威基準(zhǔn)測試中,Intern-S1-Pro均展現(xiàn)出競賽級(jí)別的解題能力。

在AI4S關(guān)鍵垂類領(lǐng)域,Intern-S1-Pro成功構(gòu)建了一個(gè)跨越化學(xué)、材料、生命、地球、物理五大核心學(xué)科的全譜系能力矩陣,涵蓋100多個(gè)專業(yè)子任務(wù),不僅在Mol-Instruction、Biology-Instruction等單學(xué)科垂類評(píng)測中表現(xiàn)優(yōu)異,更在SciReasoner等高難度的綜合學(xué)科評(píng)測基準(zhǔn)中,取得了與閉源商業(yè)大模型及垂類SOTA模型相當(dāng),甚至更優(yōu)的成績,穩(wěn)居AI4S領(lǐng)域的第一梯隊(duì)。

在基礎(chǔ)理解維度,Intern-S1-Pro基于高精度多模態(tài)感知能力,能夠精準(zhǔn)解析復(fù)雜的分子結(jié)構(gòu)圖及各類實(shí)驗(yàn)圖表,深入到邏輯推理層面 ,Intern-S1-Pro能夠處理高階科學(xué)問答,如反應(yīng)條件推斷、理化性質(zhì)預(yù)測,精準(zhǔn)捕捉數(shù)據(jù)背后的因果規(guī)律等。隨著理解與推理能力的持續(xù)增強(qiáng),Intern-S1-Pro的能力邊界不斷向真實(shí)科研場景延伸,其應(yīng)用范圍從微觀層面的化學(xué)逆合成、蛋白質(zhì)序列生成,拓展至宏觀尺度的遙感圖像分析等復(fù)雜任務(wù)。通過XLRS-Bench等真實(shí)科研場景評(píng)測,模型展現(xiàn)出從“解題”邁向“解決問題”的科研生產(chǎn)力價(jià)值,為前沿科學(xué)探索提供了堅(jiān)實(shí)支撐。

同時(shí),借助通專融合技術(shù)路線,Intern-S1-Pro在通用能力與專業(yè)科學(xué)能力上實(shí)現(xiàn)協(xié)同進(jìn)階:在圖文跨模態(tài)理解、科學(xué)圖表邏輯推理、多場景視覺感知,以及高質(zhì)量自然語言生成和復(fù)雜指令精準(zhǔn)遵循等核心維度,Intern-S1-Pro均穩(wěn)居開源模型陣營第一梯隊(duì),展現(xiàn)出扎實(shí)而全面的綜合實(shí)力。

通過通專融合的訓(xùn)練策略,Intern-S1-Pro不僅補(bǔ)齊了傳統(tǒng)前沿模型在專業(yè)推理上的短板,還實(shí)現(xiàn)了多模態(tài)與文本通用能力的均衡發(fā)展,真正將通用能力與專業(yè)科學(xué)能力的協(xié)同演進(jìn)落到實(shí)處,為科研場景下復(fù)雜問題的理解、推理與應(yīng)用提供了可靠支撐。

在智能體能力方面,Intern-S1-Pro實(shí)現(xiàn)了從“靜態(tài)任務(wù)規(guī)劃”到“動(dòng)態(tài)環(huán)境交互”的跨越式進(jìn)階。在以動(dòng)態(tài)環(huán)境與復(fù)雜交互為核心的Tau-2評(píng)測中達(dá)到了國際一流水平,為賦能復(fù)雜科學(xué)智能體打下了堅(jiān)實(shí)基礎(chǔ)。

03.

筑牢“算力-算法”一體化基座

在規(guī)模、性能提升的同時(shí),Intern-S1-Pro構(gòu)建了原創(chuàng)的“算力-算法”一體化基座。模型從架構(gòu)設(shè)計(jì)之初,便與昇騰計(jì)算生態(tài)確立聯(lián)合研發(fā)路線,實(shí)現(xiàn)了從最底層的算子、編譯優(yōu)化到上層的訓(xùn)練、推理框架的深度全棧適配。

研發(fā)團(tuán)隊(duì)攻克了大規(guī)模訓(xùn)練中精度對(duì)齊、超長序列強(qiáng)化學(xué)習(xí)穩(wěn)定性、硬件性能極致釋放等一系列核心技術(shù)難題,基于XTuner V1訓(xùn)練框架的精細(xì)優(yōu)化與LMDeploy推理引擎的高效部署,結(jié)合先進(jìn)的內(nèi)存管理與并行策略,確保了萬億參數(shù)模型訓(xùn)練的高效與穩(wěn)定。通過創(chuàng)新的全異步強(qiáng)化學(xué)習(xí)框架等技術(shù)的應(yīng)用,大幅提升了訓(xùn)練效率,降低了研發(fā)成本與門檻,此外,Intern-S1-Pro還與沐曦聯(lián)合研發(fā)利用模型加速算子適配,為開放共享、面向未來的AGI4S基礎(chǔ)設(shè)施奠定了堅(jiān)實(shí)基礎(chǔ)。

04.

高質(zhì)量開源賦能創(chuàng)新生態(tài)

自2023年書生大模型首次發(fā)布以來,上海AI實(shí)驗(yàn)室已逐步構(gòu)建起豐富的書生大模型家族,包括科學(xué)多模態(tài)模型Intern-S1、大語言模型書生·浦語InternLM、多模態(tài)模型書生·萬象InternVL、強(qiáng)推理模型書生·思客InternThinker等。同時(shí)首創(chuàng)并開源了面向大模型研發(fā)與應(yīng)用的全鏈路開源工具體系,覆蓋數(shù)據(jù)處理、預(yù)訓(xùn)練、微調(diào)、部署、評(píng)測與應(yīng)用等關(guān)鍵環(huán)節(jié),包含訓(xùn)練框架XTuner、部署推理框架LMDeploy、評(píng)測框架OpenCompass、高效文檔解析工具M(jìn)inerU,以及思索式AI搜索應(yīng)用MindSearch等在內(nèi)的核心工具已全面開源,大部分也都同步發(fā)布在wisemodel開源社區(qū),形成覆蓋數(shù)十萬開發(fā)者參與的活躍開源社區(qū)。

自發(fā)布以來,Intern-S1多次登頂HuggingFace全球多模態(tài)榜單,累計(jì)下載超41萬次,并獲得近200家科研機(jī)構(gòu)和企業(yè)的合作申請(qǐng)。其卓越的跨模態(tài)科學(xué)理解能力不僅為科研提供了高效工具,也通過開源降低了全球科研團(tuán)隊(duì)邁入AGI for Science的門檻。未來,在研究范式創(chuàng)新及模型能力提升的基礎(chǔ)上,上海AI實(shí)驗(yàn)室將推進(jìn)Intern-S1及其全鏈條工具體系持續(xù)開源,支持免費(fèi)商用,同時(shí)提供線上開放服務(wù),與全球合作伙伴共建更加開放、高效的科學(xué)AI生態(tài)。

案例展示:

----- END -----


wisemodel相關(guān):

系列模型:


關(guān)于wisemodel更多


1

歡迎持續(xù)關(guān)注和支持

開源社區(qū)建設(shè)需要長期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計(jì)劃和開源共創(chuàng)計(jì)劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請(qǐng)加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動(dòng)態(tài)。

2

歡迎加盟wisemodel開源社區(qū)

3

歡迎投稿優(yōu)質(zhì)內(nèi)容

歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵(lì)高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個(gè)人等,在wisemodel平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關(guān)于wisemodel開源社區(qū)

始智AI wisemodel.cn開源社區(qū)由清華校友總會(huì)AI大數(shù)據(jù)專委會(huì)副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高??蒲性核?、大型互聯(lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個(gè)人開發(fā)者,以及政府部門、學(xué)會(huì)協(xié)會(huì)、聯(lián)盟、基金會(huì)等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。

向上滑動(dòng)查看

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一代香港美人,感覺不是很開心的樣子,大家還記得她的名字嗎?

一代香港美人,感覺不是很開心的樣子,大家還記得她的名字嗎?

動(dòng)物奇奇怪怪
2026-03-26 08:35:16
石油危機(jī)一旦爆發(fā),房子、現(xiàn)金、股票、黃金誰最危險(xiǎn)?

石油危機(jī)一旦爆發(fā),房子、現(xiàn)金、股票、黃金誰最危險(xiǎn)?

蜉蝣說
2026-03-26 16:52:10
FIFA系列賽新規(guī):比賽需決出勝負(fù) 打平將互射點(diǎn)球

FIFA系列賽新規(guī):比賽需決出勝負(fù) 打平將互射點(diǎn)球

體壇周報(bào)
2026-03-26 15:53:18
男女約會(huì)隱秘又安全的12個(gè)地方,有6個(gè)場合你根本想不到

男女約會(huì)隱秘又安全的12個(gè)地方,有6個(gè)場合你根本想不到

聰明小石頭
2026-03-21 09:13:42
馬英九專訪中途喊停,原因曝光

馬英九專訪中途喊停,原因曝光

郭茂辰海峽傳真
2026-03-26 21:32:49
張雪峰女兒張姩菡發(fā)文:我不想哭,但眼淚止不住,我沒有得到父愛

張雪峰女兒張姩菡發(fā)文:我不想哭,但眼淚止不住,我沒有得到父愛

爆笑大聰明阿衿
2026-03-26 20:48:48
哪吒汽車破產(chǎn)覆滅,最諷刺的不是200億債務(wù),而是這個(gè)名字本身

哪吒汽車破產(chǎn)覆滅,最諷刺的不是200億債務(wù),而是這個(gè)名字本身

蜉蝣說
2026-03-25 10:54:58
新加坡預(yù)測:印度將趕中超美!美印爭世界老大,中國將成新阿三

新加坡預(yù)測:印度將趕中超美!美印爭世界老大,中國將成新阿三

荷蘭豆愛健康
2026-03-26 08:26:08
吳柳芳:我本不想跳擦邊!被管晨辰指責(zé)后失去收入 直播1年賺40萬

吳柳芳:我本不想跳擦邊!被管晨辰指責(zé)后失去收入 直播1年賺40萬

念洲
2026-03-26 13:14:22
流量退去之后|南京“10元手沖咖啡”阿姨:火過,就很滿足

流量退去之后|南京“10元手沖咖啡”阿姨:火過,就很滿足

澎湃新聞
2026-03-26 07:06:31
成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

許三歲
2026-03-17 07:34:05
一口氣刷完全集,Netflix新劇又殺瘋了

一口氣刷完全集,Netflix新劇又殺瘋了

來看美劇
2026-03-26 19:45:54
20億美元還不夠!中企對(duì)巴拿馬索賠漲價(jià),巴政府內(nèi)部已經(jīng)亂套了

20億美元還不夠!中企對(duì)巴拿馬索賠漲價(jià),巴政府內(nèi)部已經(jīng)亂套了

悄悄史話
2026-03-26 14:09:05
新華社消息|伊朗官員:美以襲擊已造成伊朗至少1750人死亡

新華社消息|伊朗官員:美以襲擊已造成伊朗至少1750人死亡

新華社
2026-03-26 10:06:18
洛克希德·馬?。簩⒕_打擊導(dǎo)彈產(chǎn)量提升四倍

洛克希德·馬?。簩⒕_打擊導(dǎo)彈產(chǎn)量提升四倍

財(cái)聯(lián)社
2026-03-25 19:18:36
曝張雪峰在蘇州舉辦葬禮,生前最后一次直播,趴桌子上身體已不適

曝張雪峰在蘇州舉辦葬禮,生前最后一次直播,趴桌子上身體已不適

180視角
2026-03-25 16:58:57
斯柯達(dá)將退出中國,大眾中國回應(yīng)

斯柯達(dá)將退出中國,大眾中國回應(yīng)

第一財(cái)經(jīng)資訊
2026-03-26 15:14:56
曼城115項(xiàng)指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

曼城115項(xiàng)指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

樂道足球
2026-03-26 19:55:49
拉里賈尼繼任者不到一天被殺,川普加派82空降師開赴中東

拉里賈尼繼任者不到一天被殺,川普加派82空降師開赴中東

移光幻影
2026-03-26 09:56:37
李幼平同志逝世

李幼平同志逝世

澎湃新聞
2026-03-26 18:05:03
2026-03-27 00:24:49
wisemodel開源社區(qū) incentive-icons
wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū),打造中國版“huggingface”
466文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
本地
游戲
藝術(shù)
軍事航空

親子要聞

看看把孩子嚇得哈哈哈

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

"死亡擱淺"外骨骼來了!小島工作室轉(zhuǎn)發(fā)聯(lián)名 原度拉滿

藝術(shù)要聞

哪一座橋不是風(fēng)景?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版