国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

直擊科學計算與設(shè)計痛點,跨學科推理統(tǒng)一基座模型SciReasoner

0
分享至



作者 | 論文團隊

編輯 | ScienceAI

面對多模態(tài)、跨尺度、強約束的科研問題,通用 LLM 正從「工具」升級為「合作者」。

來自上海人工智能實驗室等機構(gòu)的研究團隊提出了一款為科學數(shù)據(jù)「讀 — 思 — 設(shè)」而生的統(tǒng)一科學基座模型:以更完整的科學數(shù)據(jù)基座、更系統(tǒng)的訓練日程與更可驗證的推理機制,直擊科學計算與設(shè)計痛點。



  • 論文:https://arxiv.org/pdf/2509.21320
  • 數(shù)據(jù)集:https://huggingface.co/SciReason
  • 模型:https://huggingface.co/SciReason
  • 代碼:https://github.com/open-sciencelab/SciReason

它有三點最值得關(guān)注:

  • 覆蓋更廣:統(tǒng)一 I/O 與「任務分組獎勵」讓單一骨干跨化學 / 生命 / 材料等多領(lǐng)域;
  • 可驗證性更強:從數(shù)據(jù)標注到思維鏈再到 RL 獎勵全面「科學化」,強調(diào)度量統(tǒng)一與工具可復核;
  • 工程更到位:明確的數(shù)據(jù)配比、訓練日程與算力規(guī)模,保證性能與可復現(xiàn)性。

更重要的是,這不是「做題型」模型的又一次包裝:它以 206B 級多學科科學數(shù)據(jù)為基礎(chǔ),覆蓋科學文本、純科學序列(DNA/RNA/ 蛋白 / SMILES)、科學序列 — 文本 / 科學序列 — 科學序列成對數(shù)據(jù),并在此之上統(tǒng)一建模、統(tǒng)一標注、統(tǒng)一度量,讓「讀 — 思 — 設(shè)」閉環(huán)可以被數(shù)據(jù)真實地驅(qū)動與校核。

科學數(shù)據(jù)「讀 — 思 — 設(shè)」專精的基座模型

這是一套統(tǒng)一的科學推理基座:在 206B 級跨學科科學語料與數(shù)據(jù)上預訓練,隨后經(jīng)「三段式」對齊 —— 大規(guī)模指令微調(diào)(≈4000 萬樣本)、退火式冷啟動(誘導長鏈思維)、以及引入任務分組與連續(xù)化科學獎勵的強化學習(DAPO)—— 把自然語言與異構(gòu)科學表示(DNA/RNA/ 蛋白、分子 SMILES、材料結(jié)構(gòu)與文本等)深度對齊,覆蓋從文本?科學格式互譯、知識 / 要素抽取、性質(zhì)預測 / 分類到序列生成與可約束設(shè)計在內(nèi)的完整工作流,單模型覆蓋 5 大能力,共 103 個子任務。



與「做題型模型」的區(qū)別:

  • 題庫式 / 考試式模型:以高等教育考題數(shù)據(jù)為基礎(chǔ),側(cè)重少量文本問答與模板化推導,缺少多表示科學數(shù)據(jù)(序列、符號、結(jié)構(gòu))的一致編碼與可逆互譯,無法直達科學研究一線。
  • 本模型 SciReasoner:以「文本+純序列+序列 — 文本 / 序列 — 序列配對」的 AI-ready 科學數(shù)據(jù)做預訓練母體;在后訓練階段統(tǒng)一 I/O 模式、統(tǒng)一標簽域(如
  • ),并以物理 / 化學一致性的專業(yè)工具校驗獎勵和連續(xù)化獎勵作為優(yōu)化目標,確保推理與設(shè)計可被數(shù)據(jù)與度量反向約束。

三大方法學亮點

1)自適應科學推理(Adaptive Scientific Reasoning)

模型區(qū)分「即時型(instant)」與「思考型(thinking)」兩類任務:前者保留直接答案監(jiān)督,后者用思維鏈數(shù)據(jù)全量替換,確保在真正需要多步推理時給出連貫可查的理由,而簡單任務保持高效直答。進一步的實證結(jié)論:在任務級別進行「思維鏈替換」優(yōu)于在同一任務內(nèi)混配 CoT 與非 CoT 目標,避免風格 / 長度不一致帶來的校準偏移。

2)任務分組獎勵(Task Grouped Rewarding)

將科學任務劃分為距離度量型(數(shù)值預測)、匹配度量型(檢索 / 抽取)與專業(yè)工具校驗型三類,分別設(shè)計可比的質(zhì)量度量與優(yōu)勢估計,提升跨任務的泛化與魯棒性。

3)科學獎勵「軟化」(Scientific Reward Softening)

把原本難以優(yōu)化的 0/1 正確性信號,統(tǒng)一映射為 [0,1] 的連續(xù)獎勵(如把 BERTScore、RMSE 等標準量規(guī)規(guī)范化),顯著改善復雜科學推理任務的收斂性與性能提升。



覆蓋「全?!箍茖W智能

  • 五大能力家族:①文本?科學表示的雙向翻譯;②文本 / 知識抽?。虎坌再|(zhì)回歸預測;④性質(zhì)分類;⑤序列生成與設(shè)計 —— 任務總量涵蓋至 103 類。
  • 縱向?qū)Ρ龋涸?54 項任務上拿到 SOTA,并在 101 項任務里名列前二,顯示統(tǒng)一骨干在跨學科遷移與端到端工作流覆蓋上的優(yōu)勢。
  • 典型任務覆蓋:分子表征互譯(SMILES?IUPAC/Formula)、分子描述 / 圖說、蛋白功能翻譯、跨模態(tài)知識抽取到材料 / 生物 / 化學性質(zhì)預測與分類,再到約束可控的序列與材料 / 分子設(shè)計,強調(diào)「可逆性、守恒性、可檢驗性」的科學語義保真。



能落地到哪些場景

  • 藥物與分子設(shè)計:以性質(zhì)回歸 / 分類為「篩」,可控序列 / 分子生成為「設(shè)」,工具校驗與知識檢索為「評」,構(gòu)成「篩 — 設(shè) — 評」的可迭代數(shù)據(jù)閉環(huán),降低無效合成與實驗成本。
  • 蛋白 / 核酸工程:從功能 / 本體描述與信息抽取,到穩(wěn)定性 / 可溶性等屬性預測,再到定向序列設(shè)計,兼顧規(guī)則約束與可達性。
  • 材料科學:圍繞文本 — 結(jié)構(gòu) — 數(shù)值三證據(jù)鏈開展性質(zhì)回歸 / 分類與候選篩選,適配主流數(shù)據(jù)庫字段與口徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
《尋秦記》重聚尬到腳趾摳地!郭羨妮發(fā)腮,宣萱油膩,滕麗名土氣

《尋秦記》重聚尬到腳趾摳地!郭羨妮發(fā)腮,宣萱油膩,滕麗名土氣

八斗小先生
2025-12-23 23:43:56
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

燦若銀爛
2025-12-25 13:06:29
韓寒賽車喜劇電影《飛馳人生3》定檔2026年春節(jié)

韓寒賽車喜劇電影《飛馳人生3》定檔2026年春節(jié)

IT之家
2025-12-26 11:14:50
前央視主持人劉芳菲直播訪談龐萊臣后人,結(jié)果龐叔令聲明其為假冒

前央視主持人劉芳菲直播訪談龐萊臣后人,結(jié)果龐叔令聲明其為假冒

總在茶余后
2025-12-25 22:39:22
中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個

中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個

博覽歷史
2025-12-26 06:40:03
90年我當獸醫(yī),我趕公豬給寡婦家的母豬配種沒配上,被她強留一周

90年我當獸醫(yī),我趕公豬給寡婦家的母豬配種沒配上,被她強留一周

燕無衣
2024-09-06 08:10:05
帕金斯:雷迪克公開抨擊球員可愛又好笑,他總歸咎于別人

帕金斯:雷迪克公開抨擊球員可愛又好笑,他總歸咎于別人

懂球帝
2025-12-26 15:49:07
從今天起,中國不再需要日本道歉!這覺醒,來自3500萬亡魂的重量

從今天起,中國不再需要日本道歉!這覺醒,來自3500萬亡魂的重量

科普100克克
2025-11-30 21:24:29
余華:我為什么討厭魯迅 (深度好文)

余華:我為什么討厭魯迅 (深度好文)

尚曦讀史
2025-11-28 09:51:13
烤雞少年"底褲被扒光",肉寶王只是冰山一角,李維剛也坐不住了

烤雞少年"底褲被扒光",肉寶王只是冰山一角,李維剛也坐不住了

鋭娛之樂
2025-12-25 08:33:43
冬至過后,遇到此菜別錯過,失眠怕它,常吃一覺睡到天亮

冬至過后,遇到此菜別錯過,失眠怕它,常吃一覺睡到天亮

江江食研社
2025-12-25 14:30:03
就差點名了!雷迪克賽后點出輸球原因:籃板很軟,讓裁判左右情緒

就差點名了!雷迪克賽后點出輸球原因:籃板很軟,讓裁判左右情緒

你的籃球頻道
2025-12-26 12:45:44
茅臺1月1日,起發(fā)動閃電五連鞭:讓每個人喝得起普通茅臺酒

茅臺1月1日,起發(fā)動閃電五連鞭:讓每個人喝得起普通茅臺酒

時尚的弄潮
2025-12-26 12:58:27
女子遭閨蜜和丈夫雙重背叛:求閨蜜放過被拉黑,一夜白頭要追責

女子遭閨蜜和丈夫雙重背叛:求閨蜜放過被拉黑,一夜白頭要追責

江山揮筆
2025-12-26 08:17:32
中國各省地圖像什么?來看看你的家鄉(xiāng)

中國各省地圖像什么?來看看你的家鄉(xiāng)

譚老師地理大課堂
2025-12-25 18:12:15
滬指,還是8連陽了!11:13,全市場為何同步跳水?

滬指,還是8連陽了!11:13,全市場為何同步跳水?

每經(jīng)牛眼
2025-12-26 15:26:22
美國提醒日本,小心被中國揍,日本天皇急召高市早苗,有要事交代

美國提醒日本,小心被中國揍,日本天皇急召高市早苗,有要事交代

墨印齋
2025-12-25 15:04:35
2026年,幼兒園關(guān)停潮已經(jīng)來了

2026年,幼兒園關(guān)停潮已經(jīng)來了

沒有偏旁的常慶
2025-12-26 08:14:36
1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

1962年雷鋒因公殉職,41年后調(diào)查人員揭露真相,令人淚目!

抽象派大師
2025-12-22 01:46:01
中緬泰聯(lián)合清剿KK園區(qū),汪文斌發(fā)文呼吁,應倍加珍惜中柬鐵桿友誼

中緬泰聯(lián)合清剿KK園區(qū),汪文斌發(fā)文呼吁,應倍加珍惜中柬鐵桿友誼

南宮一二
2025-12-26 11:32:07
2025-12-26 16:20:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1191文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

日本領(lǐng)導人被指或參拜靖國神社 外交部回應

頭條要聞

日本領(lǐng)導人被指或參拜靖國神社 外交部回應

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天深夜道歉,只字未提五月天阿信

財經(jīng)要聞

資管江湖的人事“寒冬”

汽車要聞

速來!智界在上海西岸準備了年末潮流盛典

態(tài)度原創(chuàng)

健康
本地
時尚
房產(chǎn)
公開課

這些新療法,讓化療不再那么痛苦

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

普通人如何“偷偷”變美?她的4個微習慣很好抄

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版