国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

國內(nèi)量化圈的第二個(gè)AI選手來了,開源模型代碼跑分超 GPT-5.1

0
分享至

2026 年開年,國內(nèi)量化私募九坤投資創(chuàng)始團(tuán)隊(duì)旗下的至知研究院(IQuest Research)發(fā)布了首代開源代碼大模型系列 IQuest-Coder-V1。

這家研究機(jī)構(gòu)聲稱,其 40B 參數(shù)的旗艦?zāi)P驮?SWE-bench Verified 基準(zhǔn)測(cè)試中拿下了 81.4%的成績,超越了 Claude Sonnet 4.5 的 77.2%和 GPT-5.1 的 76.3%。模型已在 GitHub 和 Hugging Face 上全面開源,涵蓋 7B、14B、40B 三種參數(shù)規(guī)模,以及標(biāo)準(zhǔn)版和 Loop 變體。


圖丨IQuest-Coder-V1的架構(gòu)(來源:GitHub)

至知研究院由九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起設(shè)立,定位為獨(dú)立于量化投研體系的 AI 研究平臺(tái)。

九坤本身是國內(nèi)最早將深度學(xué)習(xí)大規(guī)模應(yīng)用于量化投資的機(jī)構(gòu)之一,2020 年投資過億建成 AI 超算集群“北溟”,旗下三大實(shí)驗(yàn)室長期從事數(shù)據(jù)、算法和交易執(zhí)行研究。繼幻方量化孵化出 DeepSeek 之后,這是又一家從量化圈走出來的 AI 研究力量。

IQuest-Coder-V1 技術(shù)報(bào)告中最值得關(guān)注的是 Code-Flow 訓(xùn)練范式對(duì) commit 演化數(shù)據(jù)的利用。傳統(tǒng)代碼模型基于靜態(tài)代碼文件訓(xùn)練,相當(dāng)于讓模型看一堆代碼快照。IQuest-Coder 的做法不同:它試圖讓模型學(xué)習(xí)代碼倉庫的演化軌跡——不只是代碼長什么樣,還要學(xué)習(xí)代碼是怎么一步步改出來的。

具體來說,他們?yōu)槊總€(gè)代碼倉庫構(gòu)建了形如(R_old, P, R_new)的三元組訓(xùn)練數(shù)據(jù)。R_old 代表項(xiàng)目在某個(gè)穩(wěn)定開發(fā)階段的代碼狀態(tài),P 是捕捉兩個(gè)狀態(tài)差異的 Patch 信息(即 commit 變更),R_new 則是迭代后的新狀態(tài)。

選取起點(diǎn)時(shí)有個(gè)講究:他們避開了項(xiàng)目早期不穩(wěn)定的探索性代碼和后期碎片化的維護(hù)性修改,專門聚焦于項(xiàng)目生命周期 40%到 80%區(qū)間的“成熟期”。理由是這個(gè)階段的代碼庫相對(duì)穩(wěn)定,變更模式更能反映真實(shí)的軟件開發(fā)邏輯。

這個(gè)思路有一定道理。程序員在修 bug 或加新功能時(shí),腦子里轉(zhuǎn)的不是“這段代碼是什么”,而是“這段代碼要從什么狀態(tài)變成什么狀態(tài)”。

Commit 記錄天然包含了這種“變更意圖”——為什么改、改了哪里、改完之后整體結(jié)構(gòu)如何調(diào)整。如果模型能從大量 commit 歷史中學(xué)到這種模式,理論上應(yīng)該比只看靜態(tài)代碼更擅長理解“怎么改代碼”。

這也解釋了為什么 IQuest-Coder 在 SWE-bench 這類需要生成 patch 修復(fù) issue 的任務(wù)上表現(xiàn)突出——任務(wù)形式本身就和訓(xùn)練數(shù)據(jù)的結(jié)構(gòu)高度吻合。技術(shù)報(bào)告中提到的一個(gè)發(fā)現(xiàn)印證了這點(diǎn):倉庫演化數(shù)據(jù)(repository transition data)在任務(wù)規(guī)劃能力上提供了比靜態(tài)快照更好的訓(xùn)練信號(hào)。


圖丨研究團(tuán)隊(duì)展示的太陽系模擬示例(來源:IQuest Lab)

預(yù)訓(xùn)練階段,IQuest-Coder 先用通用數(shù)據(jù)和代碼數(shù)據(jù)打底,隨后用高質(zhì)量代碼語料進(jìn)行退火(Annealing)。這部分比較常規(guī)。中間訓(xùn)練階段則分兩期進(jìn)行:他們?cè)?32K 上下文長度下注入了推理數(shù)據(jù)、Agent 軌跡和代碼數(shù)據(jù)的混合,隨后將上下文擴(kuò)展到 128K,加入倉庫級(jí)的長序列樣本。

Agent 軌跡數(shù)據(jù)包含完整的“行動(dòng)-觀察-修正”循環(huán)——命令執(zhí)行、日志輸出、錯(cuò)誤信息、測(cè)試結(jié)果等環(huán)境反饋。技術(shù)報(bào)告的說法是,推理數(shù)據(jù)提供符號(hào)層面的邏輯腳手架,Agent 軌跡則提供“閉環(huán)智能”,讓模型學(xué)會(huì)根據(jù)環(huán)境反饋調(diào)整行為。他們聲稱在高質(zhì)量代碼退火之后、后訓(xùn)練之前注入這類數(shù)據(jù),能在分布偏移下穩(wěn)定模型性能。

后訓(xùn)練階段分成兩條路徑:Thinking 路徑先用包含顯式推理軌跡的數(shù)據(jù)做監(jiān)督微調(diào),再用強(qiáng)化學(xué)習(xí)優(yōu)化推理能力;Instruct 路徑則用通用和代碼指令數(shù)據(jù)做監(jiān)督微調(diào),再用 RL 增強(qiáng)指令遵循能力。

技術(shù)報(bào)告聲稱,Thinking 版本在長程任務(wù)中展現(xiàn)出了自主錯(cuò)誤恢復(fù)(error-recovery)能力,而這種能力在標(biāo)準(zhǔn) Instruct SFT 路徑中幾乎觀察不到。換言之,RL 可能是解鎖代碼模型“自主調(diào)試”能力的關(guān)鍵。


圖丨訓(xùn)練流程(來源:GitHub)

架構(gòu)方面,Loop 變體的設(shè)計(jì)比較有意思。LoopCoder 采用循環(huán) Transformer 架構(gòu),讓參數(shù)共享的 Transformer 塊執(zhí)行兩次固定迭代。第一次迭代正常處理輸入嵌入,第二次迭代同時(shí)計(jì)算兩種注意力:全局注意力(iteration 2 的 queries attend to iteration 1 的所有 key-value 對(duì))和局部注意力(維持因果性的常規(guī)自注意力)。

兩種注意力的輸出通過一個(gè)基于 query 表示的學(xué)習(xí)門控機(jī)制加權(quán)混合。這種設(shè)計(jì)的目的是在有限參數(shù)規(guī)模下獲得更高的有效計(jì)算深度,即用參數(shù)共享換取更多計(jì)算步驟,在部署效率和模型能力之間找平衡。

后訓(xùn)練的 Thinking 路徑也值得一提。技術(shù)報(bào)告聲稱,通過強(qiáng)化學(xué)習(xí)訓(xùn)練的 Thinking 版本在長程任務(wù)中展現(xiàn)出了自主錯(cuò)誤恢復(fù)(error-recovery)能力,而這種能力在標(biāo)準(zhǔn) Instruct SFT 路徑中幾乎觀察不到。如果屬實(shí),這意味著 RL 可能是解鎖代碼模型“自主調(diào)試”能力的關(guān)鍵,模型不只是生成代碼,還能在出錯(cuò)后自我修正。

根據(jù)技術(shù)報(bào)告,IQuest-Coder-V1-40B-Loop-Instruct 在 SWE-bench Verified 上取得了 81.4% 的解決率,在 BigCodeBench 上拿下 49.9%,在 BFCL(Berkeley Function Calling Leaderboard,伯克利函數(shù)調(diào)用排行榜)V3 上達(dá)到 73.8%,在 Mind2Web 上取得 62.5%,在 Terminal-Bench v1.0 上達(dá)到 51.3%。而 Thinking 版本在 LiveCodeBench v6 上的成績是 81.1%,在 CRUXEval 的 Input-COT 和 Output-COT 上分別達(dá)到 98.5%和 99.4%。


圖丨基準(zhǔn)測(cè)試結(jié)果(來源:IQuest-Coder-V1)

當(dāng)然,SWE-bench Verified 只覆蓋 Python 且僅含 500 個(gè)樣本,社區(qū)對(duì)“針對(duì)榜單優(yōu)化”的擔(dān)憂一直存在。其在實(shí)際使用中的表現(xiàn)如何,有待社區(qū)的進(jìn)一步測(cè)試反饋。

從技術(shù)貢獻(xiàn)看,IQuest-Coder-V1 最有價(jià)值的部分可能是對(duì) commit 演化數(shù)據(jù)的系統(tǒng)性利用。這個(gè)方向此前在學(xué)術(shù)界有過探索,但在開源模型的大規(guī)模訓(xùn)練中應(yīng)用得并不多。技術(shù)報(bào)告承諾會(huì)開源完整訓(xùn)練流程和中間檢查點(diǎn),這對(duì)研究代碼模型如何學(xué)習(xí)軟件工程能力將是有價(jià)值的參考。至于跑分能否轉(zhuǎn)化為實(shí)際生產(chǎn)力,要等更多開發(fā)者上手實(shí)測(cè)才能下結(jié)論。

參考資料:

1. https://iquestlab.github.io/#/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
咸魚平臺(tái)能有多神奇?網(wǎng)友:據(jù)說那里面有很多賣一種叫原味的東西

咸魚平臺(tái)能有多神奇?網(wǎng)友:據(jù)說那里面有很多賣一種叫原味的東西

帶你感受人間冷暖
2025-12-29 00:15:07
金正恩一家出席跨年晚會(huì),李春姬大媽坐上主席臺(tái)

金正恩一家出席跨年晚會(huì),李春姬大媽坐上主席臺(tái)

IN朝鮮
2026-01-01 12:19:32
老人的積蓄,交給誰來保管安全又合適?聽聽71歲大爺?shù)穆斆髯龇?>
    </a>
        <h3>
      <a href=人間百態(tài)大全
2025-12-27 06:50:03
78歲林子祥上海城隍廟祈福,皮松肉垮滿臉老年斑,和葉倩文像父女

78歲林子祥上海城隍廟祈福,皮松肉垮滿臉老年斑,和葉倩文像父女

韓馳
2026-01-01 22:55:31
冬天要多吃這水果,煮熟效果翻倍,理氣化痰、防感染,可惜沒人懂

冬天要多吃這水果,煮熟效果翻倍,理氣化痰、防感染,可惜沒人懂

江江食研社
2025-12-31 20:30:06
被四家醫(yī)院判定為肺癌并要求手求,最后的檢查結(jié)果救了我一命!

被四家醫(yī)院判定為肺癌并要求手求,最后的檢查結(jié)果救了我一命!

墜入二次元的海洋
2026-01-01 11:10:01
最放心不下8歲幼女!馬英九態(tài)度讓蔡正元寒心鄭麗文必須發(fā)聲

最放心不下8歲幼女!馬英九態(tài)度讓蔡正元寒心鄭麗文必須發(fā)聲

愛意隨風(fēng)起呀
2026-01-02 09:36:32
港股,全線暴漲!人民幣狂拉!

港股,全線暴漲!人民幣狂拉!

證券時(shí)報(bào)
2026-01-02 12:11:19
特朗普稱將就伊朗騷亂事件進(jìn)行干涉

特朗普稱將就伊朗騷亂事件進(jìn)行干涉

界面新聞
2026-01-02 17:30:07
年齡越大越要少吃菜?醫(yī)生建議:年過65歲,盡量避免5種減壽行為

年齡越大越要少吃菜?醫(yī)生建議:年過65歲,盡量避免5種減壽行為

看世界的人
2026-01-02 15:48:40
貴陽將出現(xiàn)凍雨或雨夾雪!氣溫回升就在......

貴陽將出現(xiàn)凍雨或雨夾雪!氣溫回升就在......

知知貴陽
2026-01-02 17:52:28
美的空調(diào)2026年1月起將調(diào)整價(jià)格

美的空調(diào)2026年1月起將調(diào)整價(jià)格

家電圈
2026-01-02 11:12:41
為什么人臉識(shí)別時(shí)最好不要裸體?

為什么人臉識(shí)別時(shí)最好不要裸體?

beebee
2025-12-09 11:43:52
鎮(zhèn)壓朝鮮第六軍團(tuán)叛變的金永春,92年升大將,95年次帥,16年元帥

鎮(zhèn)壓朝鮮第六軍團(tuán)叛變的金永春,92年升大將,95年次帥,16年元帥

小熊侃史
2026-01-01 11:29:34
上海財(cái)經(jīng)美女主持孫睿淇,臺(tái)上臺(tái)下都風(fēng)光,婆家背景讓人心生羨慕

上海財(cái)經(jīng)美女主持孫睿淇,臺(tái)上臺(tái)下都風(fēng)光,婆家背景讓人心生羨慕

豐譚筆錄
2026-01-02 09:31:32
為什么“正義使命-2025”演習(xí)中,我海軍指戰(zhàn)員都戴上了頭套?

為什么“正義使命-2025”演習(xí)中,我海軍指戰(zhàn)員都戴上了頭套?

百態(tài)人間
2025-12-31 16:24:02
誰懂!你永遠(yuǎn)不知道你的顧客是干什么的,網(wǎng)友:在知識(shí)面前顫抖吧

誰懂!你永遠(yuǎn)不知道你的顧客是干什么的,網(wǎng)友:在知識(shí)面前顫抖吧

夜深愛雜談
2025-12-20 16:51:40
出大事了,美或向?yàn)跖杀??普京開始下令,烏態(tài)度變了,英法選邊站

出大事了,美或向?yàn)跖杀??普京開始下令,烏態(tài)度變了,英法選邊站

真正能保護(hù)你的
2026-01-02 03:54:16
霍震霆每周打卡霍家小廚,狂贊郭晶晶教子:這好兒媳撿到寶了

霍震霆每周打卡霍家小廚,狂贊郭晶晶教子:這好兒媳撿到寶了

鄉(xiāng)野小珥
2026-01-02 11:31:14
金暢:經(jīng)紀(jì)人吹噓很多隊(duì)想要路易斯,卡列洛也是搞到?jīng)]人要

金暢:經(jīng)紀(jì)人吹噓很多隊(duì)想要路易斯,卡列洛也是搞到?jīng)]人要

懂球帝
2026-01-02 18:49:15
2026-01-02 20:28:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16069文章數(shù) 514447關(guān)注度
往期回顧 全部

科技要聞

新勢(shì)力年榜:零跑險(xiǎn)勝華為,蔚來小鵬新高

頭條要聞

媒體:賴清德叫囂"中共不敢越雷池" 轉(zhuǎn)頭就被狠抽耳光

頭條要聞

媒體:賴清德叫囂"中共不敢越雷池" 轉(zhuǎn)頭就被狠抽耳光

體育要聞

英超離譜夜?4戰(zhàn)全平3場(chǎng)0-0 曼城紅軍翻車

娛樂要聞

田亮一家新年全家福!森碟變清純少女

財(cái)經(jīng)要聞

8200億擴(kuò)產(chǎn)潮下的鋰電供應(yīng)鏈之戰(zhàn)

汽車要聞

奇瑞汽車12月銷量超23萬輛 全年超263萬輛

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
家居
旅游
數(shù)碼

藝術(shù)要聞

神似章子怡?這個(gè)越南模特火了,天生長了一張電影臉啊~

房產(chǎn)要聞

海大譽(yù)府新年家年華暨2號(hào)樓耀世加推發(fā)布會(huì)圓滿落幕

家居要聞

無形有行 自然與靈感詩意

旅游要聞

旋轉(zhuǎn)木馬、城市冰場(chǎng)同步開放,冰雪與童話交織在陸家嘴商圈

數(shù)碼要聞

三星發(fā)布The Freestyle+便攜投影儀 亮度翻倍并加入多項(xiàng)AI功能

無障礙瀏覽 進(jìn)入關(guān)懷版