国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

「北京版幻方」開源SOTA代碼模型!40B參數(shù)掀翻Opus-4.5和GPT-5.2

0
分享至

衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

又一個(gè)中國(guó)新模型被推到聚光燈下,刷屏國(guó)內(nèi)外科技圈。

IQuest-Coder-V1模型系列,看起來(lái)真的很牛。

在最新版SWE-Bench Verified榜單中,40B參數(shù)版本的IQuest-Coder取得了81.4%的成績(jī),這個(gè)成績(jī)甚至超過(guò)了Claude Opus-4.5和GPT-5.2(這倆模型沒(méi)有官方資料,但外界普遍猜測(cè)參數(shù)規(guī)模在千億-萬(wàn)億級(jí))。

Oh~Tiny Core, Titan Power。



好,看到這里我盲猜很多人肯定已經(jīng)開始邊搖頭邊笑了。

畢竟這年頭,benchmark的權(quán)威猶在,但說(shuō)服力似乎已經(jīng)大不如前了。

那咱們就看看這個(gè)模型跑出來(lái)的case——

Prompt:編寫一個(gè)網(wǎng)頁(yè)來(lái)展示一個(gè)逼真的太陽(yáng)系模擬。

然后你將得到:



可以自由切換各種視角,讓畫面暫停、放大,調(diào)整公轉(zhuǎn)速度也ok。

選中具體的行星,還會(huì)跳出相應(yīng)的名字和簡(jiǎn)單介紹。



目前,這套代碼大模型系列已經(jīng)在GitHub和抱抱臉上開源。

有一個(gè)重點(diǎn)一定要?jiǎng)潱。。?/p>

這個(gè)模型團(tuán)隊(duì)IQuest,和DeepSeek團(tuán)隊(duì)一個(gè)路數(shù),都出自中國(guó)的量化私募。

背后公司就是北京版幻方量化——九坤投資。

(兩家公司都是業(yè)內(nèi)公認(rèn)的量化私募頭部)

X、Reddit等平臺(tái)上,關(guān)于IQuest-Coder的消息和對(duì)中國(guó)量化公司殺入AI模型戰(zhàn)場(chǎng)的討論已經(jīng)滿天飛了。

有網(wǎng)友一臉unbelievable地問(wèn)出了令他詫異的問(wèn)題:

  • 中國(guó)量化公司到底吸納了些什么人才,才能把模型訓(xùn)練成這樣?????



Ok,一起來(lái)看看這套模型的詳細(xì)情況吧~

IQuest-Coder-V1系列

從定位上看,IQuest-Coder-V1是一套覆蓋多個(gè)參數(shù)規(guī)模與使用場(chǎng)景的家族版本,專注于代碼生成、代碼理解與軟件工程任務(wù)的模型系列。

參數(shù)有7B、14B和40B的,每個(gè)規(guī)模均提供Instruct和Thinking兩種版本。

其中,Instruct偏向指令跟隨與工程使用,更高效;Thinking強(qiáng)化復(fù)雜推理和多步問(wèn)題拆解,響應(yīng)時(shí)間更長(zhǎng)。



特別提醒大家注意一下,40B參數(shù)規(guī)模的IQuest-Coder-V1額外提供了Loop版本,用于探索更高的參數(shù)利用效率。

與計(jì)算成本相似的模型相比,IQuest-Coder-V1-40B-Loop的HBM和KV Cache開銷顯著降低,而吞吐量大幅提升。

僅增加約5%的訓(xùn)練成本,Loop架構(gòu)下,40B模型達(dá)到數(shù)百億參數(shù)MoE模型的水平。



在架構(gòu)設(shè)計(jì)上,IQuest-Coder-V1系列強(qiáng)調(diào)了“工程友好”和“長(zhǎng)上下文可用性”。

官方在GitHub上給出的四點(diǎn)架構(gòu)特性分別是:

  • 分組查詢注意力(Grouped Query Attention,GQA)以實(shí)現(xiàn)高效推理
  • 原生支持128K上下文長(zhǎng)度
  • 詞表大?。?6800個(gè)token
  • 循環(huán)變體采用了具有共享參數(shù)的循環(huán)Transformer設(shè)計(jì),該設(shè)計(jì)在兩個(gè)迭代過(guò)程中保持一致。

首先說(shuō)說(shuō)GQA的引入。

通過(guò)減少KV頭數(shù)量來(lái)降低推理階段的顯存占用和計(jì)算壓力,對(duì)長(zhǎng)上下文場(chǎng)景超級(jí)友好。

其次,模型原生支持128K上下文長(zhǎng)度。這就讓模型有能力直接處理完整代碼倉(cāng)庫(kù)、跨文件依賴以及大規(guī)模工程上下文。

第三,76800個(gè)token的詞表大小,更貼近真實(shí)代碼環(huán)境中頻繁出現(xiàn)的標(biāo)識(shí)符、路徑名和符號(hào)組合。

最后,在Loop變體中,模型采用了具有跨兩次迭代共享參數(shù)的循環(huán)Transformer設(shè)計(jì),用重復(fù)計(jì)算換取更高的參數(shù)利用率,在不線性擴(kuò)大模型規(guī)模的前提下提升性能。

作者刻意指出,這和早期Parallel Loop Transformer不同,去掉了token shifting和inference trick,更強(qiáng)調(diào)推理階段的穩(wěn)定性。

這些特性組合在一起,有利于模型在真實(shí)軟件工程場(chǎng)景中跑得更好。



來(lái)看官方展示的更多case。

Prompt 1:構(gòu)建一個(gè)粒子-文本動(dòng)畫,滿足以下要求。

  • 文本采樣:將給定文本(例如,IQuest)在 Canvas 上轉(zhuǎn)換為由數(shù)百個(gè)小粒子組成的點(diǎn)陣。
  • 狀態(tài):每個(gè)粒子都有一個(gè)當(dāng)前位置和一個(gè)目標(biāo)位置(形成文本)。
  • 交互式物理效果:當(dāng)鼠標(biāo)靠近時(shí)相互排斥和散開;當(dāng)鼠標(biāo)移開時(shí)平滑地彈回。
  • 視覺效果與緩動(dòng):隨機(jī)/漸變顏色,用于整體運(yùn)動(dòng)的緩動(dòng)效果。



Prompt 2:構(gòu)建一個(gè)實(shí)時(shí)像素沙盒游戲。

通過(guò)按鈕切換沙子、水、石頭和酸液;在畫布上涂畫可生成具有不同顏色的元素;大規(guī)模更新依然流暢;元素會(huì)自然下落并流動(dòng)。



Prompt 3:構(gòu)建一個(gè)完整的單文件HTML5 Canvas太空射擊游戲,具有復(fù)古霓虹美學(xué)和明顯的戰(zhàn)斗反饋。

  • 視覺風(fēng)格:黑色背景,高飽和度霓虹幾何形狀,街機(jī)感。
  • 控制:WASD移動(dòng);兩種瞄準(zhǔn)/炮塔模式(鼠標(biāo)跟隨,或按R鍵旋轉(zhuǎn)炮塔)。
  • 射擊:帶完整視覺效果的自動(dòng)射擊太空飛船。
  • 反饋:擊殺時(shí),出現(xiàn)粒子爆炸效果;受到傷害時(shí),屏幕會(huì)震動(dòng)。
  • 敵人:普通士兵/奇襲者/重型坦克,以及Boss戰(zhàn)。
  • 進(jìn)階:按P鍵能升級(jí)火力。



Prompt 4:基于鳥群算法的仿生鳥/魚群體模擬,擁有150個(gè)以上的自主Agent,有實(shí)時(shí)調(diào)節(jié)功能。

  • 核心規(guī)則:分離(避免碰撞)、對(duì)齊(速度匹配)和內(nèi)聚(群體中心)。
  • 實(shí)時(shí)面板:調(diào)整分離/對(duì)齊/凝聚權(quán)重(0-3)、視覺半徑(20-150 像素)和最大速度。
  • 交互:鼠標(biāo)充當(dāng)捕食者,使附近的智能體散開。
  • 渲染:在深色背景下,以運(yùn)動(dòng)方向旋轉(zhuǎn)的霓虹三角形和發(fā)光軌跡。
  • 工具:FPS 計(jì)數(shù)器和暫停/繼續(xù)(空格鍵)。



與眾不同的“代碼流多階段訓(xùn)練”訓(xùn)練策略

IQuest-Coder的訓(xùn)練流程如下——

預(yù)訓(xùn)練階段先用通用數(shù)據(jù)和大規(guī)模代碼數(shù)據(jù)打底,然后通過(guò)高質(zhì)量代碼annealing強(qiáng)化基礎(chǔ)代碼表征。

中期訓(xùn)練階段第一次明確引入reasoning、agent trajectory和長(zhǎng)上下文代碼,并且分32K和128K兩個(gè)尺度逐步推進(jìn)。

最終post-training階段,模型被明確分流成instruct路線和thinking路線,分別用不同目標(biāo)函數(shù)和RL方式收斂。



官方強(qiáng)調(diào),IQuest-Coder-V1系列采用了與傳統(tǒng)單一靜態(tài)源代碼訓(xùn)練不同的訓(xùn)練策略。

稱之為code-flow multi-stage training

與大量代碼模型側(cè)重從靜態(tài)代碼片段中學(xué)習(xí)不同,這套方法強(qiáng)調(diào)從代碼的演化過(guò)程中學(xué)習(xí)。

團(tuán)隊(duì)專門設(shè)計(jì)了基于項(xiàng)目生命周期的triplet數(shù)據(jù)構(gòu)造方式,用 (R_old, Patch, R_new) 這樣的結(jié)構(gòu),讓模型看到穩(wěn)定期代碼、變更內(nèi)容以及變更后的結(jié)果。

而且刻意避開項(xiàng)目早期和后期,只取40%–80%生命周期區(qū)間。

這一步實(shí)際上把“軟件工程經(jīng)驗(yàn)”顯式編碼進(jìn)了訓(xùn)練數(shù)據(jù)里。

所以模型看到的并不只是某一時(shí)刻的完成態(tài)代碼,還包括修改前后的差異、提交歷史中的邏輯變化,以及真實(shí)工程中反復(fù)試錯(cuò)和修正的痕跡。

也就是說(shuō)模型被訓(xùn)練得能夠捕捉軟件邏輯的動(dòng)態(tài)演變。



不少網(wǎng)友猜測(cè),這就是IQuest-Coder-V1在多個(gè)軟件工程類評(píng)測(cè)中表現(xiàn)突出的重要原因之一。

這套模型成績(jī)確實(shí)亮眼。

  • SWE-Bench Verified:81.4%
  • BigCodeBench:49.9%
  • LiveCodeBench v6:81.1%



下面這張圖體現(xiàn)得更直觀一點(diǎn),IQuest-Coder在八個(gè)代碼、Agentic相關(guān)榜單上都獨(dú)占鰲頭。



不過(guò),GitHub上白紙黑字寫著,模型可以生成代碼,但不能執(zhí)行,始終在沙盒環(huán)境中驗(yàn)證輸出結(jié)果。

部署方面,官方信息顯示,不管是基礎(chǔ)版本還是Loop版本,都支持單卡H20推理。

其Int4版本可在單張消費(fèi)級(jí)3090/4090 GPU上部署。



有網(wǎng)友表示,非Loop版本的模型似乎采用的是阿里Qwen2的架構(gòu)。



隨著關(guān)注度上升,質(zhì)疑也同步出現(xiàn)。



九坤投資公司是誰(shuí)?

好,最后我們來(lái)認(rèn)識(shí)一下IQuest-Coder背后的公司,九坤投資(Ubiquant Holding Limited)。

公司成立于2012年,是中國(guó)較早一批專注量化投資和高頻交易的私募機(jī)構(gòu)之一,目前管理規(guī)模在數(shù)百億元人民幣,和幻方同屬于公認(rèn)的國(guó)內(nèi)量化私募頭部公司。

九坤主要辦公地在北京,3周前開設(shè)了新加坡辦公室。

聯(lián)合創(chuàng)始人王琛,2000年考入清華大學(xué),獲得數(shù)學(xué)物理學(xué)士學(xué)位和理論計(jì)算機(jī)博士學(xué)位,博士期間師從圖靈獎(jiǎng)得主姚期智院士。

博士畢業(yè)后,王琛就職于美國(guó)頂級(jí)對(duì)沖基金Millennium,后創(chuàng)業(yè)擔(dān)任九坤投資聯(lián)合創(chuàng)始人、CEO。

聯(lián)合創(chuàng)始人姚齊聰,2002年考入北京大學(xué)數(shù)學(xué)系,獲得數(shù)學(xué)學(xué)士和金融數(shù)學(xué)碩士學(xué)位。

碩士畢業(yè)后進(jìn)入Millennium,后與王琛共同創(chuàng)業(yè),主要負(fù)責(zé)九坤投研體系搭建、量化策略開發(fā)和風(fēng)險(xiǎn)管理,被視為公司策略和風(fēng)控體系的核心設(shè)計(jì)者之一。

九坤的投研與技術(shù)團(tuán)隊(duì)人數(shù)超過(guò)百人,90%以上畢業(yè)于清華、北大、復(fù)旦、斯坦福等國(guó)內(nèi)外知名高校,博士占比超過(guò)60%。

公開信息顯示,這家公司目前也傾向于從全球頂尖高校招募具有計(jì)算機(jī)、數(shù)學(xué)、物理、統(tǒng)計(jì)學(xué)等背景的應(yīng)屆畢業(yè)生。



在AI領(lǐng)域,幻方更早憑DeepSeek站到臺(tái)前。

不過(guò)查詢有關(guān)資料發(fā)現(xiàn),此前九坤也很注重AI技術(shù)這一塊。

目前,九坤的IT和算力建設(shè)位居國(guó)內(nèi)量化機(jī)構(gòu)前三,并建立了數(shù)據(jù)實(shí)驗(yàn)室(DATA LAB)、人工智能實(shí)驗(yàn)室(AI LAB)等多個(gè)前沿實(shí)驗(yàn)室。

本次發(fā)布的IQuest-Coder就出自其發(fā)起設(shè)立的獨(dú)立研究平臺(tái)至知?jiǎng)?chuàng)新研究院。

倒也不全是為了把AI用在金融市場(chǎng)預(yù)測(cè)和交易決策啦——前段時(shí)間(2025年12月16日),九坤已經(jīng)推出過(guò)通用推理模型URM。

該模型在ARC-AGI正確率為53.8%,當(dāng)允許多次嘗試時(shí),URM的成功率能達(dá)到85%以上;在更困難的ARC-AGI 2上也拿到了16.0%。

Paper最后附上了IQuest-Coder團(tuán)隊(duì)的成員名單。



挺長(zhǎng)的,就不一一介紹了。

不過(guò)我們發(fā)現(xiàn)這篇paper的核心作者層,和《Scaling Laws for Code》《CodeSimpleQA》《From Code Foundation Models to Agents and Applications》作者陣容重合度非常高。

所以這里稍微展開介紹一下Core Contributor的幾位成員。

(注:IQuestLab團(tuán)隊(duì)成員很多沒(méi)有公開個(gè)人檔案,我們這里放出可尋找到的公開資料)

Jian Yang,谷歌學(xué)術(shù)被引量超過(guò)1.6萬(wàn)。

此前應(yīng)該在Qwen 2.5和Qwen 3團(tuán)隊(duì)待過(guò)很長(zhǎng)一段時(shí)間,2025年起開始在九坤投資發(fā)表論文。



Zhengmao Ye,本科畢業(yè)于西南交通大學(xué),在四川大學(xué)獲得計(jì)算機(jī)科學(xué)碩士學(xué)位。

此前,他曾在華為和商湯科技擔(dān)任過(guò)技術(shù)工作人員。



你沒(méi)看錯(cuò),8位Core Contributor就找到了2位的公開資料,真的盡力了.gif

另外,paper的通訊作者,是九坤人工智能實(shí)驗(yàn)室首席研究員和負(fù)責(zé)人Bryan Dai。



Paper地址:
file:///Users/hengknows/Downloads/IQuest_Coder_Technical_Report%20(1).pdf
參考資料:
[1]https://x.com/zephyr_z9/status/2006579658972868988?s=20
[2]https://github.com/IQuestLab/IQuest-Coder-V1?tab=readme-ov-file
[3]https://iquestlab.github.io/#/
[4]https://www.reddit.com/r/LocalLLaMA/comments/1q0x19t/anyone_tried_iquestcoderv1_yet_the_40b_numbers/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
潘曉婷一桿將2025打成2026,網(wǎng)友:差點(diǎn)以為是AI,看你明年怎么打出2027

潘曉婷一桿將2025打成2026,網(wǎng)友:差點(diǎn)以為是AI,看你明年怎么打出2027

極目新聞
2026-01-02 11:27:05
郭艾倫缺席廣州險(xiǎn)勝送山西4連敗 原帥18分徐昕11+10+6帽

郭艾倫缺席廣州險(xiǎn)勝送山西4連敗 原帥18分徐昕11+10+6帽

醉臥浮生
2026-01-02 21:37:41
女巨人游戲性感新招式:肥臀壓頂、大雷光束等

女巨人游戲性感新招式:肥臀壓頂、大雷光束等

游民星空
2026-01-01 16:18:56
A股:港股突然飆升大漲,原因是什么?釋放什么信號(hào)?下周牛市穩(wěn)了

A股:港股突然飆升大漲,原因是什么?釋放什么信號(hào)?下周牛市穩(wěn)了

風(fēng)風(fēng)順
2026-01-03 00:00:03
伊朗總統(tǒng)發(fā)表講話:“伊朗正處于一場(chǎng)全面戰(zhàn)爭(zhēng)之中”

伊朗總統(tǒng)發(fā)表講話:“伊朗正處于一場(chǎng)全面戰(zhàn)爭(zhēng)之中”

環(huán)球網(wǎng)資訊
2026-01-01 19:53:05
特朗普登機(jī)訪華前,美方先通告全球,中國(guó)已經(jīng)買了800萬(wàn)噸大豆

特朗普登機(jī)訪華前,美方先通告全球,中國(guó)已經(jīng)買了800萬(wàn)噸大豆

趣味萌寵的日常
2026-01-03 04:45:31
企業(yè)家扎堆買仰望U8L 王傳福一天內(nèi)為兩位董事長(zhǎng)交車

企業(yè)家扎堆買仰望U8L 王傳福一天內(nèi)為兩位董事長(zhǎng)交車

快科技
2025-12-31 15:45:08
我,63歲河南人,死拿紫金礦業(yè)16年:58萬(wàn)滾6000W,還有128萬(wàn)分紅

我,63歲河南人,死拿紫金礦業(yè)16年:58萬(wàn)滾6000W,還有128萬(wàn)分紅

真實(shí)人物采訪
2026-01-02 09:00:11
50歲的曹錕迎娶20歲的富家千金,新婚夜一番云雨后,曹錕倒頭大睡

50歲的曹錕迎娶20歲的富家千金,新婚夜一番云雨后,曹錕倒頭大睡

詩(shī)意世界
2026-01-01 07:00:03
就在今天,1月3日凌晨,CBA傳來(lái)徐杰新消息 軟組織挫傷未跟隊(duì)訓(xùn)練

就在今天,1月3日凌晨,CBA傳來(lái)徐杰新消息 軟組織挫傷未跟隊(duì)訓(xùn)練

金風(fēng)說(shuō)
2026-01-03 01:01:32
特朗普下令開火!俄大規(guī)模空襲,中國(guó)武器亮相歐洲,美國(guó)徹底破防

特朗普下令開火!俄大規(guī)??找u,中國(guó)武器亮相歐洲,美國(guó)徹底破防

愛吃醋的貓咪
2026-01-01 16:11:34
軍演結(jié)束后24小時(shí),賴清德發(fā)表“獲勝演講”,鄭麗文也對(duì)大陸變臉

軍演結(jié)束后24小時(shí),賴清德發(fā)表“獲勝演講”,鄭麗文也對(duì)大陸變臉

時(shí)時(shí)有聊
2026-01-02 15:22:36
《人民日?qǐng)?bào)》:真正能給你撐腰的,是足夠的金錢,穩(wěn)定的情緒....

《人民日?qǐng)?bào)》:真正能給你撐腰的,是足夠的金錢,穩(wěn)定的情緒....

詩(shī)詞中國(guó)
2026-01-02 20:36:32
宗馥莉,重任法定代表人!

宗馥莉,重任法定代表人!

每日經(jīng)濟(jì)新聞
2026-01-02 20:47:05
2026年1月1日起,北京適齡男子都要登記!否則,影響很嚴(yán)重!

2026年1月1日起,北京適齡男子都要登記!否則,影響很嚴(yán)重!

美麗大北京
2026-01-02 15:45:02
極端巨浪奪命!25歲中國(guó)女子悉尼海灘遇難,已致4死2失蹤

極端巨浪奪命!25歲中國(guó)女子悉尼海灘遇難,已致4死2失蹤

華人生活網(wǎng)
2026-01-03 04:24:48
難以置信:哈勃拍到一條長(zhǎng)達(dá)20萬(wàn)光年的條紋!它比星系還長(zhǎng)

難以置信:哈勃拍到一條長(zhǎng)達(dá)20萬(wàn)光年的條紋!它比星系還長(zhǎng)

窺探宇宙1
2026-01-02 13:00:03
方媛懷抱奶呼呼三寶出鏡,慶元旦!被網(wǎng)友質(zhì)疑動(dòng)作僵硬,不會(huì)抱娃

方媛懷抱奶呼呼三寶出鏡,慶元旦!被網(wǎng)友質(zhì)疑動(dòng)作僵硬,不會(huì)抱娃

白日追夢(mèng)人
2026-01-02 21:00:31
甜炸了!周揚(yáng)青與何廣智一起跨年,從日料店喝到酒吧,姐狗CP再續(xù)

甜炸了!周揚(yáng)青與何廣智一起跨年,從日料店喝到酒吧,姐狗CP再續(xù)

觀察鑒娛
2026-01-02 11:11:14
新規(guī)來(lái)了!交管12123每年2次違停免罰機(jī)會(huì),這樣用不浪費(fèi)

新規(guī)來(lái)了!交管12123每年2次違停免罰機(jī)會(huì),這樣用不浪費(fèi)

老特有話說(shuō)
2026-01-02 17:42:55
2026-01-03 05:56:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11960文章數(shù) 176354關(guān)注度
往期回顧 全部

科技要聞

新勢(shì)力年榜:零跑險(xiǎn)勝華為,蔚來(lái)小鵬新高

頭條要聞

民調(diào)稱25%臺(tái)灣人愿上戰(zhàn)場(chǎng) 呂秀蓮:圍臺(tái)軍演后數(shù)據(jù)更低

頭條要聞

民調(diào)稱25%臺(tái)灣人愿上戰(zhàn)場(chǎng) 呂秀蓮:圍臺(tái)軍演后數(shù)據(jù)更低

體育要聞

快船似乎又行了

娛樂(lè)要聞

田亮一家新年全家福!森碟變清純少女

財(cái)經(jīng)要聞

車企2026開年大促 含16個(gè)品牌近70款

汽車要聞

方程豹全年銷量超23.4萬(wàn)輛 同比暴增316.1%

態(tài)度原創(chuàng)

本地
時(shí)尚
教育
親子
公開課

本地新聞

即將過(guò)去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

上年紀(jì)的女人別亂買衣服!有這3件單品就夠了,溫暖體面一冬

教育要聞

四川美術(shù)省前4000名能上啥學(xué)校?沖刺名校不踩坑

親子要聞

教育部下了硬指令,私立幼兒園老板們慌了,估計(jì)吃安眠藥都睡不著

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版