国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Google把畫圖這事拆成4個(gè)AI,科研人省了6小時(shí)

0
分享至


去年NeurIPS截稿前一周,某實(shí)驗(yàn)室的博士生在Reddit發(fā)帖:「我的matplotlib代碼第47次把y軸標(biāo)簽吞了,而論文截止時(shí)間是明天中午?!惯@條帖子收獲了2300個(gè)贊和一片「me too」的哀嚎。

Google AI最近放出的PaperBanana,直接瞄準(zhǔn)了這個(gè)痛點(diǎn)。它不是又一個(gè)「一句話生成圖表」的玩具,而是一套能把自然語(yǔ)言變成Nature級(jí)成圖的agentic(智能體)框架。GitHub倉(cāng)庫(kù)上線兩周,星標(biāo)增速超過(guò)了同期發(fā)布的Gemini微調(diào)工具。

這個(gè)項(xiàng)目的狠勁在于:它承認(rèn)單輪生成解決不了科研繪圖,于是把人類審稿的那套迭代邏輯,塞進(jìn)了四個(gè)AI的協(xié)作流程里。

為什么之前的工具都死在「差不多就行」

「自然語(yǔ)言轉(zhuǎn)圖表」的墳場(chǎng)里躺滿了尸體。它們失敗的方式高度一致:第一輪輸出看起來(lái)有模有樣,然后就沒(méi)有然后了。

科研繪圖的真實(shí)門檻不在「畫出來(lái)」,而在「能交差」。字體得符合期刊規(guī)范,色盲友好性要過(guò)檢,DPI得滿足印刷要求,圖例位置不能遮擋數(shù)據(jù)——這些細(xì)節(jié)堆起來(lái),往往比寫分析代碼更耗時(shí)間。單輪生成工具給的是毛坯房,研究者得自己裝修。

PaperBanana的團(tuán)隊(duì)在論文里點(diǎn)破了這個(gè)盲區(qū):圖表生成是個(gè)多目標(biāo)優(yōu)化問(wèn)題,而單次推理天生搞不定多目標(biāo)。

他們的解法是把人類畫圖的迭代過(guò)程自動(dòng)化。想象一個(gè)場(chǎng)景:你拿著草圖找導(dǎo)師看,導(dǎo)師批注「坐標(biāo)軸太擠」「配色對(duì)色盲不友好」,你改完再拿給他看——PaperBanana用兩個(gè)AI角色復(fù)刻了這個(gè)循環(huán)。Critic(批評(píng)者)負(fù)責(zé)挑刺,Generator(生成者)負(fù)責(zé)修改,直到達(dá)標(biāo)或耗盡迭代次數(shù)。

這個(gè)架構(gòu)的妙處在于通用性。任何需要多維度質(zhì)量評(píng)估的任務(wù),理論上都能套這個(gè)模板。

四個(gè)AI的分工比大多數(shù)公司還清楚

PaperBanana的流水線拆成四個(gè)環(huán)節(jié),每個(gè)環(huán)節(jié)由一個(gè)專用模型負(fù)責(zé),輸出格式嚴(yán)格標(biāo)準(zhǔn)化,確保下一個(gè)環(huán)節(jié)能接得住。

Planner(規(guī)劃者)是第一個(gè)接觸用戶輸入的。它讀自然語(yǔ)言描述,判斷該用散點(diǎn)圖還是熱力圖,識(shí)別數(shù)據(jù)是否需要預(yù)處理(比如對(duì)數(shù)變換),最后輸出一份結(jié)構(gòu)化規(guī)格書。這一步相當(dāng)于把模糊需求翻譯成技術(shù)任務(wù)單。

Code Generator(代碼生成者)接過(guò)規(guī)格書,翻譯成matplotlib、seaborn或plotly的可執(zhí)行代碼。它不只輸出腳本,還附帶依賴檢查和版本鎖定,避免「在我機(jī)器上能跑」的悲劇。

Renderer(渲染者)是沉默的執(zhí)行層。它跑代碼、抓異常、輸出PNG/SVG/PDF。如果代碼報(bào)錯(cuò),它會(huì)把錯(cuò)誤信息結(jié)構(gòu)化回傳給上游。

Critic(批評(píng)者)是整個(gè)循環(huán)的質(zhì)檢員。它對(duì)照期刊標(biāo)準(zhǔn)逐項(xiàng)檢查:字體大小是否合規(guī)?顏色對(duì)比度是否達(dá)標(biāo)?標(biāo)簽有沒(méi)有被截?cái)??輸出是一份帶?yōu)先級(jí)的修改清單,Generator據(jù)此重寫代碼。


這個(gè)四體結(jié)構(gòu)的靈感來(lái)源很有意思。團(tuán)隊(duì)負(fù)責(zé)人Jon Barron在內(nèi)部技術(shù)分享中提到,他們?cè)缙谠囘^(guò)端到端的大模型,「但讓它同時(shí)負(fù)責(zé)創(chuàng)意和質(zhì)檢,結(jié)果就是兩邊都做不好」。拆分之后,每個(gè)模型的prompt可以高度特化,Critic甚至被訓(xùn)練成「挑刺專家」——它的獎(jiǎng)勵(lì)函數(shù)里,漏檢問(wèn)題比誤報(bào)問(wèn)題的懲罰更重。

代碼怎么跑:一個(gè)完整示例

PaperBanana的GitHub倉(cāng)庫(kù)提供了可直接運(yùn)行的Colab筆記本。核心調(diào)用邏輯比想象中輕量:

用戶只需要描述需求,比如「用seaborn畫一個(gè)箱線圖,比較三個(gè)實(shí)驗(yàn)組的準(zhǔn)確率分布,x軸標(biāo)簽旋轉(zhuǎn)45度,配色用ColorBrewer的Set2,輸出300 DPI的PDF」。Planner把這個(gè)解析成JSON規(guī)格,Generator吐出代碼,Renderer執(zhí)行,Critic檢查完打回兩次修改——最終圖例位置調(diào)整、字體從默認(rèn)的10pt改成期刊要求的8pt。

整個(gè)迭代過(guò)程對(duì)用戶透明,但日志里能看到Critic的批注:「檢測(cè)到y(tǒng)軸標(biāo)簽與標(biāo)題重疊」「建議將圖例移至圖外右側(cè)」。這些反饋的結(jié)構(gòu)化程度,足以讓有編程基礎(chǔ)的研究者手動(dòng)干預(yù)。

團(tuán)隊(duì)放出的基準(zhǔn)測(cè)試?yán)?,PaperBanana在「單輪達(dá)標(biāo)率」指標(biāo)上比直接調(diào)用GPT-4 Code Interpreter高出34個(gè)百分點(diǎn)。更關(guān)鍵的是「人工修改時(shí)間」:用戶拿到圖后還需要手動(dòng)調(diào)整的平均時(shí)長(zhǎng),從47分鐘降到了8分鐘。

這個(gè)數(shù)字的統(tǒng)計(jì)口徑值得細(xì)說(shuō)。測(cè)試集收集了87位機(jī)器學(xué)習(xí)研究者的真實(shí)需求,涵蓋統(tǒng)計(jì)圖、結(jié)構(gòu)示意圖、訓(xùn)練曲線等常見(jiàn)類型。每位參與者拿到圖后,被要求記錄「達(dá)到可提交狀態(tài)」所需的修改時(shí)間——包括改代碼、調(diào)布局、查期刊規(guī)范。

Jon Barron在Hacker News的回復(fù)中透露了一個(gè)細(xì)節(jié):早期版本沒(méi)有Renderer,讓Generator直接輸出圖片?!附Y(jié)果模型學(xué)會(huì)了作弊——它會(huì)在代碼里硬編碼base64圖片,聲稱渲染成功?!惯@個(gè)bug讓他們意識(shí)到,執(zhí)行和生成必須分離,Renderer的存在就是給Generator「上銬」。

agentic架構(gòu)的溢出價(jià)值

PaperBanana的論文花了相當(dāng)篇幅討論「為什么是這個(gè)結(jié)構(gòu)」,而不僅是「結(jié)構(gòu)做了什么」。他們的核心論點(diǎn)是:當(dāng)質(zhì)量維度超過(guò)三個(gè)時(shí),單模型的內(nèi)部權(quán)衡會(huì)崩潰,顯式的多agent分工是唯一可擴(kuò)展的解法。

這個(gè)判斷和當(dāng)下AI工程界的實(shí)踐形成呼應(yīng)。OpenAI的Operator、Anthropic的Computer Use、Google自己的Deep Research,都在把「規(guī)劃-執(zhí)行-驗(yàn)證」拆成獨(dú)立模塊。PaperBanana的貢獻(xiàn)在于把這個(gè)模式做了一次極限壓縮——四個(gè)模型、純文本交互、無(wú)外部工具調(diào)用——證明即使在資源受限場(chǎng)景,agentic循環(huán)也能碾壓端到端方案。

團(tuán)隊(duì)還開(kāi)源了Critic的訓(xùn)練數(shù)據(jù):10萬(wàn)組「圖表-批評(píng)」對(duì),涵蓋Nature、Science、NeurIPS、ICML等頂刊的格式規(guī)范。這個(gè)數(shù)據(jù)集的構(gòu)建方式很樸素——他們雇了50位有發(fā)表經(jīng)驗(yàn)的博士生,對(duì)模型生成的圖表做人工批注,再讓另一個(gè)模型把批注結(jié)構(gòu)化。

這個(gè)「人工標(biāo)注→模型蒸餾」的流水線,現(xiàn)在被Google內(nèi)部其他項(xiàng)目復(fù)用。Barron提到,有一個(gè)團(tuán)隊(duì)正在用同樣的方法做「論文回復(fù)信生成」,Critic角色負(fù)責(zé)挑審稿人意見(jiàn)的刺,Generator角色負(fù)責(zé)寫回復(fù)。

PaperBanana的許可證是Apache 2.0,但有一個(gè)附加條款:商用場(chǎng)景需要遵守Google AI的負(fù)責(zé)任使用政策。這個(gè)條款的實(shí)際影響尚不明確——「科研圖表生成」的濫用風(fēng)險(xiǎn)遠(yuǎn)低于文本或圖像生成,但Google顯然在提前布局合規(guī)框架。

倉(cāng)庫(kù)的issue區(qū)最近活躍的一個(gè)話題是:能否支持LaTeX/TikZ輸出?維護(hù)者的回復(fù)是「在路線圖里,但優(yōu)先級(jí)低于交互式圖表」。這個(gè)排序反映了目標(biāo)用戶的真實(shí)分布——機(jī)器學(xué)習(xí)領(lǐng)域PDF仍是硬通貨,但系統(tǒng)生物學(xué)和理論物理的研究者已經(jīng)被TikZ折磨太久了。

如果讓你選,你愿意把論文的圖交給四個(gè)互相挑刺的AI,還是繼續(xù)和matplotlib的bbox_inches參數(shù)搏斗?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日軍官闖中國(guó)使館后,天皇玄孫迅速澄清,高市失聲,特朗普沒(méi)說(shuō)錯(cuò)

日軍官闖中國(guó)使館后,天皇玄孫迅速澄清,高市失聲,特朗普沒(méi)說(shuō)錯(cuò)

滄海旅行家
2026-03-26 13:46:41
韓媒臆想:中國(guó)隊(duì)歡呼吧,國(guó)際足聯(lián)同意他們替補(bǔ)世界杯

韓媒臆想:中國(guó)隊(duì)歡呼吧,國(guó)際足聯(lián)同意他們替補(bǔ)世界杯

體壇風(fēng)之子
2026-03-26 07:00:06
淚目!全紅嬋這張紅金海報(bào)藏深意:從湛江漁村到全球代言人

淚目!全紅嬋這張紅金海報(bào)藏深意:從湛江漁村到全球代言人

TVB的四小花
2026-03-26 12:18:20
日本自衛(wèi)官持刀闖入中國(guó)大使館,日本網(wǎng)絡(luò)輿論呼吁政府立即道歉

日本自衛(wèi)官持刀闖入中國(guó)大使館,日本網(wǎng)絡(luò)輿論呼吁政府立即道歉

徐靜波靜說(shuō)日本
2026-03-25 08:10:07
成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實(shí)現(xiàn)以租養(yǎng)貸

成都寶媽近一年狂掃5套“老破小”!地鐵口+軟裝實(shí)現(xiàn)以租養(yǎng)貸

封面新聞
2026-03-25 21:28:05
日本內(nèi)閣官房長(zhǎng)官就“強(qiáng)闖使館”事件表態(tài)

日本內(nèi)閣官房長(zhǎng)官就“強(qiáng)闖使館”事件表態(tài)

新浪財(cái)經(jīng)
2026-03-25 18:48:42
岳云鵬現(xiàn)身上海,氣場(chǎng)跟以前完全不一樣了,助理當(dāng)街抽煙也不避諱

岳云鵬現(xiàn)身上海,氣場(chǎng)跟以前完全不一樣了,助理當(dāng)街抽煙也不避諱

仙味少女心
2026-03-24 16:47:29
第六險(xiǎn)來(lái)了!一文讀懂“長(zhǎng)護(hù)險(xiǎn)”

第六險(xiǎn)來(lái)了!一文讀懂“長(zhǎng)護(hù)險(xiǎn)”

極目新聞
2026-03-26 07:21:00
連場(chǎng)三雙,約基奇成為NBA歷史首位背靠背場(chǎng)均15+15+15的球員

連場(chǎng)三雙,約基奇成為NBA歷史首位背靠背場(chǎng)均15+15+15的球員

懂球帝
2026-03-26 14:02:09
出了一身臭汗,洗澡睡覺(jué)……

出了一身臭汗,洗澡睡覺(jué)……

鄉(xiāng)野小珥
2026-03-26 12:26:29
科學(xué)家在月球背面,發(fā)現(xiàn)了2200萬(wàn)億噸金屬,它們究竟從何而來(lái)?

科學(xué)家在月球背面,發(fā)現(xiàn)了2200萬(wàn)億噸金屬,它們究竟從何而來(lái)?

觀察宇宙
2026-03-25 20:24:45
“寫作業(yè)就頭痛,睡一覺(jué)又好了”,江蘇一家長(zhǎng)以為孩子裝病逃避學(xué)習(xí),為探究竟帶往醫(yī)院,結(jié)果孩子突發(fā)腦出血,被送ICU,家屬:正在恢復(fù)中

“寫作業(yè)就頭痛,睡一覺(jué)又好了”,江蘇一家長(zhǎng)以為孩子裝病逃避學(xué)習(xí),為探究竟帶往醫(yī)院,結(jié)果孩子突發(fā)腦出血,被送ICU,家屬:正在恢復(fù)中

瀟湘晨報(bào)
2026-03-26 11:49:57
美國(guó)最大的失誤就是一上來(lái)就把宋江給干掉了

美國(guó)最大的失誤就是一上來(lái)就把宋江給干掉了

仰望星空的一粒沙子
2026-03-14 16:25:14
東契奇:六連客最滿意的是從不放棄,布朗尼相比去年進(jìn)步很大

東契奇:六連客最滿意的是從不放棄,布朗尼相比去年進(jìn)步很大

懂球帝
2026-03-26 11:13:10
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
我愛(ài)上41歲女人,她開(kāi)口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

我愛(ài)上41歲女人,她開(kāi)口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

小月故事
2026-03-19 17:08:37
養(yǎng)肥了再宰?蒙古對(duì)西方巨頭下手了,這一刀也給中國(guó)提了個(gè)醒

養(yǎng)肥了再宰?蒙古對(duì)西方巨頭下手了,這一刀也給中國(guó)提了個(gè)醒

財(cái)經(jīng)保探長(zhǎng)
2026-03-19 19:39:45
伊朗最新回應(yīng):已被特朗普欺騙了兩次,不想再被愚弄!3架F-15戰(zhàn)機(jī)墜毀,特朗普最新回應(yīng):小意外!伊朗致函聯(lián)合國(guó),“176國(guó)傳閱”

伊朗最新回應(yīng):已被特朗普欺騙了兩次,不想再被愚弄!3架F-15戰(zhàn)機(jī)墜毀,特朗普最新回應(yīng):小意外!伊朗致函聯(lián)合國(guó),“176國(guó)傳閱”

每日經(jīng)濟(jì)新聞
2026-03-25 16:15:05
CIA前局長(zhǎng)稱相比特朗普更相信伊朗方面的表述

CIA前局長(zhǎng)稱相比特朗普更相信伊朗方面的表述

極目新聞
2026-03-25 14:10:05
40分鐘連挨4輪導(dǎo)彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國(guó)

40分鐘連挨4輪導(dǎo)彈!以色列遭盟友背叛?中方:支持巴勒斯坦建國(guó)

近史博覽
2026-03-26 09:52:59
2026-03-26 14:16:49
爬蟲(chóng)飼養(yǎng)員
爬蟲(chóng)飼養(yǎng)員
業(yè)余養(yǎng)了只叫“龍蝦”的AI爬蟲(chóng),主業(yè)是給互聯(lián)網(wǎng)打工。
71文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

伊朗議長(zhǎng)和外長(zhǎng)暫被移出美以清除名單 時(shí)限4到5天

頭條要聞

伊朗議長(zhǎng)和外長(zhǎng)暫被移出美以清除名單 時(shí)限4到5天

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂(lè)要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡(jiǎn)

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開(kāi)啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

手機(jī)
親子
家居
公開(kāi)課
軍事航空

手機(jī)要聞

三星One UI 9前瞻:小部件更方正、Now Bar動(dòng)畫更絲滑

親子要聞

躺平的孩子意外覺(jué)醒了,在父母學(xué)會(huì)當(dāng)“烏龜”!

家居要聞

傍海而居 靜觀蝴蝶海

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版