国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

學(xué)術(shù)插圖新神器!萬字材料秒出SVG,西湖大學(xué)出品 | ICLR'26

0
分享至

AutoFigure團隊 投稿
量子位 | 公眾號 QbitAI

你是否也經(jīng)歷過這樣的絕望:

論文截稿在即,面對大段的文字你抓耳撓腮,PPT畫框畫到手抽筋;

嘗試用Nano banana生個圖,顏值拉滿但邏輯全錯,甚至還自帶“克蘇魯”風(fēng)格的模糊字符;

^好不容易調(diào)好了Prompt,結(jié)果想改一個小圖標(biāo),卻發(fā)現(xiàn)AI給你的只是一張無從下手的“死圖”。

這種“審美與邏輯不可兼得、生成與編輯徹底斷層”的痛點,終于要被終結(jié)了。

現(xiàn)在,你可以把大段的文字材料直接塞給AutoFigure,西湖大學(xué)團隊推出的全新智能體繪圖框架。



它能夠一鍵讀懂上萬字的論文、書籍、博客,自動化地吐出高質(zhì)量的學(xué)術(shù)插圖為你所用。

更重磅的是,其優(yōu)化版本AutoFigure-Edit實現(xiàn)了從“像素”到“矢量”的跨越:生成的插圖不再是死板的圖片png,而是細節(jié)可編輯的SVG文件(現(xiàn)在你可以在PPT里直接編輯了)。

目前,該工作已入選ICLR 2026。代碼、數(shù)據(jù)集、Web交互界面全部開源,并同步上線了可一鍵使用的在線網(wǎng)站。



背景:為什么AI以前畫不好科學(xué)插圖?

在學(xué)術(shù)繪圖界,一直存在兩個極端:

1. End-to-end派(如GPT-Image):審美在線,但邏輯經(jīng)?!氨牡稀?,文字更是重災(zāi)區(qū),充滿了莫名其妙的幻覺字符。

2. Text-to-code派(如TikZ/SVG生成):邏輯倒是嚴(yán)密,但視覺效果往往丑得像上個世紀(jì)的教科書,缺乏現(xiàn)代論文的高級感。

AutoFigure提出了“推理式渲染”(Reasoned Rendering)范式:將“腦子(邏輯布局)”和“手(美化渲染)”徹底分開。

技術(shù)方案:模擬大牛設(shè)計師的“三步走”策略

AutoFigure的核心是一個分工明確的多智能體協(xié)作系統(tǒng)。



△AutoFigure架構(gòu)圖(由AutoFigure生成,未經(jīng)修改)

第一步:Conceptual Grounding(構(gòu)建邏輯骨架)

AI讀入你長達萬詞的文字材料,自動提取實體和關(guān)系,生成一個粗糙但結(jié)構(gòu)正確的布局(SVG/HTML代碼)

第二步:Critique-and-Refine(Agent閉環(huán)迭代)

模擬人類設(shè)計師與甲方的反復(fù)拉鋸,對圖片布局進行反復(fù)修改:

  • AI Designer負責(zé)根據(jù)反饋修改布局。
  • AI Critic則負責(zé)挑毛?。ɡ纭斑@里箭頭重疊了”、“布局重心不穩(wěn)”),直到得到滿意的繪圖質(zhì)量。
第三步:Aesthetic Rendering & “Erase-and-Correct”

在最終美化階段,AutoFigure首先將布局渲染為一張精美的圖片。隨后,為了解決現(xiàn)在AIGC生圖文字變形的問題,保證圖片中文字的正確性,AutoFigure引入了專門的“擦除-修正”策略:用OCR識別模糊字符,把它們“摳掉”,再重新覆蓋上清晰的矢量文本。

AutoFigure-Edit:把AI生成圖裝進PPT



△AutoFigure-Edit流程圖(由AutoFigure-Edit生成)

在最新版本AutoFigure-Edit中,西湖大學(xué)團隊更進一步,引入了SAM3自動摳圖技術(shù),包括:

  • 利用Meta最新的SAM3技術(shù)識別圖中的Icon。
  • 配合RMBG-2.0自動去除背景。
  • 矢量重組:將這些干凈的圖標(biāo)重新塞進生成的SVG模板中。

最終,你得到的是一個可以在瀏覽器內(nèi)置編輯器里直接拖拽、改字、換色的動態(tài)畫布,能夠按照你的想法對圖片細節(jié)進行更改。



△基于AutoFigure-Edit的在線畫布



△AutoFigure-Edit渲染過程示例圖

人類實驗結(jié)果:66.7%的專家覺得它達到了Camera-ready標(biāo)準(zhǔn)!

為了驗證AutoFigure的效果,團隊構(gòu)建了全球首個大規(guī)??茖W(xué)插圖基準(zhǔn)——FigureBench

規(guī)模宏大:涵蓋3,300高質(zhì)量文本-圖片對,跨越論文、綜述、技術(shù)博客、教科書等四種科學(xué)文本。



△FigureBench數(shù)據(jù)集介紹

降維打擊:在邏輯清晰度和準(zhǔn)確度上,AutoFigure的優(yōu)勢極大,在教科書類任務(wù)中勝率甚至高達97.5%



△在FigureBench上的實驗結(jié)果

更具說服力的是人類專家盲測:10位論文一作對生成的圖片進行評審,結(jié)果顯示66.7%的專家認為AutoFigure生成的圖已經(jīng)達到了Camera-ready(出版級)標(biāo)準(zhǔn)。



△人類專家評價結(jié)果

接下來,我們看幾個case,直觀感受一下。

由AutoFigure-Edit產(chǎn)生的方法圖:



由AutoFigure-Edit產(chǎn)生的方法圖:



由AutoFigure-Edit產(chǎn)生的方法圖:



方法圖,左側(cè)為第一階段PNG形式,右側(cè)為最終轉(zhuǎn)換得到的SVG文件:



方法圖,左側(cè)為第一階段PNG形式,右側(cè)為最終轉(zhuǎn)換得到的SVG文件:



由AutoFigure-Edit產(chǎn)生的生物機制圖:



由AutoFigure-Edit產(chǎn)生的材料機制圖:



由AutoFigure產(chǎn)生的綜述圖:



由AutoFigure產(chǎn)生的教科書圖:



項目價值:AI Scientist的“最后一塊拼圖”

插圖不僅是視覺補充,更是復(fù)雜科學(xué)概念的橋梁。AutoFigure的出現(xiàn),意味著:

1. 賦能AI科學(xué)家:這是AI實現(xiàn)全流程自主研究(從文本到繪圖)的關(guān)鍵一步。

2. 不只是架構(gòu)圖:無論是流程圖、算法流程,還是復(fù)雜的教科書示意圖,它都能手到擒來。

本項目提供了可一鍵使用的在線網(wǎng)站。建議各位研究者先收藏,下次ddl前,起碼畫圖應(yīng)該不會那么倉促了。

GitHub:

https://github.com/ResearAI/AutoFigure-Edit
論文:

https://arxiv.org/abs/2602.03828v1
HuggingFace:

https://huggingface.co/datasets/WestlakeNLP/FigureBench
網(wǎng)站:

https://deepscientist.cc
彩蛋:

所有學(xué)者均可免費體驗demo,有期刊投稿需求的朋友不用擔(dān)心,Nature風(fēng)格、Science風(fēng)格等多樣風(fēng)格一鍵生成功能也將很快上線。

想要體驗這款“繪圖神器”嗎?點擊上方鏈接即可開始你的創(chuàng)作!

本項目由西湖大學(xué)張岳實驗室全面開源。西湖大學(xué)自然語言處理實驗室(WestlakeNLP)成立于2018年9月,由張岳教授領(lǐng)導(dǎo)。張岳教授畢業(yè)于牛津大學(xué),獲博士學(xué)位,現(xiàn)任西湖大學(xué)工程學(xué)院副院長。他著有劍橋大學(xué)出版社出版的《自然語言處理》一書,并擔(dān)任過EMNLP 2022等多個頂級NLP會議的程序委員會主席。

本項目核心團隊成員包括翁詣軒*、林圳、朱敏郡、謝秋婕、盧攀忠、孫啟耀等人。實驗室過往成果包括Cycle Researcher、DeepReview、DeepScientist(兩個月刷新三個前沿任務(wù)SoTA的人工智能科學(xué)家項目)等工作。歡迎感興趣的同學(xué)加入到自動化科學(xué)發(fā)現(xiàn)研究,有意向申請長期實習(xí)、博士生、研究助理者可聯(lián)系張岳教授郵箱(zhangyue@westlake.edu.cn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
一對夫妻自駕從新疆喀什到重慶,因晚5秒錯過免費高速時間付1700余元,“當(dāng)時又好笑又好氣,當(dāng)長教訓(xùn)了”

一對夫妻自駕從新疆喀什到重慶,因晚5秒錯過免費高速時間付1700余元,“當(dāng)時又好笑又好氣,當(dāng)長教訓(xùn)了”

大象新聞
2026-02-25 23:41:07
7場造7球!3500萬歐元買來邊路最強爆點,馬競冬窗撿漏非洲先生

7場造7球!3500萬歐元買來邊路最強爆點,馬競冬窗撿漏非洲先生

體壇老球迷
2026-02-25 16:10:13
孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

另子維愛讀史
2026-02-25 23:35:20
血型決定壽命長短?60萬人研究發(fā)現(xiàn):A型血或“天生”更易中風(fēng)

血型決定壽命長短?60萬人研究發(fā)現(xiàn):A型血或“天生”更易中風(fēng)

奇妙的本草
2026-02-26 12:00:24
燒光10億,下載暴跌!騰訊元寶,輸慘了!

燒光10億,下載暴跌!騰訊元寶,輸慘了!

功夫財經(jīng)
2026-02-25 08:57:30
平頂山打人后續(xù): 鑒定已出,家屬拒和解,打人夫妻結(jié)局大快人心

平頂山打人后續(xù): 鑒定已出,家屬拒和解,打人夫妻結(jié)局大快人心

觀察鑒娛
2026-02-26 10:44:49
當(dāng)韓國人知道韓國很小中國很大后,是完全顛覆他們認知的!

當(dāng)韓國人知道韓國很小中國很大后,是完全顛覆他們認知的!

夜深愛雜談
2026-02-25 21:23:43
行程有變,默茨訪華縮短一天?德國發(fā)出警告,中方身份發(fā)生變化

行程有變,默茨訪華縮短一天?德國發(fā)出警告,中方身份發(fā)生變化

無情有思ss
2026-02-25 14:59:41
國企開始“軟裁員”:沒等來辭退書,卻等來了一把鈍刀子

國企開始“軟裁員”:沒等來辭退書,卻等來了一把鈍刀子

時尚的弄潮
2026-02-24 19:53:20
哈登傷病最新進展!名記:骨折發(fā)生在拇指尖端,無需手術(shù)

哈登傷病最新進展!名記:骨折發(fā)生在拇指尖端,無需手術(shù)

大眼瞄世界
2026-02-26 12:23:44
天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

三農(nóng)老歷
2026-02-25 19:18:27
310億對臺軍售懸了?特朗普松口背后,全是中方的硬核反制!

310億對臺軍售懸了?特朗普松口背后,全是中方的硬核反制!

林子說事
2026-02-26 13:14:51
小米汽車工廠官宣:卡丁車體驗中心將于3月1日營業(yè),首發(fā)價69元

小米汽車工廠官宣:卡丁車體驗中心將于3月1日營業(yè),首發(fā)價69元

PChome電腦之家
2026-02-26 14:37:47
突發(fā)!2026年全國第一巨額搶劫案在江蘇發(fā)生了,197萬,疑犯已捕

突發(fā)!2026年全國第一巨額搶劫案在江蘇發(fā)生了,197萬,疑犯已捕

離離言幾許
2026-02-26 10:14:26
人還沒到,就涼了?曝遼寧新簽悍將賽季報銷,26歲前鋒傷情出爐

人還沒到,就涼了?曝遼寧新簽悍將賽季報銷,26歲前鋒傷情出爐

萌蘭聊個球
2026-02-26 14:34:56
日本游客:盡管中日關(guān)系不太好,但中國人很友好

日本游客:盡管中日關(guān)系不太好,但中國人很友好

日本物語
2025-12-29 21:23:17
跨境襲擊白俄羅斯,破壞俄軍通訊系統(tǒng)!澤連斯基揭穿盧卡申科本質(zhì)

跨境襲擊白俄羅斯,破壞俄軍通訊系統(tǒng)!澤連斯基揭穿盧卡申科本質(zhì)

鷹眼Defence
2026-02-25 18:40:24
黃曉明帶新女伴新加坡旅游,紳士給女方撐傘,身材不如楊穎葉珂

黃曉明帶新女伴新加坡旅游,紳士給女方撐傘,身材不如楊穎葉珂

觀察鑒娛
2026-02-26 09:30:39
節(jié)后門診爆滿,這種“神器”火了!有人用后嘔吐、厭食,醫(yī)生緊急提醒

節(jié)后門診爆滿,這種“神器”火了!有人用后嘔吐、厭食,醫(yī)生緊急提醒

環(huán)球網(wǎng)資訊
2026-02-26 07:26:21
徐夢桃婆婆郭麗圈粉,50歲凍齡顏值,十年追賽護子格局令人敬佩

徐夢桃婆婆郭麗圈粉,50歲凍齡顏值,十年追賽護子格局令人敬佩

生命中最美的奇跡
2026-02-26 09:51:00
2026-02-26 15:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12205文章數(shù) 176394關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

縣委書記抖音賬號成民情留言板 當(dāng)?shù)兀核救嘶貜?fù)網(wǎng)友

頭條要聞

縣委書記抖音賬號成民情留言板 當(dāng)?shù)兀核救嘶貜?fù)網(wǎng)友

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

人民幣升破6.85,創(chuàng)3年新高

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

本地
健康
數(shù)碼
房產(chǎn)
公開課

本地新聞

津南好·四時總相宜

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

安卓最強釘子戶:英偉達Shield TV推送9.2.4更新

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標(biāo)桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版