国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Loop-ViT:AI學會「反復思考」,3.8M參數(shù)小模型追平人類平均水平

0
分享至



本工作由香港科技大學、中科院自動化所、加州大學圣克魯斯分校的研究者們共同完成



當我們解一道復雜的數(shù)學題或觀察一幅抽象圖案時,大腦往往需要反復思考、逐步推演。然而,當前主流的深度學習模型卻走的是「一次通過」的路線——輸入數(shù)據(jù),經(jīng)過固定層數(shù)的網(wǎng)絡(luò),直接輸出答案。

這種前饋式架構(gòu)在圖像分類等感知任務(wù)上表現(xiàn)出色,但面對需要多步推理的抽象問題時,卻顯得力不從心。最典型的例子就是「ARC-AGI 基準測試」——一個被認為是衡量 AI 抽象推理能力的「試金石」。

近日,來自香港科技大學、中科院自動化所、UC Santa Cruz 的研究團隊提出了「Loop-ViT」,首次將循環(huán) Transformer 引入視覺推理領(lǐng)域。這個僅有18M 參數(shù)的模型,在 ARC-AGI-1 基準上達到了「65.8%」的準確率,超越了參數(shù)量高達 73M 的 VARC 集成模型。更令人驚訝的是,其 3.8M 的小型版本也能達到 60.1% 的準確率,幾乎追平人類平均水平(60.2%)。



  • 論文標題:LoopViT: Scaling Visual ARC with Looped Transformers
  • 論文鏈接:https://arxiv.org/abs/2602.02156
  • 代碼開源:https://github.com/WenjieShu/LoopViT

什么是 ARC-AGI?

為什么它如此困難?

ARC-AGI(Abstraction and Reasoning Corpus)是由 Keras 之父 Fran?ois Chollet 提出的抽象推理基準。與 ImageNet 等傳統(tǒng)視覺基準不同,ARC 不考察模型識別貓狗、汽車的能力,而是測試其歸納推理能力。

每個 ARC 任務(wù)僅提供 2–4 個示例對(輸入-輸出網(wǎng)格),模型需要從這些示例中歸納出潛在規(guī)則,然后將其應(yīng)用到新的測試輸入上。這些規(guī)則可能涉及:

  • 對象的平移、旋轉(zhuǎn)、鏡像
  • 圖案的重復與填充
  • 基于顏色的條件變換
  • 類似「重力」的物理模擬

人類通常能夠通過觀察示例、提出假設(shè)、驗證修正的迭代過程來解決這些問題。然而,傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)卻缺乏這種「反復思考」的能力——它們的計算深度被固定綁定在網(wǎng)絡(luò)層數(shù)上。

Loop-ViT 的核心創(chuàng)新



  • 循環(huán)架構(gòu):解耦計算深度與參數(shù)量

傳統(tǒng) Vision Transformer 的計算流程是:輸入 → 第 1 層 → 第 2 層 → …… → 第 L 層 → 輸出。每增加一層就意味著更多的參數(shù),計算深度與模型容量緊密綁定。

Loop-ViT 的設(shè)計理念截然不同:重復執(zhí)行同一組權(quán)重。模型的核心是一個權(quán)重共享的 Transformer 塊,可以被循環(huán)執(zhí)行 T 次。這意味著:

  • 計算深度可以任意擴展,而不增加參數(shù)
  • 模型被迫學習一個通用的「思考步驟」,而非任務(wù)特定的啟發(fā)式規(guī)則
  • 類似于人類大腦的工作記憶被反復更新



  • 混合編碼塊:全局推理 + 局部更新

研究團隊觀察到,ARC 任務(wù)需要兩種不同的處理模式:

  • 全局規(guī)則歸納:理解整體變換規(guī)律(如「所有藍色變紅色」)
  • 局部模式執(zhí)行:精確的像素級操作(如「填充封閉區(qū)域」)

為此,Loop-ViT 設(shè)計了Hybrid Block,融合了:

  • 自注意力機制:捕捉全局依賴關(guān)系
  • 深度可分離卷積:處理局部空間模式
  • 動態(tài)退出:知道何時停止思考

并非所有問題都需要同樣長的思考時間。簡單的幾何變換可能幾步就能確定答案,而復雜的算法推理則需要更多迭代。

Loop-ViT 引入了基于熵的動態(tài)退出機制

  • 每次迭代后,計算預測分布的 Shannon 熵
  • 當熵值低于閾值(模型「確信」了答案),立即停止
  • 無需任何額外參數(shù),完全基于模型的內(nèi)在不確定性

實驗表明,能夠「早退」的樣本準確率高達 83.33%,而需要完整迭代的困難樣本準確率為 45.80%。這與人類的認知資源分配策略驚人地一致——簡單問題快速解決,復雜問題投入更多時間。

實驗結(jié)果:

小參數(shù),大性能

在 ARC-AGI-1 基準上,Loop-ViT 的表現(xiàn)令人印象深刻。幾個關(guān)鍵觀察如下:



參數(shù)效率驚人:3.8M 的 Loop-ViT-Small 超越 18M 的 VARC,僅用 1/5 參數(shù)。

超越模型集成:18M 的 Loop-ViT 超越 73M 的 VARC 四模型集成。

深入理解:

模型在「思考」什么?

研究團隊對 Loop-ViT 的內(nèi)部機制進行了可視化分析,揭示了有趣的「涌現(xiàn)」行為:

預測結(jié)晶現(xiàn)象:隨著迭代進行,模型的預測從模糊逐漸變得清晰確定。早期迭代的預測波動較大,后期則趨于穩(wěn)定——就像溶液中的晶體逐漸析出。

注意力模式演化

  • 早期迭代:注意力分布廣泛,模型在「掃描」整個輸入,收集信息。
  • 后期迭代:注意力變得稀疏聚焦,精確對準需要操作的區(qū)域。

這種從「全局探索」到「局部執(zhí)行」的轉(zhuǎn)變,與人類解決視覺推理問題的策略高度相似。

結(jié)語

Loop-ViT 的成功揭示了一個重要洞見:在視覺領(lǐng)域,對于需要推理的任務(wù),「思考時間」比「模型大小」更重要。

這與當前大模型領(lǐng)域一味追求參數(shù)規(guī)模的趨勢形成鮮明對比。也許,實現(xiàn)真正的人工智能不僅需要更大的網(wǎng)絡(luò),更需要讓模型學會像人一樣「反復思考」。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

火山詩話
2026-02-24 21:56:12
女孩當小姐,一晚要提供4到5次上門服務(wù),2015年被親人點到不赴約

女孩當小姐,一晚要提供4到5次上門服務(wù),2015年被親人點到不赴約

漢史趣聞
2025-11-08 09:27:32
真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

真正的“逆齡運動”,堅持一年大腦年輕2.3歲!不是跑步、走路……

人民日報健康客戶端
2026-02-25 07:34:27
上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上海一行人橫穿快速路被撞身亡,家屬索賠150萬,法院判決司機等無責

上觀新聞
2026-02-25 18:39:10
平頂山打人夫妻被逮捕,老家村干部發(fā)聲:他們有兩個孩子,老家房子已塌不在村里居住,完全想不到兩人會做這種事

平頂山打人夫妻被逮捕,老家村干部發(fā)聲:他們有兩個孩子,老家房子已塌不在村里居住,完全想不到兩人會做這種事

極目新聞
2026-02-25 20:18:11
中國連發(fā)11號12號公告,日本叫囂對等制裁,兩招反擊,高市增兵

中國連發(fā)11號12號公告,日本叫囂對等制裁,兩招反擊,高市增兵

吳欣純Deborah
2026-02-25 12:25:13
威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

小火箭愛體育
2026-02-26 09:05:55
總第60順位!雷霆隊可能選中,又一個中國球員!

總第60順位!雷霆隊可能選中,又一個中國球員!

德譯洋洋
2026-02-26 12:22:07
跟腱撕裂!塔圖姆即將復出!轟動整個NBA聯(lián)盟

跟腱撕裂!塔圖姆即將復出!轟動整個NBA聯(lián)盟

籃球教學論壇
2026-02-26 12:30:21
一路走好!2026春節(jié)才過7天,已有6位大佬離世,最年輕的才40歲

一路走好!2026春節(jié)才過7天,已有6位大佬離世,最年輕的才40歲

鯨探所長
2026-02-24 19:34:36
重磅!3月1日起,CT檢查這三項費用全面取消,全國統(tǒng)一執(zhí)行!

重磅!3月1日起,CT檢查這三項費用全面取消,全國統(tǒng)一執(zhí)行!

悅心知足
2026-02-25 15:53:58
具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

具俊曄已回韓國,他清空了賬號,和好兄弟一起吃泡菜美食

素素娛樂
2026-02-26 08:05:09
一場5-0,讓榜首易主,前3只差3分,C羅點射:21場轟入21球

一場5-0,讓榜首易主,前3只差3分,C羅點射:21場轟入21球

足球狗說
2026-02-26 07:09:06
江西小伙去深圳擰螺絲,伙食一頓15塊,干了3天,連忙提桶跑路了

江西小伙去深圳擰螺絲,伙食一頓15塊,干了3天,連忙提桶跑路了

餐飲新紀元
2026-02-26 07:12:27
一份末日推演,傳得神乎其神,2028年就會到來?

一份末日推演,傳得神乎其神,2028年就會到來?

中產(chǎn)先生
2026-02-25 11:30:39
同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應(yīng)

同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應(yīng)

大風新聞
2026-02-25 17:00:14
貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網(wǎng)暴慘了

貝加爾湖事故升級!妻女遇難,逃生者是父親,疑動作慢被網(wǎng)暴慘了

聽風喃
2026-02-25 13:53:39
我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

i書與房
2026-02-25 17:22:34
長沙市重大項目集中簽約開工,總投資額超260億元

長沙市重大項目集中簽約開工,總投資額超260億元

界面新聞
2026-02-26 09:37:06
小米狂出六款新車!雷軍徹底失控了

小米狂出六款新車!雷軍徹底失控了

李東陽朋友圈
2026-02-25 13:03:08
2026-02-26 13:07:01
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12362文章數(shù) 142569關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

短劇市場風云突變!有人投百萬賠得精光

汽車要聞

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態(tài)度原創(chuàng)

游戲
親子
時尚
本地
旅游

新品節(jié)DEMO試玩報告

親子要聞

產(chǎn)后第一周:身體發(fā)出的5個“正常信號”,新手媽媽請收藏!

倫敦時裝周|2026秋冬流行趨勢早知道

本地新聞

津南好·四時總相宜

旅游要聞

一整年都有新驚喜!上海迪士尼十周年慶典即將啟幕,三大娛樂演出煥新升級

無障礙瀏覽 進入關(guān)懷版