国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

《自然》發(fā)表“AI教父”辛頓的FF算法在卷積神經(jīng)網(wǎng)絡(luò)中的最新系統(tǒng)擴展,這是類腦學(xué)習(xí)的重大進(jìn)步

0
分享至

深度學(xué)習(xí)的崛起幾乎完全依賴于反向傳播(Backpropagation, BP)算法。BP通過鏈?zhǔn)椒▌t逐層計算梯度,使得數(shù)以百萬計的參數(shù)能夠在訓(xùn)練過程中不斷調(diào)整。

然而,這一方法在實際應(yīng)用中存在顯著局限,BP需要存儲大量中間激活值,導(dǎo)致顯存消耗極高,BP依賴的計算模式在類腦硬件或非傳統(tǒng)計算架構(gòu)上難以實現(xiàn),從生物學(xué)角度看,人腦的學(xué)習(xí)機制與BP存在根本差異,這使得BP在“類腦學(xué)習(xí)”的探索中顯得不夠自然。

在這樣的背景下,Geoffrey Hinton 在 2022 年提出了Forward–Forward (FF) 算法。這一方法完全摒棄了反向傳播,而是通過兩次前向傳播來完成學(xué)習(xí):一次輸入正樣本(圖像與正確標(biāo)簽),一次輸入負(fù)樣本(圖像與錯誤標(biāo)簽),并利用局部定義的“goodness函數(shù)”來更新權(quán)重。FF算法的提出不僅是對深度學(xué)習(xí)訓(xùn)練方式的挑戰(zhàn),更是對生物學(xué)啟發(fā)式學(xué)習(xí)的一次探索。

FF算法最初僅在全連接網(wǎng)絡(luò)中得到驗證,如何將其擴展到卷積神經(jīng)網(wǎng)絡(luò)(CNN)這一圖像處理的核心架構(gòu),成為亟待解決的問題。

11 月 5 日,《自然》發(fā)表研究團隊首次系統(tǒng)性地將FF算法應(yīng)用于CNN 的最新成果,并提出了兩種新的空間標(biāo)簽策略,基于傅里葉波的標(biāo)簽與基于形態(tài)學(xué)變換的標(biāo)簽。這一創(chuàng)新使得卷積層能夠在全局范圍內(nèi)捕捉標(biāo)簽信息,避免了傳統(tǒng) one-hot 標(biāo)簽在局部嵌入時的缺陷。

研究由來自德國哥廷根的跨學(xué)科團隊完成,他們是Riccardo Scodellaro, Ajinkya Kulkarni, FraukeAlves& Matthias Schr?ter,成員橫跨Max Planck Institute for Multidisciplinary SciencesUniversity Medical Center G?ttingen以及Max Planck Institute for Dynamics and Self-Organization。他們的研究方向涵蓋分子影像學(xué)、血液學(xué)與腫瘤學(xué)、放射學(xué)以及復(fù)雜系統(tǒng)物理學(xué),體現(xiàn)了醫(yī)學(xué)影像、人工智能與復(fù)雜系統(tǒng)理論的交叉融合。這種跨學(xué)科背景為FF算法在CNN中的應(yīng)用提供了堅實的理論與實踐支撐。

01

工作綜述

反向傳播雖然是深度學(xué)習(xí)的基石,但其局限性早已引發(fā)廣泛關(guān)注。BP的存儲開銷巨大,訓(xùn)練大型模型時顯存需求往往是權(quán)重存儲的數(shù)倍。其次,BP在類腦硬件或非傳統(tǒng)計算架構(gòu)上難以實現(xiàn),限制了其在低能耗計算中的應(yīng)用。BP與生物神經(jīng)系統(tǒng)的學(xué)習(xí)機制差異明顯,使得其在“類腦學(xué)習(xí)”探索中缺乏生物學(xué)合理性。

為解決這些問題,研究者提出了多種替代方法。

1.Hebbian學(xué)習(xí)與對比Hebbian學(xué)習(xí):基于“神經(jīng)元共同激活則連接增強”的局部學(xué)習(xí)規(guī)則,強調(diào)生物學(xué)動機。

2.平衡傳播(Equilibrium Propagation):在能量模型框架下,通過網(wǎng)絡(luò)的自由態(tài)與約束態(tài)差異來驅(qū)動學(xué)習(xí),連接了Hopfield網(wǎng)絡(luò)與梯度下降。

3.反饋對齊(Feedback Alignment)、PEPITA等局部學(xué)習(xí)規(guī)則:通過局部誤差信號或隨機投影來更新權(quán)重,避免了逐層反向傳播。

4.零階優(yōu)化與能量模型:通過兩次前向傳播的差異來近似梯度,雖然效率較低,但在現(xiàn)代改進(jìn)下已具備競爭力。

在這一廣闊的探索背景下,Hinton提出的Forward–Forward算法屬于局部學(xué)習(xí)規(guī)則的范疇。它通過正負(fù)樣本的 goodness 差異來驅(qū)動權(quán)重更新,避免了反向傳播的復(fù)雜性。早期應(yīng)用主要集中在全連接網(wǎng)絡(luò),隨后擴展到圖神經(jīng)網(wǎng)絡(luò)、光學(xué)神經(jīng)網(wǎng)絡(luò)以及類腦硬件實驗。然而在卷積神經(jīng)網(wǎng)絡(luò)這一主流架構(gòu)中,F(xiàn)F算法的應(yīng)用仍是空白。本研究正是填補這一缺口的首次系統(tǒng)性嘗試。

02

研究創(chuàng)新點

在這項研究中,最具突破性的貢獻(xiàn)是提出了兩種全新的空間擴展標(biāo)簽策略,它們直接回應(yīng)了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中面臨的核心難題。Hinton 在最初的設(shè)計中采用的是one-hot 標(biāo)簽嵌入,即將類別信息編碼在圖像左上角的幾個像素中。

然而這種方式在全連接網(wǎng)絡(luò)中尚可行,但在卷積神經(jīng)網(wǎng)絡(luò)中卻存在天然缺陷,卷積核在不同空間位置滑動時,往往無法捕捉到局部嵌入的標(biāo)簽信息,導(dǎo)致網(wǎng)絡(luò)難以利用標(biāo)簽進(jìn)行有效學(xué)習(xí)。

為了解決這一問題,研究團隊提出了兩種空間化的標(biāo)簽嵌入方法,使得類別信息能夠在整張圖像中均勻分布,從而保證卷積層在任意位置都能感知到標(biāo)簽信號。

第一種方法是傅里葉波標(biāo)簽。研究者為每個類別生成一組獨特的灰度波紋,這些波紋由頻率、相位和方向的不同組合構(gòu)成。通過將這種波紋圖像與原始數(shù)據(jù)進(jìn)行像素級疊加,標(biāo)簽信息被擴展到整個圖像空間。這樣一來,卷積核在任何位置都能捕捉到與類別相關(guān)的模式,從而避免了局部標(biāo)簽缺失的問題。傅里葉波標(biāo)簽的優(yōu)勢在于其數(shù)學(xué)上的可控性和全局一致性,能夠為網(wǎng)絡(luò)提供一種穩(wěn)定的類別信號。

第二種方法是形態(tài)學(xué)標(biāo)簽。與傅里葉波的全局波紋不同,形態(tài)學(xué)標(biāo)簽通過對原始圖像施加一組確定性的形態(tài)學(xué)變換來嵌入類別信息,例如膨脹、腐蝕、旋轉(zhuǎn)或其他幾何操作。每個類別對應(yīng)一組獨特的變換組合,這些變換會改變圖像的結(jié)構(gòu)特征,從而迫使網(wǎng)絡(luò)在學(xué)習(xí)過程中關(guān)注圖像的形態(tài)差異,而不是依賴簡單的標(biāo)簽?zāi)J。形態(tài)學(xué)標(biāo)簽的優(yōu)勢在于它能有效避免“捷徑解”——即網(wǎng)絡(luò)僅僅依賴標(biāo)簽的簡單模式來區(qū)分正負(fù)樣本,而忽視了圖像本身的復(fù)雜特征。

這兩種空間擴展標(biāo)簽策略的提出,直接解決了 CNN 在 FF 框架下的關(guān)鍵問題:如何讓卷積核在全局范圍內(nèi)感知類別信息。它們不僅保證了標(biāo)簽信號的空間可達(dá)性,還通過不同的機制引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)更深層次的特征。傅里葉波標(biāo)簽提供了全局一致的模式,而形態(tài)學(xué)標(biāo)簽則強化了對圖像結(jié)構(gòu)的關(guān)注。兩者結(jié)合,為 FF-CNN 的訓(xùn)練提供了新的可能性。

從更宏觀的角度來看,這一創(chuàng)新點不僅是技術(shù)上的改進(jìn),更是理念上的突破。它體現(xiàn)了研究團隊在類腦學(xué)習(xí)與卷積架構(gòu)結(jié)合上的深度思考:如果我們希望擺脫反向傳播的限制,就必須重新設(shè)計標(biāo)簽與數(shù)據(jù)的交互方式,讓網(wǎng)絡(luò)在前向傳播中就能充分利用類別信息。這種思路為未來的類腦計算和低能耗硬件實現(xiàn)提供了重要啟示。

03

方法與實現(xiàn)

在針對 MNIST 數(shù)據(jù)集 的實驗中,研究團隊設(shè)計了一種由三層連續(xù)卷積結(jié)構(gòu)組成的網(wǎng)絡(luò)架構(gòu)。每一層均采用相同數(shù)量的濾波器矩陣,這一參數(shù)也是實驗中重點考察的超參數(shù)之一。值得注意的是,網(wǎng)絡(luò)中沒有引入最大池化層,因為在預(yù)實驗中發(fā)現(xiàn)池化操作會降低整體準(zhǔn)確率。

數(shù)據(jù)流動過程可以概括為:輸入圖像與其正負(fù)標(biāo)簽依次通過三層卷積,每層之后都進(jìn)行 層歸一化(Layer Normalization) 和 ReLU 激活。在每一層中,正負(fù)樣本的激活差異被用于計算該層的 sigmoid 函數(shù)輸出,從而形成局部的判別信號。


圖1:空間擴展標(biāo)簽存在于整個圖像中,而一個熱編碼僅限于左上角區(qū)域。對于FF訓(xùn)練,我們需要兩個數(shù)據(jù)集,它們都為圖像添加標(biāo)簽。第一行描述了陽性數(shù)據(jù)集的創(chuàng)建,其中示例圖像被正確標(biāo)記。最下面一行顯示了陰性數(shù)據(jù)集的示例,其中圖像與從其他可能標(biāo)簽中隨機選擇的假標(biāo)簽相結(jié)合。我們展示了添加標(biāo)簽的三種方法。(a)和(b)描述了Hinton使用的單熱編碼:圖像頂行的第一個像素用作指示符。在該示例中,設(shè)置為1的單個像素的列數(shù)對應(yīng)于目標(biāo)值。(c)和(d)描述了我們提出的基于傅里葉的技術(shù)。每個標(biāo)簽對應(yīng)于與輸入大小相同的圖像,但具有特征灰度值波。標(biāo)簽通過逐像素相加的方式包含在圖像中。(e)和(f)顯示了我們提出的基于形態(tài)學(xué)的方法。每個標(biāo)簽都與一組獨特的變換相關(guān)聯(lián),這些變換會影響圖像形態(tài),迫使網(wǎng)絡(luò)專注于圖像特征。

在數(shù)學(xué)定義上,優(yōu)度(goodness)被設(shè)定為該層所有激活值的平方和:


在損失函數(shù)設(shè)計上,研究者并未采用文獻(xiàn)中提出的對稱性方案,而是借鑒了其他工作提出的累積網(wǎng)絡(luò)損失,即通過將各層損失相加來增強層間協(xié)作。但與傳統(tǒng)做法不同的是,本文排除了第一層的損失。原因在于第一層的激活向量長度本身就能區(qū)分正負(fù)樣本,如果過度依賴這一信息,后續(xù)層將無法學(xué)習(xí)更復(fù)雜的特征。通過舍棄第一層的損失,網(wǎng)絡(luò)被迫依賴相對激活模式,從而在更深層次上提取有意義的特征。這一做法與 Hinton 在原始實現(xiàn)中的選擇保持一致。

在訓(xùn)練細(xì)節(jié)上,團隊遵循了兩點關(guān)鍵實現(xiàn)。

  • 層歸一化:對每個激活值進(jìn)行歸一化,使后續(xù)層只能利用前一層的模式信息,而非整體范數(shù)。
  • 學(xué)習(xí)率線性冷卻:在訓(xùn)練周期中途調(diào)整學(xué)習(xí)率,公式如下:


其中,E 表示總訓(xùn)練輪數(shù),e 為當(dāng)前輪數(shù)。

為了分析各層的貢獻(xiàn),研究者定義了基于層的判別損失與準(zhǔn)確率。Sigmoid 輸出被解釋為概率,當(dāng)值大于 0.5 時,表示該層將圖像識別為正樣本。通過與真實標(biāo)簽比較,可以得到判別準(zhǔn)確率,并進(jìn)一步計算二元交叉熵?fù)p失。

推理階段,網(wǎng)絡(luò)提供了兩種方案:

  • 線性分類器:除第一層外,每層的 HH 個神經(jīng)元與一個包含 NN 個節(jié)點的分類層全連接,節(jié)點數(shù)等于類別數(shù)。權(quán)重通過交叉熵?fù)p失訓(xùn)練,這是默認(rèn)的推理方式。
  • 優(yōu)度評估:每張圖像與所有可能的標(biāo)簽組合進(jìn)行前向傳播,計算每個標(biāo)簽的優(yōu)度值,最終選擇優(yōu)度最大的標(biāo)簽作為預(yù)測結(jié)果:


其中,對于每個關(guān)聯(lián)的標(biāo)簽m,其優(yōu)度表示為


其中H是除第一層神經(jīng)元之外的所有神經(jīng)元的數(shù)量。

CIFAR10 與 CIFAR100的實驗中,研究團隊采用了更深的網(wǎng)絡(luò)結(jié)構(gòu)。具體而言,網(wǎng)絡(luò)擴展為六層卷積,并將層歸一化替換為批歸一化(Batch Normalization),以提升訓(xùn)練穩(wěn)定性。這一設(shè)計參考了已有文獻(xiàn)中的優(yōu)化方法,同時保持空間擴展標(biāo)簽策略不變。


圖2:應(yīng)用于MNIST數(shù)據(jù)集的FF訓(xùn)練CNN的示意圖。正負(fù)樣本通過三個卷積層進(jìn)行處理,每個卷積層都經(jīng)過層歸一化和ReLU激活。在每一層,使用正樣本和負(fù)樣本的二元交叉熵計算優(yōu)度函數(shù)。然后,可以通過線性分類器或通過評估所有標(biāo)簽的優(yōu)度得分來進(jìn)行最終分類。

這種方法的獨特之處在于,它完全摒棄了反向傳播的鏈?zhǔn)教荻扔嬎,而是通過局部 goodness 函數(shù)的優(yōu)化來驅(qū)動學(xué)習(xí)。正負(fù)樣本的對比機制讓網(wǎng)絡(luò)在沒有反向傳播的情況下,依然能夠逐層提取有意義的特征。

從整體來看,方法與實現(xiàn)部分展示了 FF 算法在 CNN 中的完整落地:通過空間擴展標(biāo)簽保證卷積核能捕捉類別信息,通過 goodness 函數(shù)定義訓(xùn)練目標(biāo),再通過跨層累計損失與雙重推理方式實現(xiàn)分類。這一框架不僅在數(shù)學(xué)上自洽,也為未來在類腦硬件上的應(yīng)用提供了可行路徑。

04

實驗結(jié)果與分析

在實驗部分,研究團隊通過對MNIST、CIFAR10、CIFAR100三個經(jīng)典數(shù)據(jù)集的系統(tǒng)測試,驗證了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的可行性與局限性。結(jié)果不僅展示了 FF 與傳統(tǒng)反向傳播(BP)的性能對比,也揭示了空間擴展標(biāo)簽策略在復(fù)雜數(shù)據(jù)集上的關(guān)鍵作用。

MNIST數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)幾乎與 BP-CNN 持平。采用三層卷積結(jié)構(gòu)(每層 128 個 7×7 卷積核),F(xiàn)F-CNN在測試集上取得了99.16% 的精度,而BP-CNN 的精度為99.13%。這表明在簡單數(shù)據(jù)集上,F(xiàn)F 算法完全能夠替代 BP。然而,訓(xùn)練動態(tài)上存在差異:FF 收斂速度較慢,需要更多迭代才能達(dá)到穩(wěn)定精度,但其內(nèi)存消耗顯著降低,約為 BP 的25–30%。這意味著在硬件受限的場景下,F(xiàn)F 算法具有明顯優(yōu)勢。


圖3:FF訓(xùn)練的CNN架構(gòu)的最佳MNIST性能與相同架構(gòu)的反向傳播訓(xùn)練的CNN的結(jié)果相當(dāng)。(a)在批量大小為50的200個迭代訓(xùn)練后,根據(jù)每層濾波器的數(shù)量,為具有三個卷積層的CNN獲得的精度值。濾波器大小為7乘以7,學(xué)習(xí)率分別設(shè)置為FF的5x10-5和BP的10-3的最佳值。FF訓(xùn)練的網(wǎng)絡(luò)使用來自集合1的標(biāo)簽和35%的標(biāo)簽強度K。BP和FF的報告值是從驗證數(shù)據(jù)中收集的。綠色數(shù)據(jù)點顯示了與FF訓(xùn)練網(wǎng)絡(luò)相關(guān)的結(jié)果,并使用優(yōu)度比較進(jìn)行推理。在這種情況下,使用(b)中報告的相應(yīng)混淆矩陣所示的測試數(shù)據(jù),每層128個濾波器實現(xiàn)了99.16±0.02%的準(zhǔn)確率。(c)顯示了為區(qū)分有助于訓(xùn)練的每個隱藏層的正負(fù)訓(xùn)練數(shù)據(jù)而計算的損失(紅線和藍(lán)線),以及訓(xùn)練期間使用的組合損失(綠線)。(d)顯示相同隱藏層的辨別精度(紅線和藍(lán)線)以及訓(xùn)練期間獲得的總精度(綠線)。

在更具挑戰(zhàn)性的CIFAR10數(shù)據(jù)集上,差異開始顯現(xiàn)。傳統(tǒng) BP-CNN 的精度約為85.4%,而 FF-CNN 的表現(xiàn)依賴于標(biāo)簽策略:采用傅里葉波標(biāo)簽時精度為60.9%,而采用形態(tài)學(xué)標(biāo)簽時提升至68.6%。這一結(jié)果凸顯了標(biāo)簽設(shè)計的重要性。傅里葉波標(biāo)簽提供了全局一致的信號,但在復(fù)雜圖像中容易被網(wǎng)絡(luò)當(dāng)作“捷徑”,導(dǎo)致模型忽視圖像本身的細(xì)節(jié)。而形態(tài)學(xué)標(biāo)簽通過改變圖像結(jié)構(gòu),迫使網(wǎng)絡(luò)關(guān)注真實的形態(tài)特征,從而有效避免了捷徑解,提升了分類性能。

CIFAR100數(shù)據(jù)集上,研究團隊進(jìn)一步驗證了空間擴展標(biāo)簽的可擴展性。通過優(yōu)化標(biāo)簽集(從 2000 個候選模式中挑選出相關(guān)性最低的 100 個組合),F(xiàn)F-CNN 的精度穩(wěn)定在37–38%。雖然這一結(jié)果仍顯著低于 BP 的表現(xiàn),但它證明了空間標(biāo)簽策略能夠在百類任務(wù)中保持區(qū)分度,具備一定的擴展能力。


圖4:FF和BP訓(xùn)練的CNN的CAM顯示了網(wǎng)絡(luò)在進(jìn)行預(yù)測時認(rèn)為哪些圖像區(qū)域是有益的(黃色)或有害的(粉紅色)。(a)-(d)顯示四個輸入圖像。(e)-(h)和(i)-(l)分別是基于FF和BP培訓(xùn)的CAM。所有的例子都來自一個每層有16個卷積神經(jīng)元的網(wǎng)絡(luò),濾波器大小為5×5,在200個迭代周期內(nèi)用50個批量進(jìn)行訓(xùn)練。FF學(xué)習(xí)率:5×10^-5,BP學(xué)習(xí)率:1×10^-3。

整體來看,實驗結(jié)果揭示了 FF-CNN 的雙重特性:在簡單數(shù)據(jù)集上,它能夠與 BP 相媲美,并且在硬件資源有限的場景下更具優(yōu)勢;在復(fù)雜數(shù)據(jù)集上,性能依賴于標(biāo)簽策略,形態(tài)學(xué)標(biāo)簽展現(xiàn)出更強的魯棒性與合理性。盡管 FF 在精度上仍落后于 BP,但其訓(xùn)練機制的生物學(xué)合理性與硬件友好性,使其成為未來類腦計算與低能耗 AI 的潛在候選方案。

這種結(jié)果也提示我們,F(xiàn)F 算法的真正價值或許并不在于直接替代 BP,而在于為深度學(xué)習(xí)提供一種新的思路:通過標(biāo)簽與數(shù)據(jù)的空間交互,推動網(wǎng)絡(luò)在前向傳播中完成學(xué)習(xí)。這種理念在未來的 neuromorphic computing(類腦計算)平臺上,可能會展現(xiàn)出更大的優(yōu)勢。

05

可解釋性與學(xué)習(xí)動態(tài)

在 Forward–Forward (FF) 算法擴展到卷積神經(jīng)網(wǎng)絡(luò)的過程中,研究團隊特別強調(diào)了模型的可解釋性與訓(xùn)練動態(tài)。這不僅是為了驗證 FF-CNN 是否真正學(xué)到了有意義的特征,更是為了理解其在復(fù)雜數(shù)據(jù)集上的表現(xiàn)差異。

首先,研究者利用Class Activation Maps (CAMs)對 FF-CNN 的學(xué)習(xí)過程進(jìn)行了可視化分析。CAMs 是一種解釋性工具,可以揭示網(wǎng)絡(luò)在做出分類決策時關(guān)注的圖像區(qū)域。實驗結(jié)果顯示,F(xiàn)F-CNN 的不同卷積層往往學(xué)習(xí)到互補的特征。例如,在識別數(shù)字“7”時,某一層可能更關(guān)注水平線的內(nèi)部結(jié)構(gòu),而另一層則聚焦于邊緣輪廓。這種分層互補的特征學(xué)習(xí)表明,盡管 FF 算法不依賴反向傳播,它依然能夠逐層構(gòu)建出有意義的表示,并在整體上形成對圖像的全面理解。相比之下,傳統(tǒng) BP-CNN 的特征分布更趨于集中,而 FF-CNN 的特征呈現(xiàn)出更強的多樣性和分工性。


圖5:選擇不同的空間標(biāo)簽會影響學(xué)習(xí)過程。(a)和(b)顯示了在CIFAR10數(shù)據(jù)集上測試的FF訓(xùn)練的CNN的隱藏層的二進(jìn)制精度值(區(qū)分正負(fù)數(shù)據(jù)集的能力)。雖然第一層專注于更簡單和更粗糙的圖像特征,在兩種標(biāo)記策略下表現(xiàn)相似,但深層受益于基于形態(tài)學(xué)的標(biāo)記,但當(dāng)標(biāo)記是簡單的圖案時,它們會受到阻礙。給定相同的數(shù)據(jù)集圖像(c)和(f),與基于形態(tài)學(xué)的標(biāo)記(d)和(g)相關(guān)的歸一化CAM產(chǎn)生的最大值主要局限于圖像邊界(e,h)。

其次,訓(xùn)練穩(wěn)定性成為 FF-CNN 的一個關(guān)鍵議題。研究發(fā)現(xiàn),F(xiàn)F 算法對標(biāo)簽設(shè)計極為敏感。若標(biāo)簽過于簡單(如傅里葉波標(biāo)簽),網(wǎng)絡(luò)可能會走向“捷徑解”,即僅依賴標(biāo)簽?zāi)J蕉鲆晥D像本身的復(fù)雜特征;而形態(tài)學(xué)標(biāo)簽則能迫使網(wǎng)絡(luò)關(guān)注圖像結(jié)構(gòu),從而獲得更穩(wěn)健的收斂路徑。這種敏感性意味著 FF-CNN 的訓(xùn)練過程可能出現(xiàn)不同的收斂軌跡,類似于動力系統(tǒng)中的分岔現(xiàn)象:在相同的初始條件下,網(wǎng)絡(luò)可能因標(biāo)簽設(shè)計或參數(shù)微小差異而收斂到完全不同的解。

這種分岔特性既是挑戰(zhàn),也是機遇。一方面,它揭示了 FF 算法的非線性與復(fù)雜性,說明其學(xué)習(xí)動態(tài)比傳統(tǒng) BP 更難以預(yù)測和控制;另一方面,它也為研究類腦學(xué)習(xí)提供了新的視角——生物神經(jīng)系統(tǒng)的學(xué)習(xí)過程本身就充滿不確定性和多樣性,F(xiàn)F 算法的這種特性或許更接近真實的神經(jīng)學(xué)習(xí)機制。

綜上,F(xiàn)F-CNN 的可解釋性分析表明,它能夠在不同層次上學(xué)習(xí)互補特征,而訓(xùn)練動態(tài)的分岔現(xiàn)象則提醒我們,標(biāo)簽設(shè)計與參數(shù)選擇在這一框架下至關(guān)重要。這不僅是技術(shù)上的挑戰(zhàn),更是理解類腦學(xué)習(xí)與人工智能之間關(guān)系的重要窗口。

06

應(yīng)用前景與挑戰(zhàn)

Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的擴展,展示了其獨特的應(yīng)用潛力。首先,它的最大優(yōu)勢在于局部更新與低內(nèi)存需求。與反向傳播需要存儲大量中間激活值不同,F(xiàn)F 算法只依賴局部的 goodness 函數(shù)進(jìn)行權(quán)重更新,這使得訓(xùn)練過程更加輕量化,尤其適合在顯存有限或硬件受限的環(huán)境中運行。

其次,F(xiàn)F 算法的機制天然契合類腦硬件的實現(xiàn)。在 neuromorphic computing(類腦計算)平臺上,反向傳播往往難以實現(xiàn),而 FF 的雙前向傳播與局部更新則更接近生物神經(jīng)系統(tǒng)的學(xué)習(xí)方式。這意味著 FF-CNN 有望成為未來低能耗硬件和類腦芯片上的重要候選算法。

此外,F(xiàn)F 算法本身就是一種生物學(xué)啟發(fā)的學(xué)習(xí)機制。它通過正負(fù)樣本的對比來驅(qū)動學(xué)習(xí),類似于神經(jīng)系統(tǒng)在強化與抑制之間的動態(tài)平衡。這種機制不僅為人工智能提供了新的訓(xùn)練思路,也為理解人類大腦的學(xué)習(xí)過程提供了可能的模型。

然而,挑戰(zhàn)同樣顯而易見。首先,F(xiàn)F 的推理計算開銷較大。在 goodness 比較模式下,每個輸入需要與所有可能的標(biāo)簽組合進(jìn)行前向傳播,這在多類別任務(wù)中會顯著增加計算量。其次,F(xiàn)F 算法的理論收斂性尚未嚴(yán)格證明,其訓(xùn)練動態(tài)存在分岔現(xiàn)象,意味著結(jié)果可能因標(biāo)簽設(shè)計或參數(shù)微小差異而大幅不同。最后,在復(fù)雜數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)仍明顯落后于 BP-CNN,尤其是在 CIFAR10 和 CIFAR100 上,精度差距較大。這表明 FF 算法在實際應(yīng)用中仍需進(jìn)一步優(yōu)化。

07

結(jié)論與展望

綜合來看,本文的研究證明了FF 算法在 CNN 中的可行性。通過空間擴展標(biāo)簽策略,研究團隊解決了卷積核無法捕捉局部標(biāo)簽信息的問題,使得 FF-CNN 能夠在圖像任務(wù)中實現(xiàn)有效訓(xùn)練。這一創(chuàng)新不僅是技術(shù)上的突破,更是理念上的轉(zhuǎn)變:它強調(diào)在前向傳播中完成學(xué)習(xí),而非依賴反向傳播的鏈?zhǔn)教荻取?/p>

展望未來,F(xiàn)F 算法的應(yīng)用潛力主要集中在三個方向。首先是類腦硬件,在neuromorphic 芯片和低能耗計算平臺上,F(xiàn)F 的局部更新機制可能展現(xiàn)出更大的優(yōu)勢。其次是無監(jiān)督學(xué)習(xí),F(xiàn)F 的正負(fù)樣本對比機制天然適合在缺乏標(biāo)簽的場景中進(jìn)行特征學(xué)習(xí)。再次是對比學(xué)習(xí),通過擴展正負(fù)樣本的構(gòu)造方式,F(xiàn)F 有望與現(xiàn)代自監(jiān)督學(xué)習(xí)方法結(jié)合,提升在復(fù)雜任務(wù)中的表現(xiàn)。

更深層的意義在于,F(xiàn)F 算法為深度學(xué)習(xí)提供了一條生物學(xué)啟發(fā)的替代路徑。它不僅是對反向傳播的技術(shù)挑戰(zhàn),更是推動人工智能與神經(jīng)科學(xué)交叉發(fā)展的橋梁。隨著研究的深入,我們或許能夠在 FF 框架下找到更接近人腦學(xué)習(xí)機制的算法,從而為智能計算開辟新的方向。

這項研究提醒我們,深度學(xué)習(xí)的未來不止于更大的模型和更強的算力,還可能在于更接近生物本質(zhì)的學(xué)習(xí)方式。Forward–Forward 算法正是這一探索的重要一步。(END)

參考資料:https://www.nature.com/articles/s41598-025-26235-2


關(guān)于波動智能——

波動智能旨在建立一個基于人類情緒與反應(yīng)的真實需求洞察及滿足的價值體系,融合人工智能與意識科學(xué),構(gòu)建覆蓋情緒識別、建模與推薦的智能引擎,自主研發(fā)面向社交、電商等場景的多模態(tài)情緒識別引擎、情緒標(biāo)簽系統(tǒng)及情緒智能推薦算法,形成從情緒采集、建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動智能提出“情緒是連接人、物與內(nèi)容的新型接口”,其產(chǎn)品廣泛應(yīng)用于AI社交、個性化內(nèi)容推薦、虛擬陪伴、電商體驗優(yōu)化等領(lǐng)域。波動智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu),賦能企業(yè)實現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互,推動從功能驅(qū)動到情感驅(qū)動的產(chǎn)業(yè)范式升級。

親愛的人工智能研究者,為了確保您不會錯過*波動智能*的最新推送,請星標(biāo)*波動智能*。我們傾心打造并精選每篇內(nèi)容,只為為您帶來啟發(fā)和深思,希望能成為您理性思考路上的伙伴!

加入AI交流群請掃碼加微信

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
鈞正平發(fā)文:中國人民永遠(yuǎn)都要保持居安思危的清醒

鈞正平發(fā)文:中國人民永遠(yuǎn)都要保持居安思危的清醒

閃電新聞
2026-03-02 12:29:06
伊朗大阿亞圖拉宣布圣戰(zhàn),他的地位如何?其發(fā)言會引發(fā)什么結(jié)果?

伊朗大阿亞圖拉宣布圣戰(zhàn),他的地位如何?其發(fā)言會引發(fā)什么結(jié)果?

之乎者也小魚兒
2026-03-02 09:13:10
演都不演了!剛復(fù)出就開演唱會,票價賣到1280,到底誰給的自信

演都不演了!剛復(fù)出就開演唱會,票價賣到1280,到底誰給的自信

樂悠悠娛樂
2026-03-01 10:27:25
中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿海基本上都過萬哦

中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿;旧隙歼^萬哦

帶你感受人間冷暖
2026-03-01 04:35:13
A股:剛剛,中央四部門聯(lián)合發(fā)布,不出意外,周二將迎來新的轉(zhuǎn)變

A股:剛剛,中央四部門聯(lián)合發(fā)布,不出意外,周二將迎來新的轉(zhuǎn)變

另子維愛讀史
2026-03-02 19:31:01
悄無聲息的從21漲到254,因為一個概念,近一年低調(diào)的漲了12倍

悄無聲息的從21漲到254,因為一個概念,近一年低調(diào)的漲了12倍

有范又有料
2026-03-02 16:16:13
基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

混沌錄
2026-03-02 17:15:04
男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

朗威談星座
2026-03-02 16:54:30
“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

挪威森林
2026-03-02 14:18:46
小米車主敗訴!小米SU7Ultra挖孔機蓋案宣判,法院:不涉及虛假宣傳銷售欺詐

小米車主敗訴!小米SU7Ultra挖孔機蓋案宣判,法院:不涉及虛假宣傳銷售欺詐

DeepAuto車探
2026-03-02 11:45:43
羅永浩不知要卸妝一年沒卸 結(jié)果長了黃褐斑 現(xiàn)狀已失控

羅永浩不知要卸妝一年沒卸 結(jié)果長了黃褐斑 現(xiàn)狀已失控

快科技
2026-03-02 09:27:07
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯話

另子維愛讀史
2026-02-27 20:31:34
金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

青煙小先生
2026-03-02 10:19:13
網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

眼光很亮
2026-03-01 16:12:51
中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

潮鹿逐夢
2026-03-02 22:48:22
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
油價或飆升至每桶130美元?伊朗警告:若油氣設(shè)施遭襲,將摧毀地區(qū)所有國家油氣設(shè)施

油價或飆升至每桶130美元?伊朗警告:若油氣設(shè)施遭襲,將摧毀地區(qū)所有國家油氣設(shè)施

紅星新聞
2026-03-02 11:33:13
伊朗殺瘋了:伊朗空軍立了大功,擊落美F-15戰(zhàn)機,飛行員被俘虜?

伊朗殺瘋了:伊朗空軍立了大功,擊落美F-15戰(zhàn)機,飛行員被俘虜?

墨羽怪談
2026-03-03 00:36:56
突發(fā):莫斯科遭襲擊

突發(fā):莫斯科遭襲擊

臺州交通廣播
2026-03-03 01:02:43
寧波一旅游團所乘郵輪滯留迪拜,船上有約200名中國游客

寧波一旅游團所乘郵輪滯留迪拜,船上有約200名中國游客

上觀新聞
2026-03-02 16:27:07
2026-03-03 02:19:00
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4555文章數(shù) 37413關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

本地
房產(chǎn)
旅游
親子
游戲

本地新聞

津南好·四時總相宜

房產(chǎn)要聞

方案突然曝光!?诒睅煷蟾叫#钟袝蟊P殺出!

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

親子要聞

45歲這年,我這個二胎媽媽決定做一件“瘋狂”的事

外媒給《寶可夢》新作60分:不夠有趣的縫合怪

無障礙瀏覽 進(jìn)入關(guān)懷版