国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

吳恩達(dá):我把AI喂了15年的數(shù)據(jù),現(xiàn)在說要"斷糧"

0
分享至


2007年的某個(gè)深夜,斯坦福的機(jī)房里,吳恩達(dá)和他的學(xué)生正用游戲顯卡(GPU,圖形處理器)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。當(dāng)時(shí)沒人相信這玩意兒能成——包括英偉達(dá)自己,他們?cè)霨PU是為了讓玩家打《反恐精英》更流暢。十五年后,這條"堆數(shù)據(jù)、堆算力"的路走到了一個(gè)尷尬的分岔口:模型越來越大,電費(fèi)賬單越來越長(zhǎng),而吳恩達(dá)本人,突然轉(zhuǎn)身喊停。

他在IEEE Spectrum的專訪里拋出一個(gè)詞:Unbiggen AI。翻譯成中文大概是"給AI瘦身"。

從"大煉鋼鐵"到"小數(shù)據(jù)":一場(chǎng)遲到的自我修正

吳恩達(dá)的履歷本身就是一部AI擴(kuò)張史。Google Brain的聯(lián)合創(chuàng)始人、百度前首席科學(xué)家、Coursera上教過500萬人的機(jī)器學(xué)習(xí)課程主講——他親手參與搭建的,正是那個(gè)"越大越好"的信仰體系。GPT-3有1750億參數(shù),PaLM有5400億,最新的GPT-4據(jù)說更多。這些數(shù)字像軍備競(jìng)賽的彈頭數(shù)量,多一個(gè)零就能上頭條。

但他現(xiàn)在說,這條引擎"只適用于某些問題"。

Landing AI是他2017年創(chuàng)辦的公司,主打產(chǎn)品LandingLens幫工廠做視覺質(zhì)檢。制造業(yè)的場(chǎng)景很具體:檢測(cè)電路板上的焊點(diǎn)缺陷,或者手機(jī)屏幕的劃痕。這里沒有互聯(lián)網(wǎng)級(jí)別的數(shù)據(jù)量,可能只有500張良品照片、200張次品照片。用GPT-3的思路?電費(fèi)比工人工資還貴。

所以他推"數(shù)據(jù)-centric AI"(以數(shù)據(jù)為中心的AI)。核心操作是:模型固定,死磕數(shù)據(jù)質(zhì)量。標(biāo)注錯(cuò)了?改。光照條件不一致?統(tǒng)一。樣本太少?用合成數(shù)據(jù) augmentation(數(shù)據(jù)增強(qiáng))。

這不是否定大模型,是給大模型夠不到的地方找條活路。

Foundation Model(基礎(chǔ)模型):還沒燒到視頻的戰(zhàn)火

專訪里有個(gè)概念值得拆開:Foundation Model。斯坦福的Percy Liang團(tuán)隊(duì)起的名字,指那種在超大規(guī)模數(shù)據(jù)上預(yù)訓(xùn)練、再微調(diào)適配各種任務(wù)的"通才"模型。GPT-3是NLP(自然語言處理)領(lǐng)域的標(biāo)桿。

吳恩達(dá)認(rèn)為,計(jì)算機(jī)視覺的基礎(chǔ)模型"很有前景",但視頻領(lǐng)域還沒戲。瓶頸很實(shí)在:算力帶寬和成本。處理視頻不是處理文本——一幀1080p的圖像是1920×1080×3個(gè)像素,一秒30幀,一部電影的數(shù)據(jù)量夠GPT-3訓(xùn)練好幾輪?,F(xiàn)在沒人做得起這個(gè)規(guī)模的預(yù)訓(xùn)練。

所以他判斷,NLP的 scaling law(縮放定律)還能跑,視頻的基礎(chǔ)模型還得等。這個(gè)"等"字里,藏著對(duì)小數(shù)據(jù)方案的 urgency(緊迫性)。

數(shù)據(jù)-centric的實(shí)操:從"煉丹"到"種菜"

吳恩達(dá)喜歡打比方。他說傳統(tǒng)的模型-centric AI是"買一堆種子,指望其中一顆長(zhǎng)成參天大樹"——不斷換模型架構(gòu),調(diào)超參數(shù),賭運(yùn)氣。數(shù)據(jù)-centric則是"認(rèn)真施肥澆水,讓現(xiàn)有的種子長(zhǎng)得更好"。

具體怎么做?他列了幾條:

第一,系統(tǒng)性迭代數(shù)據(jù)。不是一次性標(biāo)注完就扔給模型,而是看模型錯(cuò)在哪,針對(duì)性地補(bǔ)數(shù)據(jù)。錯(cuò)把劃痕當(dāng)成污漬?那就多標(biāo)劃痕的邊界案例。

第二,一致性工程。工廠質(zhì)檢的光源角度變了,模型就懵。與其讓模型學(xué)"各種光照下的劃痕",不如把光照固定住——這是工程思維,不是算法思維。

第三,小樣本遷移。用1000張圖片訓(xùn)好的模型,能不能用100張新產(chǎn)線的圖片快速適配?這比從零訓(xùn)練省90%的算力。

這些操作不性感,但制造業(yè)客戶買單。Landing AI的官網(wǎng)案例里,有汽車零件廠、電池廠、食品包裝線——都是數(shù)據(jù)貧瘠、容錯(cuò)率低的場(chǎng)景。

偏見與公平:小數(shù)據(jù)反而更危險(xiǎn)?

專訪沒回避一個(gè)敏感點(diǎn):基礎(chǔ)模型的偏見問題。GPT-3生成過種族歧視文本,圖像模型把醫(yī)生默認(rèn)畫成男性。吳恩達(dá)的回應(yīng)很技術(shù)派:Foundation Model的公平性挑戰(zhàn)在于,"很多人都在它上面搭建應(yīng)用",偏會(huì)被層層放大。

但小數(shù)據(jù)方案有自己的坑。工廠質(zhì)檢數(shù)據(jù)如果只來自一條產(chǎn)線、一個(gè)班次、一批工人,模型學(xué)到的是特定光照、特定角度、特定缺陷類型。換條產(chǎn)線,準(zhǔn)確率可能斷崖下跌。這不是模型的問題,是數(shù)據(jù) coverage(覆蓋度)的問題。

數(shù)據(jù)-centric的解法是用 MLOps(機(jī)器學(xué)習(xí)運(yùn)維)做持續(xù)監(jiān)控——模型上線后,自動(dòng)檢測(cè)輸入數(shù)據(jù)的分布漂移,觸發(fā)再訓(xùn)練。這比"訓(xùn)完就扔"的傳統(tǒng)流程重得多,但也是小數(shù)據(jù)方案能商業(yè)化的前提。

吳恩達(dá)的"分裂":兩邊下注

讀完整篇專訪,一個(gè)矛盾浮出水面:他既看好NLP基礎(chǔ)模型繼續(xù)變大,又押注計(jì)算機(jī)視覺的小數(shù)據(jù)方案。這不是騎墻,是對(duì)問題域的切分。

文本數(shù)據(jù)便宜、結(jié)構(gòu)化、已經(jīng)數(shù)字化幾十年。互聯(lián)網(wǎng)就是它的訓(xùn)練場(chǎng)。所以 scaling law 還能跑,GPT-4、GPT-5會(huì)繼續(xù)膨脹。

但物理世界的數(shù)據(jù)昂貴、 messy(雜亂)、隱私敏感。工廠不會(huì)把產(chǎn)線視頻傳到云端,醫(yī)院不會(huì)共享患者影像。這些場(chǎng)景需要"在本地用少量數(shù)據(jù)快速迭代"的能力,也就是 Landing AI 賣的。

他的判斷是:AI的下一個(gè)十年,不是"大"取代"小"或者反過來,是兩者并行。就像電力系統(tǒng)既有高壓輸電,也有家用插座。

專訪最后,IEEE Spectrum的記者問了個(gè)務(wù)虛的問題:AI的未來是什么?吳恩達(dá)沒談通用人工智能,沒談奇點(diǎn)。他說,希望看到更多"數(shù)據(jù)-centric"的最佳實(shí)踐被整理出來,像當(dāng)年的深度學(xué)習(xí)課程一樣,降低行業(yè)門檻。

這個(gè)收尾很產(chǎn)品經(jīng)理——不造神,只造工具。十五年前他用GPU降低訓(xùn)練門檻,現(xiàn)在他想用數(shù)據(jù)工程降低落地門檻。至于模型有多大?那是手段,不是目的。

Landing AI的官網(wǎng)上,有個(gè)客戶評(píng)價(jià)被放在顯眼位置:某汽車零件廠的質(zhì)量經(jīng)理說,他們用LandingLens后,缺陷檢出率從人工抽檢的82%提到97%,而數(shù)據(jù)量只有3000張圖片。這個(gè)數(shù)不大,但夠交差。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全球資產(chǎn)管理巨頭貝萊德CEO:若油價(jià)達(dá)到每桶150美元,將引發(fā)全球經(jīng)濟(jì)衰退

全球資產(chǎn)管理巨頭貝萊德CEO:若油價(jià)達(dá)到每桶150美元,將引發(fā)全球經(jīng)濟(jì)衰退

紅星新聞
2026-03-25 16:13:23
到底有多無知,才能做出這樣的判決!

到底有多無知,才能做出這樣的判決!

槽三刀
2026-03-25 22:01:04
悲催!怎么會(huì)這么巧?張雪峰和曝光眼鏡暴利的記者,都是心臟驟停

悲催!怎么會(huì)這么巧?張雪峰和曝光眼鏡暴利的記者,都是心臟驟停

火山詩(shī)話
2026-03-24 18:23:32
重磅實(shí)錘!瓜帥即將告別曼城,下一站徹底跳出英超

重磅實(shí)錘!瓜帥即將告別曼城,下一站徹底跳出英超

瀾歸序
2026-03-26 06:02:38
ESPN:薩拉赫是英超歷史最佳,甚至可以沒有之一

ESPN:薩拉赫是英超歷史最佳,甚至可以沒有之一

懂球帝
2026-03-25 23:20:06
患者的住院檢查報(bào)告竟是偽造的,中山五院致歉,珠海市衛(wèi)健局:全面排查醫(yī)療機(jī)構(gòu)外送檢查報(bào)告

患者的住院檢查報(bào)告竟是偽造的,中山五院致歉,珠海市衛(wèi)健局:全面排查醫(yī)療機(jī)構(gòu)外送檢查報(bào)告

極目新聞
2026-03-25 17:53:18
在岸人民幣兌美元(CNY)北京時(shí)間03:00收?qǐng)?bào)6.8986元,較周二夜盤收盤跌70點(diǎn)

在岸人民幣兌美元(CNY)北京時(shí)間03:00收?qǐng)?bào)6.8986元,較周二夜盤收盤跌70點(diǎn)

每日經(jīng)濟(jì)新聞
2026-03-26 05:37:03
所有退休人員注意:社區(qū)這張表再不填,這些福利和錢統(tǒng)統(tǒng)跟你無關(guān)

所有退休人員注意:社區(qū)這張表再不填,這些福利和錢統(tǒng)統(tǒng)跟你無關(guān)

娛樂的硬糖吖
2026-03-26 05:20:34
西甲積分榜:巴薩73分領(lǐng)跑!皇馬69分第2!奧維耶多21分墊底!

西甲積分榜:巴薩73分領(lǐng)跑!皇馬69分第2!奧維耶多21分墊底!

林子說事
2026-03-26 01:59:35
大學(xué)教授、博導(dǎo)巴曙松被辦案機(jī)關(guān)帶走,疑涉非法集資案

大學(xué)教授、博導(dǎo)巴曙松被辦案機(jī)關(guān)帶走,疑涉非法集資案

TOP大學(xué)來了
2026-03-26 00:06:19
國(guó)際油價(jià)暴漲,國(guó)內(nèi)油價(jià)卻“壓著不漲”!國(guó)家出手了:每噸少漲1000多塊

國(guó)際油價(jià)暴漲,國(guó)內(nèi)油價(jià)卻“壓著不漲”!國(guó)家出手了:每噸少漲1000多塊

思如哲思
2026-03-26 06:36:02
霸權(quán)還沒崩,青樓先崩了:拉千萬歐美女孩下海的大佬暴斃

霸權(quán)還沒崩,青樓先崩了:拉千萬歐美女孩下海的大佬暴斃

美第奇效應(yīng)
2026-03-24 16:51:33
基辛格坦言:如果爆發(fā)核戰(zhàn)爭(zhēng),中國(guó)可能只有5個(gè)地方可以躲避危險(xiǎn)

基辛格坦言:如果爆發(fā)核戰(zhàn)爭(zhēng),中國(guó)可能只有5個(gè)地方可以躲避危險(xiǎn)

鶴羽說個(gè)事
2026-03-25 22:21:29
鬧大了!美軍東太平洋再開火!打爆44艘運(yùn)輸船,150人被打死!

鬧大了!美軍東太平洋再開火!打爆44艘運(yùn)輸船,150人被打死!

愛吃醋的貓咪
2026-03-25 20:19:15
頂著濃妝、騎著假馬,卻演古裝大將軍,到底誰的審美出了問題?

頂著濃妝、騎著假馬,卻演古裝大將軍,到底誰的審美出了問題?

娛樂圈筆娛君
2026-03-25 16:14:36
宅基地確權(quán)最后沖刺:今年不把名字改成兒子的,以后可能就改不了

宅基地確權(quán)最后沖刺:今年不把名字改成兒子的,以后可能就改不了

混沌錄
2026-03-19 21:59:03
華爾街大鱷稱:黃金正重演2008年劇本!金價(jià)將漲到11400美元?

華爾街大鱷稱:黃金正重演2008年劇本!金價(jià)將漲到11400美元?

王爺說圖表
2026-03-25 22:43:39
女大學(xué)生住院做檢查,報(bào)告竟是假的!珠海中山五院等多方回應(yīng)

女大學(xué)生住院做檢查,報(bào)告竟是假的!珠海中山五院等多方回應(yīng)

南方都市報(bào)
2026-03-24 12:42:25
杭州球場(chǎng)突發(fā),40歲男子心臟驟停倒地!緊急提醒:有這些信號(hào),千萬別硬扛!

杭州球場(chǎng)突發(fā),40歲男子心臟驟停倒地!緊急提醒:有這些信號(hào),千萬別硬扛!

環(huán)球網(wǎng)資訊
2026-03-25 17:34:17
親戚借車從不加油,這次他故意空著油箱給她,她老公卻急了:我上次不是剛加了600塊的油嗎!

親戚借車從不加油,這次他故意空著油箱給她,她老公卻急了:我上次不是剛加了600塊的油嗎!

品讀時(shí)刻
2026-03-25 09:04:33
2026-03-26 09:24:49
硅嶼手記
硅嶼手記
有態(tài)度網(wǎng)友ytd
579文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

硅谷因AI大裁員?一線工程師戳破真相

頭條要聞

"10元手沖咖啡"阿姨曾1天賣1000杯 如今只賣兩三杯

頭條要聞

"10元手沖咖啡"阿姨曾1天賣1000杯 如今只賣兩三杯

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實(shí)力

態(tài)度原創(chuàng)

時(shí)尚
親子
教育
公開課
軍事航空

《非窮盡列舉》,好看又絕望

親子要聞

四歲萌娃歐洲街頭挑戰(zhàn)街舞,圍觀路人紛紛為小萌娃鼓掌

教育要聞

春風(fēng)潤(rùn)?quán)l(xiāng)土,春假育新人——春假為鄉(xiāng)村教育注入新動(dòng)能

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗重申非交戰(zhàn)國(guó)家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進(jìn)入關(guān)懷版