国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清華唐杰:領(lǐng)域大模型,偽命題

0
分享至

編輯部 整理
量子位 | 公眾號 QbitAI

清華教授唐杰最新在微博發(fā)表了自己關(guān)于AI的一些感悟,非常值得一讀~

共八個(gè)小點(diǎn),不算長篇大論,但扎實(shí)有料:

  • 基座模型繼續(xù)scaling仍然高效;
  • 真實(shí)使用體驗(yàn)想進(jìn)一步上臺階,長尾能力的對齊和推理增強(qiáng)繞不過去;
  • Agent代表模型開始進(jìn)入環(huán)境、開始形成生產(chǎn)力;
  • 一旦模型進(jìn)入持續(xù)交互的世界,記憶機(jī)制、在線學(xué)習(xí)、自我評估就會(huì)成為核心工程題,而不是可選項(xiàng);
  • AI終究要落到替人完成工作、創(chuàng)造增量價(jià)值上;
  • 領(lǐng)域大模型是個(gè)偽命題;

唐杰表示,發(fā)微博是想分享一下,希望對大家有用。

茲以推文刊載,供大家廣泛閱讀、傳播。



以下為其感悟原文:

01,關(guān)于scaling基座模型

預(yù)訓(xùn)練使得大模型已經(jīng)掌握世界常識知識,并且具備簡單推理能力。

更多數(shù)據(jù)、更大參數(shù)和更飽和的計(jì)算仍然是scaling基座模型最高效的辦法。

02,關(guān)于激活對齊和增強(qiáng)推理能力

激活對齊和增強(qiáng)推理能力,尤其是激活更全面的長尾能力是保證模型效果的另一關(guān)鍵,通用benchmark的出現(xiàn)一方面評測了模型通用效果,但也可能使得很多模型過擬合。

真實(shí)場景下是如何讓模型更快、更好的對齊長尾的真實(shí)場景,增強(qiáng)實(shí)際體感。

mid和post training使得更多場景的快速對齊和強(qiáng)推理能力成為可能。

03,關(guān)于Agent

agent是模型能力擴(kuò)展的一個(gè)里程碑,也是體現(xiàn)ai模型進(jìn)入人類真實(shí)(虛擬/物理)世界的關(guān)鍵。

沒有agent能力,大模型將停留在(理論學(xué)習(xí))階段,就類似一個(gè)人不斷學(xué)習(xí),哪怕學(xué)習(xí)到博士,也只是知識積累,還沒有轉(zhuǎn)化為生產(chǎn)力。

原來的agent是通過模型應(yīng)用來實(shí)現(xiàn),現(xiàn)在模型已經(jīng)可以直接將agent數(shù)據(jù)集成到訓(xùn)練過程,增強(qiáng)了模型的通用性,其實(shí)難題還是不同agent環(huán)境的泛化和遷移并不是那么容易,因此最簡單辦法也只有不斷增加不同agent環(huán)境的數(shù)據(jù)和針對不同環(huán)境的強(qiáng)化學(xué)習(xí)。

04,關(guān)于模型記憶

實(shí)現(xiàn)模型記憶成為一個(gè)必須做的事情,這也是一個(gè)模型應(yīng)用到真實(shí)環(huán)境必須有的能力。

人類記憶分為短期(前額葉)、中期(海馬體)、長期(分布式大腦皮層)、人類歷史(wiki或史書)四個(gè)階段。

大模型如何實(shí)現(xiàn)不同階段的記憶是個(gè)關(guān)鍵,context、rag、模型參數(shù)可能分別對應(yīng)了人類的不同記憶階段,但如何實(shí)現(xiàn)是個(gè)關(guān)鍵,一種辦法是壓縮記憶,簡單存在context,如果大模型可以支持足夠長的context,那基本有可能實(shí)現(xiàn)短中長期的記憶。

如何迭代模型知識,更改模型參數(shù)這還是個(gè)難題。

05,關(guān)于在線學(xué)習(xí)與自我評估

在線學(xué)習(xí)與自我評估。

有了記憶機(jī)理,在線學(xué)習(xí)成為一個(gè)重點(diǎn),目前的大模型定時(shí)重新訓(xùn)練,這有幾個(gè)問題:

  • 模型無法真正的自我迭代,但模型的自學(xué)習(xí)自迭代一定會(huì)是下一個(gè)階段必然具有的能力;
  • 重新訓(xùn)練還比較浪費(fèi),同時(shí)也會(huì)丟掉很多交互數(shù)據(jù)。

因此如何實(shí)現(xiàn)在線學(xué)習(xí)是個(gè)關(guān)鍵,自我評估是在線學(xué)習(xí)的一個(gè)關(guān)鍵點(diǎn),要想模型自我學(xué)習(xí),模型首先要知道自己對還是不對,如果知道了(哪怕概率知道)模型就知道了優(yōu)化目標(biāo),能夠自我改進(jìn)。

因此構(gòu)建模型自我評價(jià)機(jī)制是個(gè)難題。

這也可能是下一個(gè)scaling范式。

continual learning/real time learning/online learning?

06,關(guān)于模型研發(fā)和應(yīng)用結(jié)合

最后,大模型的發(fā)展越來越端到端,不可避免的要把模型研發(fā)和模型應(yīng)用結(jié)合起來。

ai模型應(yīng)用的第一性不應(yīng)該是創(chuàng)造新的app,他的本質(zhì)是agi替代人類工作,因此研發(fā)替代不同工種的ai是應(yīng)用的關(guān)鍵。

chat部分替代了搜索,部分其實(shí)融合了情感交互。

明年將是ai替代不同工種的爆發(fā)年。

07,關(guān)于多模態(tài)和具身

寫在最后的是多模態(tài)和具身。

多模態(tài)肯定是個(gè)未來也很有前景,當(dāng)下的問題是多模態(tài)不大能幫助到agi的智能上界,而通用agi的智能上界到底在哪兒還不知道。

可能最有效的方式還是分開發(fā)展,文本、多模態(tài)、多模態(tài)生成。

當(dāng)然適度的探索這三者的結(jié)合肯定能發(fā)現(xiàn)一些很不一樣的能力,這需要勇氣和雄厚的資本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太難通用了(也不一定),但至少少樣本去激活通用具身能力基本不可能。

那怎么辦呢,采數(shù)據(jù),或者合成數(shù)據(jù),都不是那么容易,也貴。

但反之一旦數(shù)據(jù)規(guī)模上去了,通用能力出來了自然會(huì)形成門檻。

當(dāng)然這只是智能方面的難題,對于具身,機(jī)器人本身也是個(gè)問題,不穩(wěn)定,故障頻繁都限制了具身智能的發(fā)展。

2026年這些都將取得長足進(jìn)步。

08,關(guān)于領(lǐng)域大模型和大模型應(yīng)用

也討論一下領(lǐng)域大模型和大模型應(yīng)用。

我一直認(rèn)為領(lǐng)域大模型就是個(gè)偽命題,都agi了哪有什么domain-specific agi……

但,agi還沒實(shí)現(xiàn),領(lǐng)域模型會(huì)長時(shí)間存在(多長,不好說,ai發(fā)展實(shí)在太快了)。

領(lǐng)域模型的存在本質(zhì)上是應(yīng)用企業(yè)不愿意在ai企業(yè)面前認(rèn)輸,希望構(gòu)建領(lǐng)域know how的護(hù)城河,不希望ai入侵,希望把a(bǔ)i馴化為工具。

而ai的本質(zhì)是海嘯,走到哪里都將一切卷了進(jìn)去,一定有一些領(lǐng)域公司走出護(hù)城河,自然就卷進(jìn)了agi的世界。

簡而言之,領(lǐng)域的數(shù)據(jù)、流程、agent數(shù)據(jù)慢慢的都會(huì)進(jìn)入主模型。

而大模型的應(yīng)用也要回到第一性原理,ai不需要?jiǎng)?chuàng)建新的應(yīng)用。

ai的本質(zhì)是模擬人或者代替人或者幫助人實(shí)現(xiàn)人類的某些必須要做到事(某些工種)。

可能就是兩種,一種就是ai化以前的軟件,原來需要人參與的改成ai,另一種就是創(chuàng)造對齊人類某個(gè)工種的ai軟件,替代人類工作。

所以大模型應(yīng)用需要幫助到人、創(chuàng)造新的價(jià)值。

如果做一個(gè)ai軟件沒人用,不能產(chǎn)生價(jià)值,那這個(gè)ai軟件肯定沒有生命力。

參考鏈接:
https://weibo.com/2126427211/5247011059141988

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
河南一地漫山遍野都是淘玉人,鎮(zhèn)政府:確有大量游客來撿,當(dāng)?shù)卮迕穹Q曾挖到一塊石頭出了兩個(gè)手鐲賣了3000元

河南一地漫山遍野都是淘玉人,鎮(zhèn)政府:確有大量游客來撿,當(dāng)?shù)卮迕穹Q曾挖到一塊石頭出了兩個(gè)手鐲賣了3000元

觀威海
2026-01-07 19:18:04
倪萍攤上事了!遭嚴(yán)查面臨巨額罰款!

倪萍攤上事了!遭嚴(yán)查面臨巨額罰款!

手工制作阿殲
2025-12-26 12:53:11
項(xiàng)立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

項(xiàng)立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

讀鬼筆記
2026-01-06 19:42:20
公安部:按照過緊日子等要求,因地制宜開展警察節(jié)活動(dòng)

公安部:按照過緊日子等要求,因地制宜開展警察節(jié)活動(dòng)

南方都市報(bào)
2026-01-08 11:06:17
恭喜國乒!女單首輪5戰(zhàn)全勝,陳熠連扳3局逆轉(zhuǎn),晉級冠軍賽16強(qiáng)

恭喜國乒!女單首輪5戰(zhàn)全勝,陳熠連扳3局逆轉(zhuǎn),晉級冠軍賽16強(qiáng)

全言作品
2026-01-09 00:09:28
玩套路了!蘇州一工廠迎新,基本工資漲至2660,崗位獎(jiǎng)金等額下調(diào)

玩套路了!蘇州一工廠迎新,基本工資漲至2660,崗位獎(jiǎng)金等額下調(diào)

火山詩話
2026-01-07 07:37:29
今日入三九,老人說“三九多晴天,寡婦要發(fā)愁”,晴天有啥預(yù)兆?

今日入三九,老人說“三九多晴天,寡婦要發(fā)愁”,晴天有啥預(yù)兆?

阿龍美食記
2026-01-08 00:58:05
從今往后,鄭麗文在國民黨能“橫”著走!黨內(nèi)誰還敢攔她的路?

從今往后,鄭麗文在國民黨能“橫”著走!黨內(nèi)誰還敢攔她的路?

一身骨子里的傲氣
2025-12-21 19:46:12
茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對這5種疾病有好處,建議常吃

茼蒿立大功!醫(yī)生調(diào)查發(fā)現(xiàn):茼蒿對這5種疾病有好處,建議常吃

阿纂看事
2025-10-13 15:36:03
上海這家知名商場要關(guān)了?曾是亞洲最大!許多人都在這里逛吃購物過

上海這家知名商場要關(guān)了?曾是亞洲最大!許多人都在這里逛吃購物過

新民晚報(bào)
2026-01-07 17:29:36
安妮海瑟薇推特自拍被玩壞!喊話Grok脫衣、變貓女

安妮海瑟薇推特自拍被玩壞!喊話Grok脫衣、變貓女

游民星空
2026-01-08 22:03:29
當(dāng)不成總統(tǒng)了?特朗普承認(rèn)自己或?qū)⑾屡_,但真正的麻煩還在后頭,山雨欲來風(fēng)滿樓,接下來,且看局面會(huì)如何發(fā)展吧

當(dāng)不成總統(tǒng)了?特朗普承認(rèn)自己或?qū)⑾屡_,但真正的麻煩還在后頭,山雨欲來風(fēng)滿樓,接下來,且看局面會(huì)如何發(fā)展吧

軍霆說
2026-01-08 01:39:10
新疆生產(chǎn)建設(shè)兵團(tuán)黨委常委、副司令員李旭被查

新疆生產(chǎn)建設(shè)兵團(tuán)黨委常委、副司令員李旭被查

澎湃新聞
2026-01-08 18:32:26
南京博物院事件升級,退休員工再曝大瓜,信息量太大,果然不簡單

南京博物院事件升級,退休員工再曝大瓜,信息量太大,果然不簡單

法老不說教
2025-12-23 16:48:26
凍到結(jié)冰!未來幾天廣東會(huì)更冷嗎?

凍到結(jié)冰!未來幾天廣東會(huì)更冷嗎?

廣東發(fā)布
2026-01-08 19:16:34
閉店高達(dá)8成,投資20萬元,20天就倒閉,又一項(xiàng)目割韭菜

閉店高達(dá)8成,投資20萬元,20天就倒閉,又一項(xiàng)目割韭菜

毒sir財(cái)經(jīng)
2025-11-22 13:51:19
那黃金有沒有可能突然有一天暴跌,然后一下套你30年呢?

那黃金有沒有可能突然有一天暴跌,然后一下套你30年呢?

流蘇晚晴
2025-11-12 19:04:01
利雅得勝利連續(xù)3輪不勝,C羅社媒:戰(zhàn)斗還沒結(jié)束,繼續(xù)努力

利雅得勝利連續(xù)3輪不勝,C羅社媒:戰(zhàn)斗還沒結(jié)束,繼續(xù)努力

懂球帝
2026-01-09 04:22:37
葡萄牙的悲慘下場告訴我們:國家沒有實(shí)力,加入什么條約都沒用

葡萄牙的悲慘下場告訴我們:國家沒有實(shí)力,加入什么條約都沒用

南宮一二
2025-11-24 15:19:47
超越哈蘭德姆巴佩,18歲的亞馬爾重新定義了身價(jià)天花板

超越哈蘭德姆巴佩,18歲的亞馬爾重新定義了身價(jià)天花板

籃球看比賽
2026-01-08 11:43:12
2026-01-09 04:36:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11988文章數(shù) 176356關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會(huì)花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

家居
教育
本地
數(shù)碼
軍事航空

家居要聞

理性主義 冷調(diào)自由居所

教育要聞

一覺醒來,全球傳播學(xué)倒退100年(無限流)

本地新聞

1986-2026,一通電話的時(shí)空旅程

數(shù)碼要聞

CES 2026 | TCL實(shí)業(yè)攜全球首創(chuàng)SQD-Mini LED顯示技術(shù)亮相

軍事要聞

特朗普提出將美國軍費(fèi)提升至1.5萬億美元

無障礙瀏覽 進(jìn)入關(guān)懷版