国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

前阿里千問負責人林俊旸離職后首發(fā)長文,探討AI未來的發(fā)展方向:從訓練模型轉(zhuǎn)向訓練智能體

0
分享至

3月26日,原阿里通義千問(Qwen)技術負責人林俊旸(Justin Lin)在社交平臺上發(fā)布了一篇題為“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(從推理式思考到智能體思考)的文章長文。這是他自本月初從阿里辭職之后發(fā)布的第一篇長文。在這篇文章中,林俊旸系統(tǒng)性地復盤了推理模型階段的特征,并探討了AI未來的發(fā)展方向:從訓練模型轉(zhuǎn)向訓練智能體。

林俊旸表示,過去兩年重塑了行業(yè)對大模型的評估方式與核心期待。OpenAI 的 o1 表明,"思考"可以成為一種被訓練出來的能力。DeepSeek-R1 緊隨其后,證明推理式的后訓練可以在原始實驗室之外被復現(xiàn)、被擴展。這一階段至關重要。但 2025 年上半年,行業(yè)焦點主要停留在"推理式思考"本身:如何讓模型在推理的時候多想一會兒?,F(xiàn)在該問下一步了。他的判斷是智能體式思考:為了行動而思考,在與環(huán)境交互的過程中,并根據(jù)來自世界的反饋持續(xù)更新計劃。

他提到,2025 年初,千問團隊有一個很大的野心:做一個統(tǒng)一的系統(tǒng),讓思考模式和指令模式合二為一,支持可調(diào)節(jié)的推理努力程度(類似于低/中/高推理設置),甚至能根據(jù)提示詞和上下文自動推斷合適的推理量,讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上,這是正確的方向。但"合并"說起來容易,做好卻極難。

真正的難點在于數(shù)據(jù)。當人們談論合并思考與指令時,往往首先想到模型側的兼容性,更深層的問題是,兩種模式的數(shù)據(jù)分布和行為目標存在顯著差異。在嘗試平衡模型合并與提升后訓練數(shù)據(jù)質(zhì)量和多樣性的過程中,團隊并未把所有事情都做對,結果往往是在兩個方向上都表現(xiàn)平庸:"思考"行為變得嘈雜、冗余或不夠果斷,而"指令"行為則變得不夠清晰、不夠可靠,且比商業(yè)用戶實際想要的成本更高。

分開做在實踐中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就發(fā)了獨立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最終思考是,真正成功的合并需要一個平滑的推理力度光譜,模型能自己判斷該花多少力氣去想。

推理鏈更長,不等于模型更聰明。很多時候,推理鏈越長,反而說明模型在亂花算力?!绷挚D在文中表示,他提到,千問團隊意識到,行業(yè)正在從訓練模型的時代,走向訓練智能體的時代,它的定義特征是跟真實世界的閉環(huán)交互。

智能體式思考和推理式思考,意味著不同的優(yōu)化目標,推理式思考通常以最終答案前的內(nèi)部思辨質(zhì)量來評判:模型能否解出定理、寫出證明、生成正確代碼或通過基準測試。而智能體思維關注的是:模型能否在與環(huán)境交互的過程中持續(xù)取得進展。

這意味著,核心問題從“模型能否思考得足夠久?”轉(zhuǎn)變?yōu)椤澳P湍懿荒苡靡环N撐得起有效行動的方式來思考?”模型訓練的核心對象也隨之變了,變成了模型加環(huán)境的整個系統(tǒng)。

在這之中,模型架構和訓練數(shù)據(jù)當然還重要,但環(huán)境設計、rollout 基礎設施、評估器的穩(wěn)健程度、多個 Agent 之間怎么協(xié)調(diào),這些都進了核心圈?!昂玫乃伎肌钡亩x也變了:在真實約束下最能撐起行動的那條軌跡,而非最長或最顯眼的那條。

林俊旸預測,智能體式思考會成為主流。

《科創(chuàng)板日報》3月4日訊,《科創(chuàng)板日報》記者注意到,3月4日下午,阿里千問大模型核心負責人林俊旸新發(fā)朋友圈表示:抱歉各位朋友,今天不回復消息和電話了,我真的需要休息。qwen 的兄弟們,按照原來安排繼續(xù)干,沒問題的。而就在昨日凌晨,林俊旸在社交媒體發(fā)文稱:me stepping down. bye my beloved qwen.(我卸任了。再見了,我親愛的千問。)



3月4日凌晨,阿里Qwen技術負責人林俊旸在社交平臺上與千問道別,稱“我退出了”。隨后,阿里巴巴通義實驗室科學家惠彬原(Binyuan Hui)轉(zhuǎn)發(fā)該條博文并表示自己也退出了千問。南都N視頻記者就此向阿里云方面求證,截至發(fā)稿尚無回復。


林俊旸在社交平臺上與千問道別。


惠彬原稱自己也退出了。

林俊旸系阿里千問模型的重要負責人。公開資料顯示,林俊旸1993年出生,畢業(yè)于北京大學,系阿里巴巴達摩院高級算法專家、阿里通義千問系列大模型技術負責人,主導開發(fā)了全球領先的開源大模型。他的研究領域包括自然語言處理和多模態(tài)表示學習,研究興趣集中于大規(guī)模語言模型和多模態(tài)大模型,曾在多個頂級會議發(fā)表多篇論文。公開信息顯示,林俊旸對通義千問的技術貢獻突出,如他主導開發(fā)Qwen3.0等模型性能超越Llama2-70B、首創(chuàng)多模態(tài)Agent框架,增強視覺/語音理解能力、推動構建中文社區(qū)最大開源模型生態(tài)體系等。

有業(yè)內(nèi)人士猜測,林俊旸的離開或由于其考核目標變成了日活躍用戶數(shù)。對于林俊旸離開后誰會接任其位置,該業(yè)內(nèi)人士也提到或是一位來自谷歌Gemini團隊、以日活躍用戶數(shù)(DAU)指標為導向的非核心人才。南都記者就此向阿里云方面求證,截至發(fā)稿尚無回復。

林俊旸與月之暗面創(chuàng)始人兼CEO楊植麟、騰訊首席AI科學家姚順雨和清華大學教授、智譜創(chuàng)始人兼首席科學家唐杰被在業(yè)內(nèi)并稱“基模四杰”,其他幾位均為月之暗面、騰訊、智譜等企業(yè)的模型掌門人。

今年1月在中關村,林俊旸還提到,自己2021年做模型的時候,阿里芯片團隊的人來問自己三年后模型主流架構是不是Transformer和多模態(tài),因為三年后模型才能流片。他表示,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天還在阿里巴巴,然后他果然還是Transformer,還是多模態(tài),我就非常懊悔為什么當時沒有去催他去做?!?/p>

模型進展方面,3月3日,阿里巴巴再度開源4款小尺寸千問3.5系列模型。其中最小的0.8B和2B兩款,體積極小,推理速度極快,適合移動設備、IoT 邊緣設備部署,以及低延時的實時交互場景。據(jù)悉,四款Qwen3.5新模型雖是小尺寸,但均擁有原生多模態(tài)能力,以極小的參數(shù)量實現(xiàn)了極大的性能提升。模型發(fā)布后還迅速引來馬斯克在社交媒體上點贊評論,稱阿里千問模型“智能密度令人印象深刻”。

來源:澎湃新聞、第一財經(jīng)、界面新聞、財聯(lián)社、南方都市報

【來源:瀟湘晨報】

報料、維權通道:應用市場下載“晨視頻”客戶端,搜索“報料”一鍵直達,或撥打熱線0731-85571188;如需內(nèi)容合作,請撥打政企服務專席19176699651,商務合作聯(lián)系0731-85572288。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國連出兩條公告,特朗普不敢回應!美盟友們急了:趕緊派人赴華

中國連出兩條公告,特朗普不敢回應!美盟友們急了:趕緊派人赴華

軍機Talk
2026-03-28 13:31:41
嫁大12歲中國老公,朝鮮姑娘直言:這輩子做得最對的決定

嫁大12歲中國老公,朝鮮姑娘直言:這輩子做得最對的決定

世界圈
2026-03-29 02:05:03
廣州警方:已刑拘73人

廣州警方:已刑拘73人

番禺臺
2026-03-27 18:39:19
皇馬樂壞了!英超天才中場鬧離隊,克羅斯接班人有著落了?

皇馬樂壞了!英超天才中場鬧離隊,克羅斯接班人有著落了?

仰臥撐FTUer
2026-03-28 20:37:06
2005年《神話》重慶宣傳,為爭奪金喜善,文強與山西首富大打出手

2005年《神話》重慶宣傳,為爭奪金喜善,文強與山西首富大打出手

干史人
2026-03-27 10:00:07
iOS 緊急發(fā)布系統(tǒng)更新提醒,建議升級!

iOS 緊急發(fā)布系統(tǒng)更新提醒,建議升級!

花果科技
2026-03-29 00:02:21
張凌赫事件持續(xù)升級!官方點名怒批,粉絲正面硬剛,這下恐要涼涼

張凌赫事件持續(xù)升級!官方點名怒批,粉絲正面硬剛,這下恐要涼涼

阿晪美食
2026-03-28 15:03:17
馬英九再提統(tǒng)一條件,島內(nèi)炸鍋大陸沉默,他在幫誰說話?

馬英九再提統(tǒng)一條件,島內(nèi)炸鍋大陸沉默,他在幫誰說話?

娛樂的宅急便
2026-03-28 21:16:56
上班開糞車下班開奔馳的小伙今日大婚,當事人:吸糞車婚車隊,全球第一個

上班開糞車下班開奔馳的小伙今日大婚,當事人:吸糞車婚車隊,全球第一個

極目新聞
2026-03-28 08:51:05
文班和亞歷山大誰奪得MVP?蘇群很直接,NBA歷史神跡可能要誕生了

文班和亞歷山大誰奪得MVP?蘇群很直接,NBA歷史神跡可能要誕生了

小徐講八卦
2026-03-29 05:45:08
血虧!曼聯(lián) 1000 萬賤賣棄將封神,已成新版巴爾韋德

血虧!曼聯(lián) 1000 萬賤賣棄將封神,已成新版巴爾韋德

奶蓋熊本熊
2026-03-29 03:41:06
李現(xiàn)曬圖直呼 “快折磨死我了”!不少人已中招

李現(xiàn)曬圖直呼 “快折磨死我了”!不少人已中招

日照日報
2026-03-28 20:46:57
大馬丁:這是我們踢得最差的比賽之一;這是一記及時的警鐘

大馬丁:這是我們踢得最差的比賽之一;這是一記及時的警鐘

懂球帝
2026-03-28 11:03:16
歐洲議會投票通過附加安全條款的對美貿(mào)易協(xié)定

歐洲議會投票通過附加安全條款的對美貿(mào)易協(xié)定

參考消息
2026-03-28 15:39:05
廈門高崎機場關閉時間確定

廈門高崎機場關閉時間確定

新浪財經(jīng)
2026-03-29 03:40:43
看了觀眾對何潤東的評價,我才明白當年陳道明那番話的含金量

看了觀眾對何潤東的評價,我才明白當年陳道明那番話的含金量

糊咖娛樂
2026-03-26 17:22:19
怪不得張雪峰說普通家庭的女孩不要學金融!

怪不得張雪峰說普通家庭的女孩不要學金融!

仰望星空的一粒沙子
2026-03-27 07:26:52
重磅!一大型上市企業(yè)總部已正式遷入茂名,老板:我要做新茂名人!

重磅!一大型上市企業(yè)總部已正式遷入茂名,老板:我要做新茂名人!

茂名油城圈
2026-03-29 00:08:27
狂丟149分!三分27中4!阿德巴約被全聯(lián)盟針對

狂丟149分!三分27中4!阿德巴約被全聯(lián)盟針對

籃球教學論壇
2026-03-28 10:41:52
暴跌25%!曾經(jīng)一包難求的頂級奢侈品,如今五折甩賣都沒人要?

暴跌25%!曾經(jīng)一包難求的頂級奢侈品,如今五折甩賣都沒人要?

青眼財經(jīng)
2026-03-27 22:55:18
2026-03-29 08:15:00
瀟湘晨報 incentive-icons
瀟湘晨報
瀟湘晨報,影響湖南
123578文章數(shù) 338075關注度
往期回顧 全部

科技要聞

華為盤古大模型負責人王云鶴確認離職

頭條要聞

上海爺叔在家"打傘做飯" 自嘲掏空三代400萬買了個啥

頭條要聞

上海爺叔在家"打傘做飯" 自嘲掏空三代400萬買了個啥

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經(jīng)要聞

臥底"科技與狠活"培訓:化工調(diào)味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

本地
藝術
教育
數(shù)碼
旅游

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

藝術要聞

毛澤東手箋驚現(xiàn)美國拍賣會,滿紙崢嶸往事......

教育要聞

“女孩家長心真大!”小男孩帶女同學回家留宿,網(wǎng)友破防了!

數(shù)碼要聞

2025中國耳機全渠道銷量下降6.9% 線上銷量占據(jù)9成份額

旅游要聞

泰安市岱岳區(qū):賞梨花 看村晚 萬畝梨園迎客來

無障礙瀏覽 進入關懷版