国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

騰訊混元3年變形始末

0
分享至

2026.01.12


本文字數(shù):7212,閱讀時長大約12分鐘

作者 |新皮層NewNewThing 陸彥君 吳洋洋

2025年11月下旬,大學(xué)畢業(yè)生林楓在深圳參加了騰訊青云計劃閉門會。活動采取定向邀請制,為期兩天,會議內(nèi)容除了郵輪觀光、參觀騰訊總部,還有一個環(huán)節(jié)是部門見面會——姚順雨在現(xiàn)場。

這次見面會兩個小時左右,姚順雨是開場發(fā)言者,他講了大概只有20分鐘,但富有雄心。

「他說混元的目標是對標全球最頂尖的一批大模型。」林楓對第一財經(jīng)「新皮層」說。

林楓對姚順雨印象深刻,除了「感覺他是主導(dǎo)混元大模型研發(fā)進度的管理者」,他還是林楓在現(xiàn)場看到的騰訊高管中為數(shù)不多的年輕人。


姚順雨,2025年下半年加入騰訊,此前任職于OpenAI。

青云計劃是騰訊2023年下半年提出的面向優(yōu)秀畢業(yè)生的AI人才專項招聘,對標字節(jié)跳動的Top Seed人才計劃。

與青云計劃同時進行的是騰訊持續(xù)一年的高薪挖人行動。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對象之一是字節(jié)跳動。字節(jié)跳動2-2職級的候選人,跳槽到騰訊后可以獲得T12或T13的職級,相當于在字節(jié)跳動的原職位連升兩級。而且,薪酬也會直接翻倍,有的甚至會提升200%?!高@種行情最近一個月才出現(xiàn),以前字節(jié)2-2的候選人會定下T9或T10的職級,薪資漲幅只有30%。」許嵐說。

2025年的騰訊就是2024年的字節(jié)跳動。2024年,字節(jié)跳動加速基礎(chǔ)模型的研發(fā)進度,第一個動作也是搶人才——它當時的搶人對象主要是阿里巴巴,一年后,騰訊「接棒」,從字節(jié)跳動搶奪人才。

多位接近騰訊的人士對「新皮層」稱,騰訊大概2024年年底就開始大規(guī)模對外招募基礎(chǔ)模型相關(guān)的人才,并啟動一系列組織架構(gòu)調(diào)整。2025年9月姚順雨的加入加速了這一進程。

姚順雨新政

最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型WizardLM團隊核心成員孫慶豐、微軟亞洲研究院視覺計算組前首席研究員胡瀚、微軟WizardLM團隊項目創(chuàng)建者徐燦陸續(xù)加入騰訊。然后是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職于微軟亞洲研究院。

「騰訊只看來自DeepSeek、月之暗面、字節(jié)和阿里這4家基座模型團隊的候選人,其他公司是不看的?!菇咏v訊招聘的人士陳立峰對「新皮層」說。

他對「新皮層」稱,2025年年中,字節(jié)跳動曾通過發(fā)放「豆包虛擬股」激勵員工,相當于為其大模型團隊漲薪。但正是在這輪股權(quán)激勵期間,部分字節(jié)豆包員工乘勢轉(zhuǎn)身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節(jié)跳動員工,加入混元后能拿到年薪300萬以上的Offer。

2025年12月,字節(jié)跳動再次向全球員工發(fā)布了一封漲薪郵件,將公司整體獎金和調(diào)薪投入分別提升35%和1.5倍,以確保員工薪酬的競爭力和激勵回報在全球各個市場都「領(lǐng)先于頭部水平」。

在字節(jié)的防守下,騰訊的搶人計劃也加大了力度?!敢樣甑募尤胧球v訊混元人才招聘的一個關(guān)鍵節(jié)點?!乖S嵐說,姚順雨來之前,高管加盟騰訊「屬于大廠間的正常人才流動」,姚順雨加入后,混元不僅加強了招聘力度,「對候選人信息的保密性處理也升級了」。以姚順雨的加入為節(jié)點,騰訊招募了更多大語言模型(LLM)相關(guān)的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內(nèi)的加入者主要研究方向都以多模態(tài)為主。


多位招聘方人士告訴「新皮層」,姚順雨會在與LLM相關(guān)的招聘中擔任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位T12職級的人才來自字節(jié)Seed團隊和DeepSeek,其中一位負責預(yù)訓(xùn)練的數(shù)據(jù)工作,還有一位和姚順雨一起做大模型的前沿探索。

部分混元員工因為姚順雨的到來信心備增?!杆麄冋J為姚順雨可能會為內(nèi)部爭取更多激勵,就像字節(jié)Seed為團隊成員發(fā)豆包股一樣?!乖S嵐說,姚順雨接手騰訊混元大模型不久,就與每位團隊成員都有過接觸、聊天,還參加了不同研究小組的團建和聚餐。

姚順雨的舉動獲得了部分員工的信任。一位內(nèi)部員工認為他「性格討喜,跟著他干活有信心」,另一位內(nèi)部員工認為他「管理能力出色」。但也有部分混元成員開始擔心能力不足被調(diào)整,開始主動尋求外部機會?!笍幕煸x職的人可能會變多,無論主動還是被動?!乖S嵐說。

換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同于混元大模型前任領(lǐng)導(dǎo)者的觀念。

接近騰訊混元的人士告訴「新皮層」,相較于前任負責人,姚順雨更加重視后訓(xùn)練——這在很多人的意料之中,姚順雨此前的主要工作都與后訓(xùn)練更相關(guān)。不過除此之外,他還打算從預(yù)訓(xùn)練的數(shù)據(jù)部分入手,「從數(shù)據(jù)開始重新訓(xùn)練混元」,這相當于回到起點。林楓稱,姚順雨在11月的青云計劃閉門會上還提出過一個明確要降低「發(fā)版速度」的計劃,「他說以前混元模型在內(nèi)部更新版本的速度很快,有時候一周就會發(fā)布兩個版本。他來到這里的第一件事就是降低發(fā)版速度,打磨好整體模型再發(fā)。」林楓說。

在被騰訊挖角之前,姚順雨只在OpenAI工作過一年,深度參與Operator、Deep Research等智能體項目。更早之前,他剛剛從普林斯頓博士畢業(yè),研究方向是自然語言處理與強化學(xué)習。攻讀博士學(xué)位期間,他的主要科研成果有兩個,一個是ToT(Tree of Thoughts,思維樹),這個計算框架讓AI在解決復(fù)雜問題時能夠?qū)栴}拆解為多步思維步驟并探索多條路徑,最終找到最優(yōu)路徑。還有一個是ReAct,這個算法讓大模型可以邊推理邊行動。ToT和ReAct都可應(yīng)用于模型的后訓(xùn)練階段,提升模型的多步推理和動手操作能力。OpenAI的Operator、Deep Research等智能體項目中都有ToT和ReAct的影子。

也就是說,騰訊把姚順雨從OpenAI挖過來時,他只有一年的工作經(jīng)驗。但騰訊提供的可能是國內(nèi)大模型人才戰(zhàn)中無論職位還是薪酬都最高的標準。2025年9月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。這個數(shù)字不一定真實,但1998年出生的姚順雨一定是國內(nèi)大廠中最年輕的大語言模型(LLM)「一號位」。

2025年12月,騰訊宣布混元組織架構(gòu)調(diào)整,官宣姚順雨出任「CEO/總裁辦公室」首席AI科學(xué)家,向騰訊總裁劉熾平匯報,他同時兼任AI Infra部、大語言模型部負責人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時在香港辦公室工作。另據(jù)一位騰訊內(nèi)部人士稱,騰訊的CEO/總裁辦公室在列的人員名單上只有姚順雨一個人。

這是2023年啟動大模型研發(fā)以來,騰訊第一次把大語言模型變成一把手工程。而且,這個模型負責人對下轄的團隊擁有直接而全面的管理權(quán)和人事權(quán)。「劉熾平是財務(wù)出身,并非技術(shù)背景。姚順雨直接向他匯報,獲得資源支持的效率就更高了?!跪v訊AI Lab離職員工秦瑩瑩對「新皮層」說,在此之前,騰訊的自研模型混元有著很長的向上匯報鏈路,以及復(fù)雜的向下管理體系。

混元跟著跑

2025年從年頭沖刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領(lǐng)域開始著急。令這家大公司著急的直接原因就是,其自研模型混元的表現(xiàn)在大模型競爭中不夠靠前。

「很多公司發(fā)新模型時,會被拿來在Benchmark中對比的模型基本就是GPT、Claude、Gemini、千問、Kimi和DeepSeek,你不會看到豆包,也不會看到混元。」一位大模型業(yè)內(nèi)人士對「新皮層」說,這種選擇基本代表了行業(yè)對誰在模型第一梯隊的認知。

馬化騰在2023年5月的股東大會稱,「對于工業(yè)革命(級的機遇)來講,早一個月(還是晚一個月)把電燈泡拿出來,在長的時間跨度上來看是不那么重要的?!沟竽P腿缃褚呀?jīng)變成了一門「實驗科學(xué)」,「從基礎(chǔ)架構(gòu)到注意力機制,從參數(shù)量到優(yōu)化算法……每個環(huán)節(jié)都有多種方案,你需要做實驗才知道能不能行得通、在多大規(guī)模的參數(shù)量上行得通。」上述大模型業(yè)內(nèi)人士說。這種實驗性意味著,晚起步雖然有成熟方案可以借鑒,但也會比其他選手缺少從實驗中積累的經(jīng)驗,行動越慢差距越大、越難追趕。

騰訊是國內(nèi)大廠中最晚推出自研大模型的公司。2022年11月的最后一天,OpenAI發(fā)布ChatGPT。4個月后,2023年3月,百度發(fā)布了第一代大模型文心一言;同年4月,阿里巴巴發(fā)布通義千問大模型;同年8月,字節(jié)跳動也發(fā)布了首代大模型云雀(注:后更名為豆包大模型)。

騰訊的起跑速度就慢于這3家公司。2023年2月,騰訊才開始組建一個叫「混元助手」的團隊,從各事業(yè)群集結(jié)人才,由時任騰訊AI Lab主任張正友擔任項目總負責人。

多位騰訊離職員工對「新皮層」稱,騰訊在大模型領(lǐng)域的緩慢起跑與公司內(nèi)部節(jié)奏有相當大關(guān)系。在ChatGPT發(fā)布的2022年,騰訊正在經(jīng)歷多重低谷。

低谷之一是游戲業(yè)務(wù)。2022年,中國游戲行業(yè)版號獲批通過的總量同比減少了32%,是過往年份中數(shù)量最少的一年。另一位騰訊離職員工告訴「新皮層」,游戲是騰訊最賺錢的業(yè)務(wù)之一,受版號銳減影響,游戲營收不確定性變高,公司當年就進行了「降本增效」,就連騰訊TEG(技術(shù)工程事業(yè)群)這樣的技術(shù)中臺也要自負盈虧。后來主導(dǎo)混元模型研發(fā)的張正友所領(lǐng)導(dǎo)的AI Lab就隸屬于TEG?!改菚rAI Lab并不鼓勵研究員發(fā)論文,員工若要參加學(xué)術(shù)會議,還要蹭高校的預(yù)算才能去開會?!顾麑Α感缕印拐f。

騰訊AI Lab離職員工秦瑩瑩稱,AI Lab在2016年成立時主要任務(wù)還是做基礎(chǔ)研究。但2018年左右,AI Lab就拆分成了兩個部分,只有少部分人繼續(xù)留做AI基礎(chǔ)研究,其他大部分成員都要開始服務(wù)于公司的游戲與廣告業(yè)務(wù)。

而且,這位AI Lab離職員工稱,在游戲業(yè)務(wù)陷入危機之前,騰訊在2020年左右面臨過一個更大的危機:QQ的「孵化器魔法」失效了。


2020年之前,騰訊的很多新業(yè)務(wù)、新產(chǎn)品——比如QQ音樂、騰訊視頻——都是通過QQ孵化成功的。那時QQ扮演了一個分發(fā)渠道和入口的角色——就像今天抖音在豆包的分發(fā)中所扮演的角色一樣。但在2020年左右,騰訊的很多新業(yè)務(wù)都難以復(fù)制過去的成功路徑,比如騰訊電商、對標今日頭條的天天快報,以及對標抖音和快手的騰訊微視,都沒有獲得預(yù)期的成功。2020年,騰訊的另一大分發(fā)渠道——微信——的月活用戶已經(jīng)達到12.25億,成為移動互聯(lián)網(wǎng)時代的超級入口,但它至今沒有施展比肩當年QQ孵化新產(chǎn)品的魔法。

眾多新業(yè)務(wù)中,唯一一個被騰訊高層認為有潛力的是視頻號。上述騰訊離職員工稱,2022年,騰訊創(chuàng)始人、董事長兼CEO馬化騰在內(nèi)部員工大會上稱「微信事業(yè)群最亮眼的業(yè)務(wù)是視頻號,基本上是全場的希望」。到了2023年,馬化騰又在股東大會上表示「AI是類似工業(yè)革命一樣幾百年不遇的機會」,但整個2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰(zhàn)略上多么強調(diào)過大模型,不斷被強調(diào)的依然是視頻號。

根據(jù)上述騰訊AI Lab離職員工的說法,2023年時騰訊內(nèi)部不同事業(yè)部如果想要訓(xùn)練模型,需要向公司總辦申請預(yù)算和立項,「當時訓(xùn)練模型的成本還很高,一次試錯動輒幾百萬美元。就算訓(xùn)練成功,模型的用途是什么?那時候還沒人能說清楚?!惯@位騰訊AI Lab離職員工稱。

一號位難當

3年的大模型軍備競賽已經(jīng)讓業(yè)界發(fā)現(xiàn),大模型不僅是門實驗科學(xué),還開創(chuàng)了前所未有的開發(fā)范式:它無法通過工業(yè)時代那樣主要依靠自上而下的明確規(guī)劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個技術(shù)骨干的開發(fā)模式不同,大模型開發(fā)是一種系統(tǒng)工程,如果沒有一號位頭腦中對模型從預(yù)訓(xùn)練數(shù)據(jù)到預(yù)訓(xùn)練架構(gòu)和算法、后訓(xùn)練路徑以及基礎(chǔ)設(shè)施層面的整體實驗構(gòu)想,一個模型無法從多個技術(shù)骨干的暴力開發(fā)中產(chǎn)生。

上述騰訊AI Lab離職員工告訴「新皮層」,啟動大模型研發(fā)后的3年中,騰訊很長時間里沒有為混元團隊匹配到一位合適的技術(shù)領(lǐng)導(dǎo)者。微信團隊也曾訓(xùn)練過一個模型,后來放棄了。

上述騰訊AI Lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負責人:張正友與蔣杰。張正友的研究方向是計算機視覺,他發(fā)明的平板攝像機標定法在全球被普遍采用,被稱為「張氏方法」。但大模型中最核心的模型是LLM,LLM的核心是自然語言處理,而非圖像處理。

「張正友管理了近半年后,并沒有交出夠好的成果。蔣杰之后主動接手了混元項目,因為他認為大模型可以服務(wù)于廣告投放?!骨噩摤撜f。

蔣杰2012年加入騰訊,是騰訊企業(yè)發(fā)展事業(yè)群(CDG)與技術(shù)工程事業(yè)群(TEG)副總裁,負責騰訊廣告平臺產(chǎn)品技術(shù)管理工作。

在蔣杰的總負責下,劉威和王迪都曾短暫地直接管理過混元一段時間,「劉威類似于統(tǒng)籌者,王迪類似于執(zhí)行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術(shù)背景也都與自然語言處理關(guān)聯(lián)不深,其中劉威的核心工作方向是計算機視覺,他在2024年年底從騰訊離職后,創(chuàng)辦了一家叫ReBirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導(dǎo)混元LLM模型前主要在TEG負責數(shù)據(jù)與搜廣推算法方面的工作。

2024年11月,蔣杰也開始不再實際管理混元項目下的LLM部分了,只實際負責混元多模態(tài)模型。前述騰訊AI Lab離職員工稱,當時整個LLM團隊都在等待一位據(jù)說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。

在姚順雨負責混元LLM模型并直接向騰訊總裁劉熾平匯報之前,混元的LLM負責人是個向上、向下都很難推動工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣杰帶隊期間,混元LLM模型曾有一個小組長,但他的職級并不高,距離觸達劉熾平至少存在大模型技術(shù)負責人王迪、混元大模型負責人蔣杰、TEG總裁盧山三個層級。這種架構(gòu)使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

對下管理方面,這位組長也需要橫跨TEG的多個部門,才能接觸到他的項目相關(guān)成員。2023年成立的混元是一個虛擬團隊,其成員來自AI Lab,甚至是TEG的多個部門。

秦瑩瑩對「新皮層」說,機器學(xué)習部、數(shù)據(jù)平臺部等部門均隸屬于TEG舊的組織架構(gòu),而非混元團隊。抽調(diào)去參與混元項目的員工們還要額外服務(wù)于騰訊不同部門、不同業(yè)務(wù)的AI需求?!富煸行“肽甑臅r間比較混亂,職責與權(quán)限沒有梳理清楚。無論是張正友還是蔣杰,都沒能把團隊真正整合起來。」她說。


直到2025年4月,騰訊才從組織上配備了一個類似字節(jié)Seed那樣的獨立團隊,在TEG體系內(nèi)成立大語言模型部與多模態(tài)模型部。12月官宣姚順雨入職后,騰訊進一步調(diào)整組織架構(gòu),新成立了AI Infra部、AI Data部與數(shù)據(jù)計算平臺部,第一次從組織架構(gòu)上匹配大模式時代的研發(fā)需求。

多位招聘方人士及騰訊員工對「新皮層」稱,騰訊AI Lab目前已被逐漸弱化,多位成員已經(jīng)離職,AI Lab副主任俞棟也將于1月底離開。許嵐告訴「新皮層」,AI Lab現(xiàn)在的工作重點就是做探索性研究、對外發(fā)表論文。這意味著騰訊2016年成立的AI Lab實際上已經(jīng)反過來成為混元的一個下屬部門,而不再是它的上層管理機構(gòu)。

「新皮層」獲得的消息稱,隨著俞棟離職,AI Lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個方向是胡瀚負責的多模態(tài)理解方向,以及一位來自字節(jié)Seed前成員負責的多模態(tài)理解和生成統(tǒng)一方向。

直到2025年年底,混元才變成一個更接近于字節(jié)Seed的架構(gòu),而類似的組織架構(gòu)調(diào)整,字節(jié)在2023年下半年就動手了。這個遲來但大手筆的調(diào)整意味著,擺在姚順雨這位27歲大語言模型一號位面前的障礙,騰訊已基本為其掃清。

加速理論與甜蜜期

進入大模型軍備競賽的第三年,落后者趕上先發(fā)者的最優(yōu)路徑已經(jīng)非常清晰:要想快速交出符合市場預(yù)期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想著如何創(chuàng)新、彎道超車。

最能說明這一成功法則的例子就是Google。2025年之前,「起個大早趕個晚集」在國內(nèi)形容的是百度,在硅谷形容的則是Google——它發(fā)明了大模型的基礎(chǔ)架構(gòu)Transformer,但在自ChatGPT發(fā)布以來的全球模型競賽中,Google的Gemini始終被認為落后于OpenAI的GPT和Anthropic的Claude。

上述大模型業(yè)內(nèi)人士告訴「新皮層」,Gemini 2.0發(fā)布之前,Google一直堅持Encoder+Decoder(注:編碼器+解碼器,Google在2017年發(fā)明 Transformer 架構(gòu)時的原始形態(tài))架構(gòu)。2024年2月發(fā)布Gemini 1.5時,其模型論文中還在強調(diào)該架構(gòu)為什么更優(yōu),但到了2024年年底發(fā)布Gemini 2.0時,Google不再宣傳Encoder+Decoder的架構(gòu)如何富有潛力,而是開始和OpenAI一樣采取Decoder only(注:純解碼器)架構(gòu)。

不再偏執(zhí)地堅持自研架構(gòu)后,Google很快就帶著2025年3月發(fā)布的Gemini 2.5重回業(yè)界視野,11月發(fā)布的Gemini 3.0直接讓OpenAI拉響「紅色警報」,以應(yīng)對Gemini帶來的流量壓力。根據(jù)SimilarWeb統(tǒng)計的11月數(shù)據(jù),用戶在Gemini上的平均停留時間已超越了ChatGPT。

這位業(yè)內(nèi)人士告訴「新皮層」,DeepSeek 2024年12月和2025年2月先后發(fā)布并開源的V3和R1模型,也分別扮演了GPT的Decoder only架構(gòu)曾經(jīng)扮演的角色——告訴大家一個類GPT-4和OpenAI o1效果的模型可能是怎樣的架構(gòu)。其中,V3模型為業(yè)界提供了一個可以訓(xùn)練出等效于GPT-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個MoE(混和專家模型)架構(gòu),而不能是稠密模型;時隔一個多月后發(fā)布的R1模型又提供了類OpenAI o1的推理模型「配方」——表明強化學(xué)習可以直接通過對有推理步驟的語料的模仿學(xué)習實現(xiàn)。

「此前,大家其實不知道GPT-4是怎么訓(xùn)練出來的,也不知道o1是怎么訓(xùn)練出來的?!惯@位業(yè)內(nèi)人士說,整個2024年,國內(nèi)大模型公司的主要目標就是「趕上GPT-4」,但不知道如何趕上,OpenAI從GPT 3.5開始就不再在論文中公開其模型核心架構(gòu)和算法、甚至不發(fā)表技術(shù)報告了。

DeepSeek V3和R1模型的發(fā)布和開源加速了全球類GPT-4和OpenAI o1模型的推出。聘任一個在OpenAI直接參與過模型后訓(xùn)練、并接觸過其預(yù)訓(xùn)練的研究者擔任LLM模型負責人,對騰訊混元來說是也是一種加速。


姚順雨加入騰訊兩個月后,2025年12月初,騰訊發(fā)布混元2.0模型,總參數(shù)為4060億。其英文名更新為HY2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職后的成果。但按照業(yè)內(nèi)訓(xùn)練一代模型的周期來看,混元2.0不太會是姚順雨從零開始訓(xùn)練的模型。

「模型參數(shù)量與模型能力之間是必要不充分關(guān)系,參數(shù)量大,模型性能不一定強,但參數(shù)量小,模型潛力一定有限?!股鲜鰳I(yè)內(nèi)人士說,姚順雨大概率會訓(xùn)練出一個參數(shù)量更大的模型,估計需要大半年時間——在有「配方」、有更多資源的條件下,時間可能會更短。這意味著,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實際成果,才能在騰訊這個有著11萬人的大廠坐穩(wěn)大模型一號位。

2025年4月,姚順雨在其個人博客中寫下《The Second Half》(下半場)一文,「宣布」大模型已經(jīng)具備足夠的推理能力,大模型競爭已經(jīng)完成上半場的預(yù)訓(xùn)練戰(zhàn)斗,進入以后訓(xùn)練和Agent開發(fā)為主題的下半場。但在騰訊,他得重新鏖戰(zhàn)上半場。

一位接近騰訊混元的人士對「新皮層」稱,混元下一個版本將是一個Agent模型,主要由姚順雨主導(dǎo)訓(xùn)練。

(應(yīng)采訪對象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王杰夫、實習記者李昂、肖赫對本文亦有貢獻)

微信編輯| 七三

第一財經(jīng)持續(xù)追蹤財經(jīng)熱點。若您掌握公司動態(tài)、行業(yè)趨勢、金融事件等有價值的線索,歡迎提供。專用郵箱:bianjibu@yicai.com

(注:我們會對線索進行核實。您的隱私將嚴格保密。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
許利民怒批球員擺大牌!賽后整頓更衣室,怒批一人不是周琦而是他

許利民怒批球員擺大牌!賽后整頓更衣室,怒批一人不是周琦而是他

理工男評籃球
2026-01-12 00:01:12
閆學(xué)晶朋友圈發(fā)文,坦白“哭窮”真實原因,趙本山的話含金量上升

閆學(xué)晶朋友圈發(fā)文,坦白“哭窮”真實原因,趙本山的話含金量上升

削桐作琴
2026-01-12 16:33:06
“性蕭條”才是這個時代真正的危機

“性蕭條”才是這個時代真正的危機

深藍夜讀
2025-09-24 16:00:09
2025年,內(nèi)娛最賺錢的10位明星,劉德華第四,第一名讓人意外

2025年,內(nèi)娛最賺錢的10位明星,劉德華第四,第一名讓人意外

林雁飛
2026-01-06 13:15:06
漁村逆襲?“電詐惡魔”陳志老婆是四川人,150億比特幣沾滿血淚

漁村逆襲?“電詐惡魔”陳志老婆是四川人,150億比特幣沾滿血淚

豆腐腦觀察局
2025-11-17 06:50:03
某外派大廠家屬:老公喜歡上一位非洲黑妹

某外派大廠家屬:老公喜歡上一位非洲黑妹

螞蟻大喇叭
2025-12-20 17:16:34
發(fā)現(xiàn)一個奇怪現(xiàn)象:越是獨來獨往、沒有朋友、不合群的人,人品往往越?jīng)]問題,慢慢你就知道了

發(fā)現(xiàn)一個奇怪現(xiàn)象:越是獨來獨往、沒有朋友、不合群的人,人品往往越?jīng)]問題,慢慢你就知道了

二胡的歲月如歌
2026-01-11 17:53:51
29分+30分+25分,眾人拾柴火焰高!掘金7戰(zhàn)4勝,約基奇安心養(yǎng)傷吧

29分+30分+25分,眾人拾柴火焰高!掘金7戰(zhàn)4勝,約基奇安心養(yǎng)傷吧

世界體育圈
2026-01-12 15:26:33
580萬年薪返聘8名原高管、年齡最大近90歲,康尼機電最新回應(yīng)

580萬年薪返聘8名原高管、年齡最大近90歲,康尼機電最新回應(yīng)

界面新聞
2026-01-12 11:39:33
致敬詹姆斯,阿爾卡拉斯澳網(wǎng)開賽前訓(xùn)練中上身詹姆斯湖人球衣

致敬詹姆斯,阿爾卡拉斯澳網(wǎng)開賽前訓(xùn)練中上身詹姆斯湖人球衣

懂球帝
2026-01-12 12:50:10
難掩失望,弗格森在老特拉福德的包廂內(nèi)露出震驚表情

難掩失望,弗格森在老特拉福德的包廂內(nèi)露出震驚表情

懂球帝
2026-01-12 05:02:22
越南不恨美國,不恨日本,連殖民幾十年的法國都不恨,就只恨中國

越南不恨美國,不恨日本,連殖民幾十年的法國都不恨,就只恨中國

我心縱橫天地間
2026-01-07 19:17:18
林良鋒:聽好了,弗萊徹這話說得對

林良鋒:聽好了,弗萊徹這話說得對

體壇周報
2026-01-12 14:26:18
日媒稱高市早苗或解散眾議院提前大選

日媒稱高市早苗或解散眾議院提前大選

新京報
2026-01-12 15:12:04
千人殺豬飯后續(xù):女子“闖大禍”,哭了不殺豬了,家里已負擔不起

千人殺豬飯后續(xù):女子“闖大禍”,哭了不殺豬了,家里已負擔不起

李健政觀察
2026-01-12 11:44:44
吊帶紅裙,性感尤物

吊帶紅裙,性感尤物

吃瓜黨二號頭目
2026-01-09 09:59:03
醫(yī)生:堅持走路鍛煉的老人,過不了幾個月,身體會迎來5大變化

醫(yī)生:堅持走路鍛煉的老人,過不了幾個月,身體會迎來5大變化

岐黃傳人孫大夫
2025-12-24 09:08:19
勇士111-124不敵老鷹,庫里空砍31分,誰是輸球罪魁?數(shù)據(jù)不會說謊!

勇士111-124不敵老鷹,庫里空砍31分,誰是輸球罪魁?數(shù)據(jù)不會說謊!

劉哥談體育
2026-01-12 15:07:08
多家存儲封測廠漲價:漲幅約三成 后續(xù)不排除啟動第二波漲價

多家存儲封測廠漲價:漲幅約三成 后續(xù)不排除啟動第二波漲價

財聯(lián)社
2026-01-12 09:18:10
洗碗機后續(xù),女方提離婚,知情人女方真實情況,身上buff疊滿了

洗碗機后續(xù),女方提離婚,知情人女方真實情況,身上buff疊滿了

辣條小劇場
2026-01-10 05:57:26
2026-01-12 17:15:00
第一財經(jīng)資訊 incentive-icons
第一財經(jīng)資訊
第一財經(jīng)官方賬號
241104文章數(shù) 621173關(guān)注度
往期回顧 全部

科技要聞

小米二手車價大跳水:SU7半年跌5萬元

頭條要聞

深圳"望郎歸"一徒步男子倒地猝死:突然倒地頭砸石頭上

頭條要聞

深圳"望郎歸"一徒步男子倒地猝死:突然倒地頭砸石頭上

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財經(jīng)要聞

A股大漲 兩市成交額3.6萬億創(chuàng)歷史新高

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達2026款上市

態(tài)度原創(chuàng)

本地
親子
手機
公開課
軍事航空

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

親子要聞

什么字呢

手機要聞

榮耀Magic 8 RSR保時捷設(shè)計開啟預(yù)約,1月19日正式發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

官方確認:殲10CE在空戰(zhàn)中擊落多架戰(zhàn)機

無障礙瀏覽 進入關(guān)懷版