国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

為什么大廠必須搶郭達雅?

0
分享至



有這樣一則消息在AI圈悄然流傳:DeepSeek研究員郭達雅已經(jīng)離職。

大家第一時間的反應普遍是“誰?誰是郭達雅?”

這不難理解,因為郭達雅的知名度遠不如創(chuàng)始人梁文鋒以及“天才AI少女”羅福莉。

但是在學術(shù)研究以及對DeepSeek大模型的貢獻上,郭達雅要比后兩者高許多。

截止至發(fā)稿,郭達雅發(fā)表的論文已經(jīng)被引用超過37000次,遠遠超過了同齡的研究者。

郭達雅的h指數(shù)為37,i-10指數(shù)為46,說明他不僅學術(shù)產(chǎn)出非常穩(wěn)定,而且他還發(fā)表了多篇擁有極高影響力的論文。

甚至可以這么說,只要你了解過郭達雅的研究方向以及他所主導的研究后,你就會認識到,當年之所以能出現(xiàn)DeepSeek時刻,郭達雅絕對功不可沒。

那他去哪了?目前有兩種說法,一種說是百度,一種說是字節(jié)。

實際上這兩年加入字節(jié)的這幾個大牛,周暢、郁博文、蔣路,他們都是視頻方向的。

郭達雅不一樣,他是代碼智能和數(shù)學方向的,他剛好可以補強字節(jié)在Vibe Coding以及AGI這兩大板塊。

如果是去百度,那也說得通。文心快碼在3月份剛剛完成了4.0版本迭代,推出了多agent協(xié)同全鏈路開發(fā)的功能。

但是你知道文心快碼3.0是什么時候發(fā)布的嗎?是2024年11月。兩個大版本中間相隔了一年多,這在以周為單位的AI圈是不太常見的。

這么看下來,百度其實比字節(jié)更需要郭達雅。

然而對于遲遲不發(fā)布V4的DeepSeek,郭達雅的離職,無疑是雪上加霜。

01

郭達雅其人

郭達雅1995年出生于廣東珠海,2014年考入中山大學數(shù)據(jù)科學與計算機學院。大四時入選中山大學與微軟亞洲研究院聯(lián)合培養(yǎng)博士生項目,在印鑒教授和周明博士指導下攻讀博士學位,研究方向是自然語言處理。

2020年獲得微軟學者獎學金,這個獎項每年只授予亞太地區(qū)12名博士生。2023年博士畢業(yè)后,他加入DeepSeek擔任研究員,專注代碼智能和大語言模型推理。

郭達雅在博士期間的一個細節(jié)值得注意。他在微軟亞洲研究院實習時,分別在EMNLP和NeurIPS這兩個頂會發(fā)表了論文。

如果按照中山大學的畢業(yè)要求,郭達雅在博士入學的第三天,就已經(jīng)完成了博士學位最難的論文發(fā)表要求。

他本人在接受采訪時也提到了這件事。那我們不妨挑一篇其中影響力最高的來一起過一遍。

2020年,郭達雅作為共同第一作者,在EMNLP 2020上發(fā)表了CodeBERT。另一位共同第一作者是哈爾濱工業(yè)大學的馮章印。

CodeBERT是首個將雙模態(tài)預訓練的效果做到跨語言通用的SOTA,它能同時處理自然語言和編程語言。在此之前,BERT等預訓練模型,雖然在自然語言處理領(lǐng)域取得了成功,但針對編程語言的預訓練模型研究相對匱乏。

CodeBERT的核心創(chuàng)新在于引入了替換標記檢測任務。傳統(tǒng)的掩碼語言建模只能利用配對的自然語言-代碼數(shù)據(jù),而替換標記檢測借鑒了ELECTRA的思想,通過檢測生成器產(chǎn)生的似是而非的替代標記來訓練模型。

這使得CodeBERT能夠利用大量單模態(tài)代碼數(shù)據(jù),大大擴展了訓練數(shù)據(jù)規(guī)模。模型在代碼搜索和代碼文檔生成任務上取得了當時的最優(yōu)性能。



或者我換一種方式來描述,CodeBERT它能讓AI既能讀懂人類語言的需求描述,又能理解代碼的邏輯結(jié)構(gòu)。比如你用中文說“給我找一個排序算法”,它就能幫你找到相關(guān)的代碼;或者你給它一段代碼,它能用人話解釋這段代碼在干什么。

雖然現(xiàn)在看來這沒什么,可這篇論文是2020年發(fā)表的,在當時,代碼就是代碼,自然語言就是自然語言,這兩者之間隔著一條通天河。

因此,CodeBERT的出現(xiàn),其實可以被看做是現(xiàn)如今Vibe Coding的開端。

加入DeepSeek以后,如果你要問郭達雅參與過的最有影響力的學術(shù)成果,那肯定是非DeepSeek-R1莫屬了。

但如果你要問排名第二的是哪篇,那我告訴你,答案不是DeepSeek-V3,而是DeepSeekMath。

DeepSeek-V3的技術(shù)報告引用數(shù)量為3890,而DeepSeekMath的引用數(shù)量為5182。

2024年2月,郭達雅作為核心貢獻者參與了DeepSeekMath的研發(fā)。這是繼郭達雅以第一作者身份發(fā)表DeepSeek-Coder后的又一力作,這個項目的目標是提升大語言模型在數(shù)學推理方面的能力。

DeepSeekMath的關(guān)鍵創(chuàng)新是引入了GRPO,即群體相對策略優(yōu)化。這是近端策略優(yōu)化PPO的一種變體。

傳統(tǒng)的PPO需要訓練一個獨立的價值函數(shù)模型,這增加了內(nèi)存使用和計算開銷。

所以GRPO干脆直接放棄了對獨立價值函數(shù)模型的依賴,轉(zhuǎn)而通過群體內(nèi)的相對比較來估計優(yōu)勢,因此降低了訓練資源需求。

GRPO的工作流程是這樣的:對于同一個數(shù)學問題,模型生成多個候選答案,然后根據(jù)這些答案的正確性進行排序,將正確答案的概率提高,錯誤答案的概率降低。

這樣一來,大模型在下次遇到類似問題就知道該怎么做了。

這種方法不需要額外的價值網(wǎng)絡(luò),只需要一個能夠驗證答案正確性的獎勵函數(shù)。在數(shù)學推理任務中,獎勵函數(shù)可以直接檢查最終答案是否正確。

相當于讓模型在判斷問題的時候,又快又準確,關(guān)鍵是還節(jié)省了內(nèi)存占用。

經(jīng)過GRPO強化學習優(yōu)化后的DeepSeekMath-RL 7B,在無外部工具、無投票集成的條件下,在MATH基準上取得了51.7%的成績,這和同期的Gemini-Ultra和GPT-4接近,在當時的開源大模型領(lǐng)域,已經(jīng)非常難得了。

因此,GRPO在后來也被應用到了DeepSeek-R1的訓練當中。

02

郭達雅去哪?

其實如果咱們從技術(shù)貢獻的角度看,雖然梁文鋒、羅福莉的知名度更高,但是郭達雅對DeepSeek的貢獻要比他們倆都高。這點和公眾認知是相反的。

梁文鋒的作用是提供研究方向和資源支持。他在多篇論文中的署名位置通常靠后,表明他不是主要的技術(shù)貢獻者。

羅福莉雖然也參與了DeepSeek-V2的研發(fā)。不過從論文作者名單看,她的名字并沒有標注為核心貢獻者。

言歸正傳,在agent的本質(zhì),就是代碼理解(Code Understanding)、代碼生成(Code Generation)和程序綜合(Program Synthesis)這三件事。

而巧合的是,從CodeBERT開始,郭達雅的研究方向就是如此。

因此我認為,郭達雅的離職,對于DeepSeek來說,影響是非常大的。

除了前文提到的CodeBERT,郭達雅還主導了GraphCodeBERT和DeepSeek-Coder。



前者是讓AI能理解代碼中變量之間的依賴關(guān)系,比如說改了a會影響b,改了b又會影響c。這對代碼重構(gòu)和修復Bug特別有幫助。

后者則是通過支持多種編程語言和更長的上下文,讓模型能一次性理解整個項目的代碼架構(gòu)。DeepSeek-Coder-V2的代碼性能與同期的GPT-4 Turbo相當。

2024年的時候,字節(jié)從阿里挖走了周暢。周暢在阿里通義千問負責多模態(tài)相關(guān)研究,加入字節(jié)后擔任Seed視覺多模態(tài)負責人,主導Seedream和Seedance的研發(fā)。

2026年春節(jié),周暢交出了在字節(jié)的第一份答卷Seedance 2.0,憑借“導演級”的視頻生成能力在全球范圍內(nèi)引發(fā)轟動。

現(xiàn)在,傳言字節(jié)可能是郭達雅的下家之一。周暢補強的是視覺多模態(tài),如果傳言為真,郭達雅要補強的,是代碼智能和推理能力。

字節(jié)Seed團隊在2025年初經(jīng)歷了一次重組。

吳永輝接管后,打破了模型部門間的數(shù)據(jù)壁壘,組建了三層架構(gòu):Edge團隊負責長周期的AGI課題,F(xiàn)ocus團隊負責核心技術(shù)攻堅,Base團隊確保當前一代模型的穩(wěn)定交付。

從技術(shù)匹配度看,郭達雅最可能負責的,是代碼大模型的全鏈路技術(shù)攻堅。

比如說主導字節(jié)Code-LLM的下一個迭代之類的。

因為郭達雅擅長預訓練架構(gòu)優(yōu)化、超長上下文適配、多語言支持等核心技術(shù)的研發(fā),所以他很可能會為字節(jié)帶來那種“項目級”的代碼生成agent。

第二個核心方向是推理能力。

目前字節(jié)Seed團隊的核心戰(zhàn)略之一,就是類o1的通用推理大模型,郭達雅如果加入,將直接給字節(jié)帶來行業(yè)最成熟的GRPO落地經(jīng)驗。

他大概率會負責推理方向的強化學習算法研發(fā),優(yōu)化豆包大模型的數(shù)學推理、多步邏輯推理、復雜任務拆解能力。

第三個方向是數(shù)學推理專項模型研發(fā)。

數(shù)學推理能力是大模型通用邏輯能力的核心底座。Seed團隊專門設(shè)立的Edge團隊,聚焦3年以上的長期AGI基礎(chǔ)研究。

并且取消了短期季度考核,允許團隊投入資源做探索性研究。

郭達雅所參與過的DeepSeekMath,正是這個方向。

如果郭達雅選擇加入百度,他同樣能在代碼智能領(lǐng)域發(fā)揮重要作用。

前文提到,文心快碼在2026年3月剛剛完成了重大升級,更新的重點是多agent協(xié)同。

它具體的協(xié)同方式是:Plan agent負責需求澄清和任務規(guī)劃,Architect agent通過SubAgents機制拆解復雜任務,每個子agent擁有獨立上下文,以解決長Context下的“遺忘”問題。

而郭達雅剛好研究過這套全鏈路環(huán)節(jié)上的每一個節(jié)點,換句話說,百度正在做的事情,和郭達雅的研究方向完全重合了。

因此,如果他加入文心團隊,很可能會負責優(yōu)化這些agent之間的協(xié)同機制,提升代碼生成的準確性和項目級理解能力。

說到挖角DeepSeek核心人才,阿里也不容忽視。2026年3月初,阿里通義千問技術(shù)負責人林俊旸在社交平臺突然宣布離職。

更糟糕的是,除了林俊旸外,千問在2026年還失去了后訓練負責人郁博文、代碼模型負責人惠彬原等多名技術(shù)骨干。

就在這個關(guān)鍵時刻,阿里CEO吳泳銘在3月19日的財報電話會上放出狠話,說當前阿里的ATH事業(yè)群,更高優(yōu)先級是“打造智能能力最強的模型”。

這時候,如果阿里能夠引進郭達雅這樣的頂級專家,那無疑是一箭雙雕。既能填補林俊旸離職留下的技術(shù)空白,又能直接獲得DeepSeek在代碼智能和推理能力方面的核心經(jīng)驗。

講真的,比起遲遲不發(fā)V4的DeepSeek,郭達雅有理由趁著年輕,去字節(jié)或者百度、阿里做出點成績。

03

DeepSeek-V4還會來嗎?

2026年1月初,外媒援引兩名知情人士的消息稱,DeepSeek計劃在春節(jié)期間推出下一代旗艦模型V4。消息還提到,V4 在內(nèi)部測試中的編程能力已經(jīng)超越了Claude 3.5 Sonnet和GPT-4o。

這個消息讓整個AI圈都興奮起來。

自2025年1月20日發(fā)布 DeepSeek-R1 以來,DeepSeek沒有發(fā)布過任何一個大版本的迭代,最新的模型也只到了DeepSeek-V3.2。

春節(jié)來了,V4沒來。

2月11日,有用戶發(fā)現(xiàn)DeepSeek的App版本號更新為1.7.4,上下文窗口從128K提升至1M,知識庫截止時間更新到2025年5月。

社區(qū)立刻沸騰了,大家紛紛在猜,說這就是傳說中的V4灰度測試嗎?

但接近DeepSeek的人士很快給出了否定答案:“這不是V4,就是一個小版本更新。”

隨后外媒又報道稱,DeepSeek將在3月2日發(fā)布 V4。報道還表示,V4 將針對國產(chǎn)芯片進行優(yōu)化,是該系列大模型中第一個完全基于國產(chǎn)算力生態(tài)的版本。

這一消息很快被大量國內(nèi)媒體轉(zhuǎn)載。

3月2日到了,無事發(fā)生。

緊接著第二天,又有消息稱V4“極大概率”將在本周發(fā)布,還有泄露的基準測試數(shù)據(jù)顯示,V4在HumanEval上得分 90%,作為對比,DeepSeek V3為82%。

事實上,HumanEval只是一個入門級的代碼生成基準測試,目前已趨于指標飽和,根本無法完整區(qū)分頂級代碼大模型的真實能力,所以當時我就覺得這是個假新聞。

果然,眼瞅要到4月了,V4依然沒有出現(xiàn)。

現(xiàn)在還有報道稱DeepSeek-V4預計在2026年4月正式發(fā)布,重點提升長期記憶能力,并深度適配國產(chǎn)芯片。

延期的原因眾說紛紜。有人說是模型規(guī)模膨脹導致訓練進度延遲,還有人說是多模態(tài)功能的整合比預期復雜。

但有一個細節(jié)值得注意,V4的核心賣點之一,就是“超強編程能力”。根據(jù)泄露的信息,V4能處理30萬行代碼邏輯鏈。



而郭達雅,正是DeepSeek在這一塊的頂梁柱。

DeepSeek的核心研究人員不多。從論文作者名單看,經(jīng)常出現(xiàn)的名字不超過20個。

在這樣一個精英小團隊里,每一個都是不可缺少的,更何況他還是郭達雅這樣的超級大牛。

道理就擺在這了,如果V4成功了,說明DeepSeek找到了替代者,或者團隊成功完成了技術(shù)交接。

如果V4再次延期,或者代碼能力沒有達到預期,那么郭達雅離職的影響就會真正顯現(xiàn)出來。

從現(xiàn)在的情況看,DeepSeek正在經(jīng)歷一場嚴峻的考驗。它需要證明,即使失去了核心人才,它依然能夠保持技術(shù)創(chuàng)新的節(jié)奏。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國臺辦:堅決反對建交國與中國臺灣地區(qū)開展任何形式官方往來

國臺辦:堅決反對建交國與中國臺灣地區(qū)開展任何形式官方往來

環(huán)球網(wǎng)資訊
2026-04-15 10:38:12
張馨予老公何捷在廣州大學給保安上課,胸肌發(fā)達個子矮,一身爹味

張馨予老公何捷在廣州大學給保安上課,胸肌發(fā)達個子矮,一身爹味

小娛樂悠悠
2026-04-15 08:49:29
震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關(guān)注

震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關(guān)注

火山詩話
2026-04-15 06:12:38
78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚言回饋粉絲

78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚言回饋粉絲

LULU生活家
2026-04-14 18:43:54
伊朗總統(tǒng)贊揚中國等6國反戰(zhàn)立場

伊朗總統(tǒng)贊揚中國等6國反戰(zhàn)立場

國際在線
2026-04-15 06:55:12
女子用滴露“寵物專用消毒液”拖地后 5只幼貓當晚全部死亡 品牌回應:需尸檢報告確認因果關(guān)系

女子用滴露“寵物專用消毒液”拖地后 5只幼貓當晚全部死亡 品牌回應:需尸檢報告確認因果關(guān)系

閃電新聞
2026-04-14 21:57:12
蘋果官微發(fā)文提醒iPhone用戶立即更新設(shè)備

蘋果官微發(fā)文提醒iPhone用戶立即更新設(shè)備

界面新聞
2026-04-15 08:26:07
河南省南陽市人民政府副市長阿穎接受監(jiān)察調(diào)查

河南省南陽市人民政府副市長阿穎接受監(jiān)察調(diào)查

界面新聞
2026-04-15 09:59:35
13歲男孩被老人私拴繩索割喉,已脫離生命危險,但仍有一段氣管未能找到……他成績?nèi)G叭?,母親白血病加乳腺癌,網(wǎng)友已籌款超60萬

13歲男孩被老人私拴繩索割喉,已脫離生命危險,但仍有一段氣管未能找到……他成績?nèi)G叭?,母親白血病加乳腺癌,網(wǎng)友已籌款超60萬

極目新聞
2026-04-14 22:38:03
日本海上自衛(wèi)隊竟參與南極科考長達60年

日本海上自衛(wèi)隊竟參與南極科考長達60年

樞密院十號
2026-04-14 23:03:54
悲催!僅5人的小公司,老板負債50萬,告知兩員工公司撐不下去了

悲催!僅5人的小公司,老板負債50萬,告知兩員工公司撐不下去了

火山詩話
2026-04-15 06:54:16
許家印庭審連認八罪:2.4萬億從哪來,去了哪里?

許家印庭審連認八罪:2.4萬億從哪來,去了哪里?

黔有虎
2026-04-14 20:48:38
躺贏18年!一冠吃一輩子,里弗斯正式告別NBA執(zhí)教舞臺!

躺贏18年!一冠吃一輩子,里弗斯正式告別NBA執(zhí)教舞臺!

田先生籃球
2026-04-14 08:46:37
三球30+5+10制勝球黃蜂OT險勝熱火,米切爾28+6絕殺球被帽

三球30+5+10制勝球黃蜂OT險勝熱火,米切爾28+6絕殺球被帽

湖人崛起
2026-04-15 10:24:12
1人死亡!廣東惠州一鴻蒙智行展廳發(fā)生高墜事故,調(diào)查報告:作業(yè)人員維修頂棚,踩穿采光瓦從4.2米高的頂棚墜落至地面,頭部受傷,不幸去世

1人死亡!廣東惠州一鴻蒙智行展廳發(fā)生高墜事故,調(diào)查報告:作業(yè)人員維修頂棚,踩穿采光瓦從4.2米高的頂棚墜落至地面,頭部受傷,不幸去世

大風新聞
2026-04-15 10:43:02
一杯茶蒸發(fā)300億!霸王茶姬泡沫破裂,創(chuàng)始人卷7億走人

一杯茶蒸發(fā)300億!霸王茶姬泡沫破裂,創(chuàng)始人卷7億走人

老特有話說
2026-04-14 13:40:08
陳根:美國正式封鎖霍爾木茲海峽,為什么中國是最受傷的一方?

陳根:美國正式封鎖霍爾木茲海峽,為什么中國是最受傷的一方?

陳述智能
2026-04-15 07:45:08
54歲班主任帶15歲女孩到賓館開房猥褻被拘10天,家屬發(fā)聲

54歲班主任帶15歲女孩到賓館開房猥褻被拘10天,家屬發(fā)聲

澎湃新聞
2026-04-14 22:03:12
別再尬演情婦了!老氣橫秋,膀大腰圓,這是迷倒男人該有的皮囊?

別再尬演情婦了!老氣橫秋,膀大腰圓,這是迷倒男人該有的皮囊?

阿纂看事
2026-04-14 18:13:20
“銷量爆發(fā)式增長”!義烏,又爆單了!

“銷量爆發(fā)式增長”!義烏,又爆單了!

環(huán)球網(wǎng)資訊
2026-04-14 22:03:34
2026-04-15 11:48:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2375文章數(shù) 8058關(guān)注度
往期回顧 全部

科技要聞

手機無死角上網(wǎng)?亞馬遜砸百億硬剛馬斯克

頭條要聞

媒體:蘇林剛到北京就乘坐高鐵 不難看出是為了什么

頭條要聞

媒體:蘇林剛到北京就乘坐高鐵 不難看出是為了什么

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊道歉”

娛樂要聞

曾志偉辦73歲生日派對,逾百藝人到場

財經(jīng)要聞

特朗普稱美國對伊朗的戰(zhàn)爭已經(jīng)結(jié)束

汽車要聞

海豹08內(nèi)飾首秀 大滿配“海王”旗艦

態(tài)度原創(chuàng)

藝術(shù)
本地
旅游
教育
房產(chǎn)

藝術(shù)要聞

這山水,蕩滌胸中塵埃

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

旅游要聞

柳林:泡桐花盛放 日夜皆成春日盛景

教育要聞

剛剛,山東又有2市確認中小學春秋假時間

房產(chǎn)要聞

改善標桿,1.5w+起橫掃國興!??跇鞘校虺鲎蠲鸵粡埮?!

無障礙瀏覽 進入關(guān)懷版