国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大廠搶郭達雅進行時!DeepSeek核心成員還是個“綜藝巨佬”

0
分享至

DeepSeek,又有核心工程師流入江湖——

郭達雅,V2、V3、R1等一系列模型的核心作者,被曝離職。

這位被導師寄予厚望成為“中山大學雷軍”的技術天才,在學術與競賽領域有著近乎傳奇的履歷。

他自述在入學博士后的第三天便完成了畢業(yè)所需的論文發(fā)表要求,展現(xiàn)出驚人的科研效率。

他還多次在騰訊廣告算法大賽中蟬聯(lián)冠軍,并在ATEC科技精英賽和微信大數(shù)據(jù)挑戰(zhàn)賽中斬獲頭籌。被調(diào)侃還沒畢業(yè)就有著百萬獎金。

而且新時代的工程師,甚至還出現(xiàn)過綜藝里。

在真人秀《燃燒吧!天才程序員》中,他作為僅有的兩名SSS級“巨佬”選手,在60小時的極限挑戰(zhàn)中展現(xiàn)了頂尖的編碼實力……

消息傳到外網(wǎng),也引發(fā)了很多網(wǎng)友的關注,有人表示,希望這不會給DeepSeek-V4帶來影響。


畢竟,郭達雅從博士畢業(yè)后入職DeepSeek開始,就參與了Coder、Math等專項模型,以及從V2、V3到R1的完整研發(fā)鏈條,還都是核心作者。

所以郭達雅,究竟是哪一種天才少年?

DeepSeek多款模型核心作者

郭達雅于2023年博士畢業(yè)后加入DeepSeek,專注代碼智能和大語言模型推理。

促使他加入DeepSeek的原因很簡單:有一位師姐在DeepSeek工作,和他聊起公司追求AGI的愿景,這與他的價值觀比較吻合。

當時,我的一位師姐在 DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推動人類社會的加速發(fā)展。這跟我的價值觀是相合的。 同時,DeepSeek有比較多的資源投入研發(fā),領導層也希望打造一個有創(chuàng)新氛圍和自由的公司。我有這樣的熱情去做這件事,我也想追求這樣的工作環(huán)境。最終,我選擇加入了DeepSeek。

目前,郭達雅的個人主頁還沒有更新,仍然顯示為DeepSeek研究員。


DeepSeek的一系列模型,包括V2、V3和R1,還有Math、Coder、Prover和V2-Prover,郭達雅全都是核心貢獻者。


按時間順序梳理,第一條是2024年1月的代碼大模型DeepSeek-Coder。

這個項目推出了從1.3B到33B的一系列開源代碼模型,在多項基準上做到了當時的開源代碼模型SOTA。


第二項成果關于數(shù)學推理,也就是2024年2月的DeepSeek-Math。

它以DeepSeek-Coder-Base-v1.5 7B為基礎,針對數(shù)學能力進行了繼續(xù)訓練,額外使用了120B數(shù)學相關token。

更關鍵的是,DeepSeek-Math的論文中提出了GRPO這個新型強化學習方法,后來成為了R1推理的關鍵。


緊接著是形式化證明,2024年5月,DeepSeek發(fā)布了DeepSeek-Prover。

這個項目面向Lean 4定理證明,核心方法是大規(guī)模合成formal proof數(shù)據(jù),并在此基礎上微調(diào)DeepSeek-Math 7B。

結果,模型在Lean 4 miniF2F上whole-proof generation準確率達到 46.3%(64 samples),累計到52%,高于GPT-4的23.0%;在FIMO基準上證明了148題中的5題,而GPT-4得分為0。

這項成果說明,DeepSeek的模型不只能完成一般數(shù)學推理,還延伸到了更硬核的形式化推理方向。


還有我們更熟悉的V2、V3和R1,在這個研發(fā)過程中,DeepSeek證明了不依賴人工標注的推理軌跡,僅通過純強化學習,也能把大模型的推理能力激發(fā)出來,并自然涌現(xiàn)出自反思、驗證、動態(tài)策略調(diào)整等行為模式。

DeepSeek-R1的相關論文,后來還登上了Nature封面,該論文披露,R1的訓練成本僅約29.4萬美元(折合人民幣約208萬)。


總之,任職期間,郭達雅并不只是參與單點項目,而是參與了貫穿DeepSeek一整段主線的研發(fā)過程。

而在這一系列的成功背后,有他從中學時期便已經(jīng)產(chǎn)生的對計算機、對編程的深厚興趣。

“希望他成為中山大學的雷軍”

郭達雅曾就讀于珠海一中,從中學時期便展現(xiàn)出對計算機科學的濃厚興趣。

在接受珠海一中的訪談時,郭達雅表示,自己選擇計算機專業(yè)是興趣使然,并且這種興趣正是產(chǎn)生于中學期間。

興趣是我選擇計算機專業(yè)并取得如今成就的重要因素,而這一興趣的萌芽正源自珠海一中。 回想高中時光,學校豐富的實踐活動和課程不僅拓寬了我的視野,也讓我在信息課上第一次接觸到計算機編程。 最初的我對編程一無所知,但很快便被其嚴謹?shù)倪壿嬓院蜔o限的創(chuàng)造力深深吸引。 通過編寫簡單的代碼,我不僅感受到算法的精妙,還體會到數(shù)學在實際應用中的強大作用。 這段經(jīng)歷讓我對計算機科學產(chǎn)生了濃厚興趣,也讓我在高考結束后毫不猶豫地選擇了計算機專業(yè)。

2014年,郭達雅被中山大學計算機學院錄取,隨后留在中大繼續(xù)直博深造。


來源:中山大學網(wǎng)站

大四時,他入選中山大學與微軟亞洲研究院聯(lián)合培養(yǎng)博士生項目,師從印鑒教授和周明博士,研究方向是自然語言處理。周明則后來在大模型浪潮中,創(chuàng)辦了瀾舟科技。

京東探索研究院副院長、階躍星辰Tech Fellow段楠的博士生導師也是周明,兩人算是師出同門。

而郭達雅在中山大學對他進行的采訪中表示,自己在剛入學的第三天,就完成了中大博士畢業(yè)的論文發(fā)表要求。

讀博期間,郭達雅的實習是在聯(lián)培單位MSRA完成的。

其間,郭達雅完成了CodeBert以及GraphCodeBert的研究,分別發(fā)表在EMNLP 2020 Findings和ICLR 2021上。

CodeBert開發(fā)了一個雙模態(tài)預訓練模型,首次實現(xiàn)了自然語言(NL)和編程語言(PL)的雙模態(tài)預訓練,填補了此前沒有模型能同時處理NL和PL混合輸入的空白。


而GraphCodeBert則在此基礎上,首次將代碼的數(shù)據(jù)流結構納入預訓練,讓模型對代碼的理解更深入。


畢業(yè)時,郭達雅的博士論文《基于預訓練的程序理解與生成》,獲評2023年中山大學優(yōu)秀博士學位論文。

這篇論文主要以程序理解與生成為研究課題,并針對該領域現(xiàn)有研究工作在數(shù)據(jù)與模型方面存在的問題,提出了基于代碼預訓練的方法和模型,目的是利用人工智能技術提高軟件開發(fā)的效率。

從會議到博士論文,再到DeepSeek期間的工作,郭達雅的工作幾乎是一直圍繞著Coding展開,這也增加了曝料中他離職后負責Coding這一說法的可信度。

DeepSeek-V3發(fā)布后,他的導師印鑒教授,還特別寄語,希望他能成為“中山大學的雷軍”。

截至目前,郭達雅已在NeurIPS、ACL、EMNLP等國際頂級AI會議發(fā)表論文十余篇,谷歌學術引用量超1300次。

此外,在數(shù)據(jù)挖掘競賽方面,郭達雅也長期活躍于一線賽場:

2021、2022年,他連續(xù)兩年拿下螞蟻集團主辦的ATEC科技精英賽冠軍;

2022年微信大數(shù)據(jù)挑戰(zhàn)賽,3200支隊伍同臺競技,他帶隊奪冠,成功將30萬大獎收入囊中。


來源:中山大學網(wǎng)站

而郭達雅最具代表性的戰(zhàn)績,是在騰訊廣告算法大賽中連續(xù)奪冠。

作為DYG戰(zhàn)隊核心成員,他在2019年獲得冠軍,并于2020年實現(xiàn)衛(wèi)冕,利用BERT算法拿下50萬元大獎;2021年又成功奪冠。

也算是騰訊廣告算法大賽名人堂選手了。

One More Thing

有意思的是,學術和競賽全面開花的郭達雅,還有不太“科研”的一面——上綜藝。


在以程序員為主題的綜藝真人秀《燃燒吧!天才程序員》中,郭達雅和另外15名選手一起展開了60小時的代碼極限挑戰(zhàn)。

節(jié)目組把選手分成了S、SS、SSS三個級別,SSS級的“巨佬”只有2名,郭達雅就是其中之一。

郭達雅一出場便引人矚目,“巨佬來了”“神一樣的存在”。

不僅強,而且頭發(fā)還挺茂密。

但現(xiàn)在,秦失其鹿,天下共逐之…

誰又能得到郭達雅呢?

參考鏈接:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
[2]https://guoday.github.io/
[3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
[4]https://sai.sysu.edu.cn/node/545

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廣廈隊、上海隊、北京隊誰能奪冠?馬布里給出了自己的答案!

廣廈隊、上海隊、北京隊誰能奪冠?馬布里給出了自己的答案!

體育哲人
2026-04-27 22:28:15
深圳這天,吳彥祖發(fā)福、周潤發(fā)干癟,郭富城穿10cm厚底鞋還矮半頭

深圳這天,吳彥祖發(fā)福、周潤發(fā)干癟,郭富城穿10cm厚底鞋還矮半頭

秋姐居
2026-04-27 19:35:02
林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統(tǒng)

林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統(tǒng)

椰黃娛樂
2026-04-27 14:02:11
外商投資安全審查工作機制辦公室(國家發(fā)展改革委)對外資收購Manus項目作出安全審查決定

外商投資安全審查工作機制辦公室(國家發(fā)展改革委)對外資收購Manus項目作出安全審查決定

界面新聞
2026-04-27 16:07:47
大逆轉!希金斯4-9翻盤,13-12勝奧沙利文,晉級世錦賽8強

大逆轉!希金斯4-9翻盤,13-12勝奧沙利文,晉級世錦賽8強

懂球帝
2026-04-27 23:14:19
5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

5月1日起抽煙買煙迎來變化,6條紅線碰不得,違規(guī)就罰款!

老特有話說
2026-04-27 17:43:49
聯(lián)合國變天?秘書長候選人出現(xiàn),巴西力挺,中方:不準有官僚主義

聯(lián)合國變天?秘書長候選人出現(xiàn),巴西力挺,中方:不準有官僚主義

說歷史的老牢
2026-04-26 12:21:13
吉林伊通驚現(xiàn)200萬豪華住宅式墓地,獨門獨戶地上地下兩層

吉林伊通驚現(xiàn)200萬豪華住宅式墓地,獨門獨戶地上地下兩層

大象新聞
2026-04-27 13:41:32
槍響時美總統(tǒng)、副總統(tǒng)、眾議長在同一房間!若發(fā)生不測,第三順位繼承人是缺席晚宴的92歲老人

槍響時美總統(tǒng)、副總統(tǒng)、眾議長在同一房間!若發(fā)生不測,第三順位繼承人是缺席晚宴的92歲老人

紅星新聞
2026-04-27 19:19:23
東風-27疑似量產(chǎn),令美軍如芒在背!

東風-27疑似量產(chǎn),令美軍如芒在背!

楊風
2026-04-26 23:04:04
這條新聞在今天看來,諷刺至極!

這條新聞在今天看來,諷刺至極!

胖胖說他不胖
2026-04-27 09:00:43
當著日本航母的面,055射了一枚導彈,美國反導體系沉默了

當著日本航母的面,055射了一枚導彈,美國反導體系沉默了

等閑故人心變阡
2026-04-27 08:31:29
外媒炸鍋了!當著日本航母的面,055竟然發(fā)射鷹擊-20?

外媒炸鍋了!當著日本航母的面,055竟然發(fā)射鷹擊-20?

安珈使者啊
2026-04-27 11:46:37
特朗普,又變了

特朗普,又變了

南風窗
2026-04-27 16:22:26
一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

一場硬核風力實驗,一見這屆頂級游戲本散熱有多強?

極果酷玩
2026-04-23 23:13:17
為了外貿(mào)數(shù)據(jù)排名,南京市江寧經(jīng)濟開發(fā)區(qū)公款“購買”異地出口數(shù)據(jù),有關部門只考不核

為了外貿(mào)數(shù)據(jù)排名,南京市江寧經(jīng)濟開發(fā)區(qū)公款“購買”異地出口數(shù)據(jù),有關部門只考不核

三言四拍
2026-04-27 09:06:00
克媒:莫德里奇顴骨骨折賽季報銷,預計將戴面具出戰(zhàn)世界杯

克媒:莫德里奇顴骨骨折賽季報銷,預計將戴面具出戰(zhàn)世界杯

懂球帝
2026-04-27 22:00:51
羅永浩連發(fā)6個問句怒懟!俞敏洪反思“東方甄選多位主播離職”,有網(wǎng)友說“任何一個人遭遇羅永浩、董宇輝這種忘恩負義的小人都夠嗆”

羅永浩連發(fā)6個問句怒懟!俞敏洪反思“東方甄選多位主播離職”,有網(wǎng)友說“任何一個人遭遇羅永浩、董宇輝這種忘恩負義的小人都夠嗆”

魯中晨報
2026-04-27 17:56:12
山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

山西澤州發(fā)生重大刑事案件,33歲嫌犯潛逃,警方發(fā)布協(xié)查通報

極目新聞
2026-04-27 17:56:03
美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經(jīng)紀人淡定吃沙拉

美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經(jīng)紀人淡定吃沙拉

魯中晨報
2026-04-27 16:36:04
2026-04-27 23:39:00
算法與數(shù)學之美 incentive-icons
算法與數(shù)學之美
分享知識,交流思想
5496文章數(shù) 64624關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

手機
本地
旅游
教育
藝術

手機要聞

輕薄本迎來驍龍時刻!華碩推出三款萬元AI PC,太精準了

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統(tǒng)文化

旅游要聞

誰懂??!沈陽拉塔湖驚現(xiàn)白鷺群,工業(yè)城竟有這般仙境

教育要聞

學生課堂偷吃、聽課“擺爛”……這位老師的應對方式絕了!

藝術要聞

你絕對想不到,攝影能讓她成為女神!

無障礙瀏覽 進入關懷版