国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大廠搶郭達(dá)雅進(jìn)行時(shí)!DeepSeek核心成員還是個(gè)“綜藝巨佬”

0
分享至

  • 克雷西 聽雨 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

DeepSeek,又有核心工程師流入江湖——

郭達(dá)雅,V2、V3、R1等一系列模型的核心作者,被曝離職。

這位被導(dǎo)師寄予厚望成為“中山大學(xué)雷軍”的技術(shù)天才,在學(xué)術(shù)與競賽領(lǐng)域有著近乎傳奇的履歷。

他自述在入學(xué)博士后的第三天便完成了畢業(yè)所需的論文發(fā)表要求,展現(xiàn)出驚人的科研效率。

他還多次在騰訊廣告算法大賽中蟬聯(lián)冠軍,并在ATEC科技精英賽和微信大數(shù)據(jù)挑戰(zhàn)賽中斬獲頭籌。被調(diào)侃還沒畢業(yè)就有著百萬獎(jiǎng)金。

而且新時(shí)代的工程師,甚至還出現(xiàn)過綜藝?yán)铩?/p>

在真人秀《燃燒吧!天才程序員》中,他作為僅有的兩名SSS級“巨佬”選手,在60小時(shí)的極限挑戰(zhàn)中展現(xiàn)了頂尖的編碼實(shí)力……

消息傳到外網(wǎng),也引發(fā)了很多網(wǎng)友的關(guān)注,有人表示,希望這不會(huì)給DeepSeek-V4帶來影響。



畢竟,郭達(dá)雅從博士畢業(yè)后入職DeepSeek開始,就參與了Coder、Math等專項(xiàng)模型,以及從V2、V3到R1的完整研發(fā)鏈條,還都是核心作者。

所以郭達(dá)雅,究竟是哪一種天才少年?

DeepSeek多款模型核心作者

郭達(dá)雅于2023年博士畢業(yè)后加入DeepSeek,專注代碼智能和大語言模型推理。

促使他加入DeepSeek的原因很簡單:有一位師姐在DeepSeek工作,和他聊起公司追求AGI的愿景,這與他的價(jià)值觀比較吻合。

  • 當(dāng)時(shí),我的一位師姐在 DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推動(dòng)人類社會(huì)的加速發(fā)展。這跟我的價(jià)值觀是相合的。
    同時(shí),DeepSeek有比較多的資源投入研發(fā),領(lǐng)導(dǎo)層也希望打造一個(gè)有創(chuàng)新氛圍和自由的公司。我有這樣的熱情去做這件事,我也想追求這樣的工作環(huán)境。最終,我選擇加入了DeepSeek。

目前,郭達(dá)雅的個(gè)人主頁還沒有更新,仍然顯示為DeepSeek研究員。



DeepSeek的一系列模型,包括V2、V3和R1,還有Math、Coder、Prover和V2-Prover,郭達(dá)雅全都是核心貢獻(xiàn)者。



按時(shí)間順序梳理,第一條是2024年1月的代碼大模型DeepSeek-Coder。

這個(gè)項(xiàng)目推出了從1.3B到33B的一系列開源代碼模型,在多項(xiàng)基準(zhǔn)上做到了當(dāng)時(shí)的開源代碼模型SOTA。



第二項(xiàng)成果關(guān)于數(shù)學(xué)推理,也就是2024年2月的DeepSeek-Math。

它以DeepSeek-Coder-Base-v1.5 7B為基礎(chǔ),針對數(shù)學(xué)能力進(jìn)行了繼續(xù)訓(xùn)練,額外使用了120B數(shù)學(xué)相關(guān)token。

更關(guān)鍵的是,DeepSeek-Math的論文中提出了GRPO這個(gè)新型強(qiáng)化學(xué)習(xí)方法,后來成為了R1推理的關(guān)鍵。



緊接著是形式化證明,2024年5月,DeepSeek發(fā)布了DeepSeek-Prover。

這個(gè)項(xiàng)目面向Lean 4定理證明,核心方法是大規(guī)模合成formal proof數(shù)據(jù),并在此基礎(chǔ)上微調(diào)DeepSeek-Math 7B。

結(jié)果,模型在Lean 4 miniF2F上whole-proof generation準(zhǔn)確率達(dá)到 46.3%(64 samples),累計(jì)到52%,高于GPT-4的23.0%;在FIMO基準(zhǔn)上證明了148題中的5題,而GPT-4得分為0。

這項(xiàng)成果說明,DeepSeek的模型不只能完成一般數(shù)學(xué)推理,還延伸到了更硬核的形式化推理方向。



還有我們更熟悉的V2、V3和R1,在這個(gè)研發(fā)過程中,DeepSeek證明了不依賴人工標(biāo)注的推理軌跡,僅通過純強(qiáng)化學(xué)習(xí),也能把大模型的推理能力激發(fā)出來,并自然涌現(xiàn)出自反思、驗(yàn)證、動(dòng)態(tài)策略調(diào)整等行為模式。

DeepSeek-R1的相關(guān)論文,后來還登上了Nature封面,該論文披露,R1的訓(xùn)練成本僅約29.4萬美元(折合人民幣約208萬)。



總之,任職期間,郭達(dá)雅并不只是參與單點(diǎn)項(xiàng)目,而是參與了貫穿DeepSeek一整段主線的研發(fā)過程

而在這一系列的成功背后,有他從中學(xué)時(shí)期便已經(jīng)產(chǎn)生的對計(jì)算機(jī)、對編程的深厚興趣。

“希望他成為中山大學(xué)的雷軍”

郭達(dá)雅曾就讀于珠海一中,從中學(xué)時(shí)期便展現(xiàn)出對計(jì)算機(jī)科學(xué)的濃厚興趣。

在接受珠海一中的訪談時(shí),郭達(dá)雅表示,自己選擇計(jì)算機(jī)專業(yè)是興趣使然,并且這種興趣正是產(chǎn)生于中學(xué)期間。

  • 興趣是我選擇計(jì)算機(jī)專業(yè)并取得如今成就的重要因素,而這一興趣的萌芽正源自珠海一中。
    回想高中時(shí)光,學(xué)校豐富的實(shí)踐活動(dòng)和課程不僅拓寬了我的視野,也讓我在信息課上第一次接觸到計(jì)算機(jī)編程。
    最初的我對編程一無所知,但很快便被其嚴(yán)謹(jǐn)?shù)倪壿嬓院蜔o限的創(chuàng)造力深深吸引。
    通過編寫簡單的代碼,我不僅感受到算法的精妙,還體會(huì)到數(shù)學(xué)在實(shí)際應(yīng)用中的強(qiáng)大作用。
    這段經(jīng)歷讓我對計(jì)算機(jī)科學(xué)產(chǎn)生了濃厚興趣,也讓我在高考結(jié)束后毫不猶豫地選擇了計(jì)算機(jī)專業(yè)。

2014年,郭達(dá)雅被中山大學(xué)計(jì)算機(jī)學(xué)院錄取,隨后留在中大繼續(xù)直博深造。



大四時(shí),他入選中山大學(xué)與微軟亞洲研究院聯(lián)合培養(yǎng)博士生項(xiàng)目,師從印鑒教授和周明博士,研究方向是自然語言處理。周明則后來在大模型浪潮中,創(chuàng)辦了瀾舟科技。

京東探索研究院副院長、階躍星辰Tech Fellow段楠的博士生導(dǎo)師也是周明,兩人算是師出同門。

而郭達(dá)雅在中山大學(xué)對他進(jìn)行的采訪中表示,自己在剛?cè)雽W(xué)的第三天,就完成了中大博士畢業(yè)的論文發(fā)表要求。

讀博期間,郭達(dá)雅的實(shí)習(xí)是在聯(lián)培單位MSRA完成的。

其間,郭達(dá)雅完成了CodeBert以及GraphCodeBert的研究,分別發(fā)表在EMNLP 2020 Findings和ICLR 2021上。

CodeBert開發(fā)了一個(gè)雙模態(tài)預(yù)訓(xùn)練模型,首次實(shí)現(xiàn)了自然語言(NL)和編程語言(PL)的雙模態(tài)預(yù)訓(xùn)練,填補(bǔ)了此前沒有模型能同時(shí)處理NL和PL混合輸入的空白。



而GraphCodeBert則在此基礎(chǔ)上,首次將代碼的數(shù)據(jù)流結(jié)構(gòu)納入預(yù)訓(xùn)練,讓模型對代碼的理解更深入。



畢業(yè)時(shí),郭達(dá)雅的博士論文《基于預(yù)訓(xùn)練的程序理解與生成》,獲評2023年中山大學(xué)優(yōu)秀博士學(xué)位論文。

這篇論文主要以程序理解與生成為研究課題,并針對該領(lǐng)域現(xiàn)有研究工作在數(shù)據(jù)與模型方面存在的問題,提出了基于代碼預(yù)訓(xùn)練的方法和模型,目的是利用人工智能技術(shù)提高軟件開發(fā)的效率。

從會(huì)議到博士論文,再到DeepSeek期間的工作,郭達(dá)雅的工作幾乎是一直圍繞著Coding展開,這也增加了曝料中他離職后負(fù)責(zé)Coding這一說法的可信度。

DeepSeek-V3發(fā)布后,他的導(dǎo)師印鑒教授,還特別寄語,希望他能成為“中山大學(xué)的雷軍”

截至目前,郭達(dá)雅已在NeurIPS、ACL、EMNLP等國際頂級AI會(huì)議發(fā)表論文十余篇,谷歌學(xué)術(shù)引用量超1300次。

此外,在數(shù)據(jù)挖掘競賽方面,郭達(dá)雅也長期活躍于一線賽場:

2021、2022年,他連續(xù)兩年拿下螞蟻集團(tuán)主辦的ATEC科技精英賽冠軍;

2022年微信大數(shù)據(jù)挑戰(zhàn)賽,3200支隊(duì)伍同臺(tái)競技,他帶隊(duì)奪冠,成功將30萬大獎(jiǎng)收入囊中。



而郭達(dá)雅最具代表性的戰(zhàn)績,是在騰訊廣告算法大賽中連續(xù)奪冠

作為DYG戰(zhàn)隊(duì)核心成員,他在2019年獲得冠軍,并于2020年實(shí)現(xiàn)衛(wèi)冕,利用BERT算法拿下50萬元大獎(jiǎng);2021年又成功奪冠。

也算是騰訊廣告算法大賽名人堂選手了。

One More Thing

有意思的是,學(xué)術(shù)和競賽全面開花的郭達(dá)雅,還有不太“科研”的一面——上綜藝



在以程序員為主題的綜藝真人秀《燃燒吧!天才程序員》中,郭達(dá)雅和另外15名選手一起展開了60小時(shí)的代碼極限挑戰(zhàn)。

節(jié)目組把選手分成了S、SS、SSS三個(gè)級別,SSS級的“巨佬”只有2名,郭達(dá)雅就是其中之一。

郭達(dá)雅一出場便引人矚目,“巨佬來了”“神一樣的存在”。

不僅強(qiáng),而且頭發(fā)還挺茂密。

但現(xiàn)在,秦失其鹿,天下共逐之…

誰又能得到郭達(dá)雅呢?


[1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
[2]https://guoday.github.io/
[3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
[4]https://sai.sysu.edu.cn/node/545

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個(gè)字

林彪的兒子要結(jié)婚,葉群在全國選美,毛主席得知說了5個(gè)字

揚(yáng)平說史
2026-03-25 21:04:04
白宮:美國總統(tǒng)特朗普將于5月訪華

白宮:美國總統(tǒng)特朗普將于5月訪華

輦轂
2026-03-26 05:18:40
賴清德“返核”讓綠營崩潰?謝寒冰酸:苗博雅、黃捷精神錯(cuò)亂了

賴清德“返核”讓綠營崩潰?謝寒冰酸:苗博雅、黃捷精神錯(cuò)亂了

海峽導(dǎo)報(bào)社
2026-03-25 08:17:03
“住宅禁放骨灰盒”新規(guī)出爐,引爭議!網(wǎng)友:可以去化房地產(chǎn)庫存

“住宅禁放骨灰盒”新規(guī)出爐,引爭議!網(wǎng)友:可以去化房地產(chǎn)庫存

火山詩話
2026-03-26 11:11:22
55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

睡前講故事
2025-12-12 13:58:11
三分命中率64.1%,斷層全聯(lián)盟第一!郭士強(qiáng)該給他一個(gè)國家隊(duì)名額

三分命中率64.1%,斷層全聯(lián)盟第一!郭士強(qiáng)該給他一個(gè)國家隊(duì)名額

弄月公子
2026-03-26 11:03:13
瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

球童無忌
2026-03-26 11:10:26
患者的住院檢查報(bào)告竟是偽造的,中山五院致歉,珠海市衛(wèi)健局:全面排查醫(yī)療機(jī)構(gòu)外送檢查報(bào)告

患者的住院檢查報(bào)告竟是偽造的,中山五院致歉,珠海市衛(wèi)健局:全面排查醫(yī)療機(jī)構(gòu)外送檢查報(bào)告

極目新聞
2026-03-25 17:53:18
吃餃子沒蘸醬油進(jìn)監(jiān)獄了,這是真的

吃餃子沒蘸醬油進(jìn)監(jiān)獄了,這是真的

深度報(bào)
2026-03-25 22:55:01
四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

律法刑道
2026-03-26 10:55:03
高三男孩喀納斯湖失蹤,母親守岸7天后直言放棄,意外竟在此時(shí)發(fā)生

高三男孩喀納斯湖失蹤,母親守岸7天后直言放棄,意外竟在此時(shí)發(fā)生

古怪奇談錄
2025-10-16 10:53:42
湖人擊敗步行者,東契奇創(chuàng)2大神跡,老詹23+9+9,一戰(zhàn)看清4個(gè)現(xiàn)實(shí)

湖人擊敗步行者,東契奇創(chuàng)2大神跡,老詹23+9+9,一戰(zhàn)看清4個(gè)現(xiàn)實(shí)

毒舌NBA
2026-03-26 09:45:41
浙江省人大常委會(huì)決定任免部分省政府組成部門主要負(fù)責(zé)人

浙江省人大常委會(huì)決定任免部分省政府組成部門主要負(fù)責(zé)人

浙江發(fā)布
2026-03-26 10:04:01
克拉拉擦邊香艷床戲包貝爾再演壞淫!這部網(wǎng)大爽得太膚淺

克拉拉擦邊香艷床戲包貝爾再演壞淫!這部網(wǎng)大爽得太膚淺

釋凡電影
2026-03-24 04:57:40
女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動(dòng)起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
張國榮前經(jīng)紀(jì)人,公開聲明

張國榮前經(jīng)紀(jì)人,公開聲明

南方都市報(bào)
2026-03-26 10:57:36
那年我當(dāng)糾察放過一個(gè)女兵,結(jié)果她說:你放我一次,我還你一輩子

那年我當(dāng)糾察放過一個(gè)女兵,結(jié)果她說:你放我一次,我還你一輩子

清風(fēng)曉
2026-03-25 07:45:42
連續(xù)三天,重慶市委書記袁家軍圍繞這件事調(diào)研

連續(xù)三天,重慶市委書記袁家軍圍繞這件事調(diào)研

中國鄉(xiāng)村振興
2026-03-26 10:02:48
到底是誰讓馬景濤穿這身衣服的?簡直是災(zāi)難現(xiàn)場!

到底是誰讓馬景濤穿這身衣服的?簡直是災(zāi)難現(xiàn)場!

西樓知趣雜談
2026-03-25 23:41:24
上海一男子每天3包煙,持續(xù)幾十年!醫(yī)生:全身沒一根血管是好的

上海一男子每天3包煙,持續(xù)幾十年!醫(yī)生:全身沒一根血管是好的

上觀新聞
2026-03-24 13:32:07
2026-03-26 12:27:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12345文章數(shù) 176424關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

36歲男子辭百萬年薪工作 在電商賣玩具半年賺了300萬

頭條要聞

36歲男子辭百萬年薪工作 在電商賣玩具半年賺了300萬

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
旅游
時(shí)尚
親子
家居

教育要聞

江蘇省2026—2028年度中小學(xué)生競賽活動(dòng)名單來了!

旅游要聞

南京珍珠河櫻花滿樹夢幻燦爛

《非窮盡列舉》,好看又絕望

親子要聞

你娃三歲前已經(jīng)當(dāng)夠大孝子了

家居要聞

傍海而居 靜觀蝴蝶海

無障礙瀏覽 進(jìn)入關(guān)懷版