国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

宇樹(shù)科技王興興在浙江上了一堂什么課

0
分享至

從“絕不做人形機(jī)器人”到“All in”,王興興首次自曝“打臉”史。

作者丨YP

編輯丨沈三又

來(lái)源丨盒飯財(cái)經(jīng)(ID:daxiongfan)

封面來(lái)源丨浙江組工

王興興的身份和標(biāo)簽越來(lái)越多,是宇樹(shù)科技創(chuàng)始人,是90后企業(yè)家,是“杭州六小龍”之一的掌門人,近期他又成了一名“老師”。


據(jù)“浙江組工”消息,4月10日晚,人工智能通識(shí)及應(yīng)用網(wǎng)絡(luò)專題培訓(xùn)第四課邀請(qǐng)宇樹(shù)科技創(chuàng)始人、CEO、CTO王興興,以“機(jī)器人產(chǎn)業(yè)的現(xiàn)狀及發(fā)展趨勢(shì)”為主題,用親身經(jīng)歷分享機(jī)器人產(chǎn)業(yè)發(fā)展案例,從不同角度講述因地制宜發(fā)展新質(zhì)生產(chǎn)力的經(jīng)驗(yàn)。

王興興并不是一個(gè)吝于分享的人,他一直活躍在知乎上,分享他關(guān)注到 Tesla 機(jī)器人 Optimus 的設(shè)計(jì)細(xì)節(jié),講述自己大一寒假如何 200 元手搓了一個(gè)雙足人型機(jī)器人,回答 2021 年春晚上的機(jī)器牛和波士頓動(dòng)力機(jī)器牛的區(qū)別,關(guān)注模型訓(xùn)練的穩(wěn)定性。

但他鮮少出現(xiàn)在講臺(tái)上、直播間,這樣系統(tǒng)地和大家分享他理解的 AI 和機(jī)器人。2025 年春節(jié)聯(lián)歡晚會(huì)上,全國(guó)人民都看到了宇樹(shù)科技的人形機(jī)器人,但大眾并不知曉,在 2023 年之前,王興興的態(tài)度一直是“絕對(duì)不做人形機(jī)器人”。究竟是什么扭轉(zhuǎn)了他的理念?這次分享中他也首次正式闡述了背后的思考。

他對(duì) AI 和機(jī)器人的理解,有著濃重的“王興興”特點(diǎn)——搭建 AI 如同造房子,邏輯和 Transformer 架構(gòu)中的多頭注意力機(jī)制底層很相似。他的思維是跳躍的,直播中,嘴巴總是跟不上腦子;也因?yàn)樽约鹤哌^(guò)學(xué)習(xí)的彎路,他在這樣的講臺(tái)上一遍遍建議小孩子也可以“玩”AI。

在演講中,王興興還用“接地氣”的語(yǔ)言和概念向浙江干部們解釋了 AI 和機(jī)器人的一些技術(shù),并分享了自己對(duì)產(chǎn)業(yè)的判斷及思考。

本文根據(jù)王興興的直播整理,核心觀點(diǎn)如下。

1. 人形機(jī)器人發(fā)展還比較早期,馬上要在工廠或家里用起來(lái),在全球范圍內(nèi)還是一件不太現(xiàn)實(shí)的事。 2. 人能做到的事情,人形機(jī)器人理論上都能做。 3. 目前AI入門基本0門檻,不需要花錢,小學(xué)生也可以玩。如果從小開(kāi)始玩?zhèn)€十年,肯定是可以玩得很好,而且也不需要有心理負(fù)擔(dān)。 4. 通俗講,深度神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,和建造一個(gè)房子很像。我們?cè)旆孔訒r(shí),用現(xiàn)成的磚頭、水泥、鋼筋,只要把它搭起來(lái)就行了。你拿它里面的一些模塊,把它拼在一起,就可以構(gòu)造一個(gè)神經(jīng)網(wǎng)絡(luò)。 5. AI體系跟邏輯推理的本質(zhì)很接近。大語(yǔ)言模型目前都是建立在 Transformer 架構(gòu)中的多頭注意力機(jī)制的基礎(chǔ)上,和邏輯推理非常接近。

以下為王興興分享實(shí)錄(有刪改,未經(jīng)本人審核):

1. “我們絕對(duì)不做人形機(jī)器人”

我是宇樹(shù)科技的創(chuàng)始人兼CEO王興興,我們公司成立于2016年,到現(xiàn)在為止差不多快9年了。早些年,我們主要做高性能的機(jī)器狗,2023年開(kāi)始做人形機(jī)器人。

2013年到2016年,當(dāng)時(shí)在上海大學(xué)讀書(shū)期間做的XDog這款小型純電驅(qū)動(dòng)的四足機(jī)器人。這款機(jī)器人開(kāi)創(chuàng)了全球低成本高性能足式機(jī)器人技術(shù)方案的先河,比BD(Boston Dynamics,美國(guó)波士頓動(dòng)力公司)早一年公布。

來(lái)源:王興興賬號(hào)知乎截圖


為什么這么說(shuō)?

這款機(jī)器人本身成本是比較低的。大概是2013年大學(xué)期間,我想到了這個(gè)技術(shù)方案,又覺(jué)得它值得商業(yè)化,所以想著要不要要輟學(xué)創(chuàng)業(yè)。我們這一代人聽(tīng)著很多輟學(xué)創(chuàng)業(yè)的故事長(zhǎng)大,當(dāng)時(shí)我也萌生了這個(gè)念頭。不過(guò)當(dāng)時(shí)也只是想想,因?yàn)槟莻€(gè)時(shí)候產(chǎn)品沒(méi)做出來(lái),也沒(méi)有什么資源和資金。


2013年到2016年期間,我把這款機(jī)器人做出來(lái)了。2015年,我?guī)е@款機(jī)器人在上海參加了一個(gè)比賽,拿了二等獎(jiǎng),賺了8萬(wàn)塊獎(jiǎng)金。因?yàn)檠邪l(fā)投入大概是1~2萬(wàn)元,所以這也算是我賺的第一桶金。


剛參加比賽時(shí),這款機(jī)器人還只做了一半,比賽過(guò)程中慢慢繼續(xù)做。到了決賽,這款機(jī)器人基本上可以下地走路了。這款機(jī)器人涉及到的電控技術(shù)、電路板、控制算法、機(jī)械結(jié)構(gòu)等技術(shù)都是我一個(gè)人做的,所以哪怕我花的時(shí)間比較多,但也收到了不錯(cuò)的結(jié)果。


2016年左右,我們?cè)趪?guó)際上全球機(jī)器人圈火了一把,有人愿意買我的機(jī)器人、有人愿意投資,后來(lái)才有了辭職出來(lái)創(chuàng)業(yè)的事。


大家也知道,過(guò)去幾年,國(guó)內(nèi)外四足機(jī)器人、人形機(jī)器人都比較火。那陣子很多用的很多都是MIT Cheetah mini(麻省理工學(xué)院研發(fā)的四足機(jī)器人)的開(kāi)源方案。這個(gè)方案是在2018年左右開(kāi)源的,開(kāi)源以后很多國(guó)內(nèi)外公司用它的方案去做機(jī)器狗、人形機(jī)器人。

實(shí)際上,開(kāi)源方案里用的電機(jī)和我用的電機(jī)是一模一樣的。2015年左右,MIT的教授發(fā)現(xiàn)我這樣一個(gè)學(xué)生也可以用這種低成本的方案做出一個(gè)性能比較好的機(jī)器狗出來(lái),所以他就重新做了一個(gè)方案出來(lái),然后又把它開(kāi)源了。

這也是為什么我們公司在過(guò)去幾年,在全球范圍內(nèi)大家對(duì)我們的認(rèn)可度相對(duì)比較高。


這是非常難得的一件事情,也是時(shí)代給我們的機(jī)會(huì)。很多領(lǐng)域,要在全球獲得真正的有知名度或認(rèn)可度是非常難的。很多品類里有公司把這部分市場(chǎng)做了,哪怕后面產(chǎn)品價(jià)格很低且性能很好,很多情況大家都不認(rèn)可,覺(jué)得你不是開(kāi)創(chuàng)性的。但唯獨(dú)我們這個(gè)領(lǐng)域,因?yàn)槲覀児镜募夹g(shù)方案、產(chǎn)品等,在全球范圍內(nèi)做的都比較早,大眾對(duì)我們的認(rèn)可度一直比較高。

2023年初,宇樹(shù)開(kāi)始做人形機(jī)器人。


我個(gè)人一直比較喜歡機(jī)器人,大概在2009年大一的時(shí)候,我就做一個(gè)小的雙足機(jī)器人,制作那個(gè)機(jī)器人大概花了我200元。但是做好了以后,我發(fā)現(xiàn)當(dāng)時(shí)的技術(shù)和效果都不太理想,所以后面很多年我都沒(méi)有再做人形機(jī)器人。


2019年、2022年有人問(wèn)我,“你們公司要不要做人形機(jī)器人”。面對(duì)這些問(wèn)題,我都是直接給出了否定的答案,說(shuō)“我們絕對(duì)不做人形機(jī)器人”。從當(dāng)時(shí)AI技術(shù)和工程技術(shù)的發(fā)展程度來(lái)看,做(人形機(jī)器人)是比較吃力不討好的,效果不太好,又比較貴。


那為什么宇樹(shù)又在2023年大力做人形機(jī)器人呢?


原因比較簡(jiǎn)單,就是在2021~2022年,整個(gè)機(jī)器人和AI技術(shù)進(jìn)步比較快。尤其海外幾家大的巨頭公司,他們對(duì)人形機(jī)器人這塊更加專注和投入了。簡(jiǎn)單來(lái)說(shuō),就是需求建立起來(lái)了,大家更加關(guān)注人形機(jī)器人,更加喜歡人形機(jī)器人,并且整個(gè)AI的技術(shù)也差不多快要到一個(gè)臨界點(diǎn)了。


我們判斷這是非常好的一個(gè)時(shí)間節(jié)點(diǎn)。


大家可能想象不到,在宇樹(shù)做人形機(jī)器人之前,2022年底就有人找我們下訂單。我們還沒(méi)有做,就有人愿意買我們的人形機(jī)器人,所以覺(jué)得值得做。原因也比較簡(jiǎn)單,沒(méi)有大家想的那么復(fù)雜。


2023年8月,我們發(fā)布了第一款人形機(jī)器人。這款機(jī)器人當(dāng)時(shí)大概花了半年多時(shí)間,效率非???。2023年下半年,我們完成了小批量量產(chǎn)。我記得大概在2023年10月,我們就把機(jī)器人的貨發(fā)到美國(guó),效率還是非常高的。


為什么我們效率會(huì)比較快呢?


我們之前做機(jī)器狗的累積,涉及到的關(guān)鍵電機(jī)、電池、動(dòng)力系統(tǒng)、控制算法都是現(xiàn)成的。


可以看到,在國(guó)內(nèi)我們公司做人形機(jī)器人不是最早的,甚至相對(duì)晚一些,但是目前來(lái)看我們的出貨量、性能在全球范圍內(nèi)都有很強(qiáng)的競(jìng)爭(zhēng)性。因?yàn)樵谧鰴C(jī)器人這件事上,我們從硬件、軟件、生產(chǎn)等方面都有深厚的累積。


當(dāng)時(shí)發(fā)布的時(shí)候,這款H1機(jī)器人還刷新了幾個(gè)指標(biāo)。去年3月,H1就實(shí)現(xiàn)了原地的空翻,是世界首個(gè)可原地空翻全尺寸電驅(qū)人形機(jī)器人。去年5月我們發(fā)布了第二款人形機(jī)器人G1,它外觀好看很多,而且它的關(guān)節(jié)自由度、關(guān)節(jié)舒展、傳感器都是非常領(lǐng)先,同時(shí)相對(duì)價(jià)格也比較低。

2. 為什么要做人形機(jī)器人

目前,人形機(jī)器人發(fā)展還是比較早期,馬上要在工廠或者家里用起來(lái),在全球范圍內(nèi)都還是一件不太現(xiàn)實(shí)的事。但像這款機(jī)器人,我們目前有一部分市場(chǎng)已經(jīng)開(kāi)始做起來(lái)了,像一些科研教育、AI公司和一些娛樂(lè)活動(dòng)的展示。

到現(xiàn)在為止,大家在網(wǎng)上還是爭(zhēng)論為什么要做人形機(jī)器人,有的人贊同,有的人反對(duì),但從全球頭部公司創(chuàng)始人到政府都很關(guān)注這一塊。這個(gè)趨勢(shì)是不可阻擋的。

(1)結(jié)構(gòu)最簡(jiǎn)單的通用機(jī)器人

早些年大家做的AI,都是單功能的AI,比如識(shí)別一個(gè)數(shù)字,識(shí)別一個(gè)文字,識(shí)別一個(gè)音頻。但到現(xiàn)在為止,大家希望一個(gè)AI模型能把所有的功能都集合在一起,它可以自由的調(diào)度,能做任何事情,這是大家正在推進(jìn)的通用AI。

機(jī)器人也一樣,就是配合通用AI我們需要一個(gè)通用機(jī)器人。因?yàn)閷S眯偷臋C(jī)器我們已經(jīng)做了很多了,比如工廠里的、家庭洗衣做飯的,現(xiàn)在我們需要通用型的機(jī)器人配合通用AI。大家回頭發(fā)現(xiàn)人形機(jī)器人反而是最簡(jiǎn)單的通用機(jī)器人。

可能很多人覺(jué)得人形機(jī)器人很復(fù)雜。實(shí)際上,人形機(jī)器人一點(diǎn)都不復(fù)雜。為什么呢?

人形機(jī)器人,你可以認(rèn)為就是把幾個(gè)關(guān)節(jié)拿幾個(gè)連桿組合在一起,構(gòu)成一個(gè)人形機(jī)器人,沒(méi)有比人形機(jī)器人更經(jīng)典的通用機(jī)器人了。不然的話,如果你要做成一只蜘蛛、做成其他的形態(tài),難度其實(shí)要比做人形機(jī)器人還要大。甚至,如果未來(lái)通用AI很成熟的時(shí)候,沒(méi)準(zhǔn)哪一天,比如說(shuō)一個(gè)小朋友在垃圾堆里撿幾個(gè)電機(jī)、撿幾個(gè)連桿裝在一起,隨便下個(gè)程序就能跑了,一個(gè)機(jī)器人成型。


(2)人更喜歡長(zhǎng)得像人的機(jī)器人,更有情緒價(jià)值


因?yàn)樗L(zhǎng)得更像人,所以它還具備除了機(jī)器以外的附加價(jià)值。比如表演、服務(wù)、還有去到一些人能去的一些地方。如表演這樣的功能,其實(shí)就包含了情緒價(jià)值。

(3)方便數(shù)據(jù)采集

現(xiàn)在的AI都是靠數(shù)據(jù)采集來(lái)驅(qū)動(dòng)的,數(shù)據(jù)質(zhì)量好一點(diǎn),AI效果就好一點(diǎn)。目前數(shù)據(jù)采集只能靠人,這種時(shí)候肯定是長(zhǎng)得像人的東西去采集更好一點(diǎn)。如果你要映射到一只蜘蛛、一只豬或者別的形態(tài)的機(jī)器人上,其實(shí)就很難映射,把這個(gè)數(shù)據(jù)給這種機(jī)器用也很難用。如果這個(gè)機(jī)器人長(zhǎng)非常像人,那么最后采集數(shù)據(jù)和訓(xùn)練數(shù)據(jù)就會(huì)變得非常容易。

(4)可以處理需要人處理的各種事

目前自然環(huán)境中,人的越障能力都是非常好。比如說(shuō)人可以通過(guò)一些很狹窄的或很崎嶇的地方,別的一些形態(tài)就不一定。人作為靈長(zhǎng)類的動(dòng)物,它的通過(guò)能力、運(yùn)動(dòng)能力都算是卓越的。所以這也是為什么做成人形機(jī)器人相對(duì)比較好。舉個(gè)例子,如果你現(xiàn)在把一個(gè)機(jī)器人做成車或者做成別的樣子,你讓一輛車翻過(guò)一個(gè)墻,怎么翻呢,對(duì)吧。


人能做的事情,人形機(jī)器人理論上都能做。以上四點(diǎn)是我個(gè)人想到相對(duì)比較直接的原因。

3.國(guó)內(nèi)外人形機(jī)器人的產(chǎn)業(yè)現(xiàn)狀

過(guò)去一兩年,國(guó)家對(duì)機(jī)器人行業(yè)非常重視和支持。今年年初開(kāi)始,尤其是今年2月,國(guó)內(nèi)人形機(jī)器人包括整個(gè)機(jī)器人行業(yè),都是熱火朝天。

簡(jiǎn)單來(lái)說(shuō),不單單是我們公司,就是所有我知道的(公司),過(guò)去哪怕可能都已經(jīng)虧損很嚴(yán)重、快要撐不下去的機(jī)器人公司,今年訂單業(yè)務(wù)都非常不錯(cuò),相關(guān)行業(yè)的表現(xiàn)也很不錯(cuò)。很多傳統(tǒng)行業(yè)的老板或傳統(tǒng)行業(yè)的人都開(kāi)始想,我能不能在工廠里或商店里使用機(jī)器人?需求和消費(fèi)情緒都開(kāi)始被點(diǎn)燃了。

當(dāng)然可能里面也有一些盲目的成分。需求端被點(diǎn)燃肯定是一個(gè)好事,但大家也要保持一些克制,因?yàn)槟壳按蠹蚁胍男枨?,可能有些是機(jī)器人還辦不到的,可能還有點(diǎn)偏差。

過(guò)去幾年,海外也是一直非常熱,包括特斯拉、英偉達(dá)和其他頭部科技公司對(duì)人形機(jī)器人都很關(guān)注。

比如OpenAI,去年開(kāi)始他就是開(kāi)始想做機(jī)器人AI,今年年初,他們自己在招做機(jī)器人硬件的人。但是確實(shí)目前整個(gè)機(jī)器人AI還是沒(méi)有到達(dá)突破的臨界點(diǎn)。目前每個(gè)月機(jī)器人AI都在進(jìn)步,但在還沒(méi)有達(dá)到真正大規(guī)模在工業(yè)還是家庭應(yīng)用的臨界點(diǎn)。

現(xiàn)在類似什么情況呢?

有點(diǎn)像ChatGPT出來(lái)前一兩年,大家已經(jīng)發(fā)現(xiàn)了這種技術(shù)方向,正在做的過(guò)程中,但還沒(méi)有做出來(lái)。對(duì)于普通消費(fèi)者來(lái)說(shuō),可能如果你真的要家用,不是當(dāng)下一兩年就能用的。

目前機(jī)器人AI行業(yè)發(fā)展如何呢?

比如說(shuō)你想在工廠、在農(nóng)業(yè)場(chǎng)景,或者如礦業(yè)這樣這樣比較辛苦或危險(xiǎn)的場(chǎng)景使用機(jī)器人,現(xiàn)在最大的問(wèn)題就是機(jī)器人AI還沒(méi)有達(dá)到突破的臨界點(diǎn),反而硬件是個(gè)相對(duì)小的問(wèn)題。當(dāng)然,硬件目前做得肯定還不夠完善,但它不是一個(gè)限制性因素。某種程度上,硬件方面的本體已經(jīng)夠用了或者能用了,但未來(lái)幾年需要做得更好。

但這些不是本質(zhì)上的問(wèn)題,本質(zhì)的問(wèn)題還是機(jī)器人AI模型做得不太夠,而且機(jī)器人AI模型和目前的大語(yǔ)言模型還不是同一種東西。我們可以簡(jiǎn)單理解為,機(jī)器人的AI模型更多偏向干活。

4. AI模型的基本邏輯規(guī)則

下面我簡(jiǎn)單介紹一下AI,方便大家了解。另外,如果家里有小朋友,我非常鼓勵(lì)小學(xué)或者初中的學(xué)生都可以學(xué)一下AI相關(guān)的內(nèi)容。

首先提出一個(gè)點(diǎn),就是邏輯推理的本質(zhì)。

這也是我高中時(shí)思考的一個(gè)點(diǎn)。大家在討論邏輯的時(shí)候,比如說(shuō)這個(gè)人邏輯思維比較好,到底什么是邏輯?總結(jié)起來(lái)也是比較簡(jiǎn)單的,其實(shí)就是通過(guò)一些概念和規(guī)則連接在一起。比如有A、B、C、D這幾個(gè)概念和相應(yīng)的很多規(guī)則,那A跟B有什么關(guān)系?。緽跟C有什么關(guān)系?相互可以推導(dǎo)。

所以很多情況下,比如要學(xué)一個(gè)新的知識(shí)點(diǎn),其實(shí)也比較簡(jiǎn)單。比如說(shuō)我要學(xué)新的概念C這個(gè)知識(shí)點(diǎn),我只要用我自己比較熟悉的概念B和D的知識(shí)點(diǎn)把這個(gè)規(guī)則給推導(dǎo)出來(lái)就行了。

這樣你對(duì)整個(gè)新知識(shí)點(diǎn)的記憶和理解是比較深的,而且某種程度上你學(xué)東西可以越來(lái)越快。再舉個(gè)例子,如果你學(xué)了某個(gè)知識(shí)點(diǎn),但過(guò)了五年到十年后忘記了,你還可以把概念B和概念C重新推導(dǎo)出來(lái)。

我在介紹AI前,為什么要說(shuō)這個(gè)?原因比較簡(jiǎn)單,目前的整個(gè)AI體系跟這張圖很接近。大語(yǔ)言模型目前都是建立Transformer架構(gòu)中的多頭注意力機(jī)制的基礎(chǔ)上,和這張圖的非常接近。

來(lái)源:直播截圖


另外一點(diǎn),目前的AI都采用的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。就是有一層層的神經(jīng)網(wǎng)絡(luò),然后里面有一個(gè)個(gè)神經(jīng)元,就是一神經(jīng)元、二神經(jīng)元、三神經(jīng)元,這是作為一層。再有第二層又是一個(gè)神經(jīng)元,一個(gè)神經(jīng)元,然后有第三層。里面每一層之間有一根線連接在一起,這個(gè)線其實(shí)也比較簡(jiǎn)單,就是全連接。這個(gè)模型目前也是全世界用的最多的、最基礎(chǔ)的模型,叫全連接層。

什么叫全連接層?就是每一根線出來(lái)把所有的線都連一遍,就是一把一、二、三全連一遍,二把一、二、三全連一遍,這是目前最常用的模型。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(1),來(lái)源:直播截圖


簡(jiǎn)單理解,就是一個(gè)圓圈里面就是一個(gè)數(shù)學(xué)公式。最簡(jiǎn)單的一個(gè)神經(jīng)元的構(gòu)造就是,輸入和輸出。比如,輸入a、b、c,輸出有y,然后每次計(jì)算時(shí),就是a×Wa、b×Wb、c×Wc,乘一下,然后再加一個(gè)激活函數(shù)就輸出了。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(2),來(lái)源:直播截圖


打個(gè)比方,大家在玩AI的時(shí)候,輸入一段文字,比如今天星期幾?輸入A、B、C,然后他算一下就把星期幾給輸出了。然后里面就是每一個(gè)數(shù)學(xué)公式。

從某種程度上,你可以換成任何函數(shù),可以把這個(gè)函數(shù)換成復(fù)雜一點(diǎn)。所以你如果要發(fā)表一篇比較簡(jiǎn)單的AI論文,要怎么做呢?把這個(gè)函數(shù)換一下,然后做一些實(shí)驗(yàn),測(cè)試哪個(gè)函數(shù)效果比較好,接著你就可以發(fā)表論文了。

目前最常用的神經(jīng)網(wǎng)絡(luò)就是這種,沒(méi)有大家想的那么難,只不過(guò)實(shí)際應(yīng)用的時(shí)候還有點(diǎn)麻煩。

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心原理(3),來(lái)源:直播截圖


這里有兩個(gè)概念,前向傳播和反向傳播。剛才提到的,從輸入A、B、C算一遍到輸出,就是一個(gè)前向傳播的過(guò)程。簡(jiǎn)單來(lái)說(shuō),就是做了個(gè)數(shù)學(xué)函數(shù),就是y=f(x)。

前向傳播,就是訓(xùn)練好后,我在調(diào)用它,讓它干活的時(shí)候再這么做。那我訓(xùn)練的時(shí)候怎么訓(xùn)練呢?這里就是反向傳播。反向傳播其實(shí)就是求導(dǎo)數(shù),就是y'=f'(x),這個(gè)就是自動(dòng)微分的過(guò)程,就是做了個(gè)梯度下降。


怎么理解?比如我前面有座山,我要去爬山,那有什么比較好的路線可以上山,把它找來(lái)。比較簡(jiǎn)單的理解,就是把這個(gè)山的梯度(斜率)給求出來(lái)。因?yàn)槲乙吹竭@個(gè)山的哪個(gè)地方比較陡、哪個(gè)地方比較緩,比較陡和比較緩的地方先找出來(lái)以后,就可以發(fā)現(xiàn)這條路可以從什么地方上去和下來(lái)。


反向傳播的求導(dǎo)就做了這件事情,就是我們有好多山,通過(guò)反向傳播求導(dǎo)以后,我就可以把這些路徑給查出來(lái),就是怎么從y到x的路徑搜索出來(lái)。


大家可能覺(jué)得自動(dòng)微分比較復(fù)雜,實(shí)際上你不需要做,因?yàn)橛泄ぞ吣軒湍阕龊谩_@也是我剛才提到的,鼓勵(lì)小學(xué)生都去玩一下AI。很多情況下,你不需要裝軟件,打開(kāi)一個(gè)網(wǎng)頁(yè)就可以直接編程,很多的工具都比較現(xiàn)成。

5. 小學(xué)生也能建AI模型

目前比較常用的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)核心工具PyTorch。這個(gè)工具是目前全世界用的最多的AI工具,也是一個(gè)開(kāi)源工具。

PyTorch這個(gè)工具的功能有哪些?

第一,批量數(shù)據(jù)的處理和加載。目前的AI都需要用海量采集來(lái)的數(shù)據(jù)訓(xùn)練,這個(gè)時(shí)候數(shù)據(jù)的管理和整理都是非常麻煩的一件事情,而這個(gè)工具具有數(shù)據(jù)的管理和整理功能。

第二,深度神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建。上面我們也了解了一些神經(jīng)網(wǎng)絡(luò)最基本的原理,那我們要如何搭建經(jīng)網(wǎng)絡(luò)?其實(shí)就和我們搭積木一樣,而這個(gè)搭載過(guò)程中這個(gè)工具已經(jīng)構(gòu)造好了。

通俗易懂一點(diǎn),你要構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò),這和建造一個(gè)房子很像。目前我們?cè)旆孔訒r(shí),就有很多磚頭、水泥、鋼筋,這些已經(jīng)有現(xiàn)成的了,你只要把它搭起來(lái)就行了。你拿它里面的一些模塊,把它拼在一起,你就可以自己構(gòu)造一個(gè)神經(jīng)網(wǎng)絡(luò)了。

第三,自動(dòng)訓(xùn)練。神經(jīng)網(wǎng)絡(luò)構(gòu)造好了后,剩下的比如自動(dòng)微分、自動(dòng)訓(xùn)練,你只要“吊”一兩行程序,整個(gè)過(guò)程全自動(dòng)幫你做好了。構(gòu)建神經(jīng)網(wǎng)絡(luò)的時(shí)候你會(huì)發(fā)現(xiàn),這就像搭積木,搭著搭著,可能就倒了。所以在做一些實(shí)驗(yàn)時(shí),如果發(fā)現(xiàn)這個(gè)“積木”搭出來(lái)效果不錯(cuò),那你就可以保留下來(lái)。

來(lái)源:直播截圖


大家如果有興趣,或者家里的小朋友,我這里推薦幾個(gè)工具。這里提供幾個(gè)國(guó)內(nèi)外的平臺(tái),你只要打開(kāi)網(wǎng)站注冊(cè)好就能用了,而且它的GPU少量使用是免費(fèi)的。你只要打開(kāi)網(wǎng)站,輸入幾行代碼就可以做AI訓(xùn)練了,包括有些數(shù)據(jù)工具都是現(xiàn)成的,這也是我自己用的比較多的工具。

目前整個(gè)AI的入門門檻是比較低的,就是基本0門檻,不需要花錢,小學(xué)生也可以玩。如果從小開(kāi)始玩,玩?zhèn)€十年,那肯定是可以玩得很好了,而且也不需要有心理負(fù)擔(dān)。打個(gè)比方,如果現(xiàn)在市面上的一些AI模型是“摩天大樓”的話,那我可以先造個(gè)小房子出來(lái),這是完全沒(méi)問(wèn)題的。


那我現(xiàn)在如果真的要造一個(gè)“摩天大樓”出來(lái),要怎么做呢?我肯定要有圖紙,對(duì)吧?目前大家已驗(yàn)證用得比較多的“圖紙”,目前全球最前沿AI模型架構(gòu),大家比較公認(rèn)的模型的搭建方式,主要有以下三種。


第一,擴(kuò)散模型。這種目前主要用來(lái)干嘛呢?主要是用來(lái)畫(huà)畫(huà)的,生成一張比較漂亮的圖片,生成一個(gè)視頻,用得最多的是擴(kuò)散模型。


擴(kuò)散模型這個(gè)名字也比較簡(jiǎn)單、直觀。什么叫擴(kuò)散?如果我有一杯清水,我在這個(gè)水杯里點(diǎn)了一滴墨水進(jìn)去,這個(gè)墨水就會(huì)擴(kuò)散。兩個(gè)是同一個(gè)意思,就是我把一個(gè)規(guī)則的物體擴(kuò)散成一個(gè)有很多噪聲或者很多噪聲的東西,然后重新收斂到一個(gè)比較規(guī)則的東西里去,這就是一個(gè)擴(kuò)散的過(guò)程。再打個(gè)比方,比如一張照片本身是很清晰的,然后把它變得很模糊,接著把這個(gè)過(guò)程再映像一下,就變成AI的一個(gè)生成過(guò)程。


但目前來(lái)看,擴(kuò)散模型我個(gè)人感覺(jué)還是有一定的局限性,所以目前主要還是畫(huà)畫(huà)用的比較多。


第二,GPT等為代表的LLM大語(yǔ)言模型。這個(gè)模型更為主流一些,LLM大語(yǔ)言模型目前基本以Transformer架構(gòu)構(gòu)建的,就是多頭注意力機(jī)制。我后面會(huì)詳細(xì)介紹下。


第三,強(qiáng)化學(xué)習(xí),PPO、GRPO等。目前,強(qiáng)化學(xué)習(xí)也是最主流的方向之一,像我們機(jī)器人用的都是強(qiáng)化學(xué)習(xí)。比如DeepSeek,目前大語(yǔ)言模型也在做強(qiáng)化學(xué)習(xí)。


為什么大語(yǔ)言模型需要強(qiáng)化學(xué)習(xí)?原因也比較簡(jiǎn)單,因?yàn)閭鹘y(tǒng)的語(yǔ)言模型的架構(gòu)就是,有多好的訓(xùn)練數(shù)據(jù)集就有多好的結(jié)果。如果我的數(shù)據(jù)集不好,那結(jié)果也比較糟糕;我的訓(xùn)練數(shù)據(jù)集的質(zhì)量很好,那我的訓(xùn)練效果也很好。

但是,這是有極限的,輸出的結(jié)果不可能比你訓(xùn)練的數(shù)據(jù)質(zhì)量還好。那我怎么才能進(jìn)一步提升AI模型的輸出能力呢?就是必須得用強(qiáng)化學(xué)習(xí)。今年年初爆火的DeepSeek,最大的點(diǎn)就是很好得把強(qiáng)化學(xué)習(xí)用出來(lái)了。他們自己開(kāi)發(fā)了一個(gè)強(qiáng)化學(xué)習(xí)算法,可以把真正的,比如說(shuō)一些數(shù)學(xué)推理做得更好一點(diǎn)。


個(gè)人感覺(jué),未來(lái)的幾年強(qiáng)化學(xué)習(xí)會(huì)成為整個(gè)AI的最主流方向。

6. GPT LLM大語(yǔ)言模型、強(qiáng)化學(xué)習(xí)與VLA模型

(1)GPT LLM大語(yǔ)言模型


目前,語(yǔ)言模型的架構(gòu)相對(duì)比較直觀和精簡(jiǎn)。在做的各位,包括我本身也不是搞語(yǔ)言模型,有些太深的點(diǎn)我們也不用太多了解,大概了解一些基礎(chǔ)的點(diǎn)就行了。

來(lái)源:直播截圖

目前的語(yǔ)言模型,簡(jiǎn)單來(lái)說(shuō)就是用一個(gè)編碼層和解碼層(構(gòu)成的)。編碼層,比如我打開(kāi)加一個(gè)word文檔,里面每一個(gè)漢字或一個(gè)漢字拼音都是用大概兩個(gè)字節(jié)來(lái)編碼的,兩個(gè)字節(jié)我就可以編碼一個(gè)漢字。但是做AI的時(shí)候,肯定是行不通的。那目前大家做AI的時(shí)候怎么做呢?先要把一個(gè)編碼、一個(gè)漢字或一個(gè)字母變成一個(gè)向量,就是我要把它重新編碼一下。比如說(shuō)“今天晚上有點(diǎn)熱”這幾個(gè)漢字,每個(gè)漢字編碼成一個(gè)向量。后面我再做一下多頭注意力機(jī)制。


多頭注意力機(jī)制是干嘛的?就是算一下向量的相關(guān)性。


某種意義上,注意力機(jī)制就是求一下相關(guān)性。相關(guān)性求好了以后再把它輸出,然后再重新解碼一下,就變成輸出了整個(gè)過(guò)程也相對(duì)比較直觀。我每一個(gè)概念或規(guī)則其實(shí)有一個(gè)向量,每個(gè)概念再求一下每個(gè)向量的相關(guān)性,就可以推導(dǎo)出每個(gè)向量之間的邏輯推理。


但是真正要做一個(gè)比較復(fù)雜的模型出來(lái),肯定會(huì)涉及到很多公式上的問(wèn)題。因?yàn)橐煲粋€(gè)小的房子出來(lái)和建一個(gè)摩天大樓,本身還有很多技術(shù)上和工程上的問(wèn)題要解決,工作量也是非常大的。


(2)強(qiáng)化學(xué)習(xí)(用策略模型和獎(jiǎng)勵(lì)函數(shù)代替模型反向傳播誤差)


強(qiáng)化學(xué)習(xí)并不是一個(gè)單純的算法,某種程度上,強(qiáng)化學(xué)習(xí)是一個(gè)思維的、概念的問(wèn)題。


說(shuō)得簡(jiǎn)單一點(diǎn),強(qiáng)化學(xué)習(xí)就是試錯(cuò),比如我往前走一步可能摔倒了,我遇到了什么狀況,然后我把每次試錯(cuò)的最好結(jié)果給保留下來(lái),把不好的結(jié)果給丟了就行。比如在仿真環(huán)境里試錯(cuò)時(shí),試一百萬(wàn)次、一億次,我總是有一些好的結(jié)果的,對(duì)吧?那我就把這些好的結(jié)構(gòu)都給保留下來(lái)。


(3)當(dāng)下潛力最大的具身智能模型VLA模型?


目前整個(gè)的具身智能模型比較主流的模型:VLA模型。某種程度上,VLA模型就是在大語(yǔ)言模型的基礎(chǔ)上加了一些東西。比如說(shuō)?Llama的模型,傳統(tǒng)的語(yǔ)言模型都是用文字,輸入是文字,輸出也是文字,它的整個(gè)架構(gòu)通用性很不錯(cuò)。

來(lái)源:直播截圖


那它既然可以輸入文字,那我就可以把文字給編碼,把一個(gè)漢字編碼成一個(gè)向量,那我為什么不能把圖片和圖像也編碼一下呢?


這個(gè)思路也很簡(jiǎn)單,就是我在輸入端加一個(gè)圖片或一些視頻編碼器,我加在頭端,然后和文字的向量放在一起,做一下交叉注意力就可以了。


VLA,V就是視覺(jué)模型,L就是語(yǔ)言模型,A就是執(zhí)行器模型。什么是執(zhí)行器的模型?一般的語(yǔ)言模型輸出的是文字,在輸出的文字前,再加一個(gè)神經(jīng)網(wǎng)絡(luò),比如最簡(jiǎn)單的是說(shuō),我把全鏈接層加上去,加上去以后就可以輸出一些機(jī)器的控制指令,比如關(guān)節(jié)的運(yùn)動(dòng)指令、執(zhí)行指令。VLA的架構(gòu)也相對(duì)比較簡(jiǎn)單直觀。

7. 未來(lái),真正的AGI需要實(shí)物機(jī)器人

現(xiàn)在智能機(jī)器人技術(shù)最重要的是什么?


第一就是,統(tǒng)一,端到端智能機(jī)器人大模型。就是需要一個(gè)更好的機(jī)器人模型去做,可能就是剛才提到的VLA模型就可以了,但是VLA模型個(gè)人感覺(jué)還是有很多的局限性。


第二,更低成本、更高壽命的硬件,及超大批量的制造。簡(jiǎn)單來(lái)說(shuō),就是要生產(chǎn)很多人形機(jī)器人,或者很多別的各種各樣的機(jī)器人出來(lái),就要要成本低,且性能也要很好。

第三,低成本、大規(guī)模算力。如果機(jī)器人的數(shù)量達(dá)到一定規(guī)模,比如當(dāng)幾百萬(wàn)或者上億都需要配置算力時(shí),那對(duì)算力低成本要求是非常高的。

現(xiàn)在很多情況下,大家在強(qiáng)調(diào)AI的時(shí)候,脫離了物理機(jī)器人去強(qiáng)調(diào)AI。我在這里想提出的,也是我去年一直提出的一個(gè)點(diǎn),就是物理機(jī)器人對(duì)AI也是非常重要的。這是我個(gè)人的判斷,可能是錯(cuò)誤的,但這是我非常相信的一個(gè)點(diǎn)。對(duì)于真正的AGI(通用人工智能)、真正的通用機(jī)器人來(lái)說(shuō),物理機(jī)器人非常非常重要。

為什么“身體”非常重要?目前很多的AI模型,它沒(méi)有身體,它和真實(shí)世界是脫離交互的,它不能很好地去感知這個(gè)世界。它不能感知這個(gè)空間,感知桌子的碰撞等感受。

舉個(gè)例子,為什么夢(mèng)里跑不快?比如我小時(shí)候睡覺(jué)做噩夢(mèng)的時(shí)候,有怪物追我,我在前面跑,但是我一直感覺(jué)很吃力地在跑,但跑不快。我在大學(xué)的時(shí)候想過(guò),原因比較簡(jiǎn)單,就是人在睡覺(jué)的時(shí)候,你的大腦和身體斷開(kāi)了連接。

清醒狀況下,我們跑步時(shí),每次跑到地面都是有反饋,所以我知道我的腳踩到地面上了。但做夢(mèng)時(shí),因?yàn)樯眢w和大腦是斷開(kāi)連接的,我不知道自己踩到地面上去了,會(huì)覺(jué)得我的腳是踩到空氣里面,所以我跑不快。

為什么要說(shuō)這個(gè)事情?目前的語(yǔ)言模型是有幻覺(jué)的,它說(shuō)出的話有時(shí)候錯(cuò)了自己也不知道,或者編一些亂七八糟的內(nèi)容出來(lái)。這個(gè)情況很像做夢(mèng),說(shuō)夢(mèng)話。目前很多情況下,語(yǔ)言模型就有點(diǎn)像說(shuō)夢(mèng)話,像在做夢(mèng),迷失在虛擬環(huán)境里面,和真實(shí)世界是脫離交互的。

AGI需要參與到和整個(gè)世界的物理交互,需要參與到人類的大眾生活中,來(lái)體驗(yàn)和理解人類的情緒和性格等等。

目前AI的發(fā)展速度非???,但是發(fā)展速度還是階梯性的。最后希望大家相信、相信、盡可能相信AI。

歡迎在評(píng)論區(qū)留言~如需開(kāi)白請(qǐng)加微信:YPYP01234567

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
550名間諜落網(wǎng),海軍司令遭斬首:伊朗的篩子比我們想的要深

550名間諜落網(wǎng),海軍司令遭斬首:伊朗的篩子比我們想的要深

映象觀察
2026-03-27 10:01:23
小鵬汽車宣布更名

小鵬汽車宣布更名

大象新聞
2026-03-27 19:45:02
羅技:“我一降價(jià),你還不是像狗一樣跑過(guò)來(lái)”

羅技:“我一降價(jià),你還不是像狗一樣跑過(guò)來(lái)”

電腦吧評(píng)測(cè)室
2026-03-26 22:05:58
庫(kù)拉索怎么進(jìn)世界杯的?國(guó)足并不菜!張玉寧8.5分最高 韋世豪第二

庫(kù)拉索怎么進(jìn)世界杯的?國(guó)足并不菜!張玉寧8.5分最高 韋世豪第二

刀鋒體育
2026-03-27 16:37:11
張雪峰追悼會(huì)定于本周六,喪事從簡(jiǎn)不搞排場(chǎng),11歲女兒成全家心病

張雪峰追悼會(huì)定于本周六,喪事從簡(jiǎn)不搞排場(chǎng),11歲女兒成全家心病

未曾青梅
2026-03-26 22:48:49
與用戶共創(chuàng)價(jià)值!新款凡爾賽C5 X 11.37萬(wàn)起,給出了答案

與用戶共創(chuàng)價(jià)值!新款凡爾賽C5 X 11.37萬(wàn)起,給出了答案

買車大師
2026-03-27 16:04:13
法國(guó)發(fā)布重磅提醒?美軍若強(qiáng)行插手臺(tái)海,法國(guó)軍事分析做出推演

法國(guó)發(fā)布重磅提醒?美軍若強(qiáng)行插手臺(tái)海,法國(guó)軍事分析做出推演

安安說(shuō)
2026-03-27 12:18:51
中美俄石油儲(chǔ)量對(duì)比:俄800億桶,美國(guó)超700億桶,中國(guó)有多少?

中美俄石油儲(chǔ)量對(duì)比:俄800億桶,美國(guó)超700億桶,中國(guó)有多少?

福建平子
2026-03-27 11:27:57
“黃金大買家”,開(kāi)始拋售黃金

“黃金大買家”,開(kāi)始拋售黃金

第一財(cái)經(jīng)資訊
2026-03-27 13:03:09
重磅!證監(jiān)會(huì)調(diào)整股市安排,理性應(yīng)對(duì)本周變局

重磅!證監(jiān)會(huì)調(diào)整股市安排,理性應(yīng)對(duì)本周變局

慧眼看世界哈哈
2026-03-27 13:28:50
張雪峰女兒張姩菡發(fā)文緬懷爸爸,引網(wǎng)友淚目

張雪峰女兒張姩菡發(fā)文緬懷爸爸,引網(wǎng)友淚目

環(huán)球網(wǎng)資訊
2026-03-27 10:41:04
被美國(guó)關(guān)了兩個(gè)多月,馬杜羅再次上庭的時(shí)候,簡(jiǎn)直就像變了一個(gè)人

被美國(guó)關(guān)了兩個(gè)多月,馬杜羅再次上庭的時(shí)候,簡(jiǎn)直就像變了一個(gè)人

牛鍋巴小釩
2026-03-27 17:21:04
張雪峰女兒親自辟謠!父母恩愛(ài)沒(méi)離婚,回應(yīng)三個(gè)問(wèn)題,口才很意外

張雪峰女兒親自辟謠!父母恩愛(ài)沒(méi)離婚,回應(yīng)三個(gè)問(wèn)題,口才很意外

離離言幾許
2026-03-27 14:42:23
隨著喀麥隆0-1,F(xiàn)IFA系列賽澳洲站最新積分榜出爐:中國(guó)男足第一

隨著喀麥隆0-1,F(xiàn)IFA系列賽澳洲站最新積分榜出爐:中國(guó)男足第一

側(cè)身凌空斬
2026-03-27 19:03:34
全線跳水!霍爾木茲,大消息!

全線跳水!霍爾木茲,大消息!

中國(guó)基金報(bào)
2026-03-27 19:12:20
德國(guó)外交部長(zhǎng):美國(guó)和伊朗在間接接觸,而且有直接會(huì)晤的考慮,可能很快在巴基斯坦發(fā)生

德國(guó)外交部長(zhǎng):美國(guó)和伊朗在間接接觸,而且有直接會(huì)晤的考慮,可能很快在巴基斯坦發(fā)生

瀟湘晨報(bào)
2026-03-27 20:14:03
打虎!郭永航被查

打虎!郭永航被查

新京報(bào)政事兒
2026-03-27 18:33:38
周口一油菜花田打卡地被推土機(jī)鏟平,當(dāng)?shù)兀合挡疬w征收用地,居民不能私自種植

周口一油菜花田打卡地被推土機(jī)鏟平,當(dāng)?shù)兀合挡疬w征收用地,居民不能私自種植

極目新聞
2026-03-27 14:54:50
張本智和回?fù)糁袊?guó)網(wǎng)友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

張本智和回?fù)糁袊?guó)網(wǎng)友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

乒乓網(wǎng)國(guó)球匯
2026-03-27 00:03:40
重磅!張雪峰家人緊急發(fā)聲

重磅!張雪峰家人緊急發(fā)聲

品牌頭版
2026-03-27 19:01:17
2026-03-27 21:36:50
盒飯財(cái)經(jīng) incentive-icons
盒飯財(cái)經(jīng)
約會(huì)最好的商業(yè)思想
1308文章數(shù) 16872關(guān)注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價(jià)

頭條要聞

美為應(yīng)對(duì)中國(guó)首次部署"無(wú)人艦隊(duì)" 不料在實(shí)戰(zhàn)區(qū)掉鏈子

頭條要聞

美為應(yīng)對(duì)中國(guó)首次部署"無(wú)人艦隊(duì)" 不料在實(shí)戰(zhàn)區(qū)掉鏈子

體育要聞

邵佳一:足球就像一場(chǎng)馬拉松

娛樂(lè)要聞

范瑋琪加盟,官宣《浪姐7》遭全網(wǎng)抵制

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

汽車要聞

與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
房產(chǎn)
游戲
公開(kāi)課

數(shù)碼要聞

哈趣Ace1:百元價(jià)位千元體驗(yàn),IP67防護(hù)+杜比級(jí)聲場(chǎng)的全能耳夾耳機(jī)

藝術(shù)要聞

張大千:形成于未畫(huà)之先,神留于既畫(huà)之后

房產(chǎn)要聞

6.8萬(wàn)方!天河員村再征地,金融城西區(qū)開(kāi)發(fā)全面提速

玩家眾評(píng)“完美”游戲 《大鏢客2》遙遙領(lǐng)先

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版