国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)AI走進(jìn)Second Half:真正的問題、價(jià)值與生態(tài)是什么?|甲子光年

0
分享至



重新定義問題、評(píng)估真實(shí)價(jià)值、重構(gòu)產(chǎn)業(yè)生態(tài)。

今年4月,時(shí)任OpenAI研究員姚順雨寫了一篇博客《The Second Half 下半場(chǎng)》,他認(rèn)為:“AI的下半場(chǎng)將把重點(diǎn)從解決問題轉(zhuǎn)向定義問題。在這個(gè)新時(shí)代,評(píng)估將比訓(xùn)練更重要。”

12月17日,騰訊升級(jí)大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,全面強(qiáng)化其大模型的研發(fā)體系與核心能力。姚順雨出任“CEO/總裁辦公室”首席AI科學(xué)家,同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人。

一場(chǎng)新的競賽開始了。

這一年,AI技術(shù)正從“規(guī)模競賽”轉(zhuǎn)向“價(jià)值定義”。AI下半場(chǎng)的關(guān)鍵不在于模型有多大,而在于能否通過評(píng)估、Agent與應(yīng)用場(chǎng)景構(gòu)建,創(chuàng)造新問題、新工作流和新產(chǎn)業(yè)生態(tài)。

AI似乎已經(jīng)走進(jìn)了下半場(chǎng),但是關(guān)于下半場(chǎng)本身還有很多問題等待厘清。

在12月3日舉辦的“轟然成勢(shì),萬象歸一”2025甲子引力年終盛典的巔峰對(duì)話環(huán)節(jié),甲子光年創(chuàng)始人&CEO張一甲與面壁智能聯(lián)合創(chuàng)始人&CEO李大海、云知聲創(chuàng)始人&CEO黃偉、昆侖萬維董事長兼CEO方漢、它石智航創(chuàng)始人兼CEO陳亦倫一起聊了聊《當(dāng)AI走進(jìn)Second Half》。

在這場(chǎng)關(guān)于“AI下半場(chǎng)”的討論中有三個(gè)關(guān)鍵詞:重新定義問題、評(píng)估真實(shí)價(jià)值、重構(gòu)產(chǎn)業(yè)生態(tài)。而這些來自AI產(chǎn)業(yè)一線的佼佼者將會(huì)做出怎樣的回答?

以下為本場(chǎng)巔峰對(duì)話的文字實(shí)錄,經(jīng)「甲子光年」編輯,在不改變?cè)獾幕A(chǔ)上略有刪改。

1.什么是“AI下半場(chǎng)”

張一甲:今天我們一起聊聊“AI下半場(chǎng)”,首先請(qǐng)四位嘉賓介紹一下自己和所在公司。

李大海:大家好,我是李大海,面壁智能是一家具有清華背景,且專注于推動(dòng)端側(cè)大模型研發(fā)及產(chǎn)業(yè)應(yīng)用的公司。自 2022 年 8 月成立以來,面壁智能已逐步形成“理論-模型-工具-應(yīng)用”的全鏈路技術(shù)生態(tài)閉環(huán)與產(chǎn)業(yè)向心力。圍繞“密度法則”(Densing Law)的科學(xué)化理論與架構(gòu)創(chuàng)新,我們自主研發(fā)MiniCPM面壁小鋼炮系列端側(cè)模型,憑借超高效能優(yōu)勢(shì),不僅收獲了來自開源社區(qū)、開發(fā)者的廣泛認(rèn)可,更推動(dòng)了在汽車、AI手機(jī)、AIPC、智能家居等終端領(lǐng)域廣泛落地。

黃偉:大家好,我是黃偉。有朋友開玩笑說,云知聲是一家“古典主義”人工智能企業(yè),意思是我們活得比較久,所以我對(duì)“AI下半場(chǎng)”的話題可能有自己的一些想法。

云知聲成立十多年了。在AI 1.0時(shí)代,專注投入AI算法和所謂的“小模型”,給客戶提供基于算法和模型的產(chǎn)品和解決方案;到了大模型時(shí)代,我們自己研發(fā)了大模型,并在一些確定場(chǎng)景里面提供了基于自研大模型的產(chǎn)品和解決方案。

方漢:大家好,我是方漢。我們公司是2008年成立,2015年上市,從2020年開始在AI方面加大投入,2022年12月份發(fā)布國內(nèi)第一個(gè)13B開源的中文預(yù)訓(xùn)練大模型,公司目前主要業(yè)務(wù)海外(95%的收入來自于海外),目前在海外的AI產(chǎn)品,有AI音樂、AI社交、AI視頻以及短劇等業(yè)務(wù)。

我們重點(diǎn)關(guān)注AIGC領(lǐng)域,在海外AI業(yè)務(wù)均已產(chǎn)生大量的收入,我們相信全球AI應(yīng)用市場(chǎng)會(huì)蓬勃發(fā)展。目前的狀態(tài),技術(shù)遠(yuǎn)超前于產(chǎn)品,我相信這個(gè)情況會(huì)在“AI下半場(chǎng)”得到極大改觀。

陳亦倫:大家好,我是陳亦倫,我們是一家年輕的公司,2025年2月5日成立。它石智航是一家AI驅(qū)動(dòng)的具身智能機(jī)器人公司,希望以機(jī)器人技術(shù)和具身智能技術(shù)為核心,打造可信賴的具身智能全棧系統(tǒng),讓它可以規(guī)?;刈呷氲酱蠹业纳a(chǎn)和生活中,我們也很感興趣用技術(shù)解決高價(jià)值的生產(chǎn)生活問題。

張一甲:首先我們來聊聊“重新定義問題”。過去幾年,我們見證了“AI上半場(chǎng)”:算力狂飆、模型軍備競賽、參數(shù)越卷越大,大家都在拼“更強(qiáng)的模型”。今年4月,當(dāng)時(shí)還是OpenAI研究員的姚順雨提到了“AI下半場(chǎng)”的概念,他認(rèn)為:在這個(gè)新時(shí)代,評(píng)估將比訓(xùn)練更重要。我們不再只是問“我們能訓(xùn)練出一個(gè)能解決X的模型嗎”,而是在問“我們應(yīng)該訓(xùn)練AI去做什么,以及如何衡量真正的進(jìn)步”。我想知道,你們認(rèn)為我們進(jìn)入“AI下半場(chǎng)”了嗎?你們理解的“AI下半場(chǎng)”有什么特征?

李大海:“下半場(chǎng)”的概念,不同的人會(huì)有不同的理解。

我個(gè)人觀點(diǎn),從技術(shù)上很難說已經(jīng)到了“下半場(chǎng)”。比如,從最近谷歌發(fā)布的Gemini 3展現(xiàn)出的驚艷效果來看,大家發(fā)現(xiàn)預(yù)訓(xùn)練時(shí)代還沒有結(jié)束,依舊能帶來驚喜。從技術(shù)層面來說,還有智能體的突破、大模型如何提高個(gè)性化記憶及主動(dòng)學(xué)習(xí)的能力,以及模型之間的如何更好的協(xié)同完成更復(fù)雜的任務(wù)等等,這些提升模型智能能力上線工作都還在路上,所以技術(shù)上遠(yuǎn)沒有收斂。

但是從應(yīng)用的角度來講,“下半場(chǎng)”肯定到了。以前發(fā)一個(gè)模型,大家只能拿行業(yè)里面的標(biāo)準(zhǔn)評(píng)測(cè)集去評(píng)分。現(xiàn)在大家主要關(guān)心大模型如何賦能實(shí)際業(yè)務(wù),更關(guān)注成本、ROI,跟人比效能是不是更高。越到后面,大家越會(huì)用產(chǎn)品說話,所以從應(yīng)用層面來講,這個(gè)過程在穩(wěn)定持續(xù)的發(fā)生,但是不會(huì)一蹴而就。


面壁智能聯(lián)合創(chuàng)始人&CEO 李大海

黃偉:如果提“下半場(chǎng)”,好像有點(diǎn)隱含的意思是說“上半場(chǎng)”的事已經(jīng)做得差不多,條件具備了所以開始“下半場(chǎng)”,這好像拿到畢業(yè)文憑才能找工作。我的觀點(diǎn)是需要“勤工儉學(xué)”,一邊讀書一邊工作。我認(rèn)為,所謂的“下半場(chǎng)”,其實(shí)是2023年就已經(jīng)開始,在某些場(chǎng)景里,有些公司已經(jīng)開始嘗試用一定的模型能力去解決問題。

如果沒有做嚴(yán)格的區(qū)分,所謂的“上下半場(chǎng)”可能會(huì)同時(shí)存在。一方面基礎(chǔ)模型在不斷迭代升級(jí),可能也會(huì)出現(xiàn)做了一些數(shù)據(jù)調(diào)優(yōu)工作之后,發(fā)現(xiàn)一個(gè)新的大模型比調(diào)優(yōu)之后做得還要好,但并不意味著這件事不重要。如果人工智能始終在做研發(fā)沒有落地,可能就是泡沫。

但還有些問題更重要:定義的AI能力是什么,定義AI要解決什么問題。

其實(shí),不同人對(duì)AGI(通用人工智能)的定義也是不一樣的,有的人可能會(huì)把AGI想得無比強(qiáng)大,同時(shí)要具備20個(gè)博士學(xué)位,甚至在很多領(lǐng)域達(dá)到院士的水平。但其實(shí)AGI可能也就是普通人,比如自動(dòng)駕駛領(lǐng)域,難道開車需要博士學(xué)位嗎?所以我們要定義一下,在什么場(chǎng)景需要什么能力,這可能是“下半場(chǎng)”比較重要的話題。


云知聲創(chuàng)始人&CEO 黃偉

方漢:我個(gè)人看法是,實(shí)現(xiàn)AGI之后才會(huì)有“下半場(chǎng)”。但是這樣的話,今天就沒法討論了。

如果按照一甲之前引用的觀點(diǎn),我可以從宏觀層面下個(gè)判斷:當(dāng)AI產(chǎn)品不以技術(shù)、算法作為護(hù)城河,而更多的是以產(chǎn)品創(chuàng)新或者用戶黏性作為護(hù)城河,“AI下半場(chǎng)”就到來了。

在微觀上,我認(rèn)為,就像之前互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代一樣,當(dāng)一個(gè)公司的產(chǎn)品總監(jiān)的薪資跟算法總監(jiān)的薪資看齊的時(shí)候,我認(rèn)為“下半場(chǎng)”就真的到來了。


昆侖萬維董事長兼CEO 方漢

陳亦倫:我之前仔細(xì)閱讀了姚順雨博士的那篇Blog,他提到“上半場(chǎng)”跟“下半場(chǎng)”,我理解是一個(gè)大型AI系統(tǒng)發(fā)展的節(jié)奏,我想用另外一種方式來詮釋我對(duì)這種節(jié)奏的觀察。

在行業(yè)里其實(shí)有三個(gè)Scaling Law:

1.對(duì)于數(shù)據(jù)的Scaling Law;

2.對(duì)于算力的Scaling Law;

3.對(duì)于環(huán)境或者推理時(shí)運(yùn)行時(shí)間的Scaling Law。

這三個(gè)Scaling Law,它是有先后順序的。你必須先打穿第一個(gè)環(huán)節(jié)——數(shù)據(jù)墻,才有資格進(jìn)入到第二個(gè)環(huán)節(jié)——算力墻,當(dāng)你打穿算力墻的時(shí)候,才有資格進(jìn)入到交互態(tài),進(jìn)一步提升能力。

這三個(gè)發(fā)展的階段決定了不同行業(yè)的發(fā)展節(jié)奏。以我在上一個(gè)十年全身心參與過的自動(dòng)駕駛行業(yè)為例,2019年到2021年,自動(dòng)駕駛行業(yè)最頭部的公司率先打破了數(shù)據(jù)墻,這個(gè)時(shí)候大家已經(jīng)能看到自動(dòng)駕駛具備很好的能力了。2022年到2025年是算力跟數(shù)據(jù)豐收的紅利期,大家可以看到路上其實(shí)自動(dòng)駕駛系統(tǒng)已經(jīng)很多了,它是不是做得足夠好了?沒有。這些問題集中體現(xiàn)在自動(dòng)駕駛車輛怎么跟其他的社會(huì)車輛互相交互、避讓,那么就需要一個(gè)訓(xùn)練環(huán)境。環(huán)境就是第三層次Scaling Law,也就是駕駛級(jí)的世界模型。

我覺得這件事情基本上跟大語言模型的發(fā)展過程等同,我認(rèn)為大語言模型是一個(gè)被祝福的領(lǐng)域,因?yàn)樗鼪]有數(shù)據(jù)墻這種說法,它從出生的第一天,互聯(lián)網(wǎng)數(shù)據(jù)就是極其充沛的,所以它直接跳過了第一個(gè)階段,進(jìn)入到了第二個(gè)階段。你會(huì)發(fā)現(xiàn)一開始,大家就在瘋狂地比拼算力。不過,我認(rèn)為第二個(gè)階段的紅利已經(jīng)在慢慢降低了,大家就到了第三個(gè)階段。第三個(gè)階段是我們?cè)趺礃忧逦x任務(wù),賦予它的交互模型,然后再上類似強(qiáng)化學(xué)習(xí)的方法,這樣就有希望能夠在單點(diǎn)或者是多點(diǎn)任務(wù)上徹底解決這個(gè)領(lǐng)域。


它石智航創(chuàng)始人兼CEO 陳亦倫

張一甲:接下來我想分別問各位嘉賓一些問題。大海總,我們知道面壁智能一直在強(qiáng)調(diào)模型能力與場(chǎng)景融合,比如你們已經(jīng)將VLA多模態(tài)大模型部署于汽車智能座艙端側(cè)。在這個(gè)過程中,誰來定義“AI該做什么”?是你們自己還是來自場(chǎng)景或客戶?

李大海:這肯定雙向奔赴。作為AI公司,面壁智能更擅長的持續(xù)提升模型智能能力并提高模型應(yīng)用的性價(jià)比,模型擅長做什么事情。但是模型能做的事情太多了,哪些事情真正有價(jià)值,這個(gè)價(jià)值錨點(diǎn)是由客戶來提供。

就拿智能座艙舉例,我們的MiniCPM端側(cè)模型部署到汽車的智能座艙中,能夠準(zhǔn)確識(shí)別不同的用戶、理解用戶的指令,感受用戶的情緒和艙內(nèi)艙外的環(huán)境。但這個(gè)能力最后在哪些場(chǎng)景里面有價(jià)值?很多時(shí)候是需要我們與客戶、主機(jī)廠一起來共創(chuàng)、定義的。

比如說AI發(fā)現(xiàn)后座上有小朋友,會(huì)主動(dòng)開啟兒童鎖,用戶會(huì)覺得這個(gè)功能很有用。在吉利的銀河M9這款車上,超過90%的用戶都會(huì)主動(dòng)打開端側(cè)大模型的功能,我們覺得這是一個(gè)很好的正面反饋。

張一甲:黃偉總,首先恭喜云知聲以“港股AGI第一股”的身份完成上市。云知聲已經(jīng)成立十多年了,在這個(gè)過程當(dāng)中你們面臨了無數(shù)的分岔路口,身邊的人也是來來往往。云知聲長期深耕語音、多模態(tài)和產(chǎn)業(yè)場(chǎng)景,尤其是醫(yī)療場(chǎng)景。前段時(shí)間我們對(duì)話時(shí)你跟我說“云知聲不做特別大的平臺(tái)型大模型,那種模型評(píng)測(cè)可以,但落地很難”。這一路走來,你們是怎么定義問題的?

黃偉:我覺得每一個(gè)做實(shí)業(yè)的創(chuàng)始人都要回答:公司定位是什么,競爭優(yōu)勢(shì)是什么。

我們做醫(yī)療并不是因?yàn)榻裉煊辛舜竽P?,大家看好“AI+醫(yī)療”。恰恰相反,我們?cè)谑畮啄昵熬烷_始做醫(yī)療,而且我們是在很多人不看好,十多年前很多醫(yī)院沒有信息化,數(shù)據(jù)還沒有數(shù)字化的情況下,我們就已經(jīng)決定做了。

那么,為什么我們選擇做醫(yī)療,有兩個(gè)方面原因。

第一,這個(gè)事業(yè)的天花板足夠高。人類有兩個(gè)H很重要,一個(gè)是Happy,一個(gè)是Health;第二,醫(yī)療在國內(nèi)其實(shí)它并不是一個(gè)巨頭可以統(tǒng)一的領(lǐng)域,就算是今天BAT過來做,依然很難做。它是一個(gè)非常分散的市場(chǎng),相對(duì)來說,它對(duì)創(chuàng)業(yè)者來講會(huì)起到某種保護(hù)隔離作用。

當(dāng)然,很多時(shí)候選擇就意味著痛苦和堅(jiān)持,因?yàn)樵谀莻€(gè)時(shí)間點(diǎn)做醫(yī)療的話是很難的事情,面臨的是“先有雞還是先有蛋”的問題。你憑什么讓醫(yī)院用你的產(chǎn)品?難道我能跟院長說“你把數(shù)據(jù)給我,我就能做好”?

To B和To C是完全不同的決策機(jī)制。To C的話你只需要80%的人說你OK就可以了,很多人你用各種營銷手段是可以影響的。To B是關(guān)鍵人決策,就是90%的人說你好,沒用,一定要關(guān)鍵決策者或者是流程機(jī)制認(rèn)可你。

所以你的決定能不能落實(shí),就是你的心理、定力、耐力、毅力各方面的綜合考驗(yàn)。在這個(gè)過程中,我們堅(jiān)持下來了。

今天來看,第一,我覺得“AI+醫(yī)療”是大家比較認(rèn)可的一個(gè)方向;第二,我們確實(shí)做得比較早,有先發(fā)優(yōu)勢(shì),我們覆蓋了幾百家醫(yī)院。這些都是我們今天醫(yī)療大模型在醫(yī)院內(nèi)部能夠更順利落地的一個(gè)重要前提。

張一甲方漢總,我是你們的用戶。昆侖萬維今年推出了多款A(yù)I模型,天工大模型4.0、空間智能大模型Matrix-Zero、視頻生成大模型SkyReels等。你們推出了這么多的模型,這期間有沒有收到一些反饋,從而讓你們覺得要做什么、不做什么?

方漢:其實(shí)我覺得所有做AI業(yè)務(wù)的決策人都會(huì)遇到一個(gè)問題,就是B端跟C端的反饋是完全不一樣的,我認(rèn)為B端對(duì)于效率更敏感,C端對(duì)成本更敏感。

在B端,現(xiàn)在最好的商業(yè)模式是編程,編程基本上就是增效。在B端,你一定要說服客戶,我們能夠幫你大幅提高生產(chǎn)效率。比如,我們做的天工超級(jí)智能體(Skywork Super Agents),可以給B端提供deep research的功能,不用人干預(yù)就能快速生成一篇很詳細(xì)的分析文檔,一些B端的用戶反饋,這至少幫他省了幾十個(gè)實(shí)習(xí)生的工作量。

在C端,情感供給是剛需。但是如果由真人來供給情感,成本是絕大多數(shù)人沒法接受的。如果用AI來供給情感,就可以把成本打到真人的幾十分之一,這種商業(yè)模式在C端就會(huì)迅速爆發(fā)。所以,我們選擇了AI社交這個(gè)賽道。

簡而言之,一個(gè)AI產(chǎn)品到底該做不該做,其實(shí)就看在B端增加多少效率,在C端降低多少成本,憑著這兩點(diǎn)去分析應(yīng)用場(chǎng)景,基本上我覺得就可以get到用戶最關(guān)鍵的需求。

張一甲亦倫總,它石智航的英文簡稱是TARS,這讓我想到了電影《星際穿越》中的機(jī)器人TARS,它石的TARS代表的是“Trusted AI and Robotics Solution”(可信賴的AI和機(jī)器人解決方案),我們應(yīng)該如何理解Trusted AI?你們是一家非常年輕的公司,某種程度上說,你們處于后發(fā)身位,你們是如何選擇要做什么?

陳亦倫:我們公司起名字確實(shí)是參考了TARS,因?yàn)槲覀児镜膭?chuàng)始團(tuán)隊(duì)都是《星際穿越》的忠實(shí)粉絲,電影里面我們最喜歡的機(jī)器人就是TARS,它真誠、幽默、可信賴,所以我們希望我們做的機(jī)器人也是可信賴的。

我一直在做物理世界AI,我覺得AI在物理世界的可信賴最基本一條是能力可信賴。

比如說對(duì)于一個(gè)自動(dòng)駕駛系統(tǒng),我可以放心地把方向盤交給它,這件事情背后是因?yàn)樗哪芰υ谖抑?,或者按照L4的標(biāo)準(zhǔn),它的能力應(yīng)該是人類駕駛10倍以上為技術(shù)保證。

再比如說我在參加一個(gè)重要的國際活動(dòng),用一個(gè)語言模型做翻譯的時(shí)候,我可以非常信賴它的翻譯是對(duì)的。

對(duì)于機(jī)器人來說這一點(diǎn)就尤為重要,所以說我們希望打造在能力上非常優(yōu)秀的,讓這個(gè)機(jī)器人非??煽俊⒖尚刨嚒⒖梢詫?duì)生產(chǎn)生活產(chǎn)生價(jià)值。

我們選擇落地場(chǎng)景有三個(gè)原則:第一,必須是真實(shí)需求,真需求往往來自行業(yè)最迫切的痛點(diǎn);第二,要有足夠的市場(chǎng)顆粒度,解決這個(gè)問題后能覆蓋一個(gè)足夠大的市場(chǎng);第三,要有技術(shù)難度,真需求、大市場(chǎng)往往伴隨著極高的技術(shù)門檻,這也是我們的核心競爭力所在。

2.多維度對(duì)AI價(jià)值進(jìn)行評(píng)估

張一甲:那我們就就來聊聊第二個(gè)關(guān)鍵詞——“評(píng)估真實(shí)價(jià)值”。AI模型存在一個(gè)根本性矛盾:它們?cè)诟唠y度、設(shè)計(jì)良好的benchmark(基準(zhǔn))上表現(xiàn)得很驚艷,但當(dāng)應(yīng)用到真實(shí)世界,落地到產(chǎn)業(yè)中,面對(duì)復(fù)雜多變的場(chǎng)景時(shí),往往會(huì)出現(xiàn)一些問題。如果讓你們?cè)O(shè)計(jì)一套評(píng)測(cè)體系來評(píng)估AI模型的真實(shí)價(jià)值,你們會(huì)如何設(shè)計(jì)?


甲子光年創(chuàng)始人&CEO 張一甲

陳亦倫:首先我也非常認(rèn)同現(xiàn)在很多AI模型打榜結(jié)果非常驚艷,但是在實(shí)際部署過程中,它可能會(huì)出現(xiàn)一些不符合期望的現(xiàn)象。

按照一個(gè)更加工程化的視角來看,AI模型其實(shí)就是在逼近數(shù)據(jù)分布。你訓(xùn)練時(shí)候的分布,跟你實(shí)際應(yīng)用時(shí)候的分布,這兩個(gè)分布如果越接近,它的性能就會(huì)越好。為什么說打榜的AI不太容易泛化呢?恰恰因?yàn)樗^度聚焦于打榜,所以它會(huì)讓整個(gè)的數(shù)據(jù)分布越來越遠(yuǎn)離,這會(huì)出現(xiàn)問題。

如何消除這種問題?各個(gè)領(lǐng)域都有自己的一套方法,我可以提供一套之前行之有效的方法論,就是自動(dòng)駕駛影子模式。自動(dòng)駕駛影子模式是一個(gè)典型的、部署的數(shù)據(jù)跟訓(xùn)練的數(shù)據(jù)在任何角落、任何時(shí)刻都能夠?qū)R的一種方式。即便你人在開一輛車的時(shí)候,它背后也有一個(gè)像影子一樣的自動(dòng)駕駛模式隨時(shí)在跑,它會(huì)隨時(shí)判斷AI輸出的結(jié)果跟人輸出的結(jié)果是不是一致,發(fā)現(xiàn)異常數(shù)據(jù)都會(huì)被收集并加入到訓(xùn)練。這樣就可以每時(shí)每刻都在做評(píng)測(cè),收集出來的數(shù)據(jù)都能夠動(dòng)態(tài)的反饋到系統(tǒng),讓它變得越來越好。

我觀察到,不僅是自動(dòng)駕駛領(lǐng)域,我覺得很多AI相關(guān)領(lǐng)域都有這樣的影子模式,機(jī)器人也是一樣,所以說我覺得它背后的關(guān)鍵還是怎么把訓(xùn)練的數(shù)據(jù)跟實(shí)際使用的數(shù)據(jù)盡可能拉齊。

方漢:現(xiàn)在為了刷benchmark,很多的大模型要么背題,要么背答案,要么背過程,現(xiàn)在更多是在背過程,最大的問題就是這些題目是固定的。

這個(gè)情況其實(shí)跟我們平時(shí)在招聘的時(shí)候遇到的問題是一樣的,招聘的時(shí)候我們可以通過兩個(gè)方面判斷:

第一,看這個(gè)人是哪個(gè)學(xué)校畢業(yè)的,學(xué)歷如何,這個(gè)就是好像現(xiàn)在的benchmark;

第二,看這個(gè)人做過什么項(xiàng)目,在項(xiàng)目中解決了什么問題,這個(gè)就是實(shí)際的應(yīng)用場(chǎng)景。

我認(rèn)為,現(xiàn)在的benchmark還是有非常大的作用,因?yàn)樗蟹浅=y(tǒng)一的標(biāo)準(zhǔn),但是現(xiàn)在所有的benchmark都在拼命的換題。與其這樣,我覺得不如把現(xiàn)實(shí)世界的工單作為一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)。比如說我們?cè)贕ithub上,把Github上每時(shí)每刻提交的新的issue(問題),讓所有參加測(cè)試的大模型同時(shí)去解決,看誰的完成率更高,我認(rèn)為這種是相對(duì)比較公正的。

第三,把真實(shí)世界的工作流引入評(píng)測(cè)體系,比如要看AI產(chǎn)品的用戶真實(shí)數(shù)據(jù),比如用戶留存率。把流量分給不同AI產(chǎn)品,最后看哪個(gè)AI產(chǎn)品的用戶留存率最高,這是非常干的數(shù)據(jù)。

黃偉:我基本認(rèn)同方總的觀點(diǎn),我也分享幾個(gè)方面的想法。

第一,我們模型優(yōu)化的方向是不是現(xiàn)實(shí)世界里面迫切需要解決的問題。

第二,我們有沒有必要讓物理學(xué)博士一定要把川菜做得很好吃,因?yàn)楫吘刮覀儸F(xiàn)在很多所謂的評(píng)測(cè)榜單都是有模擬題,通過刷題你是可以刷到比較好的,但是未必代表一個(gè)真實(shí)水平。

所以我覺得非常重要的一點(diǎn),就是我們要了解在真實(shí)世界里需要解決什么問題。當(dāng)然To C和To B的問題是不太一樣的。To C這一塊可能要解決80%、90%人的80%、90%的需求。但是To B這一塊你可能要解決這個(gè)場(chǎng)景里面這個(gè)客戶當(dāng)下的痛點(diǎn)是什么,如果你定位很準(zhǔn)確的話,我們是有足夠多的手段來解決好這個(gè)問題的。

3.產(chǎn)業(yè)生態(tài)正在底層發(fā)生重構(gòu)

張一甲:最后,我們來聊聊“重構(gòu)產(chǎn)業(yè)生態(tài)”。你們用AI改變了哪些產(chǎn)業(yè)的生態(tài)?可以講講最新的進(jìn)展和實(shí)例。

李大海:我們看到了一些變化。

一是大模型的應(yīng)用在向端云協(xié)同的方向演進(jìn)。比如我們已經(jīng)把端側(cè)大模型部署到汽車、手機(jī)等終端上,用戶也開始在手機(jī)上利用端側(cè)大模型執(zhí)行復(fù)雜的任務(wù)。在我們看來,端云協(xié)同最大的優(yōu)勢(shì)在于模型響應(yīng)快、數(shù)據(jù)不出本地確保隱私安全。

在云端,大家用AI解決一些復(fù)雜的問題時(shí),模型深度思考10秒沒有任何問題,甚至做一份Deep Reaserch,半個(gè)小時(shí)后再給一份完整的答案也可以接受。但是我們?cè)诟鷻C(jī)器人、智能座艙和手機(jī)設(shè)備互動(dòng)的時(shí)候,希望它可以立刻響應(yīng),這背后的速度以及功耗也都是大模型規(guī)模化應(yīng)用需要考慮的關(guān)鍵因素。

二是有些企業(yè)從直接為用戶提供服務(wù),轉(zhuǎn)向?yàn)锳gent提供服務(wù)。從App轉(zhuǎn)向Agent這個(gè)過程中,服務(wù)用戶和服務(wù)Agent慢慢會(huì)產(chǎn)生新的遷移,這背后有很多的機(jī)會(huì)。

黃偉:我們現(xiàn)在做的事情更多是延續(xù),但是我感覺到這個(gè)行業(yè)在更底層方面在發(fā)生重構(gòu)。比如豆包手機(jī)助手,五年后回頭看,也許就是里程碑式的事情。

我們主要是To B的模式,以前給客戶提供的是基于Bert模型的產(chǎn)品,現(xiàn)在開始給客戶提供基于GPT模型的產(chǎn)品,當(dāng)然性能和能力相比過去都有顯著提升?,F(xiàn)在我們?cè)陂T診環(huán)節(jié),可以給醫(yī)院提供基于大模型的門診病歷生成系統(tǒng),這背后就是數(shù)字醫(yī)生,從這個(gè)角度來講,我們既是延續(xù)也是重構(gòu)。

另一方面,我們?cè)谝恍┬碌膱?chǎng)景,或者根據(jù)一些新的需求,做微觀層面的重構(gòu)。包括企業(yè)組織結(jié)構(gòu),原來是人人協(xié)同,接下來可能是人與Agent協(xié)同。以前我們通過網(wǎng)站操作并執(zhí)行任務(wù),后來通過APP,而現(xiàn)在的AI Agent可能就沒有界面,用戶告知意圖,它可以幫我完成所有的任務(wù)。這是接下來所有人必須要重點(diǎn)關(guān)注的,這里面也是蘊(yùn)藏著巨大的商機(jī)。

方漢:我舉個(gè)例子,我們發(fā)布的音樂生成大模型Mureka。大家可能以為傳統(tǒng)的歌手對(duì)我們的音樂生成大模型是深惡痛絕,但實(shí)際他們是最愿意擁抱音樂生成大模型的群體。因?yàn)楦枋衷谧龈璧臅r(shí)候,有一個(gè)工序是做小樣,做一個(gè)小樣可能成本要幾萬元,一個(gè)月的時(shí)間能做2-3個(gè)小樣?,F(xiàn)在他們用Mureka,可以在一天之內(nèi)做出十幾個(gè)小樣,拿這個(gè)小樣可以直接到抖音上投流看用戶反饋,找專家評(píng)審,這使得所有歌手做新歌的速度比原來快很多,這是我們觀察到的第一個(gè)對(duì)產(chǎn)業(yè)的影響。

第二個(gè)例子是Skywork Super Agents。因?yàn)槲覀冏鲂醒械乃俣确浅??,?dǎo)致很多券商原來要請(qǐng)大學(xué)生寫行研報(bào)告,現(xiàn)在這個(gè)工種幾乎已被AI取代。我跟很多券商的朋友交流過,他們都使用我們的Skywork Super Agents做快速的行研報(bào)告,每次股市上一個(gè)新的事件出來之后,可以很迅速的在幾分鐘之內(nèi)把行研報(bào)告寫出來,他們?cè)俑鶕?jù)行研報(bào)告做決策,這對(duì)于二級(jí)市場(chǎng)的影響非常深刻。

張一甲:我家人在炒股,就是在付費(fèi)用你們的Agents做行研報(bào)告。我想補(bǔ)充問一下,因?yàn)槟銈冇写罅康腃端用戶,在大量真實(shí)的場(chǎng)景中,有沒有什么數(shù)據(jù)或用戶反饋?zhàn)屇阌X得非常有意思,或者和之前想得不一樣?

方漢:其實(shí)我們做AI聊天的時(shí)候做過大量用戶訪談,一開始認(rèn)為大家AI聊天都是要滿足生活中滿足不能不了的幻想,結(jié)果用戶調(diào)研之后發(fā)現(xiàn)根本不是,用戶跟AI聊天主要兩個(gè)原因:第一,用戶認(rèn)為和AI聊天沒有社交門檻和心理障礙;第二,用戶覺得跟AI聊天是特別安全的事情,因?yàn)锳I不會(huì)“電詐”你,跟真人聊天很有可能遭遇“電詐”。這是用戶反饋跟我們想象有很大差別的地方。

張一甲:請(qǐng)亦倫總分享一下你觀察到的AI給產(chǎn)業(yè)帶來了什么樣的改變?

陳亦倫:我們?cè)谧鰴C(jī)器人,它是軟硬結(jié)合的領(lǐng)域。我觀察到,這一代機(jī)器人的企業(yè)有一個(gè)非常明顯的特點(diǎn)是,會(huì)主動(dòng)在硬件設(shè)計(jì)中考量AI,我們的機(jī)器人硬件設(shè)計(jì)標(biāo)準(zhǔn)也是“designed for AI”,這樣的好處是能盡可能縮小digital-to-physical gap。

舉兩個(gè)例子:第一,現(xiàn)在的機(jī)器狗、機(jī)器人,關(guān)節(jié)都走向了直驅(qū)或準(zhǔn)直驅(qū)。為什么要做這樣的選擇?因?yàn)檫@種最容易被AI建模、最容易被AI驅(qū)動(dòng),Sim2Real的gap會(huì)比較??;第二,在設(shè)計(jì)整個(gè)硬件系統(tǒng)的時(shí)候,我們和生態(tài)合作伙伴,首先討論的問題已經(jīng)不是機(jī)械怎么安裝,而是在考慮計(jì)算流怎么走,算力是怎么分配的,通信怎么走,延時(shí)怎么卡。這其實(shí)就是AI在驅(qū)動(dòng)硬件的趨勢(shì)。

張一甲:每年甲子引力年終盛典其實(shí)都是產(chǎn)業(yè)交流和資源對(duì)接平臺(tái),會(huì)有各行各業(yè)的決策者來到現(xiàn)場(chǎng)。各位嘉賓也都來自產(chǎn)業(yè),站在歲末的時(shí)間點(diǎn)上,展望新的一年,你們有什么期待?

陳亦倫:回到我最開始提到的AI發(fā)展的三個(gè)階段:數(shù)據(jù)、算力、環(huán)境。三個(gè)階段要三把鑰匙解鎖,我們目前接近于拿到了第一把鑰匙,希望明年可以跟大家匯報(bào),具身智能Scaling Law的這幾把鑰匙都是長成什么樣子的。

方漢:我的期待比較明確,希望看到基于AI的全新產(chǎn)品模式出現(xiàn)。如果只是一味迭代算法,現(xiàn)在并沒有沒有太多aha moment(頓悟時(shí)刻),但我相信產(chǎn)品的aha moment會(huì)大量涌現(xiàn)。

黃偉:對(duì)過去兩年AI技術(shù)演進(jìn),自己感到非常意外和驚喜,期待明年世界模型有更加超出預(yù)期的表現(xiàn),這樣會(huì)進(jìn)一步加速AGI。

李大海:我比較期待明年大模型在自主學(xué)習(xí)上進(jìn)一步突破,且能夠跟端側(cè)應(yīng)用有機(jī)結(jié)合,期待有更多的硬件能夠進(jìn)入到各位的組織里學(xué)習(xí)、進(jìn)化,成為大家的硅基同事。

張一甲可以感受到,這場(chǎng)巔峰對(duì)話與上一場(chǎng)巔峰對(duì)話的畫風(fēng)非常不一樣。

黃偉總剛才提到一個(gè)詞叫“勤工儉學(xué)”,各位做的事情就是一邊工、一邊學(xué),在研究的時(shí)候做好商業(yè),從商業(yè)反哺我們的研究,我們也會(huì)看到越來越多的真實(shí)世界實(shí)踐,這恰恰是對(duì)于技術(shù)迭代本身的一個(gè)很好的校準(zhǔn)和反哺。

非常期待四位嘉賓在做AI和做公司兩件事情上取得更好的進(jìn)展,謝謝大家!

(封面圖及文中配圖來源:2025甲子引力年終盛典)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大爆冷!馬刺8連勝終結(jié),文班空砍32分7板5帽,我必須承認(rèn)4個(gè)現(xiàn)實(shí)

大爆冷!馬刺8連勝終結(jié),文班空砍32分7板5帽,我必須承認(rèn)4個(gè)現(xiàn)實(shí)

小鬼頭體育
2025-12-28 13:12:53
大反轉(zhuǎn)!歐盟不再硬剛俄羅斯,集體喊停,澤連斯基擔(dān)心的事發(fā)生了

大反轉(zhuǎn)!歐盟不再硬剛俄羅斯,集體喊停,澤連斯基擔(dān)心的事發(fā)生了

愛下廚的阿釃
2025-12-28 12:03:38
笑發(fā)財(cái)了!當(dāng)大學(xué)生從家?guī)Я顺缘娜ニ奚?,我要笑死在評(píng)論區(qū)!

笑發(fā)財(cái)了!當(dāng)大學(xué)生從家?guī)Я顺缘娜ニ奚?,我要笑死在評(píng)論區(qū)!

另子維愛讀史
2025-12-19 15:35:10
三方地震級(jí)交易?祖巴茨離隊(duì),保羅重回火箭聯(lián)手哈登?

三方地震級(jí)交易?祖巴茨離隊(duì),保羅重回火箭聯(lián)手哈登?

漫川舟船
2025-12-28 13:25:57
當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

杰絲聊古今
2025-12-25 19:53:45
60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

情感大使館
2025-12-01 10:40:53
不團(tuán)結(jié)搞內(nèi)耗、工作不在狀態(tài),16名干部被省委調(diào)整

不團(tuán)結(jié)搞內(nèi)耗、工作不在狀態(tài),16名干部被省委調(diào)整

新京報(bào)政事兒
2025-12-28 09:44:24
美油輪被扣,特朗普急了,向6國發(fā)出邀請(qǐng),以色列早已按耐不住

美油輪被扣,特朗普急了,向6國發(fā)出邀請(qǐng),以色列早已按耐不住

云上烏托邦
2025-12-27 15:04:43
丈夫吐槽妻子生兩孩后胖50斤不愿牽手,網(wǎng)友直言問題在于丈夫自身

丈夫吐槽妻子生兩孩后胖50斤不愿牽手,網(wǎng)友直言問題在于丈夫自身

看曉天下事
2025-12-28 13:25:39
李湘曬與王詩齡參加晚宴照,P圖引發(fā)網(wǎng)友吐槽:王詩齡裙子都P歪了

李湘曬與王詩齡參加晚宴照,P圖引發(fā)網(wǎng)友吐槽:王詩齡裙子都P歪了

小咪侃娛圈
2025-12-28 10:38:22
當(dāng)你隔壁是個(gè)超級(jí)大國:東南亞人眼中的中國,到底是什么樣的?

當(dāng)你隔壁是個(gè)超級(jí)大國:東南亞人眼中的中國,到底是什么樣的?

遠(yuǎn)方風(fēng)林
2025-12-28 08:15:06
彈劾賴清德,結(jié)局會(huì)如何?

彈劾賴清德,結(jié)局會(huì)如何?

新民周刊
2025-12-27 09:15:57
靈隱寺被扒個(gè)底朝天,方丈身世曝光?網(wǎng)友:比釋永信還厲害?

靈隱寺被扒個(gè)底朝天,方丈身世曝光?網(wǎng)友:比釋永信還厲害?

小嵩
2025-08-07 20:11:39
史上最嚴(yán)電動(dòng)汽車電耗國標(biāo)來了!明年1月1日起實(shí)施,告別堆電池提升續(xù)航

史上最嚴(yán)電動(dòng)汽車電耗國標(biāo)來了!明年1月1日起實(shí)施,告別堆電池提升續(xù)航

紅星資本局
2025-12-28 12:27:04
饒穎:趙忠祥與我發(fā)生關(guān)系多年!他有特殊癖好,讓我身心受到傷害

饒穎:趙忠祥與我發(fā)生關(guān)系多年!他有特殊癖好,讓我身心受到傷害

蕾爸退休日記
2025-12-10 18:56:14
攤牌了!37歲張繼科高調(diào)官宣喜訊,釋放2大信號(hào),肖戰(zhàn)當(dāng)初沒說錯(cuò)

攤牌了!37歲張繼科高調(diào)官宣喜訊,釋放2大信號(hào),肖戰(zhàn)當(dāng)初沒說錯(cuò)

林子說事
2025-12-28 10:57:38
國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休!元旦動(dòng)車/城際有新調(diào)整→

國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休!元旦動(dòng)車/城際有新調(diào)整→

城事特搜
2025-12-27 18:38:10
突然開始信命——當(dāng)影帝逼近“斬殺線”

突然開始信命——當(dāng)影帝逼近“斬殺線”

百味朱砂
2025-12-28 14:06:30
超級(jí)外援即將離開上海!無法忍受盧偉長期DNP,場(chǎng)均25分跌至12分

超級(jí)外援即將離開上海!無法忍受盧偉長期DNP,場(chǎng)均25分跌至12分

老葉評(píng)球
2025-12-28 10:03:27
304萬億,我國的貨幣發(fā)行總量已經(jīng)是世界第一了。

304萬億,我國的貨幣發(fā)行總量已經(jīng)是世界第一了。

流蘇晚晴
2025-11-18 20:20:14
2025-12-28 14:44:49
甲子光年
甲子光年
中國科技產(chǎn)業(yè)化前沿智庫
3302文章數(shù) 9254關(guān)注度
往期回顧 全部

科技要聞

AR眼鏡第一案,究竟在爭什么?

頭條要聞

四川原副省長葉寒冰被通報(bào):長期出入私人會(huì)所聚餐飲酒

頭條要聞

四川原副省長葉寒冰被通報(bào):長期出入私人會(huì)所聚餐飲酒

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

姚晨打卡絕版機(jī)位 高崎機(jī)場(chǎng)背后的遺憾

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

親子
手機(jī)
藝術(shù)
旅游
公開課

親子要聞

62歲懷二胎真相驚人!醫(yī)生擔(dān)憂的惡心一幕曝光!

手機(jī)要聞

紅米Turbo5系列再次被確認(rèn):補(bǔ)齊參數(shù)短板,配置規(guī)格很全!

藝術(shù)要聞

360天津總部,以“0與1”打造科技地標(biāo)!

旅游要聞

雙山聯(lián)動(dòng)啟新歲!松江冬日文旅:在自然人文間藏盡治愈時(shí)光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版