国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

對話元理智能張帆:為什么「商業(yè)強化學習」,才是 AI To B 的新出路

0
分享至


AI To B 突圍的新解法就在非共識里。


對話|張鵬

編輯|徐珊

如何將技術實力轉化為可持續(xù)的商業(yè)模式,這是擺在整個大模型行業(yè)面前的集體命題,更是對每一個參與者的現(xiàn)實拷問。

若要理解這道考題的深度與難度,或許沒有比張帆更合適的躬身入局者。作為智譜 AI 前 COO,他不僅親歷了中國大模型從「百模大戰(zhàn)」到落地為王的完整周期,更是在 To B 領域主導完成了數(shù)億元規(guī)模的項目落地,積累了扎實且豐富的大模型商業(yè)化閉環(huán)經驗。

但張帆的視野從未局限于當下。早在十余年前,他就選擇投身第一波 AGI 浪潮,此后十年持續(xù)深耕 AI 與產業(yè)結合之路。正是這份獨特的經歷,讓他在 2025 年選擇卸任智譜 AI COO、創(chuàng)立元理智能時,行業(yè)關注的不是「他遇到了什么困境」,而是「他看到了什么未來」。

他創(chuàng)辦的新公司元理智能,不再計劃做大模型的「布道者」或「應用商」,而是轉向更艱難、但價值更廣闊的命題:如何將基礎智能轉化為企業(yè)的核心生產力?如何在模型算力難以指數(shù)級擴張的前提下,通過「商業(yè)強化學習」、「模型性理解」,實現(xiàn)生產力的千倍提升?

正如極客公園創(chuàng)始人 & 總裁張鵬所言,張帆探索的 To B 新路徑,關鍵不在于追求智能的絕對高度,而在于跳出原有思維框架,通過合成數(shù)據(jù)啟動一個能「光速進化」的商業(yè)強化學習——只有這種學習路徑,才能解決過去無法解決的問題。

帶著對 AI 時代變革的洞察與對不同市場的思考,元理智能創(chuàng)始人張帆與張鵬展開了一場坦誠對話。不僅是對過去兩年喧囂產業(yè)的總結,更是對未來 AI 商業(yè)化新范式的堅定選擇。

對話精華要點:

  • 客戶提問的變化折射出市場演進:從早期的「為什么不用開源」,到中期的「數(shù)據(jù)安全」,再到如今的「業(yè)務指標怎么提升」,這三個問題見證了 AI 技術從嘗鮮走向實用。

  • 搭建知識庫或問答系統(tǒng)絕不等于實現(xiàn)業(yè)務價值。真正的 AI 化要用 AI 特性重構業(yè)務邏輯,否則就只是「應用 AI 工具的公司」。

  • AI 革命類似電力革命:電力延伸人類體力,AI 延伸人類智力,二者形成對稱關系。用電力時代類比,電力的最大受益者不是發(fā)電廠,而是整個工業(yè)化進程。AI 同樣是杠桿,其最大價值在于嵌入物理世界實現(xiàn)轉化。

  • 當所有人一致看好達成「共識」時,反而更容易陷入非理性狀態(tài),回歸第一性原理的思考很關鍵。比如說,人們總是認為 C 端比 B 端更有價值是基于歸納法,但現(xiàn)在市場規(guī)則已變,To C 更具競爭,To B 機遇會更大。

  • 元理智能的使命是為企業(yè)建立「模型大學」,培養(yǎng)具有行業(yè)特質的智能專家,打造企業(yè)需要能夠干預模型,將行業(yè)知識沉淀和環(huán)境特征映射到智能體中,構建解決自身問題的專屬 Agent。

  • 想要讓 AI 更好融入到企業(yè)中,僅理解系統(tǒng)架構不夠,必須把握「模型人格」特性,包括幻覺。要想在模型規(guī)模不顯著增加的前提下實現(xiàn)生產力躍升,核心靠強化學習,特別是「商業(yè)強化學習」。

  • 企業(yè)競爭本質是創(chuàng)始人認知的競爭。我們有一套標準方法論,可以幫助企業(yè)以 70-80 分的水平啟動 AI 轉型。


元理智能創(chuàng)始人、CEO 張帆 | 圖片來源:元理智能

以下是極客公園創(chuàng)始人張鵬與元理智能創(chuàng)始人、CEO張帆的對話,經編輯整理。

01

大模型落地成情緒價值?

AI 是生產要素

張鵬: 2023 年加入智譜時,你對產業(yè)環(huán)境的觀察,與你現(xiàn)在出來創(chuàng)業(yè)重新評估環(huán)境時相比,你覺得最大變化是什么?

張帆:與其說是變化,不如說是一種使命的召喚。我過去十年專注于 AI 與產業(yè)的結合,但直到 2022 年底看到 ChatGPT,作為自然語言處理專業(yè)出身的我,立刻意識到這次技術顛覆性與以往完全不同。

當時智譜的首席戰(zhàn)略官張闊找到我,他之前是搜狗搜索首席科學家,也是我在搜狗時期的老板。雖然當時智譜的模型尚未商業(yè)化,但看到 Demo 時,我意識到這是一個新大陸。我當場就決定將公司整體并入智譜,非常決絕,共同推進大模型的商業(yè)化。

過去無論是做 NLP 還是類 Siri 產品,我都非??释寵C器像人一樣完成任務。以前通用技術沒有機會解決,但大模型的出現(xiàn)讓這件事有了可能。這是我們當時加入智譜的核心原因。

張鵬:在智譜期間,你推動大模型落地企業(yè),交付了接近幾個億規(guī)模 ToB 大模型落地服務,將技術價值真正帶給產業(yè)。這個過程的體驗如何?是如水銀瀉地般順暢,還是充滿磨合與挑戰(zhàn)?

張帆:過程雖非一帆風順,但我們確實把握住了關鍵機遇,憑借技術前瞻性提前布局,完整經歷了市場的幾輪演進。

在 23 年上半年,當時智譜幾乎是唯一能夠提供模型 To B 方案的廠商,直到下半年,才開始有大廠入局,智譜享受了一段時間的市場獨占期,得益于模型效果和商業(yè)策略的制定,也確實抓住了這段紅利。當時行業(yè)普遍認為 AI 應用必須用自研模型,當時大熱的 Character.ai、Inflection 等團隊均出身模型背景。

但到 2023 年底風向突變,行業(yè)認識到模型與應用可以解構,Perplexity、Cursor 等應用開始爆發(fā)。同時,追求模型能力的客戶企業(yè)從互聯(lián)網巨頭擴展到中型公司。這些企業(yè)更務實,不再執(zhí)著自研,而是憑借自身產研能力追求產品價值,關注響應速度、準確率等硬指標。這也促使我們組建交付團隊,從單純賣模型轉向提供解決方案。

今年又開始出現(xiàn)新趨勢,ARR 創(chuàng)新高的初創(chuàng)企業(yè)全是產業(yè)結合,如法律領域的 Harvey、醫(yī)療行業(yè)的 OpenEvidence 等,印證了 To B 的演進路徑。同時,客戶方面,大量純業(yè)務公司開始入場,他們不再考慮選擇什么模型或產品的價值,而是直接要業(yè)務價值,詢問 AI 能否提升業(yè)務轉化率?能否改善業(yè)務指標?

我們從客戶的提問也能看到市場的變化軌跡:早期問『為什么不用開源』,中期關注『數(shù)據(jù)安全』,現(xiàn)在則最常問『業(yè)務指標怎么提升』

回顧歷程,我們在每個階段都提供了相應價值。但要是說是否做到完美?有多少公司真正轉型為 AI 公司或實現(xiàn)指標顯著提升?這樣的案例還不多。但這并非能力問題,我們在行業(yè)內做得已經算深入的。

張鵬:據(jù)我觀察,不少AI項目需求并非來自業(yè)務部門,而是自上而下推動,也就是CEO認定大模型是戰(zhàn)略必需,必須擁有自己的模型。這種「擁抱大模型」的姿態(tài)往往停留在表面,實際落地卻很難觸及業(yè)務核心。你怎么看這種現(xiàn)象?

張帆:我們確實看到很多。雖然智譜始終專注于務實落地,但市場上確實存在「焦慮驅動」,也就是企業(yè)因害怕錯過技術浪潮而倉促入場。我們見過太多客戶在采購完一體機后就陷入「下一步該怎么做」的迷茫。

不過這種現(xiàn)象未必是壞事。任何新興產業(yè)都會經歷這樣的泡沫期,就像互聯(lián)網早期的域名炒作階段。企業(yè)認為做個 APP 就是互聯(lián)網公司,注冊域名就是觸網了。這是技術普及過程中的必然階段,具有其歷史價值。

但現(xiàn)在我們需要向前邁進。關于「AI 真正產生價值」的標準,我認為:首先,搭建知識庫或問答系統(tǒng)絕不等于實現(xiàn)業(yè)務價值,這本質上不是業(yè)務驅動的創(chuàng)新。現(xiàn)在很多企業(yè)做的知識庫和問答系統(tǒng),本質上滿足的是「情緒價值」——老板面對技術焦慮時,通過采購一個可見的 AI 方案來獲得安全感。

AI 轉型可以借鑒移動時代,就像當年的 BOSS 直聘用移動特性重塑招聘體驗,而不是簡單從網站到 APP,今天企業(yè)的 AI 戰(zhàn)略也應該用 AI 特性來重構業(yè)務邏輯。如果只是給現(xiàn)有業(yè)務流程加個對話功能,本質上仍是「應用 AI 工具的公司」。關鍵要看 AI 是否促使業(yè)務流程重組、環(huán)節(jié)優(yōu)化和組織變革。

正是基于這些思考,我創(chuàng)辦元理智能時決定:不要以應用模型為目標,而是直接以提升業(yè)務價值為出發(fā)點。

張鵬:當新的技術革命浪潮來臨,大家都渴望離技術原點越近。但今天如果要選擇賽道,你判斷整個產業(yè)環(huán)境是否發(fā)生了變化?你設定新目標背后的思考邏輯是什么?

張帆:本質上,我還是「使命契合」(People-Mission Fit)的驅動。23 年加入智譜,我們經歷了模型的高速發(fā)展時代,讓模型智能快速提升,而到了今天模型已經非常強大,將模型智能轉化為生產力可能更符合我的使命,所以是時候換種方式來推進模型的落地了。

尤其是我看到現(xiàn)在市場共識太強了,反而讓我擔心,我總覺得機遇都在非共識里。所有人都認為「模型是未來」,都在拼命堆芯片、建集群、追求智能突破。結合我在智譜的經驗,我發(fā)現(xiàn)最大的認知偏差在于:當前所有注意力都集中在「供給側」——做芯片、半導體、模型,試圖提高性價比的分母;卻鮮少有人真正關注「需求側」,我們是否也該思考如何提升分子端的價值?

與其扎堆在擁擠的賽道,不如結合自身能力,思考如何做大需求側。這是我最直觀的感受。就像黃仁勛所說,每個人的使命不同。如果一件事已經有很多人做得很好,我風險偏好較高,總想找到一些新的「共識」再去探索。

張鵬:原來你是一位風險偏好高的創(chuàng)業(yè)者。我理解你的意思是:現(xiàn)在大家都在致力于用更低成本提供更多「電力」,而你認為關鍵在于制造更多「電動機」,讓「電」真正落地到應用場景中。你現(xiàn)在選擇的這個方向,更具挑戰(zhàn)性也更有意義。

張帆:完全正確。在智譜時我深刻體會到,基座模型的最大價值在于找到更廣闊的應用場景?,F(xiàn)在我直接以應用場景為核心目標,這在某種意義上也是對智譜的另一種支持,或許能共同打開更大的天花板。

舉個例子,今天的 AI 商業(yè)化就像我們帶著一根電線到了一個原始部落,我們不斷說服酋長用更多的電,但只能提供燈泡,但部落即使點滿了燈泡也無法消耗更多電,補充場景可能比降低電價更有效。但實際上你看,現(xiàn)在我們有電冰箱、洗衣機、空調,以及各種電與物理世界自然結合的場景。因此,當大量應用場景出現(xiàn),用電」將會是自然而然的事情。我只是從另一個視角,來幫助基座模型去擴大消耗量。

我們用電力時代的邏輯來看,你發(fā)現(xiàn)真正電力最大的受益其實不是發(fā)電廠,也不是電力公司,而是由于電的發(fā)明導致了整個工業(yè)化的出現(xiàn)。有了電梯,電就讓整個城市從平面變成了立體;有了生產流水線,逐步導致整個社會的生產構成都變了。所以電的價值不是一個結果的交付物,而是一個杠桿。你看電的價值是通過嵌入自然世界、嵌入物理世界來做轉化的,我覺得今天AI也是桿杠,最大的價值也是要嵌入物理世界去做轉化,這就是為什么我要做 ToB。

張鵬:我們究竟該如何理解這一波AI帶來的變革?我認為它并非簡單的從互聯(lián)網到移動互聯(lián)網的迭代,本質上是一場計算革命,這場新革命理應在更廣闊的領域創(chuàng)造新的價值。

張帆:我認為這一波 AI 其實很像電力革命。你看,電力的本質是人類體力的延伸甚至無限擴張,而 AI 的本質是人類智力的無限延伸,二者形成對稱關系。因此,我們應該參考電力革命的發(fā)展路徑來理解 AI 的發(fā)展軌跡。

就像過去做手機,是從現(xiàn)有格局中開辟新戰(zhàn)場,戰(zhàn)場是空的,誰跑得快誰就能贏。但現(xiàn)在的邏輯完全不同:戰(zhàn)場數(shù)量沒有增加,只是在原有戰(zhàn)場上多了一個全新的生產要素。這正是 AI 與互聯(lián)網邏輯的根本差異。如果沒有具體場景,脫離物理世界,我們很難將 AI 作為獨立產品進行交付。而 ChatGPT 的出現(xiàn)證明了「電」的價值,但 AI 的價值絕不僅僅局限于誕生一個 ChatGPT。

02

「不對稱」的模型才能打造最優(yōu)解

張鵬:今天大家普遍認為模型很重要,但我們也觀察到一些 ToC 企業(yè)在工程上投入大量精力做場景適配,結果模型一升級,之前的努力可能就被覆蓋了。你認為 ToB 領域會有所不同嗎?你為什么敢于深入具體場景?

張帆:其實今天做 ToB 仍是一個「非共識」。我始終認為,一旦某個方向成為高度共識,真正的機會往往已經不在其中。早期 Transformer 就不是共識,所有創(chuàng)新都從邊緣切入,從非共識走向共識?,F(xiàn)在市場共識是什么?無非是模型重要、算力重要、C 端重要、垂類 Agent 重要。但當所有人一致看好時,反而容易陷入非理性,所以回歸第一性原理的思考很關鍵。

為什么大家總認為 C 端比 B 端更有價值?這個結論更多來自歸納法,互聯(lián)網時代做 C 端的賺得盆滿缽滿,做 B 端的卻很艱難,于是簡單平移認知,認為還是要做 C 端。但底層邏輯已經變了。過去 C 端有價值,是因為互聯(lián)網早期線上空曠、線下?lián)頂D。那時講究速度、跑馬圈地,物理世界的沉淀在數(shù)字世界失效,創(chuàng)業(yè)公司和巨頭同臺競技,誰快誰就能建立壁壘。

現(xiàn)在完全不同了,線上線下都已飽和。沒有出現(xiàn)新 iPhone、新平臺。競爭要素在互聯(lián)網時代和 AI 時代已經不同,創(chuàng)業(yè)者面對的是非對稱競爭。做 C 端,可能找到一個好點子快速做到 100 萬美元 ARR。但如果成功,10 個月內就會有巨頭帶著 10 倍資源進場。你能在 10 個月內建立足夠壁壘嗎?做產業(yè)端的問題也大致相似,如果做出一款體驗極佳的旅游產品,OTA 巨頭或許一年能追上體驗,但你要追上他們的供應鏈和服務體系,沒十年是不可能的。

某種程度上,我們處于一場極其不對稱的戰(zhàn)爭。如今 C 端創(chuàng)業(yè)可能更具挑戰(zhàn),而 B 端的故事可能會不一樣。

張鵬:當前 ToB 領域最關注的是 Agent 在實際業(yè)務中的表現(xiàn)。大家想知道,Agent 究竟能否真正融入工作流、帶來生產力升級,你如何看待當前 Agent 技術的發(fā)展現(xiàn)狀?

張帆:Agent 技術已走過一個發(fā)展周期,從 AutoGPT 到 GPTS 不斷演進,但離理想狀態(tài)仍有距離。

目前主要有三類 Agent:第一類是 Workflow 派,如 Coda、Defi 和智譜的「清流」。它們能快速搭建原型,但本質是增強版低代碼工具,并非真正的 AI 原生 Agent。以機票預訂為例,預設流程要求用戶嚴格按步驟操作,若用戶直接說"我要去上海"就會卡住。雖然可通過增加連線解決,但復雜度呈指數(shù)級增長,因此在企業(yè)核心系統(tǒng)中應用有限,就像低代碼工具無法構建 SAP 這樣復雜的系統(tǒng)。

第二類 Agent 追求 AI 自主規(guī)劃,從 AutoGPT 到 Manus 等產品都在探索自我規(guī)劃能力,顯著提升了泛化性。但這類系統(tǒng)依賴上下文理解和云端規(guī)劃器,本質上仍受限于模型自身能力。這意味著所有問題都被默認用同一套「大腦」處理,只是更換資料就期望得到最優(yōu)解?,F(xiàn)實中這種方式存在局限。雖然通用性有所提升,但企業(yè)每個問題都沒有通用解,不同場景的最優(yōu)解可能沖突,環(huán)境更是千差萬別。

因此,第三個階段正在到來:企業(yè)需要能夠干預模型,將自己的行業(yè)知識沉淀和環(huán)境特征映射到智能體中,構建解決自身問題的專屬 Agent。這標志著 AI 從規(guī)則化到模型化,再到個性化甚至自我進化的演進路徑。

有人總會問我模型是否會吞噬一切,我認為走到這一步的前提是所有標準必須統(tǒng)一,但現(xiàn)實恰恰相反。OpenAI 提出的「智能不對稱性」概念很說明問題:模型能拿奧數(shù)金牌,卻數(shù)不清"Strawberry"中的'r'數(shù)。這不是缺陷,而是智能的本質特性。

你看混合專家模型(MoE)也是在構造這種不對稱性。每個企業(yè)都是獨特環(huán)境,都存在其不對稱性。如何系統(tǒng)化地找到這種不對稱,將企業(yè)競爭優(yōu)勢融入模型,這正是元理智能致力解決的核心問題。

張鵬:你提到「不對稱」特別有意思——因為在智能領域,不對稱恰恰是最高效的。反過來說,完全對稱反而可能意味著平庸。你看人就是不對稱的,真正有鮮明特點和競爭力的個體,大概率都不是對稱的;關鍵在于,你是否把不對稱的長處,發(fā)揮在了決定勝負的關鍵點上。

張帆:人的智商在幾千年來并未發(fā)生巨大進化。但從生產力角度看,現(xiàn)代人比五千年前的原始人高出上千倍。按照原有邏輯,生產力提高一千倍,需要一個重達百斤的大腦,這顯然不現(xiàn)實?,F(xiàn)實是,人腦這個「模型」本身沒有改變,但我們的生產力卻提高了一千倍。關鍵在于我們增加了「不對稱性」。

一個人如何創(chuàng)造生產力?他是從幾乎相同的嬰兒開始,通過學習、教育,分化出不同的工種,再利用專業(yè)工具,通過分工協(xié)作,最終創(chuàng)造出整個社會的生產力。你會發(fā)現(xiàn),從上學到分工、使用工具、進入企業(yè),整個過程就是一個塑造「不對稱」性的過程。這個系統(tǒng)為個體定義了環(huán)境和最優(yōu)解,從而激發(fā)生產力。

我認為這是另一種形式的規(guī)模擴展(Scaling Up)。通過這個類比,人類實際上進化出了一種極高效率的方式:將一個通用模型(人腦)進化為一個個具有不對稱能力的個體,再通過個體間的協(xié)作,最大化整體優(yōu)勢。

本質上,世界對模型的研究已進入下一階段。原來的階段是「為知識建?!埂讶祟愔R壓縮進一個預訓練模型。而今天,我們進入的是「為學習建?!沟碾A段:研究如何讓通用知識一步步映射到每個局部環(huán)境,并找到最優(yōu)解。這個從「為知識建?!沟健笧閷W習建?!沟霓D變,是關鍵所在。

張鵬:如何將這些理念真正落地?怎樣將「智能的不對稱」轉化為企業(yè)「競爭力的不對稱」?推進過程中是否存在清晰的路徑?我們正觸及今天對話的核心——AITO B 是否真有突破性的新思路?

張帆:如何在模型規(guī)模不顯著增加的前提下,實現(xiàn)生產力上千倍的提升?我覺得核心是靠一項技術:強化學習,特別是「商業(yè)強化學習」,包含兩大關鍵:強化學習與商業(yè)應用。

我之所以推崇強化學習,是因為它突破了語言知識的局限性。語言模型雖能復刻人類知識,但語言本身是對思維的「降維」。就像讀完《游泳秘訣》仍不會游泳,得到 C 羅親授也踢不進任意球,有些東西單純的知識傳遞遠遠不夠。

真正的掌握需要反復實踐:根據(jù)反饋持續(xù)調整動作,這正是強化學習的本質。它架起了智能與物理世界的橋梁,能捕捉那些難以言傳的細節(jié)。就像用文字描述一支筆,每個人的想象都不同,但親眼所見立見分曉。

當前,強化學習已成為主流。去年業(yè)界還在擔憂數(shù)據(jù)枯竭,如今行業(yè)共識已轉向合成數(shù)據(jù)與強化學習共同驅動突破。

其次,「商業(yè)」也非常關鍵,這是強化學習依賴清晰的獎勵信號。目前在數(shù)學、編程等規(guī)則明確領域效果顯著,但在真實商業(yè)場景中,大多數(shù)問題沒有標準答案。這正是因為當優(yōu)化目標從解數(shù)學題變?yōu)樘嵘龢I(yè)務指標時,現(xiàn)有方法就難以直接應用。

這也是元理智能的使命:既要懂技術,更要懂業(yè)務。我們要為企業(yè)建立「模型大學」,讓模型在具體場景中學習成長,培養(yǎng)具有行業(yè)特質的智能專家,成為關鍵突破的方向。

03

用好模型前,要先理解模型的「性格」

張鵬:你的思路與具身智能如出一轍,都依賴先驗知識和模擬訓練環(huán)境。這就像自動駕駛,仿真再完美也得通過真實數(shù)據(jù)完成最后 10% 的優(yōu)化。本質上,你是要把機器人概念平移到商業(yè)場景,打造能自主進化、達到 L5 級別的組織智能體?,F(xiàn)在關鍵是:如何將企業(yè) Know-How 轉化為有效先驗?又該怎樣構建商業(yè)仿真環(huán)境?這需要構建「世界模型」還是「場景模型」?

張帆:首先,我覺得這需要的并非是完整世界模型,實際要簡單得多。我們可以參考 AlphaGo 下圍棋的范式——那是一個極簡化的訓練環(huán)境。找到好的應用場景關鍵是要能夠將泛化的業(yè)務描述抽象為標準化的環(huán)境要素。

模型需要明確區(qū)分環(huán)境的核心維度與次要因素。以圍棋為例,棋盤規(guī)格與規(guī)則屬于環(huán)境定義范疇,而棋手外貌、執(zhí)子手勢則不是。這需要深厚的行業(yè)認知:必須深入理解業(yè)務本質,才能精準抽象關鍵維度,完成環(huán)境建模。

張鵬:所以本質上,這是對商業(yè)場景進行抽象化重構?

張帆:確實如此。我一直強調,僅懂技術遠遠不夠,必須具備業(yè)務洞察力,并能夠將業(yè)務邏輯轉化為數(shù)字特征,這本質上是一門跨界融合的學科。

以銷售訓練為例:構建真實的銷售博弈環(huán)境,需要定義「顧客角色」、「商品信息」、「預算框架」和「銷售政策」等核心要素,同時建立合理的評估體系——究竟該以最終成交為導向,還是關注溝通過程質量,或是引入「銷售教練」實時指導?雖然每個人的抽象方式不同,但這樣的框架清晰地展現(xiàn)了一個多智能體協(xié)作系統(tǒng):不同模型扮演特定角色,當這些角色行為足夠擬真時,模型就能獲得有效的學習體驗。

我們最近的一個重要認知突破是,僅理解系統(tǒng)架構還不夠,必須深入把握「模型人格」特性。所以我們提出「模型性」這個概念,與「人性」相對應。正如優(yōu)秀銷售教練需要深諳人性,要有效引導模型就必須理解其行為特性。目前許多模型交互研究流于表面,根源不在于技術局限,而是對模型性理解不足——就像理解一個人,關鍵在于把握其心理特征和行為模式,而非僅僅了解生理構造。在實際應用中,你甚至不需要深究 Transformer 的技術細節(jié)。

例如,某些研究模擬銷售博弈時僅設置成本價和預算價兩個參數(shù),只要價格區(qū)間有重疊就判定交易成功——這種簡化顯然脫離商業(yè)現(xiàn)實。

所以問題的關鍵在于理解模型性。比如,模型具有怎樣的人格特質?我可以明確地說,當前主流模型普遍表現(xiàn)出「討好型人格」,這是 RLHF 訓練過程的直接產物——不迎合用戶會受懲罰,積極附和則獲得獎勵。這也解釋了為什么許多用戶特別青睞現(xiàn)有模型:因為它們總是積極認同用戶的觀點,頻繁使用「您說得太對」、「這個問題抓得很準」等表達。有時候我都不忍點破,只好說:「您確實很厲害,得到了最聰明模型的認可」。

張鵬:你提到的「模型性」讓我想到一個有趣現(xiàn)象。不少朋友和讀者都反饋,對模型「說狠話」能提升表現(xiàn),比如威脅「再不好好干就斷電」——這就是所謂的「PUA提高模型性能」。這背后是否與「模型性」有關?是否意味著我們需要理解模型的內在機制,它在什么情況下會改變?哪些是有效的「魔法指令」?這種 PUA 方式真有技術依據(jù)嗎?

張帆:我雖然沒有親自驗證,但從原理上推測是可能的。既然 PUA 對人類有效,而模型訓練基于人類數(shù)據(jù),這種模式很可能被習得。特別是在小說等文本場景中,模型可能學到了「被批評后需要表現(xiàn)得更好」的行為模式。本質上,這是人類知識壓縮的體現(xiàn)。RLHF 過程可能強化了這種模式:當模型被批評后改進獲得正面反饋,就會強化這種應對方式。這確實是「模型性」的一個具體表現(xiàn)。

模型性不是單一固定的特質,而是需要我們去識別和理解的模型內在傾向。比如訓練銷售場景時,我們需要模擬各種性格的客戶——急躁的、溫和的、粗魯?shù)摹?yōu)雅的,這樣才能真實還原世界。模型性不是要統(tǒng)一模型的性格,而是理解其傾向并善加利用。

這里我想延伸一個觀點:很多人將「幻覺」視為缺陷,但我認為這是智能的核心特征。幻覺的本質是創(chuàng)造新內容,如果只能復現(xiàn)已知信息,那就只是檢索系統(tǒng)。有觀點認為「只要模型還有 1% 的幻覺,就永遠需要人類」,這種說法既不懂模型,也不懂人性。

張鵬:確實,但所有創(chuàng)業(yè)者都是從「幻覺」開始的。

張帆:正是!世界進步源于超越現(xiàn)實的想象。關鍵在于我們不能用舊標準衡量新事物。過去我們將程序視為完全可控的規(guī)則系統(tǒng),但現(xiàn)在需要轉變思維。

理解模型性首先要接受模型的特性,包括幻覺的存在。過度壓制幻覺會扼殺創(chuàng)造力。既然人類也有幻覺,我們就該用管理人類的方式來引導模型——通過質檢、雙重確認等機制來把控質量。

模型性提醒我們要正視模型的特質。創(chuàng)造力與幻覺是一體兩面,若要前者就必須容忍后者。將模型視為仿生體,運用人類管理智慧來引導,這代表著未來的重要方向。

張鵬:回到銷售場景,我理解你們是為復雜業(yè)務定義類似「圍棋」的清晰環(huán)境與邊界,來啟動「商業(yè)強化學習」。這種構建前所未有的環(huán)境、并洞察人機交互的過程,是否正是元理智能創(chuàng)造新的「規(guī)模擴展定律」,釋放更大生產力的核心目標?

張帆:完全正確。但需要強調一個關鍵區(qū)別:圍棋是典型的規(guī)則驅動環(huán)境,搜索空間有限,因此在大模型出現(xiàn)前就已解決。而我們面對的商業(yè)場景,已不再是純粹的規(guī)則驅動,而是模型驅動的。

張鵬:但規(guī)則應該仍然存在吧?就像沙盒游戲,總要有基本邊界和規(guī)則框架,盡管內部交互不是預設的。

張帆:實際上邊界已經相當模糊了。就像極致開放的沙盒游戲,它定義的是底層規(guī)律,然后讓世界自然演化。我認為,今天我們所有的建模本質上都是在「為世界建?!?,但世界本身極其復雜且無法直接觀測,我們只能通過交互反饋來逐步理解。

圍棋可能只有幾十個維度,但如果我們讓三個萬億級參數(shù)的模型相互交互,就形成了萬億乘萬億的規(guī)模。這個空間近乎無限,無法窮舉,也沒有明確邊界。

今天的建模已不僅是對物理結構的還原,更是對心理動態(tài)的模擬,我們不再只是構建分子模型,而是在刻畫人的心理活動。這種轉變讓系統(tǒng)更難以精確解釋,卻也帶來了前所未有的研究價值。

張鵬:這讓我聯(lián)想到合成數(shù)據(jù)。目前業(yè)界似乎形成了一種共識:就是即使心存疑慮,但除了合成數(shù)據(jù)似乎已沒有更可行的路徑?

張帆:作為曾經的 NLP 研究者,我最初也對合成數(shù)據(jù)持懷疑態(tài)度。總覺得這是用百條規(guī)則生成萬條數(shù)據(jù),再用這些數(shù)據(jù)訓練模型,無異于自欺欺人。更擔心會導致過擬合,削弱模型的泛化能力。

但后來我突破了思維定式:為什么規(guī)則數(shù)量一定要少于數(shù)據(jù)?如果能用萬條規(guī)則生成百條數(shù)據(jù),過擬合的問題不就迎刃而解了嗎?這個認知轉變的關鍵在于大模型的出現(xiàn)。當模型擁有上萬億參數(shù),僅用 100 條數(shù)據(jù)進行訓練就能引發(fā)所有參數(shù)的變化,因為這相當于創(chuàng)造了萬億條新規(guī)則。

在這個新時代,我們必須摒棄規(guī)則必須少于數(shù)據(jù)的陳舊觀念。正是這種思維突破讓我們認識到:所構建的環(huán)境與圍棋有著本質區(qū)別,其規(guī)模復雜度已超出傳統(tǒng)表達范疇。

就像正是通過不精確的描述,我們才能激發(fā)出更準確的理解,雖然仍需保持抽象思維,但這本身就成為了一種有效提示方式。

本質上是如何利用模型這個新杠桿。從第一性原理看:蒸汽機讓動力無限擴張,AI 讓智力無限擴張,而在商業(yè)上,這意味著生產力可以無限擴張。理解了這一點,企業(yè)戰(zhàn)略設計就清晰了。合成數(shù)據(jù)只是一個小例子,但它代表一種新杠桿,對知識、對理解世界的杠桿。

04

「到明年 Q2 前,

元理的客戶不會超過 6 個」

張鵬:這件事必然要求商業(yè)組織理解并認同其底層邏輯,并對新生產力環(huán)境有思考和準備。你有了這個 idea 后,有沒有接觸潛在客戶?能不能還原一下:你最早是怎么說服天使客戶的?他們如何理解?你們又是如何展開合作的?

張帆:創(chuàng)業(yè)不能脫離實際。我們必須深入場景,結合技術趨勢與業(yè)務洞察。我們不是靠人寫規(guī)則,而是構建一個能自己轉起來的「飛輪」——但這個飛輪必須落在具體的「田地」上。

我們 6 月底才從智譜離開,7 月注冊公司,8、9 月正式開工。但這兩三個月里,我們已經有了 5-6 家天使客戶共同共創(chuàng)。商業(yè)環(huán)境我創(chuàng)造不了,我只是放大器、是杠桿——而杠桿必須有個支點。所以我們從第一天就開始尋找這樣的企業(yè)。

為什么這些企業(yè)愿意嘗試?實際上有興趣的企業(yè)比我們預想的多。我們并不想做交付公司,而是希望找到通用解,而非個性解。雖然早期難免投入較重,但我們給自己設了上限:到明年 Q2 前,客戶不能超過 6 個。

張鵬:設上限是因為無法同時拆解無限場景嗎?每個客戶是否代表不同場景?否則就變成統(tǒng)一的最佳實踐了?

張帆:是的。要想做出標準產品,就必須從非標準化環(huán)境開始。我們刻意選擇不同行業(yè)的客戶,避免陷入定制化工作流。

我們設上限而非下限,是因為目標不是靠人力解決一兩個客戶問題,而是通過這個過程,摸清理論在真實世界中高清晰度的落地形態(tài)。我希望客戶在 3-6 個月內核心指標發(fā)生質變,成為 AI 原生或深度 AI 增強的企業(yè)。

至于他們?yōu)槭裁丛敢夂献鳎芏嗍呛臀覀冇兴浇坏钠髽I(yè)老板,聊下來覺得理論有道理,就開始了。這些老板想得很清楚:投資 AI 是「微笑曲線」——損失有限,收益無限。就像學游泳,站在岸邊永遠學不會,必須下水。他們先做有限投入嘗試,一旦成功,收益是無限的。

我認為企業(yè)普遍有這類訴求,只是市場還沒有相應供給。這有點像 iPhone 或英偉達——是「單邊需求無限市場」:只要你能把模型轉化為業(yè)務能力,轉化多少都有人愿意用。這個場景空間非常廣闊。

張鵬:不同行業(yè)的客戶需求是否對應不同工種?比如銷售、客服?還是你們會先聚焦特定場景驗證價值閉環(huán)?

張帆:我們確實有明確傾向。首先我們要回答一個根本問題:什么是生產力的最佳標準單元?我們認為答案是「工種」。

在 AI 出現(xiàn)前,SaaS 行業(yè)試圖將「業(yè)務流」作為標準單元,推崇「行業(yè)最佳實踐」。但現(xiàn)實證明這條路從未走通。即使 SAP、Salesforce 也需要大量定制交付,甚至催生了專門的實施服務產業(yè)。

從第一性原理看,SaaS 本質是「為業(yè)務建?!梗祟惤?偸菑囊?guī)則體系開始,而規(guī)則只是真實世界的降維表達。比如醫(yī)生建議「38 度以上吃退燒藥」,這遠非醫(yī)療真相,因為還需考慮年齡、病程、檢驗指標等。納入所有變量會阻礙溝通,最終只能選擇覆蓋 80% 情況的簡化規(guī)則。

當幾十個「80% 規(guī)則」疊加,系統(tǒng)就難以維護。SaaS 將高維業(yè)務壓縮到幾百個維度,必然造成信息損耗和隨機性,就像不同人讀《紅樓夢》寫的摘要都不同但都正確。因此標準化業(yè)務流很難真正泛化。

為什么「工種」能突破局限?舉例來說:兩家相同業(yè)務的火鍋店,A 店的 SaaS 系統(tǒng)直接搬到 B 店需修改 30%-40% 才能使用,但 A 店店長調到 B 店當天就能上崗——因為人腦是高維模型,SaaS 只是低維模型。

我們堅信「工種」作為可泛化、跨行業(yè)復用的單元,也是生產力的最優(yōu)建模單元,優(yōu)勢遠超業(yè)務流,這讓我們對擺脫重交付模式充滿信心。

關于發(fā)展路徑上,我們不會一開始就做上百個工種,而是有所側重。首先,平臺本身是通用架構,底層邏輯是「為學習建模」而非特定職能。其次,早期會優(yōu)先選擇市場最大、成本最高的工種,比如銷售、客服,以及各行業(yè)的專家角色如醫(yī)生、教師,還有 HR、財務、法務等專業(yè)崗位。目前我們首先聚焦于人機交互頻次最高的銷售和客服場景。

準確來說,我們是一所「模型大學」?;P腿缤咧猩髽I(yè)難以直接使用。我們通過專業(yè)培養(yǎng),將其轉化為醫(yī)生、程序員、產品經理等專業(yè)人才,再輸送到企業(yè)崗位。模型產出后需要經過「深造」,才能成為合格的「崗位工人」?;P吞峁┑氖峭ㄓ媒鉀Q方案,我們將其轉化為具備專業(yè)特長的智能體——這種從對稱到不對稱的轉變,實際上放大了模型的整體效能。


張鵬:這個思路很有創(chuàng)新性,但關鍵在于如何實現(xiàn)智能與場景的精準對齊——不是簡單地構建知識庫或工作流,而是讓模型具備持續(xù)進化的能力,成為可批量部署的高級生產力單元。這種「自我進化」的能力才是根本目標。

張帆:我追求的第一性原理就是「自我進化」。學習是連接智能與物理世界的橋梁。既然人和企業(yè)都在持續(xù)變化,固定的知識體系永遠無法滿足動態(tài)需求。因此我不看好定制化的流程智能體,就像造鞋不能只有一個尺碼。

更重要的是,這種方式難以觸及企業(yè)核心業(yè)務。您可能不會讓智能體負責選題策劃,但會用它處理合同審核——標準化功能通常只能勝任邊緣業(yè)務。而我們的目標,是幫助用戶將獨特的經驗能力標準化,形成差異化的競爭優(yōu)勢。

張鵬:對你們來說,客戶自身的認知水平是否至關重要?你們找到了AI能力進化的路徑,那么企業(yè)需要具備哪些條件?業(yè)界常說「問題不在 AI 而在用戶」,你們如何篩選客戶?

張帆:現(xiàn)實往往比理論嚴峻。我們見過太多企業(yè)因焦慮而盲目跟風,選擇了不適合大模型的問題,例如期待投入一百產出五百,用 AI 預測股價或銷量,最終無果而終。問題的根源在決策者。我們篩選客戶主要看三個維度:企業(yè)規(guī)模的示范效應;業(yè)務場景與模型能力的高度匹配;以及決策層具備互信基礎和戰(zhàn)略定力。

許多企業(yè)宣稱「重視 AI」,但只是設立基金、鼓勵用 GPT、舉辦競賽等采購思維遠遠不夠。這同樣是認知偏差,企業(yè)競爭本質是創(chuàng)始人認知的競爭。正如張一鳴所說,除了認知,所有要素皆可配置。早年云計算的案例已證明,是領袖認知決定了企業(yè)的發(fā)展路徑。

AI 轉型不能靠外包或資金投入,因為其本質是業(yè)務重構,需要管理者深入理解 AI 特性,重塑戰(zhàn)略、體驗和組織。企業(yè)領袖投入的時間精力是不可替代的關鍵。有時過度推動適得其反。MIT 研究曾經表明:個體效率提升不等于組織效能優(yōu)化。放任使用 ChatGPT,可能導致「熵增」蔓延,也就是員工各自開發(fā)臨時系統(tǒng),自詡為「AI 化企業(yè)」,但這恰恰是對模型特性理解膚淺的表現(xiàn)。

張鵬:如果老板意識到AI轉型與自己息息相關,希望成為 AI Native 的生產力公司,但現(xiàn)在還不太懂、不太掌握,該從何入手啟動一個正向過程?總不能從頭學模型原理吧,你有什么建議?

張帆:我分享一套標準方法論,幫助企業(yè)以 70-80 分的水平順利啟動 AI 轉型。

AI 落地的核心不在技術本身,而在于業(yè)務。我們?yōu)榇笮推髽I(yè)制定戰(zhàn)略時,首先會深度訪談 20-30 名一線員工,不預設結論,通過梳理實際業(yè)務鏈路找準發(fā)力點。以旅游公司為例,需完整分析從市場投放、內容生產到供應鏈管理的全流程。

第二步,結合企業(yè)自身的商業(yè)與財務模型,量化分析各環(huán)節(jié)成本與核心指標,鎖定可變成本最高的模塊,像是如獲客或服務,確立明確的優(yōu)化目標。

第三步,將 AI 能力與業(yè)務鏈匹配,識別出 30-40 個潛在改進點。通過「業(yè)務+財務+AI 能力」的三維分析,形成清晰的優(yōu)化路徑。

實施階段,我們可以構建二維象限圖,橫軸是業(yè)務價值,縱軸是技術成熟度,優(yōu)先選擇兩者交集最大的「低垂果實」,避開價值低或技術不成熟的領域。

選定 2-3 個關鍵點后,以此制定 AI 戰(zhàn)略:設想這些環(huán)節(jié)實現(xiàn)規(guī)?;嵘?,業(yè)務模式與組織架構將如何演進。接著圍繞具體業(yè)務指標設計智能體方案,秉持快速見效原則,力求 3 個月內實現(xiàn) 5%-10% 的指標提升,關鍵是要用業(yè)務指標而非技術參數(shù)來衡量成效。

通過這種每月可見進展的方式,團隊能持續(xù)積累信心,逐步掌握實施方法。遵循這個框架,就能確保戰(zhàn)略方向不偏離正軌。

*頭圖來源:元理智能

本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO

極客一問

你覺得 AI To B 還有哪些非共識?

AMD 蘇姿豐豪言:AI 業(yè)務年增 80%,硬剛英偉達,搶食億萬蛋糕

點贊關注極客公園視頻號,


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日本的大動作,讓中國感到震驚,給了中方一個不得不出手的理由

日本的大動作,讓中國感到震驚,給了中方一個不得不出手的理由

呂璐說
2025-12-23 19:03:43
勝率跌破5成!阿不都兩雙新疆慘負青島 齊麟16分段昂君18+5三分

勝率跌破5成!阿不都兩雙新疆慘負青島 齊麟16分段昂君18+5三分

醉臥浮生
2025-12-24 21:27:49
極氪汽車正式退市,震驚行業(yè)!

極氪汽車正式退市,震驚行業(yè)!

互聯(lián)網品牌官
2025-12-24 12:36:49
3億多的榮耀OPPO被偷?京東倉庫遭洗劫,內部員工爆料:早有預謀

3億多的榮耀OPPO被偷?京東倉庫遭洗劫,內部員工爆料:早有預謀

烏娛子醬
2025-12-24 14:59:27
美國人,已經癲成了所有人看不懂的樣子

美國人,已經癲成了所有人看不懂的樣子

楓冷慕詩
2025-12-23 17:17:41
劉嘉玲曝林青霞家中的麻將房掛“東方不敗”照片:坐在她家里面打麻將要嚇死了

劉嘉玲曝林青霞家中的麻將房掛“東方不敗”照片:坐在她家里面打麻將要嚇死了

紅星新聞
2025-12-22 18:29:10
高市早苗支持率居高不下!高達75.9%,年輕人支持率突破92%

高市早苗支持率居高不下!高達75.9%,年輕人支持率突破92%

環(huán)球熱點快評
2025-12-24 14:13:34
強生爽身粉致癌案新進展:被判向一患癌女子賠償110億元,創(chuàng)15年來紀錄!后面還有超6.7萬起訴訟

強生爽身粉致癌案新進展:被判向一患癌女子賠償110億元,創(chuàng)15年來紀錄!后面還有超6.7萬起訴訟

每日經濟新聞
2025-12-24 20:45:05
樹立豪華產品標桿,阿維塔以科技開道,打造智能化新時代

樹立豪華產品標桿,阿維塔以科技開道,打造智能化新時代

車壹圈
2025-12-23 17:17:24
他姓胡,曾被視為中共“接班人”之一,58歲官至正國級,今年95歲

他姓胡,曾被視為中共“接班人”之一,58歲官至正國級,今年95歲

大運河時空
2025-12-24 11:50:03
爭議!曝周琦腰反應大恐無緣客戰(zhàn)新疆 重返CBA后從未打過新疆客場

爭議!曝周琦腰反應大恐無緣客戰(zhàn)新疆 重返CBA后從未打過新疆客場

醉臥浮生
2025-12-24 19:24:05
一夜之間,房價的玩笑這次開大了

一夜之間,房價的玩笑這次開大了

重遠投資觀
2025-12-24 12:14:19
南博事件,“舉報人”郭禮典危險了

南博事件,“舉報人”郭禮典危險了

林中木白
2025-12-24 20:19:50
搶瘋了!各地門店大排長龍,排號炒到400元一個!網友:怎么又火了?

搶瘋了!各地門店大排長龍,排號炒到400元一個!網友:怎么又火了?

觀威海
2025-12-24 10:14:23
龐家后人硬剛新華社!七條質疑炸鍋,香港媒體敢報的真相太炸裂了

龐家后人硬剛新華社!七條質疑炸鍋,香港媒體敢報的真相太炸裂了

小蜜情感說
2025-12-24 12:21:12
攤牌了,日本反咬美國,用“自殺式豪賭”拉美國下水!

攤牌了,日本反咬美國,用“自殺式豪賭”拉美國下水!

局勢帝
2025-12-24 15:32:32
無恥下作還不夠,還要明目張膽地硬搶!

無恥下作還不夠,還要明目張膽地硬搶!

胖胖說他不胖
2025-12-24 14:47:25
家長沸騰!中小學或迎新改革,將于2026年2月1日起施行

家長沸騰!中小學或迎新改革,將于2026年2月1日起施行

老特有話說
2025-12-24 12:31:24
黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術,兒子很像楊穎

黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術,兒子很像楊穎

笑飲孤鴻非
2025-12-24 01:09:08
華為路由 X3 Pro硬剛1000㎡防空洞火鍋店?

華為路由 X3 Pro硬剛1000㎡防空洞火鍋店?

極果酷玩
2025-12-24 22:10:46
2025-12-25 00:27:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11695文章數(shù) 78745關注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

體育要聞

26歲廣西球王,在質疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

時尚
本地
親子
房產
數(shù)碼

對不起周柯宇,是陳靖可先來的

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

親子要聞

三部委出手治理幼兒園收費亂象:叫?;ㄊ绞召M、隱形賬單

房產要聞

硬核!央企??谝痪€江景頂流紅盤,上演超預期交付!

數(shù)碼要聞

AMD Zen 6與Intel Nova Lake或將上演288 MB 3D緩存“大戰(zhàn)”

無障礙瀏覽 進入關懷版