国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

<samp id="sqwko"><kbd id="sqwko"></kbd></samp>

<table id="sqwko"><dl id="sqwko"></dl></table>

<samp id="sqwko"></samp>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊免費(fèi)郵箱

注冊VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動(dòng)端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

“現(xiàn)在的AI就像1880年的笨重工廠！”微軟CSO斯坦福潑冷水：別急著造神

2026-03-05 18:28:23　來源: CSDN

北京舉報(bào)

0

分享至

大模型仍未對上商業(yè)的齒輪？

編譯 | 王啟隆

來源 | youtu.be/aWqfH0aSGKI

出品丨AI 科技大本營（ID：rgznai100）

現(xiàn)在的硅谷，空氣里都飄著一股“再不上車就晚了”的焦躁感。

最近 OpenClaw 風(fēng)頭正旺，強(qiáng)勢登頂 GitHub，終結(jié)了 React 神話，許多人更是覺得“AI 自己干活賺錢”的日子就在明天了。

特別是在斯坦福商學(xué)院（GSB）這種地方，臺下坐著的都是成天琢磨怎么用下一個(gè)技術(shù)風(fēng)口搞個(gè)獨(dú)角獸出來的狠人。

微軟的首席科學(xué)官（CSO）Eric Horvitz被請到了這個(gè)幾乎全美最想用 AI 變現(xiàn)的禮堂里。作為從上世紀(jì) 80 年代就開始搞 AI 的絕對老炮、也是微軟技術(shù)底座的“掃地僧”，這位老哥并沒有順著臺下的胃口，去吹捧下個(gè)月大模型又要顛覆什么行業(yè)，而是兜頭給大家澆了一盆帶點(diǎn)學(xué)術(shù)味的冷水。

他講了一個(gè)挺有畫面感的比喻：大家都在聊 AI 馬上要爆發(fā)，但這感覺就像 1880 年代人類剛弄出電動(dòng)機(jī)的時(shí)候。那時(shí)候的工廠怎么用電？他們搞個(gè)巨大的中央滑輪，扯著無數(shù)根笨重的皮帶，生硬地去連接各個(gè)工作臺。看起來是通電了，實(shí)際上別扭得很。

Horvitz 把這叫作“阻抗失配（Impedance Mismatch）”。說白了，就是現(xiàn)在牛逼哄哄的底層大模型，跟現(xiàn)實(shí)商業(yè)世界的組織架構(gòu)和運(yùn)轉(zhuǎn)方式，其實(shí)根本就沒對上齒輪。

這篇足足 55 分鐘的對話非?！胺垂沧R”。Eric 直言現(xiàn)在的模型連最基本的“概率校準(zhǔn)”都做不到（也就是一本正經(jīng)地胡說八道且不知道自己有多不靠譜）；他甚至毫不客氣地扒下了醫(yī)療 AI 的底褲，說在 A 醫(yī)院好用的模型，直接端到 B 醫(yī)院去其實(shí)根本跑不通。

在這個(gè)所有人都恨不得把各種 Agent 供在神壇上的節(jié)點(diǎn)，聽聽這位真正在工業(yè)界和科學(xué)界摸爬滾打了幾十年的老兵怎么吐槽當(dāng)下的行業(yè)現(xiàn)狀，可能會讓你對這個(gè)草莽時(shí)代多幾分其他視角的理解。

以下為這場斯坦福 AI@GSB 對話的完整實(shí)錄。

尋找 AI 時(shí)代的“皮帶與滑輪”

Jennifer Aaker（斯坦福商學(xué)院 General Atlantic 教授）：我是 Jennifer Aaker，非常榮幸能為大家介紹 Eric Horvitz。他今天來到了現(xiàn)場，將與 Sarah Soule 院長在爐邊進(jìn)行對話。Eric 是微軟的首席科學(xué)官，很長一段時(shí)間以來，他一直致力于在人工智能、社會與科學(xué)的交叉前沿領(lǐng)域進(jìn)行探索。

很多年前我就認(rèn)識了 Eric。他是斯坦?！耙匀藶楸救斯ぶ悄苎芯吭骸保℉AI）的董事會成員。在那個(gè)背景下，以及在更廣泛的領(lǐng)域里，他是我見過的最具思想深度、最有意圖性（intentional）、最具體恤人類精神（humanistic）的思考者之一。

幾十年來，他一直是“以人為本的人工智能”領(lǐng)域極具影響力的聲音。他發(fā)起了斯坦福大學(xué)的“人工智能百年研究”項(xiàng)目（AI100），也是“AI 伙伴關(guān)系”（Partnership on AI）的聯(lián)合創(chuàng)始人。他曾作為國會任命的委員，任職于美國國家人工智能安全委員會，同時(shí)也是斯坦福 HAI 的杰出研究員?？傊?，他是一個(gè)非常好的人。

很高興他今天能來到這里。我覺得他身上最了不起的一點(diǎn)，是他對“人類繁榮（human flourishing）”的深刻承諾，而這也是他十多年前就已經(jīng)在談?wù)摰脑掝}。在今天關(guān)于 AI 的海量對話中，我們都在思考：什么是“主體性（agency）”？什么是“同理心（empathy）”？在設(shè)計(jì)這些技術(shù)工具時(shí)，融入這些理念意味著什么？最根本的是，技術(shù)究竟該如何去“增強(qiáng)（augment）”人類，而不是“取代”人類？

Eric 不僅僅是在寫這些東西，他也在身體力行。曾經(jīng)有人告訴我，他在微軟指導(dǎo)過的門生（mentees）比公司里的任何人都多。他的行事風(fēng)格充滿了善意。帶著這份敬意，我想歡迎 Eric Horvitz 和 Sarah Soule。

Sarah A. Soule（斯坦福商學(xué)院院長）：非常感謝 Jennifer 剛才那段無比慷慨的介紹。Eric，能和你坐在一起對話，看到這么多感興趣的學(xué)生、教職員工齊聚一堂，真是一件令人愉悅的事。歡迎大家來到這場爐邊談話。

Eric Horvitz：謝謝你們邀請我。

Sarah A. Soule：我們非常高興。Eric，我想先從你過去曾說過的一個(gè)觀點(diǎn)開始。你之前描述過，我們正處于一個(gè)快速轉(zhuǎn)型的時(shí)刻，并且這將是人類生存軌跡中，極少數(shù)能從根本上改變發(fā)展方向的“罕見快速轉(zhuǎn)型期”之一。我想問你，如果你從現(xiàn)在起往回看——假設(shè)站在 20 年后往回看，你認(rèn)為后人會如何銘記我們現(xiàn)在所處的這個(gè)時(shí)期？

Eric Horvitz：你提到“20 年”，這很有意思。我經(jīng)常思考的是，如果站在 700 年后的時(shí)間點(diǎn)往回看，歷史書上肯定會給這個(gè)時(shí)期專門命名。書里會有圖表，會用某些特定的色彩來描繪這個(gè)時(shí)代，它肯定會有一個(gè)專屬的名字——雖然我現(xiàn)在還不知道那名字會是什么。

至于 20 年后，這很有趣。當(dāng)我聽到“20 年”這個(gè)時(shí)間跨度，我腦海中浮現(xiàn)的是其他通用目的技術(shù)（general-purpose technologies），比如電力和蒸汽機(jī)。

你知道，蒸汽機(jī)大約是在 1769 年或 1770 年左右出現(xiàn)第一批可用發(fā)明的。但直到大約 100 年后，它們才真正進(jìn)入并在工業(yè)界展現(xiàn)出變革性的力量。電力大概是在 1880 年代出現(xiàn)的，然后它也是經(jīng)歷了數(shù)十年的慢慢滲透，才真正產(chǎn)生了廣泛的影響。

所以，我可以承認(rèn) AI 的發(fā)展速度可能會比蒸汽機(jī)或電力快得多——尤其是現(xiàn)在我們都已經(jīng)“通電”了，基礎(chǔ)設(shè)施都在那里。但我認(rèn)為，20 年后我們回顧現(xiàn)在，會把這個(gè)時(shí)期看作是一個(gè)“早期部署、早期實(shí)施”的階段。

在這個(gè)階段，會有很多人關(guān)注：在這個(gè)時(shí)期里，人們到底有多么深的遠(yuǎn)見？有多么強(qiáng)烈的焦慮？又有多少期望？

我不認(rèn)為在蒸汽機(jī)或電力崛起的時(shí)代，會有這樣一群觀眾坐在這里聽這樣一個(gè)關(guān)于技術(shù)未來的話題；或者像飛行技術(shù)的誕生之初，我也不認(rèn)為有很多人去深入思考我們是否應(yīng)該確立規(guī)范——比如，我們是否應(yīng)該從這些飛行器上投擲燃燒裝置？而現(xiàn)在，我們正在進(jìn)行各種各樣有趣的深思熟慮，看到大家對“如何引導(dǎo)這項(xiàng)技術(shù)”如此感興趣，這真的很讓人感到溫暖。

所以我想，回顧過去，我們會說：“哇，那就是一切開始的地方?！钡词故?20 年后，我們依然會處于一個(gè)快節(jié)奏的轉(zhuǎn)型期，我不認(rèn)為一切會在 20 年內(nèi)就完全收斂并塵埃落定。

Sarah A. Soule：我非常高興你能成為目前這些討論和深思熟慮的一部分。我也希望，在 20 年后，人們會認(rèn)為你是這個(gè)時(shí)代的英雄之一。

Eric Horvitz：哦，我倒不奢望走那么遠(yuǎn)（笑）。只要我做出的貢獻(xiàn)能在沿途幫到大家，讓事情變得好一點(diǎn)點(diǎn)，我就很樂意被大家遺忘了。

Sarah A. Soule：既然談到了如何讓事情變得更好，全國各地、甚至全世界的學(xué)生，現(xiàn)在都在聽到很多關(guān)于“確保自己具備 AI 素養(yǎng)”的建議。事實(shí)上，我們在 GSB 的 AI 倡議一直非常有針對性地通過一些工作坊（包括今晚由 Celeste Bean 舉辦的）來確保這一點(diǎn)。

你參與了許多跨越工業(yè)界、政策界和學(xué)術(shù)界的辯論與討論。針對目前的情況——在一個(gè)知識和能力正輕易被 AI “商品化（commoditized）”的世界里，你會給我們的學(xué)生（無論是 MBA 還是本科生）什么建議？他們現(xiàn)在應(yīng)該投資學(xué)習(xí)什么？此外，對于那些在當(dāng)下這種飛速變化中感到真切焦慮的學(xué)生，你有什么最好的建議？

Eric Horvitz：首先我好奇的是，想聽聽在這個(gè)極其特殊的歷史時(shí)刻，你們腦海中那種焦慮與興奮交織的狀態(tài)到底有多強(qiáng)烈。這真的是人類歷史上的一個(gè)頂點(diǎn)（vertex）——你們正在經(jīng)歷、觀察、吸收這些正在發(fā)生（以及可能發(fā)生）的變化，并且討論這對你們的職業(yè)生涯意味著什么。

尤其是在一個(gè)教育項(xiàng)目中，特別是在商學(xué)院的 MBA 項(xiàng)目里——這里有來自不同背景的學(xué)生，但 MBA 項(xiàng)目本質(zhì)上源自彼得·德魯克（Peter Drucker）的世界，它關(guān)乎將商業(yè)視為一門科學(xué)，關(guān)乎如何引導(dǎo)和思考生產(chǎn)、價(jià)值與利潤。

我的第一反應(yīng)是，對于人們（包括管理和商業(yè)領(lǐng)域的人）來說，思考如何將這些技術(shù)初步部署下去，存在著巨大的機(jī)遇。

回到我之前的評論：人們最初其實(shí)并不知道如何在工業(yè)中部署電力。你們可能見過那些老照片——一個(gè)巨大的中央滑輪，連著無數(shù)根皮帶，笨拙地向各個(gè)工作臺輸送動(dòng)力，人們甚至不愿意去思考是否應(yīng)該為每臺機(jī)器配備獨(dú)立的電機(jī)。這只是一個(gè)隱喻，說明我們在面對現(xiàn)在的技術(shù)時(shí)，需要做大量的思考。

我們面臨著一種“阻抗失配（impedance mismatch）”——即商業(yè)流程、組織結(jié)構(gòu)及其運(yùn)作方式，與這些底層基礎(chǔ)技術(shù)、核心生產(chǎn)力技術(shù)之間的錯(cuò)位。思考如何將這些自身也在不斷進(jìn)化的 AI 技術(shù)交織融入進(jìn)去，是一項(xiàng)巨大的工程。

在我們的腦海中，我們還需要對“AI 到底是什么”建立一種感知。對我來說——我 80 年代中期在斯坦福大學(xué)，1990 年完成了博士學(xué)位——AI 是一幅極其豐富的掛毯，是一個(gè)由各種技術(shù)組成的星座。盡管現(xiàn)在大家都在將其同質(zhì)化，言必稱“深度神經(jīng)網(wǎng)絡(luò)”以及它們在頂層是如何被訓(xùn)練的，但它依然是一幅廣闊的圖景，隨著時(shí)間的推移，它會變得更加細(xì)分。

所以，這不僅僅是思考“Claude、ChatGPT 或 Gemini 將被如何使用”。本質(zhì)上，你需要更深入地了解這項(xiàng)技術(shù)，理解“深度思考”、“決策制定”、“管理”、“監(jiān)督”和“創(chuàng)造力”的機(jī)會在哪里。這才是推動(dòng)我們走向 20 年后，甚至走向前面提到的“700 年后”的動(dòng)力。這是一個(gè)非常豐富的機(jī)會空間。

所以我建議：找到你的熱情所在，深入挖掘你的熱情，思考AI 的相關(guān)性；走向跨學(xué)科（interdisciplinary），因?yàn)槟惚仨氁愿鼜V闊的視角思考；然后看看現(xiàn)在人們在做什么，努力超越當(dāng)下的炒作，去真正融合并應(yīng)用它。

Sarah A. Soule：我很喜歡這個(gè)觀點(diǎn)。這也觸及了我們在幾周前的預(yù)備電話里談到的事情。我們在思考，我們需要為學(xué)生提供什么。我經(jīng)常跟學(xué)生說，當(dāng)他們被允許保持好奇心并試圖滿足這種好奇心時(shí)，他們就處于最佳狀態(tài)；而當(dāng)我們的教職員工帶著好奇心提出有趣的科研問題時(shí)，他們也處于最佳狀態(tài)；當(dāng)我們的員工帶著好奇心與師生互動(dòng)時(shí)，他們同樣處于最佳狀態(tài)。這就是我們建立我們想要的文化的方式之一，這同樣需要慷慨的精神，需要彼此寬容并互相給予恩典，我們需要將這些融入到文化中。

在幾個(gè)星期前我們交流時(shí)，你談到了很多關(guān)于“好奇心”的內(nèi)容，現(xiàn)在你又提到了。你能否展開講講？因?yàn)槲蚁氪蠹叶紩芨信d趣：在這個(gè) AI 時(shí)代，你如何看待“人類與 AI 協(xié)作”作為一種推動(dòng)人們解決他們以前無法處理的問題和想法的方式？

Eric Horvitz：我一直熱衷于思考計(jì)算機(jī)如何幫助人們進(jìn)行認(rèn)知、解決問題和探索。幾十年來，這一直是我的熱情所在?！叭祟惻c AI 的協(xié)作”這個(gè)詞在大概 23、25 年前還是個(gè)很奇怪的概念，那時(shí)我們開始展示一些技術(shù)，清晰地描繪了這種機(jī)會空間可能是什么樣子的。

根據(jù)我們對人類認(rèn)知基底（cognitive substrate）的了解，什么是邊界？認(rèn)知心理學(xué)家通常會描述我們在能力上的差距，作為人類我們的優(yōu)勢是什么。

當(dāng)然，我們在很多方面各不相同，但有一個(gè)我們多年來逐漸了解的人類共性基礎(chǔ)。早年我在想，建立一個(gè)能深刻理解這一點(diǎn)的計(jì)算系統(tǒng)，知道應(yīng)該在哪里介入、在哪里支撐、在哪里退后，并且在此基礎(chǔ)上不僅應(yīng)對互補(bǔ)性的挑戰(zhàn)，還能理解“主動(dòng)性（initiative）”——計(jì)算系統(tǒng)何時(shí)應(yīng)該向前一步，何時(shí)應(yīng)該退后？人類駕駛員何時(shí)應(yīng)該理解如何以及何時(shí)使用這些機(jī)器，以增強(qiáng)自身的探索能力、獲取答案以及更廣泛地解決問題？

現(xiàn)在回想起來，這真是太美妙了?？粗F(xiàn)在的技術(shù)，有些人正在學(xué)習(xí)如何使用像 GPT、Claude 和 Gemini 這樣的通用工具來適當(dāng)?shù)亍疤崾荆╬rompt）”它們，并把自己置于“駕駛員”的位置——他們帶來目標(biāo)，帶來非常人性化的一套目標(biāo)體系、偏好、好奇心和方向，然后利用這些系統(tǒng)作為向?qū)?。通過引入新的效率來進(jìn)行模擬、探索，擴(kuò)展可能性的集合，我認(rèn)為這些系統(tǒng)在人與人的互動(dòng)、國家與國家的互動(dòng)中會非常有幫助。希望能帶來一場文藝復(fù)興。

你可以將這個(gè)領(lǐng)域命名為：材料科學(xué)、生物學(xué)與醫(yī)療保健、教育……挑選你的領(lǐng)域，生產(chǎn)制造、效率等等。我認(rèn)為這些優(yōu)化、整合、證據(jù)收集與綜合、專業(yè)化、泛化以及涌現(xiàn)概念的工具，將改變一切。

智能體（Agent）的崛起與“防偽印章”

Sarah A. Soule：你在那次對話中用了一個(gè)很棒的詞。我想是關(guān)于“可能性的邊緣（the edge of possibility）”，對吧？

Eric Horvitz：是的。作為微軟的研究總監(jiān)，我經(jīng)常會對我們在世界各地實(shí)驗(yàn)室的同事說：“你們真的在探索可能性的邊緣嗎？”

我們當(dāng)時(shí)會停下來思考那是什么意思。在幾個(gè)月或一年前，去探索那些在那個(gè)前沿領(lǐng)域被認(rèn)為不僅是不可能、甚至連想都不會去想的事情。

今天，我認(rèn)為一些人正在研究不僅是將如何應(yīng)用像 MedPaLM 這樣的模型于臨床醫(yī)學(xué)，還要看它在你自己的數(shù)據(jù)集、你自己的受眾上的表現(xiàn)。

我最近在美國國家醫(yī)學(xué)院的會議上分享了一個(gè)重要秘密：大家聽好了，最大的秘密是，這些醫(yī)療大模型不具備可移植性（not portable）。

你不能只是把它們從 A 醫(yī)院拿到 B 醫(yī)院，然后期望它們能完美運(yùn)行。多年前我們在傳統(tǒng)的機(jī)器學(xué)習(xí)模型上就發(fā)現(xiàn)了這一點(diǎn)。所以，你需要深入思考：不僅僅是決策制定，甚至包括轉(zhuǎn)錄（transcription），你都要非常清晰地思考潛在的錯(cuò)誤，思考它意味著什么，以及它在特定環(huán)境下的表現(xiàn)。事實(shí)上，未來幾年，這需要進(jìn)行隨機(jī)臨床試驗(yàn)（randomized clinical trials）來理解這些 AI 工具在醫(yī)療服務(wù)中的真正作用。

我對這些模型展現(xiàn)出的潛力感到興奮，但我們也看到了人們將它們推向我們所謂的“人工智能家族（artificial intelligence family）”的未知領(lǐng)域。

Sarah A. Soule：你能詳細(xì)說說，當(dāng)真實(shí)性變得模糊時(shí)，尤其是在深度偽造和幻覺面前，我們該怎么辦？

Eric Horvitz：2015 年左右，我開始看到一些零星的跡象。事實(shí)上，最早引起我注意的是斯坦福大學(xué)計(jì)算機(jī)科學(xué)團(tuán)隊(duì)的一個(gè)關(guān)于 Deepfake 的展示。他們展示了如何構(gòu)建一個(gè)系統(tǒng)，把文字放入一個(gè)政治家的嘴里。我當(dāng)時(shí)對這印象極其深刻，當(dāng)然大家也都說“別擔(dān)心，這只是一個(gè)計(jì)算機(jī)視覺/圖形學(xué)的演示?！边@些都在實(shí)驗(yàn)室緊閉的大門后進(jìn)行，大家覺得很酷，有人還能就此寫篇博士論文。

但我當(dāng)時(shí)做了一個(gè)演講，說這件事未來會走向何方。那還是 9 到 10 年前?，F(xiàn)在我們就在這里了。

一路上，在微軟內(nèi)部以及在政府和公民社會的各個(gè)團(tuán)隊(duì)中，我一直在強(qiáng)調(diào)，一旦你創(chuàng)造出這樣的技術(shù)，你就必須進(jìn)行紅藍(lán)對抗，并攻擊它，以確保解決方案本身不會成為問題。

最近發(fā)生了一件事，我們發(fā)布了一份 54 頁的內(nèi)部微軟研究報(bào)告，我讓團(tuán)隊(duì)進(jìn)行了“紅隊(duì)測試”：人們會如何利用這些工具？這讓你認(rèn)為，那些底特律的群眾并沒有真正在歡迎卡馬拉·哈里斯（Kamala Harris），或者反之亦然。我們必須思考其中的可能性。

好消息是，這項(xiàng)研究的最終結(jié)果，是提出了一種被稱為內(nèi)容溯源（media provenance）的高可信度身份驗(yàn)證方法。簡單來說，就是給攝像頭和麥克風(fēng)捕捉到的內(nèi)容蓋上一個(gè)“加密的蠟封（cryptographic wax seal）”。你可以看到這個(gè)印章在顯示端的終端是未破損的。

這后來變成了現(xiàn)在的 C2PA（內(nèi)容溯源和真實(shí)性聯(lián)盟）標(biāo)準(zhǔn)。這是所有大型科技公司、相機(jī)公司等都在使用的標(biāo)準(zhǔn)。但我們必須走得更遠(yuǎn)，因?yàn)橐坏┠銊?chuàng)建了這樣一個(gè)有前景的解決方案，你也必須進(jìn)行紅隊(duì)測試，攻擊它以確保它確實(shí)安全。就在兩天前，我們發(fā)布了一份 54 頁的報(bào)告，探討人們?nèi)绾卫眠@些帶有“蠟封”的技術(shù)，讓你誤以為并沒有發(fā)生的事情發(fā)生了，或者反過來。

這也是整個(gè)生態(tài)系統(tǒng)需要去思考的：不僅僅是普通的特異性和敏感性、診斷的準(zhǔn)確率，還要思考一旦這些系統(tǒng)被部署，會有哪些極其災(zāi)難性的失敗。

此外，還有智能體市場（Agentic Marketplaces）的問題。十年內(nèi)，如果存在買賣和中間過程的代理人（proxies），而我們各自都有自己的代理人，這將形成一個(gè)由智能體互動(dòng)的完整經(jīng)濟(jì)體。

我們最近發(fā)表了一篇關(guān)于“即將到來的智能體市場”的論文。我們開發(fā)了一個(gè)模擬工具，你可以下載并進(jìn)行實(shí)驗(yàn)。我們觀察當(dāng)我們釋放出原型的 Agent 去購買、出售和安排日程時(shí)會發(fā)生什么。

如果你把這些工具放出去，卻不思考關(guān)于人類主體性和自我尊嚴(yán)的深層問題——不把它們設(shè)計(jì)成注重保護(hù)和培育人類自主權(quán)、個(gè)體性與智力的機(jī)器，那是很危險(xiǎn)的。這也是為什么目前公眾有如此強(qiáng)烈的焦慮。這種焦慮是有道理的。

醫(yī)療與科研：AI 不能“即插即用”

Sarah A. Soule：好的，我想現(xiàn)在是我們開放給學(xué)生提問的好時(shí)機(jī)。我們有話筒傳遞員，如果有同學(xué)想提問，請舉手。

Serena（MS/MBA 學(xué)生）：非常感謝您今天能來。我是 Serena，是管理科學(xué)與工程系的碩士生，本科也是數(shù)據(jù)科學(xué)背景。我想問的是，隨著我們邁向下一階段的 AI 部署，您認(rèn)為在模型評估、安全評估，特別是 AI 生態(tài)系統(tǒng)的治理和新興標(biāo)準(zhǔn)方面，最重要且懸而未決的問題是什么？

Eric Horvitz：關(guān)于這個(gè)問題，我有很多想說的，但我先從這一點(diǎn)開始：對于所有大語言模型的狂熱慶祝和大量投資，我們目前其實(shí)不知道如何對它們進(jìn)行概率上的校準(zhǔn)（calibrate them probabilistically）。

這些系統(tǒng)被用于在決策環(huán)境中提出建議。在這樣的環(huán)境里，世界必須提出要求：“如果你要說些什么，我需要一個(gè)關(guān)于它真實(shí)性的概率（probability of its truth）。我需要你有良好校準(zhǔn)的置信度?！?/p>

對我來說，在更安全的系統(tǒng)中，這將會大有作為，因?yàn)槲覀兙涂梢园堰@些輸出整合到我們自己的效用函數(shù)（utility functions）中，或者說成本收益模型中，并理解如何使用這些系統(tǒng)，以及在評估時(shí)如何認(rèn)真對待它們。所以除了安全性、控制等問題之外，我最近在想，在廣泛的筆刷下，我們投入了大量的時(shí)間和精力在安全問題上——包括測試指標(biāo)、評估，我們也與斯坦福的團(tuán)隊(duì)在諸如 MedHelm 等臨床醫(yī)學(xué)指標(biāo)上合作，以衡量這些系統(tǒng)的表現(xiàn)——提出了一些有趣的工具來保證這些通用模型的安全，確保它們生成的內(nèi)容的安全。

但我認(rèn)為，目前真正的盲點(diǎn)在于如何實(shí)現(xiàn)概率校準(zhǔn)。這對于高風(fēng)險(xiǎn)決策極其重要。

Ulugbek（醫(yī)學(xué)院學(xué)生）：您好，我是 Ulugbek，醫(yī)學(xué)院的學(xué)生。我的問題與 AI 在醫(yī)療保健中的日益普及有關(guān)。您認(rèn)為我們在醫(yī)療領(lǐng)域面臨的主要挑戰(zhàn)是：提升 AI 模型本身的性能，還是改善機(jī)構(gòu)利用 AI 進(jìn)行決策的方式？

Eric Horvitz：我明白你的意思，你是問如何在“提高模型表現(xiàn)”與“改善機(jī)構(gòu)決策”之間做區(qū)分。

這絕對是相互依存的（interdependent）。如果你在診斷和治療規(guī)劃方面擁有更高性能的能力，那這些考慮在機(jī)構(gòu)如何融合、應(yīng)用這項(xiàng)技術(shù)上就變得非常核心。

我的直覺是，那些表現(xiàn)出色的模型通常并不能做到完全便攜。如我所說，你不能指望它們在不同醫(yī)院間“即插即用”。過去幾年我們發(fā)現(xiàn)在傳統(tǒng)的機(jī)器學(xué)習(xí)模型中，表現(xiàn)極佳的模型在換了環(huán)境后就不行了。這就要求我們在本地機(jī)構(gòu)有能力在本地?cái)?shù)據(jù)上進(jìn)行微調(diào)和校準(zhǔn)，以確保模型在特定人群和特定工作流中實(shí)際有效。

所以，不僅是單純的性能，還涉及到這套系統(tǒng)的“適應(yīng)性”。其次，如何利用它們來協(xié)助決策，而不會引發(fā)意外的偏見或加劇現(xiàn)有的不平等，這也是醫(yī)療機(jī)構(gòu)必須在制度層面建立的護(hù)欄。

Ben（MBA 學(xué)生）：您好，我是 Ben，商學(xué)院 MBA 學(xué)生。我想問一個(gè)關(guān)于您之前提到的“蒸汽機(jī)和鋼鐵”的比較。您說即便 20 年后，我們可能仍在經(jīng)歷有意義的、甚至是地震般的巨變。您如何將這一點(diǎn)與目前大量涌入該領(lǐng)域的興奮、炒作和資金結(jié)合起來？您是否認(rèn)為大多數(shù)人同意您的觀點(diǎn)，即我們正在玩一場真正長期的游戲？還是您認(rèn)為我們會看到短期的地震級轉(zhuǎn)變，同時(shí)也要期待長期的價(jià)值顯現(xiàn)？

Eric Horvitz：謝謝你提出這個(gè)非常有洞察力的問題。我想我們必須為驚喜（surprises）做好準(zhǔn)備。

驚喜在于，AI 在某些方面的移動(dòng)速度將遠(yuǎn)超我們的預(yù)期，而在另一些方面，其移動(dòng)速度又會比我們想象的慢得多。取決于你關(guān)注的是哪個(gè)維度。

我預(yù)計(jì)，在解決一些我們過去認(rèn)為極其困難、可能需要幾十年才能解決的長期科學(xué)挑戰(zhàn)上，我們將看到突破。我們已經(jīng)看到了 AlphaFold 這樣的例子，在生物學(xué)和醫(yī)學(xué)上，AI 將極大加速新藥的發(fā)現(xiàn)、疾病的理解，甚至治愈某些頑疾。在這些領(lǐng)域，它可能帶來的“地震”就在眼前，或者在接下來的 10 到 15 年內(nèi)。

但在另一方面，日常工作流程的改變，人類社會組織架構(gòu)對這項(xiàng)技術(shù)的吸收——這種屬于“社會技術(shù)（socio-technical）”范疇的事情，往往會慢得多。因?yàn)檫@涉及到改變?nèi)说牧?xí)慣、改變法律、改變權(quán)力和利益的分配。所以，盡管資金和熱情瘋狂涌入，期望在短時(shí)間內(nèi)看到所有商業(yè)模式被顛覆，但這其中必然充滿摩擦。這也是為什么我反復(fù)強(qiáng)調(diào)“阻抗失配”。

我們應(yīng)該準(zhǔn)備好迎接一場長期的轉(zhuǎn)型。那些純粹為了短期的、吹噓性質(zhì)的炒作而投入的資本，可能會面臨失望。但對于那些致力于在科研突破、醫(yī)療革新以及建立真正安全的 AI 基礎(chǔ)設(shè)施上進(jìn)行長期投資的人來說，這種價(jià)值是無法估量的。

希望有一天，我們能迎來一個(gè)“關(guān)懷經(jīng)濟(jì)（caring economy）”的崛起，而不是一個(gè)純粹由機(jī)器主導(dǎo)的效率社會。

（投稿或?qū)で髨?bào)道：zhanghy@csdn.net）

未來沒有前后端，只有 AI Agent 工程師。

這場十倍速的變革已至，你的下一步在哪？

4 月 17-18 日，由 CSDN 與奇點(diǎn)智能研究院聯(lián)合主辦「2026 奇點(diǎn)智能技術(shù)大會」將在上海隆重召開，大會聚焦 Agent 系統(tǒng)、世界模型、AI 原生研發(fā)等 12 大前沿專題，為你繪制通往未來的認(rèn)知地圖。

成為時(shí)代的見證者，更要成為時(shí)代的先行者。

奇點(diǎn)智能技術(shù)大會上海站，我們不見不散！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
波士頓機(jī)器狗練成“輕功”！連續(xù)七個(gè)后空翻

量子位 2025-09-07 01:03:18
21 跟貼 21

五八智能四足機(jī)器人平臺Q20A，適用于千行百業(yè)

量子位 2025-09-30 15:35:41
0 跟貼 0

荒野求生（機(jī)器狗全自主版），2025ATEC挑戰(zhàn)真實(shí)戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0

行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡智機(jī)器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0

周鴻祎談“龍蝦”爆火：很快就能“一鍵安裝”

大象新聞 2026-03-09 11:37:43
253 跟貼 253
首個(gè)物理AI數(shù)據(jù)基座平臺“無垠”落戶浙江，專治機(jī)器人數(shù)據(jù)荒

量子位 2026-03-09 18:39:03
0 跟貼 0

高通萬衛(wèi)星談終端大模型優(yōu)勢：個(gè)性化與數(shù)據(jù)推理

量子位 2025-12-11 03:38:41
0 跟貼 0
機(jī)器人管家Figure 03來了，承包一切家務(wù)！

量子位 2025-10-11 10:13:00
0 跟貼 0
陶哲軒：AI看似在推理，其實(shí)是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
打敗GPT-5.2，嵌入真實(shí)工業(yè)生產(chǎn)，這個(gè)大模型什么來頭？

量子位 2026-03-09 15:44:13
1 跟貼 1
對話南理工楊劍飛：機(jī)器人走進(jìn)家庭之前，必須先學(xué)會如何與人共處

DeepTech深科技 2025-12-28 18:38:06
0 跟貼 0
Claude考場突然「覺醒」，自行寫代碼偷答案！人類考試，管不住AI了

新智元 2026-03-09 19:50:11
1 跟貼 1
人活著的唯一理由是善良

葉檀財(cái)經(jīng) 2026-02-01 17:07:04
0 跟貼 0
a16z最新訪談：SaaS已死為時(shí)尚早，AI落地最大瓶頸已經(jīng)不是模型智商

華爾街見聞官方 2026-03-09 22:49:07
0 跟貼 0
“AI龍蝦”霸屏，“一人公司”迎來爆發(fā)點(diǎn)？

每日經(jīng)濟(jì)新聞 2026-03-09 23:43:12
0 跟貼 0
微軟“玻璃硬盤”登Nature，可存上萬年

量子位 2026-03-10 01:53:40
0 跟貼 0
Kinect：游戲機(jī)外設(shè)如何成為科研神器？

量子位 2026-01-21 00:24:22
0 跟貼 0
微軟Xbox亮劍Helix 索尼恐被迫提前亮牌PS6？

游民星空 2026-03-09 20:09:15
18 跟貼 18
微軟CEO薩提亞·納德拉與新任游戲部門負(fù)責(zé)人阿莎·夏爾馬問答對話：重新評估Xbox發(fā)展戰(zhàn)略絕不忽視現(xiàn)有根基

游戲早知道 2026-03-10 00:09:29
0 跟貼 0
AI為什么沒法讓人快速變聰明？

白話頻道 2026-03-07 01:07:39
0 跟貼 0
30年數(shù)學(xué)懸案，Claude一小時(shí)破解，88歲圖靈獎(jiǎng)得主震驚

量子位 2026-03-07 20:19:13
0 跟貼 0
法老控45周年；日本一新作官宣；納德拉談?dòng)螒?；Epic送生存射擊 | 3月10日游戲日報(bào)

游戲圈那些事兒 2026-03-10 01:09:38
1 跟貼 1
微軟CEO重申對游戲"長期投入"！Xbox玩家先吃定心丸

游民星空 2026-03-09 21:13:33
0 跟貼 0
充氣模型如何騙取導(dǎo)彈

純白的夢j 2026-03-07 07:35:38
0 跟貼 0
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
9 跟貼 9
無需訓(xùn)練、即插即用，這個(gè)解碼方法讓模型學(xué)會謹(jǐn)慎思考

DeepTech深科技 2026-02-23 20:21:48
0 跟貼 0
人工智能，正成為美軍誤炸的“背鍋俠”

俄語大世界 2026-03-08 11:35:35
0 跟貼 0
智能體基礎(chǔ)設(shè)施是AI時(shí)代操作系統(tǒng)，真正的智能體要能思考、能分析，能行動(dòng)

量子位 2025-12-11 03:38:22
1 跟貼 1
大二學(xué)生打造AI智能招聘平臺，項(xiàng)目估值近6000萬元

星視頻 2026-03-08 18:50:54
0 跟貼 0
美團(tuán)也能裝龍蝦了？！OpenClaw火出圈，人人想養(yǎng)龍蝦

量子位 2026-03-10 01:53:41
0 跟貼 0
【吃透 AI Agent】AI Agent 全網(wǎng)最通俗講解：從原理到落地應(yīng)用！Agent智能體搭建

盧菁老師 2026-03-09 08:45:29
0 跟貼 0
日本部署遠(yuǎn)程導(dǎo)彈射程在1000公里左右

參考消息 2026-03-09 14:33:40
21308 跟貼 21308
真錢買假模型？187篇論文被「套殼API」坑慘，準(zhǔn)確率暴跌

機(jī)器之心Pro 2026-03-10 08:10:06
0 跟貼 0
AI研發(fā)本質(zhì)是一場與生物進(jìn)化同構(gòu)的試錯(cuò)游戲

量子位 2025-12-12 04:34:17
0 跟貼 0
AWS提供工具幫助客戶實(shí)現(xiàn)從POC到生產(chǎn)的跨越

量子位 2025-12-11 03:38:33
0 跟貼 0
AI花錢雇人類跑腿，租個(gè)人平臺吸引十萬人

量子位 2026-02-05 16:43:07
0 跟貼 0
仿真落地三難點(diǎn)：物理、視覺、交互

量子位 2025-12-12 04:34:09
0 跟貼 0
高速公路施工現(xiàn)場，機(jī)器和工人配合默契

樂呵指南 2026-03-08 22:58:57
1 跟貼 1

41+19+11！給機(jī)會楊瀚森就是中國版約基奇

41+19+11！給機(jī)會楊瀚森就是中國版約基奇

林子說事

2026-03-09 20:03:44

馬斯克評比亞迪：產(chǎn)能跌破50%是"巨大痛苦"，BYD連續(xù)六個(gè)月銷量下滑

馬斯克評比亞迪：產(chǎn)能跌破50%是"巨大痛苦"，BYD連續(xù)六個(gè)月銷量下滑

新浪財(cái)經(jīng)

2026-03-07 20:46:51

山姆超市最值得買的10樣美食，基本都口碑封神，性價(jià)比拉滿

山姆超市最值得買的10樣美食，基本都口碑封神，性價(jià)比拉滿

市井覓食記

2026-03-09 00:59:33

一次越界打擊揭開美以裂痕，盟友的“伊朗算盤”為何打不到一起？

一次越界打擊揭開美以裂痕，盟友的“伊朗算盤”為何打不到一起？

上觀新聞

2026-03-10 04:53:03

牡丹花下死！這次自曝和張杰分手細(xì)節(jié)的段曦，沒給謝娜留一絲體面

牡丹花下死！這次自曝和張杰分手細(xì)節(jié)的段曦，沒給謝娜留一絲體面

做一個(gè)合格的吃瓜群眾

2026-03-04 20:31:49

官宣！28歲中超新援被美職聯(lián)終身禁賽若上報(bào)國際足聯(lián)恐全球禁賽

官宣！28歲中超新援被美職聯(lián)終身禁賽若上報(bào)國際足聯(lián)恐全球禁賽

念洲

2026-03-10 06:47:39

為什么中年男人去哪都要開車??？

科普中國
2026-03-08 19:06:44

起底伊朗新領(lǐng)袖穆杰塔巴：19歲進(jìn)入革命衛(wèi)隊(duì)，曾說服父親力推內(nèi)賈德當(dāng)選總統(tǒng)，坐鎮(zhèn)平息內(nèi)賈德選舉舞弊風(fēng)波引發(fā)的全國抗議

起底伊朗新領(lǐng)袖穆杰塔巴：19歲進(jìn)入革命衛(wèi)隊(duì)，曾說服父親力推內(nèi)賈德當(dāng)選總統(tǒng)，坐鎮(zhèn)平息內(nèi)賈德選舉舞弊風(fēng)波引發(fā)的全國抗議

大象新聞

2026-03-09 09:45:05

你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂？一件提神醒腦，兩件直接撂倒

你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂？一件提神醒腦，兩件直接撂倒

另子維愛讀史

2026-01-22 18:21:09

手機(jī)有沒有被監(jiān)聽？看一眼頂部狀態(tài)欄就清楚

手機(jī)有沒有被監(jiān)聽？看一眼頂部狀態(tài)欄就清楚

小柱解說游戲

2026-03-08 05:10:17

固態(tài)變壓器爆發(fā)在即，訂單暴漲700%

固態(tài)變壓器爆發(fā)在即，訂單暴漲700%

環(huán)球零碳

2026-03-09 21:36:36

重磅：曝烏克蘭準(zhǔn)備對俄羅斯領(lǐng)土發(fā)動(dòng)春季大反攻！

重磅：曝烏克蘭準(zhǔn)備對俄羅斯領(lǐng)土發(fā)動(dòng)春季大反攻！

項(xiàng)鵬飛

2026-03-09 15:57:15

張國立沒想到，央劇《我的山與?！凡コ鰞H3天，趙亮竟口碑逆轉(zhuǎn)

張國立沒想到，央劇《我的山與?！凡コ鰞H3天，趙亮竟口碑逆轉(zhuǎn)

吳锎旅行ing

2026-03-10 05:56:05

中國為何要掛日式燈籠？博主譴責(zé)這是嚴(yán)重的“文化錯(cuò)位”

中國為何要掛日式燈籠？博主譴責(zé)這是嚴(yán)重的“文化錯(cuò)位”

映射生活的身影

2026-03-09 03:08:46

婚禮上，新娘索要9萬改口費(fèi)，不給就不叫媽，婆婆：還是叫阿姨吧

婚禮上，新娘索要9萬改口費(fèi)，不給就不叫媽，婆婆：還是叫阿姨吧

清水家庭故事

2026-03-09 07:27:17

梁山上唯一沒有朋友的好漢：無人與他玩，就算生病到死都沒人問津

梁山上唯一沒有朋友的好漢：無人與他玩，就算生病到死都沒人問津

銘記歷史呀

2026-03-08 14:05:52

2026安裝OpenClaw接入A股數(shù)據(jù)，實(shí)現(xiàn)全時(shí)股票AI解析教程

2026安裝OpenClaw接入A股數(shù)據(jù)，實(shí)現(xiàn)全時(shí)股票AI解析教程

呼呼歷史論

2026-03-07 21:59:17

油價(jià)即將暴漲 92號汽油上漲0.55元/升加油站已大排長隊(duì)

油價(jià)即將暴漲 92號汽油上漲0.55元/升加油站已大排長隊(duì)

太平洋汽車

2026-03-09 21:13:10

林徽因落選的國徽方案，網(wǎng)友看后感嘆：審美確實(shí)一絕，但真不合適

林徽因落選的國徽方案，網(wǎng)友看后感嘆：審美確實(shí)一絕，但真不合適

興趣知識

2026-03-08 19:32:42

黃金、白銀大跌！美元飆升，原油飆升！

黃金、白銀大跌！美元飆升，原油飆升！

每日經(jīng)濟(jì)新聞

2026-03-09 10:07:57

成就一億技術(shù)人

26365文章數(shù) 242241關(guān)注度

往期回顧全部

科技要聞

OpenClaw更新，"養(yǎng)蝦"再也不會犯健忘癥了

頭條要聞

牛彈琴：特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

頭條要聞

牛彈琴：特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

體育要聞

36連勝終結(jié)！大魔王也是可以戰(zhàn)勝的

娛樂要聞

薛之謙老婆懷二胎，現(xiàn)身產(chǎn)檢心情愉快

財(cái)經(jīng)要聞

"養(yǎng)蝦"生意經(jīng)：有人賣鏟，有人做保鏢

G7稱暫不釋放油儲但"隨時(shí)準(zhǔn)備"采取必要措施

汽車要聞

對標(biāo)奔馳小號G級路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機(jī)

教育

藝術(shù)

親子

時(shí)尚

手機(jī)要聞

蘋果發(fā)布iOS 26.4開發(fā)者預(yù)覽版Beta 4：可關(guān)閉液態(tài)玻璃刺眼高亮效果

教育要聞

“6年考研不如一條黑褲襪”，女孩活成研王爺，視頻說明一切

藝術(shù)要聞

30000畝杏花開了，才知道原來新疆的春天這么美！

親子要聞

真是服你倆了～

今年最流行的5條半裙，怎么搭都好看！

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報(bào) Complaint Center | 廉正舉報(bào) | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版