国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“現(xiàn)在的AI就像1880年的笨重工廠!”微軟CSO斯坦福潑冷水:別急著造神

0
分享至


大模型仍未對上商業(yè)的齒輪?

編譯 | 王啟隆

來源 | youtu.be/aWqfH0aSGKI

出品丨AI 科技大本營(ID:rgznai100)


現(xiàn)在的硅谷,空氣里都飄著一股“再不上車就晚了”的焦躁感。

最近 OpenClaw 風(fēng)頭正旺,強(qiáng)勢登頂 GitHub,終結(jié)了 React 神話,許多人更是覺得“AI 自己干活賺錢”的日子就在明天了。

特別是在斯坦福商學(xué)院(GSB)這種地方,臺下坐著的都是成天琢磨怎么用下一個(gè)技術(shù)風(fēng)口搞個(gè)獨(dú)角獸出來的狠人。

微軟的首席科學(xué)官(CSO)Eric Horvitz被請到了這個(gè)幾乎全美最想用 AI 變現(xiàn)的禮堂里。作為從上世紀(jì) 80 年代就開始搞 AI 的絕對老炮、也是微軟技術(shù)底座的“掃地僧”,這位老哥并沒有順著臺下的胃口,去吹捧下個(gè)月大模型又要顛覆什么行業(yè),而是兜頭給大家澆了一盆帶點(diǎn)學(xué)術(shù)味的冷水。

他講了一個(gè)挺有畫面感的比喻:大家都在聊 AI 馬上要爆發(fā),但這感覺就像 1880 年代人類剛弄出電動(dòng)機(jī)的時(shí)候。那時(shí)候的工廠怎么用電?他們搞個(gè)巨大的中央滑輪,扯著無數(shù)根笨重的皮帶,生硬地去連接各個(gè)工作臺。看起來是通電了,實(shí)際上別扭得很。

Horvitz 把這叫作“阻抗失配(Impedance Mismatch)”。說白了,就是現(xiàn)在牛逼哄哄的底層大模型,跟現(xiàn)實(shí)商業(yè)世界的組織架構(gòu)和運(yùn)轉(zhuǎn)方式,其實(shí)根本就沒對上齒輪。

這篇足足 55 分鐘的對話非?!胺垂沧R”。Eric 直言現(xiàn)在的模型連最基本的“概率校準(zhǔn)”都做不到(也就是一本正經(jīng)地胡說八道且不知道自己有多不靠譜);他甚至毫不客氣地扒下了醫(yī)療 AI 的底褲,說在 A 醫(yī)院好用的模型,直接端到 B 醫(yī)院去其實(shí)根本跑不通。

在這個(gè)所有人都恨不得把各種 Agent 供在神壇上的節(jié)點(diǎn),聽聽這位真正在工業(yè)界和科學(xué)界摸爬滾打了幾十年的老兵怎么吐槽當(dāng)下的行業(yè)現(xiàn)狀,可能會讓你對這個(gè)草莽時(shí)代多幾分其他視角的理解。

以下為這場斯坦福 AI@GSB 對話的完整實(shí)錄。


尋找 AI 時(shí)代的“皮帶與滑輪”

Jennifer Aaker(斯坦福商學(xué)院 General Atlantic 教授):我是 Jennifer Aaker,非常榮幸能為大家介紹 Eric Horvitz。他今天來到了現(xiàn)場,將與 Sarah Soule 院長在爐邊進(jìn)行對話。Eric 是微軟的首席科學(xué)官,很長一段時(shí)間以來,他一直致力于在人工智能、社會與科學(xué)的交叉前沿領(lǐng)域進(jìn)行探索。

很多年前我就認(rèn)識了 Eric。他是斯坦?!耙匀藶楸救斯ぶ悄苎芯吭骸保℉AI)的董事會成員。在那個(gè)背景下,以及在更廣泛的領(lǐng)域里,他是我見過的最具思想深度、最有意圖性(intentional)、最具體恤人類精神(humanistic)的思考者之一。

幾十年來,他一直是“以人為本的人工智能”領(lǐng)域極具影響力的聲音。他發(fā)起了斯坦福大學(xué)的“人工智能百年研究”項(xiàng)目(AI100),也是“AI 伙伴關(guān)系”(Partnership on AI)的聯(lián)合創(chuàng)始人。他曾作為國會任命的委員,任職于美國國家人工智能安全委員會,同時(shí)也是斯坦福 HAI 的杰出研究員??傊?,他是一個(gè)非常好的人。

很高興他今天能來到這里。我覺得他身上最了不起的一點(diǎn),是他對“人類繁榮(human flourishing)”的深刻承諾,而這也是他十多年前就已經(jīng)在談?wù)摰脑掝}。在今天關(guān)于 AI 的海量對話中,我們都在思考:什么是“主體性(agency)”?什么是“同理心(empathy)”?在設(shè)計(jì)這些技術(shù)工具時(shí),融入這些理念意味著什么?最根本的是,技術(shù)究竟該如何去“增強(qiáng)(augment)”人類,而不是“取代”人類?

Eric 不僅僅是在寫這些東西,他也在身體力行。曾經(jīng)有人告訴我,他在微軟指導(dǎo)過的門生(mentees)比公司里的任何人都多。他的行事風(fēng)格充滿了善意。帶著這份敬意,我想歡迎 Eric Horvitz 和 Sarah Soule。

Sarah A. Soule(斯坦福商學(xué)院院長):非常感謝 Jennifer 剛才那段無比慷慨的介紹。Eric,能和你坐在一起對話,看到這么多感興趣的學(xué)生、教職員工齊聚一堂,真是一件令人愉悅的事。歡迎大家來到這場爐邊談話。

Eric Horvitz:謝謝你們邀請我。

Sarah A. Soule:我們非常高興。Eric,我想先從你過去曾說過的一個(gè)觀點(diǎn)開始。你之前描述過,我們正處于一個(gè)快速轉(zhuǎn)型的時(shí)刻,并且這將是人類生存軌跡中,極少數(shù)能從根本上改變發(fā)展方向的“罕見快速轉(zhuǎn)型期”之一。我想問你,如果你從現(xiàn)在起往回看——假設(shè)站在 20 年后往回看,你認(rèn)為后人會如何銘記我們現(xiàn)在所處的這個(gè)時(shí)期?

Eric Horvitz:你提到“20 年”,這很有意思。我經(jīng)常思考的是,如果站在 700 年后的時(shí)間點(diǎn)往回看,歷史書上肯定會給這個(gè)時(shí)期專門命名。書里會有圖表,會用某些特定的色彩來描繪這個(gè)時(shí)代,它肯定會有一個(gè)專屬的名字——雖然我現(xiàn)在還不知道那名字會是什么。

至于 20 年后,這很有趣。當(dāng)我聽到“20 年”這個(gè)時(shí)間跨度,我腦海中浮現(xiàn)的是其他通用目的技術(shù)(general-purpose technologies),比如電力和蒸汽機(jī)。

你知道,蒸汽機(jī)大約是在 1769 年或 1770 年左右出現(xiàn)第一批可用發(fā)明的。但直到大約 100 年后,它們才真正進(jìn)入并在工業(yè)界展現(xiàn)出變革性的力量。電力大概是在 1880 年代出現(xiàn)的,然后它也是經(jīng)歷了數(shù)十年的慢慢滲透,才真正產(chǎn)生了廣泛的影響。

所以,我可以承認(rèn) AI 的發(fā)展速度可能會比蒸汽機(jī)或電力快得多——尤其是現(xiàn)在我們都已經(jīng)“通電”了,基礎(chǔ)設(shè)施都在那里。但我認(rèn)為,20 年后我們回顧現(xiàn)在,會把這個(gè)時(shí)期看作是一個(gè)“早期部署、早期實(shí)施”的階段。

在這個(gè)階段,會有很多人關(guān)注:在這個(gè)時(shí)期里,人們到底有多么深的遠(yuǎn)見?有多么強(qiáng)烈的焦慮?又有多少期望?

我不認(rèn)為在蒸汽機(jī)或電力崛起的時(shí)代,會有這樣一群觀眾坐在這里聽這樣一個(gè)關(guān)于技術(shù)未來的話題;或者像飛行技術(shù)的誕生之初,我也不認(rèn)為有很多人去深入思考我們是否應(yīng)該確立規(guī)范——比如,我們是否應(yīng)該從這些飛行器上投擲燃燒裝置?而現(xiàn)在,我們正在進(jìn)行各種各樣有趣的深思熟慮,看到大家對“如何引導(dǎo)這項(xiàng)技術(shù)”如此感興趣,這真的很讓人感到溫暖。

所以我想,回顧過去,我們會說:“哇,那就是一切開始的地方?!钡词故?20 年后,我們依然會處于一個(gè)快節(jié)奏的轉(zhuǎn)型期,我不認(rèn)為一切會在 20 年內(nèi)就完全收斂并塵埃落定。

Sarah A. Soule:我非常高興你能成為目前這些討論和深思熟慮的一部分。我也希望,在 20 年后,人們會認(rèn)為你是這個(gè)時(shí)代的英雄之一。

Eric Horvitz:哦,我倒不奢望走那么遠(yuǎn)(笑)。只要我做出的貢獻(xiàn)能在沿途幫到大家,讓事情變得好一點(diǎn)點(diǎn),我就很樂意被大家遺忘了。

Sarah A. Soule:既然談到了如何讓事情變得更好,全國各地、甚至全世界的學(xué)生,現(xiàn)在都在聽到很多關(guān)于“確保自己具備 AI 素養(yǎng)”的建議。事實(shí)上,我們在 GSB 的 AI 倡議一直非常有針對性地通過一些工作坊(包括今晚由 Celeste Bean 舉辦的)來確保這一點(diǎn)。

你參與了許多跨越工業(yè)界、政策界和學(xué)術(shù)界的辯論與討論。針對目前的情況——在一個(gè)知識和能力正輕易被 AI “商品化(commoditized)”的世界里,你會給我們的學(xué)生(無論是 MBA 還是本科生)什么建議?他們現(xiàn)在應(yīng)該投資學(xué)習(xí)什么?此外,對于那些在當(dāng)下這種飛速變化中感到真切焦慮的學(xué)生,你有什么最好的建議?

Eric Horvitz:首先我好奇的是,想聽聽在這個(gè)極其特殊的歷史時(shí)刻,你們腦海中那種焦慮與興奮交織的狀態(tài)到底有多強(qiáng)烈。這真的是人類歷史上的一個(gè)頂點(diǎn)(vertex)——你們正在經(jīng)歷、觀察、吸收這些正在發(fā)生(以及可能發(fā)生)的變化,并且討論這對你們的職業(yè)生涯意味著什么。

尤其是在一個(gè)教育項(xiàng)目中,特別是在商學(xué)院的 MBA 項(xiàng)目里——這里有來自不同背景的學(xué)生,但 MBA 項(xiàng)目本質(zhì)上源自彼得·德魯克(Peter Drucker)的世界,它關(guān)乎將商業(yè)視為一門科學(xué),關(guān)乎如何引導(dǎo)和思考生產(chǎn)、價(jià)值與利潤。

我的第一反應(yīng)是,對于人們(包括管理和商業(yè)領(lǐng)域的人)來說,思考如何將這些技術(shù)初步部署下去,存在著巨大的機(jī)遇。

回到我之前的評論:人們最初其實(shí)并不知道如何在工業(yè)中部署電力。你們可能見過那些老照片——一個(gè)巨大的中央滑輪,連著無數(shù)根皮帶,笨拙地向各個(gè)工作臺輸送動(dòng)力,人們甚至不愿意去思考是否應(yīng)該為每臺機(jī)器配備獨(dú)立的電機(jī)。這只是一個(gè)隱喻,說明我們在面對現(xiàn)在的技術(shù)時(shí),需要做大量的思考。

我們面臨著一種“阻抗失配(impedance mismatch)”——即商業(yè)流程、組織結(jié)構(gòu)及其運(yùn)作方式,與這些底層基礎(chǔ)技術(shù)、核心生產(chǎn)力技術(shù)之間的錯(cuò)位。思考如何將這些自身也在不斷進(jìn)化的 AI 技術(shù)交織融入進(jìn)去,是一項(xiàng)巨大的工程。

在我們的腦海中,我們還需要對“AI 到底是什么”建立一種感知。對我來說——我 80 年代中期在斯坦福大學(xué),1990 年完成了博士學(xué)位——AI 是一幅極其豐富的掛毯,是一個(gè)由各種技術(shù)組成的星座。盡管現(xiàn)在大家都在將其同質(zhì)化,言必稱“深度神經(jīng)網(wǎng)絡(luò)”以及它們在頂層是如何被訓(xùn)練的,但它依然是一幅廣闊的圖景,隨著時(shí)間的推移,它會變得更加細(xì)分。

所以,這不僅僅是思考“Claude、ChatGPT 或 Gemini 將被如何使用”。本質(zhì)上,你需要更深入地了解這項(xiàng)技術(shù),理解“深度思考”、“決策制定”、“管理”、“監(jiān)督”和“創(chuàng)造力”的機(jī)會在哪里。這才是推動(dòng)我們走向 20 年后,甚至走向前面提到的“700 年后”的動(dòng)力。這是一個(gè)非常豐富的機(jī)會空間。

所以我建議:找到你的熱情所在,深入挖掘你的熱情,思考AI 的相關(guān)性;走向跨學(xué)科(interdisciplinary),因?yàn)槟惚仨氁愿鼜V闊的視角思考;然后看看現(xiàn)在人們在做什么,努力超越當(dāng)下的炒作,去真正融合并應(yīng)用它。

Sarah A. Soule:我很喜歡這個(gè)觀點(diǎn)。這也觸及了我們在幾周前的預(yù)備電話里談到的事情。我們在思考,我們需要為學(xué)生提供什么。我經(jīng)常跟學(xué)生說,當(dāng)他們被允許保持好奇心并試圖滿足這種好奇心時(shí),他們就處于最佳狀態(tài);而當(dāng)我們的教職員工帶著好奇心提出有趣的科研問題時(shí),他們也處于最佳狀態(tài);當(dāng)我們的員工帶著好奇心與師生互動(dòng)時(shí),他們同樣處于最佳狀態(tài)。這就是我們建立我們想要的文化的方式之一,這同樣需要慷慨的精神,需要彼此寬容并互相給予恩典,我們需要將這些融入到文化中。

在幾個(gè)星期前我們交流時(shí),你談到了很多關(guān)于“好奇心”的內(nèi)容,現(xiàn)在你又提到了。你能否展開講講?因?yàn)槲蚁氪蠹叶紩芨信d趣:在這個(gè) AI 時(shí)代,你如何看待“人類與 AI 協(xié)作”作為一種推動(dòng)人們解決他們以前無法處理的問題和想法的方式?

Eric Horvitz:我一直熱衷于思考計(jì)算機(jī)如何幫助人們進(jìn)行認(rèn)知、解決問題和探索。幾十年來,這一直是我的熱情所在?!叭祟惻c AI 的協(xié)作”這個(gè)詞在大概 23、25 年前還是個(gè)很奇怪的概念,那時(shí)我們開始展示一些技術(shù),清晰地描繪了這種機(jī)會空間可能是什么樣子的。

根據(jù)我們對人類認(rèn)知基底(cognitive substrate)的了解,什么是邊界?認(rèn)知心理學(xué)家通常會描述我們在能力上的差距,作為人類我們的優(yōu)勢是什么。

當(dāng)然,我們在很多方面各不相同,但有一個(gè)我們多年來逐漸了解的人類共性基礎(chǔ)。早年我在想,建立一個(gè)能深刻理解這一點(diǎn)的計(jì)算系統(tǒng),知道應(yīng)該在哪里介入、在哪里支撐、在哪里退后,并且在此基礎(chǔ)上不僅應(yīng)對互補(bǔ)性的挑戰(zhàn),還能理解“主動(dòng)性(initiative)”——計(jì)算系統(tǒng)何時(shí)應(yīng)該向前一步,何時(shí)應(yīng)該退后?人類駕駛員何時(shí)應(yīng)該理解如何以及何時(shí)使用這些機(jī)器,以增強(qiáng)自身的探索能力、獲取答案以及更廣泛地解決問題?

現(xiàn)在回想起來,這真是太美妙了??粗F(xiàn)在的技術(shù),有些人正在學(xué)習(xí)如何使用像 GPT、Claude 和 Gemini 這樣的通用工具來適當(dāng)?shù)亍疤崾荆╬rompt)”它們,并把自己置于“駕駛員”的位置——他們帶來目標(biāo),帶來非常人性化的一套目標(biāo)體系、偏好、好奇心和方向,然后利用這些系統(tǒng)作為向?qū)?。通過引入新的效率來進(jìn)行模擬、探索,擴(kuò)展可能性的集合,我認(rèn)為這些系統(tǒng)在人與人的互動(dòng)、國家與國家的互動(dòng)中會非常有幫助。希望能帶來一場文藝復(fù)興。

你可以將這個(gè)領(lǐng)域命名為:材料科學(xué)、生物學(xué)與醫(yī)療保健、教育……挑選你的領(lǐng)域,生產(chǎn)制造、效率等等。我認(rèn)為這些優(yōu)化、整合、證據(jù)收集與綜合、專業(yè)化、泛化以及涌現(xiàn)概念的工具,將改變一切。


智能體(Agent)的崛起與“防偽印章”

Sarah A. Soule:你在那次對話中用了一個(gè)很棒的詞。我想是關(guān)于“可能性的邊緣(the edge of possibility)”,對吧?

Eric Horvitz:是的。作為微軟的研究總監(jiān),我經(jīng)常會對我們在世界各地實(shí)驗(yàn)室的同事說:“你們真的在探索可能性的邊緣嗎?”

我們當(dāng)時(shí)會停下來思考那是什么意思。在幾個(gè)月或一年前,去探索那些在那個(gè)前沿領(lǐng)域被認(rèn)為不僅是不可能、甚至連想都不會去想的事情。

今天,我認(rèn)為一些人正在研究不僅是將如何應(yīng)用像 MedPaLM 這樣的模型于臨床醫(yī)學(xué),還要看它在你自己的數(shù)據(jù)集、你自己的受眾上的表現(xiàn)。

我最近在美國國家醫(yī)學(xué)院的會議上分享了一個(gè)重要秘密:大家聽好了,最大的秘密是,這些醫(yī)療大模型不具備可移植性(not portable)。

你不能只是把它們從 A 醫(yī)院拿到 B 醫(yī)院,然后期望它們能完美運(yùn)行。多年前我們在傳統(tǒng)的機(jī)器學(xué)習(xí)模型上就發(fā)現(xiàn)了這一點(diǎn)。所以,你需要深入思考:不僅僅是決策制定,甚至包括轉(zhuǎn)錄(transcription),你都要非常清晰地思考潛在的錯(cuò)誤,思考它意味著什么,以及它在特定環(huán)境下的表現(xiàn)。事實(shí)上,未來幾年,這需要進(jìn)行隨機(jī)臨床試驗(yàn)(randomized clinical trials)來理解這些 AI 工具在醫(yī)療服務(wù)中的真正作用。

我對這些模型展現(xiàn)出的潛力感到興奮,但我們也看到了人們將它們推向我們所謂的“人工智能家族(artificial intelligence family)”的未知領(lǐng)域。

Sarah A. Soule:你能詳細(xì)說說,當(dāng)真實(shí)性變得模糊時(shí),尤其是在深度偽造和幻覺面前,我們該怎么辦?

Eric Horvitz:2015 年左右,我開始看到一些零星的跡象。事實(shí)上,最早引起我注意的是斯坦福大學(xué)計(jì)算機(jī)科學(xué)團(tuán)隊(duì)的一個(gè)關(guān)于 Deepfake 的展示。他們展示了如何構(gòu)建一個(gè)系統(tǒng),把文字放入一個(gè)政治家的嘴里。我當(dāng)時(shí)對這印象極其深刻,當(dāng)然大家也都說“別擔(dān)心,這只是一個(gè)計(jì)算機(jī)視覺/圖形學(xué)的演示?!边@些都在實(shí)驗(yàn)室緊閉的大門后進(jìn)行,大家覺得很酷,有人還能就此寫篇博士論文。

但我當(dāng)時(shí)做了一個(gè)演講,說這件事未來會走向何方。那還是 9 到 10 年前?,F(xiàn)在我們就在這里了。

一路上,在微軟內(nèi)部以及在政府和公民社會的各個(gè)團(tuán)隊(duì)中,我一直在強(qiáng)調(diào),一旦你創(chuàng)造出這樣的技術(shù),你就必須進(jìn)行紅藍(lán)對抗,并攻擊它,以確保解決方案本身不會成為問題。

最近發(fā)生了一件事,我們發(fā)布了一份 54 頁的內(nèi)部微軟研究報(bào)告,我讓團(tuán)隊(duì)進(jìn)行了“紅隊(duì)測試”:人們會如何利用這些工具?這讓你認(rèn)為,那些底特律的群眾并沒有真正在歡迎卡馬拉·哈里斯(Kamala Harris),或者反之亦然。我們必須思考其中的可能性。

好消息是,這項(xiàng)研究的最終結(jié)果,是提出了一種被稱為內(nèi)容溯源(media provenance)的高可信度身份驗(yàn)證方法。簡單來說,就是給攝像頭和麥克風(fēng)捕捉到的內(nèi)容蓋上一個(gè)“加密的蠟封(cryptographic wax seal)”。你可以看到這個(gè)印章在顯示端的終端是未破損的。

這后來變成了現(xiàn)在的 C2PA(內(nèi)容溯源和真實(shí)性聯(lián)盟)標(biāo)準(zhǔn)。這是所有大型科技公司、相機(jī)公司等都在使用的標(biāo)準(zhǔn)。但我們必須走得更遠(yuǎn),因?yàn)橐坏┠銊?chuàng)建了這樣一個(gè)有前景的解決方案,你也必須進(jìn)行紅隊(duì)測試,攻擊它以確保它確實(shí)安全。就在兩天前,我們發(fā)布了一份 54 頁的報(bào)告,探討人們?nèi)绾卫眠@些帶有“蠟封”的技術(shù),讓你誤以為并沒有發(fā)生的事情發(fā)生了,或者反過來。

這也是整個(gè)生態(tài)系統(tǒng)需要去思考的:不僅僅是普通的特異性和敏感性、診斷的準(zhǔn)確率,還要思考一旦這些系統(tǒng)被部署,會有哪些極其災(zāi)難性的失敗。

此外,還有智能體市場(Agentic Marketplaces)的問題。十年內(nèi),如果存在買賣和中間過程的代理人(proxies),而我們各自都有自己的代理人,這將形成一個(gè)由智能體互動(dòng)的完整經(jīng)濟(jì)體。

我們最近發(fā)表了一篇關(guān)于“即將到來的智能體市場”的論文。我們開發(fā)了一個(gè)模擬工具,你可以下載并進(jìn)行實(shí)驗(yàn)。我們觀察當(dāng)我們釋放出原型的 Agent 去購買、出售和安排日程時(shí)會發(fā)生什么。

如果你把這些工具放出去,卻不思考關(guān)于人類主體性和自我尊嚴(yán)的深層問題——不把它們設(shè)計(jì)成注重保護(hù)和培育人類自主權(quán)、個(gè)體性與智力的機(jī)器,那是很危險(xiǎn)的。這也是為什么目前公眾有如此強(qiáng)烈的焦慮。這種焦慮是有道理的。


醫(yī)療與科研:AI 不能“即插即用”

Sarah A. Soule:好的,我想現(xiàn)在是我們開放給學(xué)生提問的好時(shí)機(jī)。我們有話筒傳遞員,如果有同學(xué)想提問,請舉手。

Serena(MS/MBA 學(xué)生):非常感謝您今天能來。我是 Serena,是管理科學(xué)與工程系的碩士生,本科也是數(shù)據(jù)科學(xué)背景。我想問的是,隨著我們邁向下一階段的 AI 部署,您認(rèn)為在模型評估、安全評估,特別是 AI 生態(tài)系統(tǒng)的治理和新興標(biāo)準(zhǔn)方面,最重要且懸而未決的問題是什么?

Eric Horvitz:關(guān)于這個(gè)問題,我有很多想說的,但我先從這一點(diǎn)開始:對于所有大語言模型的狂熱慶祝和大量投資,我們目前其實(shí)不知道如何對它們進(jìn)行概率上的校準(zhǔn)(calibrate them probabilistically)。

這些系統(tǒng)被用于在決策環(huán)境中提出建議。在這樣的環(huán)境里,世界必須提出要求:“如果你要說些什么,我需要一個(gè)關(guān)于它真實(shí)性的概率(probability of its truth)。我需要你有良好校準(zhǔn)的置信度?!?/p>

對我來說,在更安全的系統(tǒng)中,這將會大有作為,因?yàn)槲覀兙涂梢园堰@些輸出整合到我們自己的效用函數(shù)(utility functions)中,或者說成本收益模型中,并理解如何使用這些系統(tǒng),以及在評估時(shí)如何認(rèn)真對待它們。所以除了安全性、控制等問題之外,我最近在想,在廣泛的筆刷下,我們投入了大量的時(shí)間和精力在安全問題上——包括測試指標(biāo)、評估,我們也與斯坦福的團(tuán)隊(duì)在諸如 MedHelm 等臨床醫(yī)學(xué)指標(biāo)上合作,以衡量這些系統(tǒng)的表現(xiàn)——提出了一些有趣的工具來保證這些通用模型的安全,確保它們生成的內(nèi)容的安全。

但我認(rèn)為,目前真正的盲點(diǎn)在于如何實(shí)現(xiàn)概率校準(zhǔn)。這對于高風(fēng)險(xiǎn)決策極其重要。

Ulugbek(醫(yī)學(xué)院學(xué)生):您好,我是 Ulugbek,醫(yī)學(xué)院的學(xué)生。我的問題與 AI 在醫(yī)療保健中的日益普及有關(guān)。您認(rèn)為我們在醫(yī)療領(lǐng)域面臨的主要挑戰(zhàn)是:提升 AI 模型本身的性能,還是改善機(jī)構(gòu)利用 AI 進(jìn)行決策的方式?

Eric Horvitz:我明白你的意思,你是問如何在“提高模型表現(xiàn)”與“改善機(jī)構(gòu)決策”之間做區(qū)分。

這絕對是相互依存的(interdependent)。如果你在診斷和治療規(guī)劃方面擁有更高性能的能力,那這些考慮在機(jī)構(gòu)如何融合、應(yīng)用這項(xiàng)技術(shù)上就變得非常核心。

我的直覺是,那些表現(xiàn)出色的模型通常并不能做到完全便攜。如我所說,你不能指望它們在不同醫(yī)院間“即插即用”。過去幾年我們發(fā)現(xiàn)在傳統(tǒng)的機(jī)器學(xué)習(xí)模型中,表現(xiàn)極佳的模型在換了環(huán)境后就不行了。這就要求我們在本地機(jī)構(gòu)有能力在本地?cái)?shù)據(jù)上進(jìn)行微調(diào)和校準(zhǔn),以確保模型在特定人群和特定工作流中實(shí)際有效。

所以,不僅是單純的性能,還涉及到這套系統(tǒng)的“適應(yīng)性”。其次,如何利用它們來協(xié)助決策,而不會引發(fā)意外的偏見或加劇現(xiàn)有的不平等,這也是醫(yī)療機(jī)構(gòu)必須在制度層面建立的護(hù)欄。

Ben(MBA 學(xué)生):您好,我是 Ben,商學(xué)院 MBA 學(xué)生。我想問一個(gè)關(guān)于您之前提到的“蒸汽機(jī)和鋼鐵”的比較。您說即便 20 年后,我們可能仍在經(jīng)歷有意義的、甚至是地震般的巨變。您如何將這一點(diǎn)與目前大量涌入該領(lǐng)域的興奮、炒作和資金結(jié)合起來?您是否認(rèn)為大多數(shù)人同意您的觀點(diǎn),即我們正在玩一場真正長期的游戲?還是您認(rèn)為我們會看到短期的地震級轉(zhuǎn)變,同時(shí)也要期待長期的價(jià)值顯現(xiàn)?

Eric Horvitz:謝謝你提出這個(gè)非常有洞察力的問題。我想我們必須為驚喜(surprises)做好準(zhǔn)備。

驚喜在于,AI 在某些方面的移動(dòng)速度將遠(yuǎn)超我們的預(yù)期,而在另一些方面,其移動(dòng)速度又會比我們想象的慢得多。取決于你關(guān)注的是哪個(gè)維度。

我預(yù)計(jì),在解決一些我們過去認(rèn)為極其困難、可能需要幾十年才能解決的長期科學(xué)挑戰(zhàn)上,我們將看到突破。我們已經(jīng)看到了 AlphaFold 這樣的例子,在生物學(xué)和醫(yī)學(xué)上,AI 將極大加速新藥的發(fā)現(xiàn)、疾病的理解,甚至治愈某些頑疾。在這些領(lǐng)域,它可能帶來的“地震”就在眼前,或者在接下來的 10 到 15 年內(nèi)。

但在另一方面,日常工作流程的改變,人類社會組織架構(gòu)對這項(xiàng)技術(shù)的吸收——這種屬于“社會技術(shù)(socio-technical)”范疇的事情,往往會慢得多。因?yàn)檫@涉及到改變?nèi)说牧?xí)慣、改變法律、改變權(quán)力和利益的分配。所以,盡管資金和熱情瘋狂涌入,期望在短時(shí)間內(nèi)看到所有商業(yè)模式被顛覆,但這其中必然充滿摩擦。這也是為什么我反復(fù)強(qiáng)調(diào)“阻抗失配”。

我們應(yīng)該準(zhǔn)備好迎接一場長期的轉(zhuǎn)型。那些純粹為了短期的、吹噓性質(zhì)的炒作而投入的資本,可能會面臨失望。但對于那些致力于在科研突破、醫(yī)療革新以及建立真正安全的 AI 基礎(chǔ)設(shè)施上進(jìn)行長期投資的人來說,這種價(jià)值是無法估量的。

希望有一天,我們能迎來一個(gè)“關(guān)懷經(jīng)濟(jì)(caring economy)”的崛起,而不是一個(gè)純粹由機(jī)器主導(dǎo)的效率社會。

(投稿或?qū)で髨?bào)道:zhanghy@csdn.net)



未來沒有前后端,只有 AI Agent 工程師。

這場十倍速的變革已至,你的下一步在哪?

4 月 17-18 日,由 CSDN 與奇點(diǎn)智能研究院聯(lián)合主辦「2026 奇點(diǎn)智能技術(shù)大會」將在上海隆重召開,大會聚焦 Agent 系統(tǒng)、世界模型、AI 原生研發(fā)等 12 大前沿專題,為你繪制通往未來的認(rèn)知地圖。

成為時(shí)代的見證者,更要成為時(shí)代的先行者。

奇點(diǎn)智能技術(shù)大會上海站,我們不見不散!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
41+19+11!給機(jī)會楊瀚森就是中國版約基奇

41+19+11!給機(jī)會楊瀚森就是中國版約基奇

林子說事
2026-03-09 20:03:44
馬斯克評比亞迪:產(chǎn)能跌破50%是"巨大痛苦",BYD連續(xù)六個(gè)月銷量下滑

馬斯克評比亞迪:產(chǎn)能跌破50%是"巨大痛苦",BYD連續(xù)六個(gè)月銷量下滑

新浪財(cái)經(jīng)
2026-03-07 20:46:51
山姆超市最值得買的10樣美食,基本都口碑封神,性價(jià)比拉滿

山姆超市最值得買的10樣美食,基本都口碑封神,性價(jià)比拉滿

市井覓食記
2026-03-09 00:59:33
一次越界打擊揭開美以裂痕,盟友的“伊朗算盤”為何打不到一起?

一次越界打擊揭開美以裂痕,盟友的“伊朗算盤”為何打不到一起?

上觀新聞
2026-03-10 04:53:03
牡丹花下死!這次自曝和張杰分手細(xì)節(jié)的段曦,沒給謝娜留一絲體面

牡丹花下死!這次自曝和張杰分手細(xì)節(jié)的段曦,沒給謝娜留一絲體面

做一個(gè)合格的吃瓜群眾
2026-03-04 20:31:49
官宣!28歲中超新援被美職聯(lián)終身禁賽 若上報(bào)國際足聯(lián)恐全球禁賽

官宣!28歲中超新援被美職聯(lián)終身禁賽 若上報(bào)國際足聯(lián)恐全球禁賽

念洲
2026-03-10 06:47:39
為什么中年男人去哪都要開車???

科普中國
2026-03-08 19:06:44

起底伊朗新領(lǐng)袖穆杰塔巴:19歲進(jìn)入革命衛(wèi)隊(duì),曾說服父親力推內(nèi)賈德當(dāng)選總統(tǒng),坐鎮(zhèn)平息內(nèi)賈德選舉舞弊風(fēng)波引發(fā)的全國抗議

起底伊朗新領(lǐng)袖穆杰塔巴:19歲進(jìn)入革命衛(wèi)隊(duì),曾說服父親力推內(nèi)賈德當(dāng)選總統(tǒng),坐鎮(zhèn)平息內(nèi)賈德選舉舞弊風(fēng)波引發(fā)的全國抗議

大象新聞
2026-03-09 09:45:05
你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

另子維愛讀史
2026-01-22 18:21:09
手機(jī)有沒有被監(jiān)聽?看一眼頂部狀態(tài)欄就清楚

手機(jī)有沒有被監(jiān)聽?看一眼頂部狀態(tài)欄就清楚

小柱解說游戲
2026-03-08 05:10:17
固態(tài)變壓器爆發(fā)在即,訂單暴漲700%

固態(tài)變壓器爆發(fā)在即,訂單暴漲700%

環(huán)球零碳
2026-03-09 21:36:36
重磅:曝烏克蘭準(zhǔn)備對俄羅斯領(lǐng)土發(fā)動(dòng)春季大反攻!

重磅:曝烏克蘭準(zhǔn)備對俄羅斯領(lǐng)土發(fā)動(dòng)春季大反攻!

項(xiàng)鵬飛
2026-03-09 15:57:15
張國立沒想到,央劇《我的山與?!凡コ鰞H3天,趙亮竟口碑逆轉(zhuǎn)

張國立沒想到,央劇《我的山與?!凡コ鰞H3天,趙亮竟口碑逆轉(zhuǎn)

吳锎旅行ing
2026-03-10 05:56:05
中國為何要掛日式燈籠?博主譴責(zé)這是嚴(yán)重的“文化錯(cuò)位”

中國為何要掛日式燈籠?博主譴責(zé)這是嚴(yán)重的“文化錯(cuò)位”

映射生活的身影
2026-03-09 03:08:46
婚禮上,新娘索要9萬改口費(fèi),不給就不叫媽,婆婆:還是叫阿姨吧

婚禮上,新娘索要9萬改口費(fèi),不給就不叫媽,婆婆:還是叫阿姨吧

清水家庭故事
2026-03-09 07:27:17
梁山上唯一沒有朋友的好漢:無人與他玩,就算生病到死都沒人問津

梁山上唯一沒有朋友的好漢:無人與他玩,就算生病到死都沒人問津

銘記歷史呀
2026-03-08 14:05:52
2026安裝OpenClaw接入A股數(shù)據(jù),實(shí)現(xiàn)全時(shí)股票AI解析教程

2026安裝OpenClaw接入A股數(shù)據(jù),實(shí)現(xiàn)全時(shí)股票AI解析教程

呼呼歷史論
2026-03-07 21:59:17
油價(jià)即將暴漲 92號汽油上漲0.55元/升 加油站已大排長隊(duì)

油價(jià)即將暴漲 92號汽油上漲0.55元/升 加油站已大排長隊(duì)

太平洋汽車
2026-03-09 21:13:10
林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

興趣知識
2026-03-08 19:32:42
黃金、白銀大跌!美元飆升,原油飆升!

黃金、白銀大跌!美元飆升,原油飆升!

每日經(jīng)濟(jì)新聞
2026-03-09 10:07:57
2026-03-10 09:00:49
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26365文章數(shù) 242241關(guān)注度
往期回顧 全部

科技要聞

OpenClaw更新,"養(yǎng)蝦"再也不會犯健忘癥了

頭條要聞

牛彈琴:特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

頭條要聞

牛彈琴:特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

體育要聞

36連勝終結(jié)!大魔王也是可以戰(zhàn)勝的

娛樂要聞

薛之謙老婆懷二胎,現(xiàn)身產(chǎn)檢心情愉快

財(cái)經(jīng)要聞

"養(yǎng)蝦"生意經(jīng):有人賣鏟,有人做保鏢

汽車要聞

對標(biāo)奔馳小號G級 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

手機(jī)
教育
藝術(shù)
親子
時(shí)尚

手機(jī)要聞

蘋果發(fā)布iOS 26.4開發(fā)者預(yù)覽版Beta 4:可關(guān)閉液態(tài)玻璃刺眼高亮效果

教育要聞

“6年考研不如一條黑褲襪”,女孩活成研王爺,視頻說明一切

藝術(shù)要聞

30000畝杏花開了,才知道原來新疆的春天這么美!

親子要聞

真是服你倆了~

今年最流行的5條半裙,怎么搭都好看!

無障礙瀏覽 進(jìn)入關(guān)懷版