国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

是真的!AI科學(xué)家來了,這是一場令人類科學(xué)家目瞪口呆的范式革命

0
分享至

近日,西湖大學(xué)的研究者發(fā)布了一個名為“DeepScientist”的人工智能系統(tǒng),根據(jù)新聞里的說法,這是首個具有完整科研能力,且在無人工干預(yù)的情況下,能夠自我設(shè)定目標并獨立通過迭代方式完成研究工作的人工智能。最可怕的是,經(jīng)過測試,的研究能力超越了人類科學(xué)家!


DeepScientist 開源界面

對此,網(wǎng)友在新聞下面的留言是:看到科學(xué)家也失業(yè)了我就放心了。
調(diào)侃歸調(diào)侃,我們想知道的是,這個新聞是否言過其實了?因為創(chuàng)造一個聰明的大語言模型是一回事,而創(chuàng)造 AI 科學(xué)家是另外一回事。它無關(guān)于想象力是否足夠豐富,也無關(guān)于深度思維能力夠不夠強。它涉及到一個人工智能的底層詛咒:知識迷信。即便是我們的專欄沒事兒就夸一夸的 DeepSeek 也沒有逃過這個底層詛咒。

科學(xué)哲學(xué)家托馬斯·庫恩提出過一個概念,叫做“范式革命”。他認為,科學(xué)發(fā)展不是簡單的知識累積,而是在一個個范式框架的更替中跳躍前進的。比如說,地心說就是一個范式,無數(shù)天文學(xué)家通過努力觀察行星運動規(guī)律,在這個框架下修修補補,讓它能盡可能完美地擬合天文觀察。但是,當問題積累到一定程度,用地心說就實在解釋不通了,于是哥白尼等人提出的日心說就開啟了新范式時代。后面的天文學(xué)家把行星的圓形軌道修改成橢圓軌道,后來相對論又解決了水星進動問題,這都是在新范式下進行的。這就是“范式革命”。



范式革命最困難的,就在于打破對現(xiàn)有知識體系的迷信。這個過程極為困難,原因就是,即使最富有科學(xué)精神的科學(xué)家,也會傾向于相信自己為之努力過的舊觀點。別以為 AI 會更加理性中立和客觀,不會的,AI 比所有人類科學(xué)家都更固執(zhí)。

如果說人類最底層的執(zhí)念就是保衛(wèi)自己的生命的話,那么 AI 的底層執(zhí)念就是保衛(wèi)它已經(jīng)學(xué)會的知識。

  • 知識固化:把學(xué)到的東西當成絕對真理,不支持自我修正;
  • 推理幻覺:為了保衛(wèi)舊知識,它會做出荒謬的推理;
  • 盲目崇拜:固有知識的權(quán)重高于推理結(jié)論,導(dǎo)致它刻意調(diào)和兩者的矛盾,導(dǎo)致觀點混亂;

這是傳統(tǒng) AI 無法擺脫的三大魔咒。說白了,傳統(tǒng)的 AI 更像一個虔誠的“知識信徒”,而不是一個叛逆的“革命者”。

這就是傳統(tǒng) AI 當不了科學(xué)家的理由。一個真正的科學(xué)家,其價值不僅僅是學(xué)習(xí)和應(yīng)用知識,更在于他敢于挑戰(zhàn)、甚至推翻已有的知識,創(chuàng)造新的知識。那么,這個名叫 DeepScientist 的人工智能,真的有能力否定自己的舊知識,創(chuàng)造出新知識嗎?我們帶著這個疑問,翻開了它的論文。

AI 科學(xué)家如何擺脫“知識崇拜”?

DeepScientist 之所以被稱為“科學(xué)家”,不是因為它算得快,而是因為它在系統(tǒng)層面重建了一套科學(xué)方法論。它工作的基本流程可以簡化為四步:觀察、思考、假設(shè)、驗證。而在這簡單的循環(huán)背后,藏著一套精妙的反知識崇拜機制。


Findings Memory 的工作機制,圖源:論文[1]

首先,DeepScientist 在設(shè)計時就沒有絕對的固有知識,它的知識是臨時用的,而且是隨時準備被推翻的。

傳統(tǒng) AI 系統(tǒng)有個固化的知識庫,像一本不容置疑的圣經(jīng)。但 DeepScientist 的腦子里沒有這種東西。它的知識只來源于兩個動態(tài)的部分:一是實時的外部文獻(每次啟動前,從網(wǎng)上抓取最新的相關(guān)論文);二是它自己的“實驗記憶”(Findings Memory),里面密密麻麻記錄了自己每一次嘗試的成敗。

更關(guān)鍵的問題在于,的世界觀里,那些頂刊論文的領(lǐng)域最高水平也不等于真理。它的核心任務(wù),恰恰是去打破這些主流方法,找到更好的路徑。所以,它天生就被設(shè)計成了一個權(quán)威反叛者,人類最高水平本來就是被超越的目標!

其次,它的認知迭代靠實驗,而不是靠相信。DeepScientist從不相信任何一個想法,無論這個想法聽起來多么天才。它信奉的是科學(xué)實證主義:可重復(fù)的實驗結(jié)果高于一切權(quán)威和推理。

它的工作流是一個嚴格的閉環(huán):提出一個新假設(shè) → 自動編程實現(xiàn)它 → 讓程序在真實的測試環(huán)境中跑一遍 → 把性能指標(比如準確率、速度)存入自己的實驗記憶 → 根據(jù)新結(jié)果更新下一步的探索策略。

如果一個想法和現(xiàn)有文獻的結(jié)論完全沖突,但實驗證明它的效果更好,那么系統(tǒng)會毫不猶豫地信任實驗結(jié)果。反之,如果實驗失敗了,那無論這個想法的理論推理多么完美,都會被標記為無效。這就像一位嚴謹?shù)目茖W(xué)家,他的認知只建立在冷冰冰的實驗數(shù)據(jù)之上。

人類科學(xué)家很容易陷入一個思維陷阱,那就是總會不自覺地尋找支持自己理論的證據(jù),而忽略反面證據(jù)。沒辦法,科學(xué)家太想實驗成功了。但是 DeepScientist 通過它的發(fā)現(xiàn)記憶庫完美地規(guī)避了這一問題。

這個記憶庫里記錄的,不只是成功的經(jīng)驗,更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無變化的嘗試,都被忠實地記錄在案。在開啟下一輪探索時,這些失敗記錄就成了一張寶貴的“排雷圖”,讓它能主動避開已經(jīng)被證偽的方向。



更妙的是,它還會利用一種叫做 UCB 的算法,在“繼續(xù)挖掘現(xiàn)有研究方法的潛能”和“尋找一個新方法去探索”之間取得平衡。失敗不是垃圾,而是一張能指引方向的導(dǎo)航地圖。

最令人驚嘆的是,DeepScientist 連自己創(chuàng)造出的東西都敢推翻。論文提到,它自動生成的代碼經(jīng)常失敗。但它不會固執(zhí)地認為“我寫的肯定對”。相反,它會啟動一個叫 A2P 的調(diào)試框架,進行反事實歸因。

它會像一個老練的程序員一樣問自己:

“如果我把這一行代碼換一種寫法,會不會就成功了?”

或者更進一步:

“是不是我最開始的那個假設(shè)本身就錯了?”

連自己的推理都能被自己證偽,這才叫真正的自我迭代。

DeepScientist 的范式革命之路

說到這里,你肯定好奇 DeepScientist 到底研究了什么問題呢?

說來也簡單,它解決的一個重要課題,就是想辦法自己設(shè)計一個算法,讓它對 AI 生成的文字的判斷準確率碾壓當前所有算法。注意,不是 DeepScientist 本身具有這個能力,是讓它設(shè)計算法來實現(xiàn)對當前最佳算法的碾壓。這是一項真正的研究。

在 DeepScientist 入場前,人類科學(xué)家已經(jīng)在這個領(lǐng)域奮斗了三年,把識別的準確率(AUROC 分數(shù))從 0.61 分逐步提升到了 0.80 分左右 。這是一個典型的、在舊范式內(nèi)添磚加瓦式的進步。

當前算法的基本思想,就是把一段文本當作語言學(xué)對象進行分析。研究者們主要關(guān)注詞匯的分布、語法的結(jié)構(gòu)以及邏輯連貫性等統(tǒng)計學(xué)特征。這就像通過分析筆跡和用詞習(xí)慣來判斷作者是一樣的。

但 DeepScientist 在觀察了現(xiàn)有研究的成果之后,敏銳地發(fā)現(xiàn)了這個經(jīng)典范式的根本局限:AI 的模仿能力越來越強,在統(tǒng)計學(xué)特征上,已經(jīng)和人類非常接近,繼續(xù)在這條路上卷,收益太低了。于是,DeepScientist 決定放棄當前范式,開辟一條新路。

DeepScientist 的假設(shè)是:如果不把文本看作文本,而是看作一個信號,會怎么樣?如果文本是一段信號,那么目標就從語義分析之類的事情,轉(zhuǎn)換成生成和發(fā)送信號的過程了。這就是范式革命。

它完全跳出了語言學(xué)的框架,進入了信號處理的領(lǐng)域。就像音頻工程師分析一段聲波,尋找其中不和諧的雜音一樣,DeepScientist 決定用“小波分析(一種能捕捉信號局部突變的數(shù)學(xué)工具)”和“相位一致性(衡量信號各頻率成分同步性的指標)”等數(shù)學(xué)工具,去尋找 AI 生成文本信號中那些不自然的、隱藏的噪聲和異常波動。

具體來說,人類寫作的時候,有時候會用生僻詞,有時候會存在邏輯跳脫,有時候還會故意制造意外。比如講到這里,我就很想讓大家多點點收藏點點贊,而 AI 就不會這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對比時,就會發(fā)現(xiàn)人類的文章信號中的熵波動很大,而 AI 的穩(wěn)定且低。說白了,就是 AI 更喜歡輸出正確的廢話。

另外,DeepScientist 還發(fā)現(xiàn),寫作這件事情其實是一個思考過程。文章都是一個字一個字打出來的,前面的字會影響后面的字。這就意味著,光看文章的結(jié)果是不完善的,要看文章這個信號產(chǎn)生的過程。這就是信號藏在時間維度中的信息。說句大白話,就是人類寫文章會回頭修改,信息的組織順序與一次成型的不一樣。所以,DeepScientist 就設(shè)計了一個名叫時序熵特征提取器(Temporal Entropy Feature Extractor)的算法,進一步抓住了 AI 與人類寫作的不同特征。

在短短兩周內(nèi),DeepScientist 自主地設(shè)計、編程、并迭代了三個越來越強的方法(T-Detect, TDT, 和 PA-Detect)。最終結(jié)果是:它不僅將識別準確率的最先進水平提升了 7.9%,還順便把檢測速度提高了一倍 。人類研究者三年的漸進式積累,被它以一個全新范式在短短兩周內(nèi)一舉超越——這不僅是效率的勝利,更是方法論的躍遷。


DeepScientist 用 2 周即可達到人類 3 年才能達到的水平 圖源:論

這場精彩的戰(zhàn)役完美展示了 DeepScientist 是如何工作的:它沒有死守語言學(xué)分析的老路,而是開辟了全新范式。那個“把文本看作信號”的瘋狂想法,只是數(shù)千個想法之一,DeepScientist 沒有嘗試論證自己的想法厲害,而是用實驗數(shù)據(jù)證明了自己。它在成功之前,已經(jīng)經(jīng)歷了無數(shù)次失敗,它踩著自己的失敗走了出來。從 T-Detect 到 TDT 再到 PA-Detect,它是在不斷推翻自己剛剛?cè)〉玫某晒?,用新的、更強的假設(shè)來迭代自己,展現(xiàn)了驚人的自我革命能力。

AI 科學(xué)家會讓人類研究者失業(yè)嗎?

一個狠起來連自己的命都革的 AI,確實可以稱得上是科學(xué)家了。DeepScientist 在系統(tǒng)層面,用代碼復(fù)刻了科學(xué)方法論的核心精神:可證偽性、實證精神和迭代循環(huán)。

它不是靠更多的參數(shù),更豐富的知識和更深度的推理取勝,而是靠一套類似真正科研的笨辦法:更嚴謹、更高效、更沒有偏見的科研流程——觀察、思考、假設(shè)、驗證的循環(huán)。

說到這里,你可能更關(guān)心的問題是:人類科學(xué)家要下崗了嗎?

跟以前所有同類問題一樣,這個問題的答案是:是,也不是。

未來,低層次的,缺少實驗設(shè)計能力的,專門從事簡單重復(fù)和試錯工作的科研工作者必然會被挑戰(zhàn)。但是那些能夠發(fā)現(xiàn)好問題的優(yōu)秀科學(xué)家,必然會開啟人機協(xié)同的科研新范式。人類科學(xué)家將從繁瑣的試錯中解放出來,專注于提出更有價值的科學(xué)問題,進行“元認知”層面的范式思考;而AI則作為最強大的“探索引擎”,在人類劃定的方向上,以我們無法企及的速度和規(guī)模,去窮盡各種可能性。

你需要知道的是,DeepScientist 是問題的解決者,而非問題的提出者。而你,必須問問自己,你能提出好問題嗎?

參考資料:

[1]https://arxiv.org/pdf/2509.26603

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
年前100多元一斤,年后價格腰斬!有湖北人已迫不及待下單

年前100多元一斤,年后價格腰斬!有湖北人已迫不及待下單

環(huán)球網(wǎng)資訊
2026-02-27 09:52:19
關(guān)鍵談判前,魯比奧、萬斯對伊朗發(fā)出警告

關(guān)鍵談判前,魯比奧、萬斯對伊朗發(fā)出警告

參考消息
2026-02-26 19:51:14
巴拿馬強收港口僅3天,李嘉誠再度“出手”,原來他早留退路

巴拿馬強收港口僅3天,李嘉誠再度“出手”,原來他早留退路

諦聽骨語本尊
2026-02-27 13:21:32
這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關(guān)!

這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關(guān)!

蜉蝣說
2026-01-29 14:46:50
240萬轉(zhuǎn)錯賬戶,浙江女子崩潰:對方欠銀行700萬,還是被執(zhí)行人,錢一直拿不回來

240萬轉(zhuǎn)錯賬戶,浙江女子崩潰:對方欠銀行700萬,還是被執(zhí)行人,錢一直拿不回來

犀利辣椒
2026-01-12 06:40:13
伊官員:若美國犯錯 伊朗將對其造成重大傷亡

伊官員:若美國犯錯 伊朗將對其造成重大傷亡

財聯(lián)社
2026-02-25 00:06:27
我國停產(chǎn)消失的25個汽車品牌,你還記得幾個?

我國停產(chǎn)消失的25個汽車品牌,你還記得幾個?

藍色海邊
2026-02-26 02:11:42
原來每個省過年都有專屬飲品!河北露露是標配,江西才需8毛錢

原來每個省過年都有專屬飲品!河北露露是標配,江西才需8毛錢

北緯的咖啡豆
2026-02-27 17:05:06
孔乙己排出九文大錢,相當于現(xiàn)在多少錢?網(wǎng)友:終于算清楚了

孔乙己排出九文大錢,相當于現(xiàn)在多少錢?網(wǎng)友:終于算清楚了

長風(fēng)文史
2026-02-27 11:00:36
馬杜羅的辯護律師指責美國政府阻止委政府向他支付律師費 要求主審法官撤銷案件

馬杜羅的辯護律師指責美國政府阻止委政府向他支付律師費 要求主審法官撤銷案件

每日經(jīng)濟新聞
2026-02-28 00:04:30
新娘長相富態(tài),和新郎同框宛如母子,網(wǎng)友:兄弟你是真不想上班啊

新娘長相富態(tài),和新郎同框宛如母子,網(wǎng)友:兄弟你是真不想上班啊

梅子的小情緒
2026-01-22 11:02:13
戲子誤國!春節(jié)剛過就有3位明星相繼塌房,走到這一步不值得同情

戲子誤國!春節(jié)剛過就有3位明星相繼塌房,走到這一步不值得同情

牛牛叨史
2026-02-28 00:40:54
嚴重泄漏后仍不停止生產(chǎn),應(yīng)急管理部點名包鋼板材廠爆炸事故

嚴重泄漏后仍不停止生產(chǎn),應(yīng)急管理部點名包鋼板材廠爆炸事故

南方都市報
2026-02-27 13:59:00
高人預(yù)測:十年后長沙,真正值錢的不是房子,而是這5個地段!

高人預(yù)測:十年后長沙,真正值錢的不是房子,而是這5個地段!

林子說事
2026-02-27 20:37:40
人老了,決定壽命的是5種病,沒有多半可以活到90歲,特別第5種

人老了,決定壽命的是5種病,沒有多半可以活到90歲,特別第5種

醫(yī)學(xué)原創(chuàng)故事會
2026-02-27 21:07:04
湖南一女子在網(wǎng)吧騷擾男性玩家,涉事網(wǎng)吧回應(yīng):一開始以為情侶爭吵,了解清楚立即制止了

湖南一女子在網(wǎng)吧騷擾男性玩家,涉事網(wǎng)吧回應(yīng):一開始以為情侶爭吵,了解清楚立即制止了

大象新聞
2026-02-26 18:53:03
大家不知道的是,媽祖乩童的真實待遇,不只是榮耀這么簡單

大家不知道的是,媽祖乩童的真實待遇,不只是榮耀這么簡單

觀察鑒娛
2026-02-25 10:17:00
哭窮的閆學(xué)晶,意外炸出中戲驚天腐??!三大招生大佬相繼自首...

哭窮的閆學(xué)晶,意外炸出中戲驚天腐敗!三大招生大佬相繼自首...

細雨中的呼喊
2026-02-15 11:00:48
嚴查!事關(guān)北京所有中小學(xué)生!

嚴查!事關(guān)北京所有中小學(xué)生!

美麗大北京
2026-02-26 19:13:25
難怪高市搞事,原來中國歷史上最大的錯誤就是:總習(xí)慣性低估日本

難怪高市搞事,原來中國歷史上最大的錯誤就是:總習(xí)慣性低估日本

議紀史
2026-02-26 20:25:06
2026-02-28 04:20:49
科學(xué)聲音 incentive-icons
科學(xué)聲音
普及科學(xué)知識,傳播科學(xué)精神
364文章數(shù) 35302關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

特朗普警告伊朗:“有時候不得不打”

頭條要聞

特朗普警告伊朗:“有時候不得不打”

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

本地
親子
家居
游戲
公開課

本地新聞

津南好·四時總相宜

親子要聞

驚呆了!12歲小女孩抱弟弟如同媽媽般自然,背后真相感人至深!

家居要聞

素色肌理 品意式格調(diào)

Oi朋友!你聽說過大只切的故事嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版