国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

是真的!AI科學(xué)家來了,這是一場令人類科學(xué)家目瞪口呆的范式革命

0
分享至

近日,西湖大學(xué)的研究者發(fā)布了一個名為“DeepScientist”的人工智能系統(tǒng),根據(jù)新聞里的說法,這是首個具有完整科研能力,且在無人工干預(yù)的情況下,能夠自我設(shè)定目標(biāo)并獨立通過迭代方式完成研究工作的人工智能。最可怕的是,經(jīng)過測試,的研究能力超越了人類科學(xué)家!

對此,網(wǎng)友在新聞下面的留言是:看到科學(xué)家也失業(yè)了我就放心了。
調(diào)侃歸調(diào)侃,我們想知道的是,這個新聞是否言過其實了?因為創(chuàng)造一個聰明的大語言模型是一回事,而創(chuàng)造 AI 科學(xué)家是另外一回事。它無關(guān)于想象力是否足夠豐富,也無關(guān)于深度思維能力夠不夠強(qiáng)。它涉及到一個人工智能的底層詛咒:知識迷信。即便是我們的專欄沒事兒就夸一夸的 DeepSeek 也沒有逃過這個底層詛咒。

科學(xué)哲學(xué)家托馬斯·庫恩提出過一個概念,叫做“范式革命”他認(rèn)為,科學(xué)發(fā)展不是簡單的知識累積,而是在一個個范式框架的更替中跳躍前進(jìn)的。比如說,地心說就是一個范式,無數(shù)天文學(xué)家通過努力觀察行星運動規(guī)律,在這個框架下修修補(bǔ)補(bǔ),讓它能盡可能完美地擬合天文觀察。但是,當(dāng)問題積累到一定程度,用地心說就實在解釋不通了,于是哥白尼等人提出的日心說就開啟了新范式時代。后面的天文學(xué)家把行星的圓形軌道修改成橢圓軌道,后來相對論又解決了水星進(jìn)動問題,這都是在新范式下進(jìn)行的。這就是“范式革命”。

范式革命最困難的,就在于打破對現(xiàn)有知識體系的迷信。這個過程極為困難,原因就是,即使最富有科學(xué)精神的科學(xué)家,也會傾向于相信自己為之努力過的舊觀點。別以為 AI 會更加理性中立和客觀,不會的,AI 比所有人類科學(xué)家都更固執(zhí)。

如果說人類最底層的執(zhí)念就是保衛(wèi)自己的生命的話,那么 AI 的底層執(zhí)念就是保衛(wèi)它已經(jīng)學(xué)會的知識。

  • 知識固化:把學(xué)到的東西當(dāng)成絕對真理,不支持自我修正;
  • 推理幻覺:為了保衛(wèi)舊知識,它會做出荒謬的推理;
  • 盲目崇拜:固有知識的權(quán)重高于推理結(jié)論,導(dǎo)致它刻意調(diào)和兩者的矛盾,導(dǎo)致觀點混亂;

這是傳統(tǒng) AI 無法擺脫的三大魔咒。說白了,傳統(tǒng)的 AI 更像一個虔誠的“知識信徒”,而不是一個叛逆的“革命者”。

這就是傳統(tǒng) AI 當(dāng)不了科學(xué)家的理由。一個真正的科學(xué)家,其價值不僅僅是學(xué)習(xí)和應(yīng)用知識,更在于他敢于挑戰(zhàn)、甚至推翻已有的知識,創(chuàng)造新的知識。那么,這個名叫 DeepScientist 的人工智能,真的有能力否定自己的舊知識,創(chuàng)造出新知識嗎?我們帶著這個疑問,翻開了它的論文。

AI 科學(xué)家如何擺脫“知識崇拜”?

DeepScientist 之所以被稱為“科學(xué)家”,不是因為它算得快,而是因為它在系統(tǒng)層面重建了一套科學(xué)方法論。它工作的基本流程可以簡化為四步:觀察、思考、假設(shè)、驗證。而在這簡單的循環(huán)背后,藏著一套精妙的反知識崇拜機(jī)制。

首先,DeepScientist 在設(shè)計時就沒有絕對的固有知識,它的知識是臨時用的,而且是隨時準(zhǔn)備被推翻的。

傳統(tǒng) AI 系統(tǒng)有個固化的知識庫,像一本不容置疑的圣經(jīng)。但 DeepScientist 的腦子里沒有這種東西。它的知識只來源于兩個動態(tài)的部分:一是實時的外部文獻(xiàn)(每次啟動前,從網(wǎng)上抓取最新的相關(guān)論文);二是它自己的“實驗記憶”(Findings Memory),里面密密麻麻記錄了自己每一次嘗試的成敗。

更關(guān)鍵的問題在于,的世界觀里,那些頂刊論文的領(lǐng)域最高水平也不等于真理。它的核心任務(wù),恰恰是去打破這些主流方法,找到更好的路徑。所以,它天生就被設(shè)計成了一個權(quán)威反叛者,人類最高水平本來就是被超越的目標(biāo)!

其次,它的認(rèn)知迭代靠實驗,而不是靠相信。DeepScientist從不相信任何一個想法,無論這個想法聽起來多么天才。它信奉的是科學(xué)實證主義:可重復(fù)的實驗結(jié)果高于一切權(quán)威和推理。

它的工作流是一個嚴(yán)格的閉環(huán):提出一個新假設(shè) → 自動編程實現(xiàn)它 → 讓程序在真實的測試環(huán)境中跑一遍 → 把性能指標(biāo)(比如準(zhǔn)確率、速度)存入自己的實驗記憶 → 根據(jù)新結(jié)果更新下一步的探索策略。

如果一個想法和現(xiàn)有文獻(xiàn)的結(jié)論完全沖突,但實驗證明它的效果更好,那么系統(tǒng)會毫不猶豫地信任實驗結(jié)果。反之,如果實驗失敗了,那無論這個想法的理論推理多么完美,都會被標(biāo)記為無效。這就像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,他的認(rèn)知只建立在冷冰冰的實驗數(shù)據(jù)之上。

人類科學(xué)家很容易陷入一個思維陷阱,那就是總會不自覺地尋找支持自己理論的證據(jù),而忽略反面證據(jù)。沒辦法,科學(xué)家太想實驗成功了。但是 DeepScientist 通過它的發(fā)現(xiàn)記憶庫完美地規(guī)避了這一問題。

這個記憶庫里記錄的,不只是成功的經(jīng)驗,更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無變化的嘗試,都被忠實地記錄在案。在開啟下一輪探索時,這些失敗記錄就成了一張寶貴的“排雷圖”,讓它能主動避開已經(jīng)被證偽的方向。

更妙的是,它還會利用一種叫做 UCB 的算法,在“繼續(xù)挖掘現(xiàn)有研究方法的潛能”和“尋找一個新方法去探索”之間取得平衡。失敗不是垃圾,而是一張能指引方向的導(dǎo)航地圖。

最令人驚嘆的是,DeepScientist 連自己創(chuàng)造出的東西都敢推翻。論文提到,它自動生成的代碼經(jīng)常失敗。但它不會固執(zhí)地認(rèn)為“我寫的肯定對”。相反,它會啟動一個叫 A2P 的調(diào)試框架,進(jìn)行反事實歸因。

它會像一個老練的程序員一樣問自己:

“如果我把這一行代碼換一種寫法,會不會就成功了?”

或者更進(jìn)一步:

“是不是我最開始的那個假設(shè)本身就錯了?”

連自己的推理都能被自己證偽,這才叫真正的自我迭代。

DeepScientist 的范式革命之路

說到這里,你肯定好奇 DeepScientist 到底研究了什么問題呢?

說來也簡單,它解決的一個重要課題,就是想辦法自己設(shè)計一個算法,讓它對 AI 生成的文字的判斷準(zhǔn)確率碾壓當(dāng)前所有算法。注意,不是 DeepScientist 本身具有這個能力,是讓它設(shè)計算法來實現(xiàn)對當(dāng)前最佳算法的碾壓。這是一項真正的研究。

在 DeepScientist 入場前,人類科學(xué)家已經(jīng)在這個領(lǐng)域奮斗了三年,把識別的準(zhǔn)確率(AUROC 分?jǐn)?shù))從 0.61 分逐步提升到了 0.80 分左右 。這是一個典型的、在舊范式內(nèi)添磚加瓦式的進(jìn)步。

當(dāng)前算法的基本思想,就是把一段文本當(dāng)作語言學(xué)對象進(jìn)行分析。研究者們主要關(guān)注詞匯的分布、語法的結(jié)構(gòu)以及邏輯連貫性等統(tǒng)計學(xué)特征。這就像通過分析筆跡和用詞習(xí)慣來判斷作者是一樣的。

但 DeepScientist 在觀察了現(xiàn)有研究的成果之后,敏銳地發(fā)現(xiàn)了這個經(jīng)典范式的根本局限:AI 的模仿能力越來越強(qiáng),在統(tǒng)計學(xué)特征上,已經(jīng)和人類非常接近,繼續(xù)在這條路上卷,收益太低了。于是,DeepScientist 決定放棄當(dāng)前范式,開辟一條新路。

DeepScientist 的假設(shè)是:如果不把文本看作文本,而是看作一個信號,會怎么樣?如果文本是一段信號,那么目標(biāo)就從語義分析之類的事情,轉(zhuǎn)換成生成和發(fā)送信號的過程了。這就是范式革命。

它完全跳出了語言學(xué)的框架,進(jìn)入了信號處理的領(lǐng)域。就像音頻工程師分析一段聲波,尋找其中不和諧的雜音一樣,DeepScientist 決定用“小波分析(一種能捕捉信號局部突變的數(shù)學(xué)工具)”和“相位一致性(衡量信號各頻率成分同步性的指標(biāo))”等數(shù)學(xué)工具,去尋找 AI 生成文本信號中那些不自然的、隱藏的噪聲和異常波動。

具體來說,人類寫作的時候,有時候會用生僻詞,有時候會存在邏輯跳脫,有時候還會故意制造意外。比如講到這里,我就很想讓大家多點點收藏點點贊,而 AI 就不會這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對比時,就會發(fā)現(xiàn)人類的文章信號中的熵波動很大,而 AI 的穩(wěn)定且低。說白了,就是 AI 更喜歡輸出正確的廢話。

另外,DeepScientist 還發(fā)現(xiàn),寫作這件事情其實是一個思考過程。文章都是一個字一個字打出來的,前面的字會影響后面的字。這就意味著,光看文章的結(jié)果是不完善的,要看文章這個信號產(chǎn)生的過程。這就是信號藏在時間維度中的信息。說句大白話,就是人類寫文章會回頭修改,信息的組織順序與一次成型的不一樣。所以,DeepScientist 就設(shè)計了一個名叫時序熵特征提取器(Temporal Entropy Feature Extractor)的算法,進(jìn)一步抓住了 AI 與人類寫作的不同特征。

在短短兩周內(nèi),DeepScientist 自主地設(shè)計、編程、并迭代了三個越來越強(qiáng)的方法(T-Detect, TDT, 和 PA-Detect)。最終結(jié)果是:它不僅將識別準(zhǔn)確率的最先進(jìn)水平提升了 7.9%,還順便把檢測速度提高了一倍 。人類研究者三年的漸進(jìn)式積累,被它以一個全新范式在短短兩周內(nèi)一舉超越——這不僅是效率的勝利,更是方法論的躍遷。

這場精彩的戰(zhàn)役完美展示了 DeepScientist 是如何工作的:它沒有死守語言學(xué)分析的老路,而是開辟了全新范式。那個“把文本看作信號”的瘋狂想法,只是數(shù)千個想法之一,DeepScientist 沒有嘗試論證自己的想法厲害,而是用實驗數(shù)據(jù)證明了自己。它在成功之前,已經(jīng)經(jīng)歷了無數(shù)次失敗,它踩著自己的失敗走了出來。從 T-Detect 到 TDT 再到 PA-Detect,它是在不斷推翻自己剛剛?cè)〉玫某晒眯碌?、更?qiáng)的假設(shè)來迭代自己,展現(xiàn)了驚人的自我革命能力。

AI 科學(xué)家會讓人類研究者失業(yè)嗎?

一個狠起來連自己的命都革的 AI,確實可以稱得上是科學(xué)家了。DeepScientist 在系統(tǒng)層面,用代碼復(fù)刻了科學(xué)方法論的核心精神:可證偽性、實證精神和迭代循環(huán)。

它不是靠更多的參數(shù),更豐富的知識和更深度的推理取勝,而是靠一套類似真正科研的笨辦法:更嚴(yán)謹(jǐn)、更高效、更沒有偏見的科研流程——觀察、思考、假設(shè)、驗證的循環(huán)。

說到這里,你可能更關(guān)心的問題是:人類科學(xué)家要下崗了嗎?

跟以前所有同類問題一樣,這個問題的答案是:是,也不是。

未來,低層次的,缺少實驗設(shè)計能力的,專門從事簡單重復(fù)和試錯工作的科研工作者必然會被挑戰(zhàn)。但是那些能夠發(fā)現(xiàn)好問題的優(yōu)秀科學(xué)家,必然會開啟人機(jī)協(xié)同的科研新范式。人類科學(xué)家將從繁瑣的試錯中解放出來,專注于提出更有價值的科學(xué)問題,進(jìn)行“元認(rèn)知”層面的范式思考;而AI則作為最強(qiáng)大的“探索引擎”,在人類劃定的方向上,以我們無法企及的速度和規(guī)模,去窮盡各種可能性。

你需要知道的是,DeepScientist 是問題的解決者,而非問題的提出者。而你,必須問問自己,你能提出好問題嗎?

參考資料:

[1]https://arxiv.org/pdf/2509.26603

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
曾受記過處分,任市委書記僅一年多落馬

曾受記過處分,任市委書記僅一年多落馬

中國新聞周刊
2026-05-07 15:46:43
太狂了!成都麓湖二手房價破10萬!

太狂了!成都麓湖二手房價破10萬!

樓市滅霸
2026-05-07 19:49:24
凱恩進(jìn)球只算挽回顏面?不,他或幫德甲額外搶下一個歐冠名額!

凱恩進(jìn)球只算挽回顏面?不,他或幫德甲額外搶下一個歐冠名額!

仰臥撐FTUer
2026-05-07 20:35:10
羽毛球運動員何冰嬌、乒乓球運動員錢天一擬退役,二人均選擇自主擇業(yè),各自獲一次性補(bǔ)償金70余萬元

羽毛球運動員何冰嬌、乒乓球運動員錢天一擬退役,二人均選擇自主擇業(yè),各自獲一次性補(bǔ)償金70余萬元

大象新聞
2026-05-07 17:46:09
小米SU7鎖單8萬臺,扯下了誰的訂單遮羞布?

小米SU7鎖單8萬臺,扯下了誰的訂單遮羞布?

邱小鋮
2026-05-06 16:09:25
谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

魯中晨報
2026-05-05 16:26:17
蘇提達(dá)贏麻了!王后從瑞典回國地位又提升,為慶祝她生日泰王豁出去了

蘇提達(dá)贏麻了!王后從瑞典回國地位又提升,為慶祝她生日泰王豁出去了

小魚愛魚樂
2026-05-07 16:41:14
段鵬79歲臨終前說出隱情:和尚死在黑云寨,是因為和尚知道了……

段鵬79歲臨終前說出隱情:和尚死在黑云寨,是因為和尚知道了……

呆子的故事
2026-02-10 14:44:11
法國突然宣布:“戴高樂”號航母正駛向紅海,準(zhǔn)備為霍爾木茲海峽護(hù)航!美軍:“林肯”號航母起飛戰(zhàn)機(jī),炸毀伊朗油輪船舵

法國突然宣布:“戴高樂”號航母正駛向紅海,準(zhǔn)備為霍爾木茲海峽護(hù)航!美軍:“林肯”號航母起飛戰(zhàn)機(jī),炸毀伊朗油輪船舵

每日經(jīng)濟(jì)新聞
2026-05-07 08:05:02
張亮兒子17歲當(dāng)?shù)耍。?>
    </a>
        <h3>
      <a href=八卦瘋叔
2026-05-06 11:04:32
贏了!《寒戰(zhàn)1994》票房破2億,港片丟的臉,讓周潤發(fā)掙回來了

贏了!《寒戰(zhàn)1994》票房破2億,港片丟的臉,讓周潤發(fā)掙回來了

娛樂圈筆娛君
2026-05-06 11:18:59
一位普通母親拿出3000元補(bǔ)貼失業(yè)女兒,撐起失業(yè)年輕人的生活底氣

一位普通母親拿出3000元補(bǔ)貼失業(yè)女兒,撐起失業(yè)年輕人的生活底氣

搗蛋窩
2026-05-07 14:02:53
別尬演美女了!大餅?zāi)槨⑺忸^鼻、這是能迷倒4個男人該有的皮囊?

別尬演美女了!大餅?zāi)槨⑺忸^鼻、這是能迷倒4個男人該有的皮囊?

暖心萌阿菇?jīng)?/span>
2026-05-06 15:52:07
美油布油雙雙下挫5% 美油跌破每桶90美元

美油布油雙雙下挫5% 美油跌破每桶90美元

財聯(lián)社
2026-05-07 20:58:06
等不到了!!東契奇自爆復(fù)出時間....

等不到了??!東契奇自爆復(fù)出時間....

柚子說球
2026-05-07 18:06:04
人能捅多大簍子?上海迪士尼十周年手帳印錯字,變身“迪土尼”!網(wǎng)友傻眼!

人能捅多大簍子?上海迪士尼十周年手帳印錯字,變身“迪土尼”!網(wǎng)友傻眼!

上觀新聞
2026-05-06 17:14:06
高市特使抵達(dá)后,俄罕見開出關(guān)系正?;瘲l件,果然沒有讓中國失望

高市特使抵達(dá)后,俄罕見開出關(guān)系正常化條件,果然沒有讓中國失望

混沌錄
2026-05-07 21:08:17
剛剛!霍爾木茲海峽,突傳大消息!全球巿場,集體異動!

剛剛!霍爾木茲海峽,突傳大消息!全球巿場,集體異動!

數(shù)據(jù)寶
2026-05-07 19:09:59
江蘇入梅最新消息!

江蘇入梅最新消息!

江南晚報
2026-05-07 17:48:24
佛說:當(dāng)你看懂這段文字,你的人生真的會越來越順

佛說:當(dāng)你看懂這段文字,你的人生真的會越來越順

金沛的國學(xué)筆記
2026-05-05 12:29:12
2026-05-07 21:36:49
科學(xué)聲音 incentive-icons
科學(xué)聲音
普及科學(xué)知識,傳播科學(xué)精神
376文章數(shù) 35324關(guān)注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

存款被銀行員工"轉(zhuǎn)走炒股" 兩儲戶1800萬元已全部到賬

頭條要聞

存款被銀行員工"轉(zhuǎn)走炒股" 兩儲戶1800萬元已全部到賬

體育要聞

巴黎再進(jìn)歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

Lisa主持!寧藝卓觀看脫衣秀風(fēng)波升級

財經(jīng)要聞

金融“風(fēng)暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

家居
教育
游戲
房產(chǎn)
公開課

家居要聞

破繭成蝶 土味精裝房爆改

教育要聞

名額分配人數(shù)又要分析?別走火入魔了……

PS主機(jī)獨占國產(chǎn)大作竟在海外被狂噴!官方回應(yīng)來了

房產(chǎn)要聞

負(fù)債23億,抵押482畝地!海南這家巨頭,慘遭拍賣!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版