国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

科幻作家劉洋:文學(xué)計算研究不僅是可行的,而且是必要的

0
分享至


文學(xué)計算( Literary Computing ),即通過計量的方式進(jìn)行文學(xué)作品的挖掘、分析、比較和批評,是當(dāng)前方興未艾的數(shù)字人文潮流的一個重要組成部分,但其傳統(tǒng)和源流又遠(yuǎn)遠(yuǎn)早于數(shù)字人文這一概念所通常涵蓋的時間范圍。在 19 世紀(jì)末,歐洲和美國的一些科學(xué)家就已經(jīng)嘗試通過量化的方式,對文學(xué)作品進(jìn)行分析,這可以看作是最早期的文學(xué)計算研究。顯然,這一領(lǐng)域?qū)儆诘湫偷目鐚W(xué)科研究,對文本的數(shù)字化和特定要素的讀取涉及信息科學(xué),對數(shù)據(jù)的計算涉及統(tǒng)計學(xué),對數(shù)據(jù)中隱藏模式和結(jié)構(gòu)的提取涉及物理學(xué),對作品中角色或創(chuàng)作者的性格、精神的量化分析涉及心理學(xué),對文本中地理分布和變遷路徑的提取和可視化呈現(xiàn)涉及地理學(xué),等等。

跨學(xué)科研究固然是令人興奮的,因為它打破學(xué)科的邊界,通過新的視角和范式來處理既有的問題,往往能帶來新的洞見,但也帶來了新的困惑、懷疑和批評。特別是那些嘗試在人文學(xué)科與自然學(xué)科之間架設(shè)有效聯(lián)系和方法論橋梁的努力,尤其容易遭受各方的質(zhì)疑。正如查爾斯 · 珀西 · 斯諾( Charles Percy Snow )在《兩種文化與科學(xué)革命》的演講中提到的那樣,科學(xué)與人文之間 “ 存在互不理解的鴻溝 ” ( Snow , [1959]1990 )。作為一名科學(xué)家與作家,斯諾常常白天和科學(xué)家同事們一起工作,晚上則又和文學(xué)家朋友們聚在一起,因此他深刻地體會到在當(dāng)時的社會環(huán)境中,文學(xué)家和科學(xué)家之間的互不理解甚至是厭惡、敵意。我非常理解斯諾的這種感受,因為我本身是做物理研究出身的,在我學(xué)術(shù)生涯的初期,我主要從事凝聚態(tài)物理學(xué)研究。與此同時,在讀研究生的時候,我就開始創(chuàng)作科幻小說,并一直持續(xù)至今。也正因為我對科幻小說的喜愛,后來,我從理學(xué)院轉(zhuǎn)到人文學(xué)院,開始接觸到更多人文學(xué)者和文學(xué)理論。我發(fā)現(xiàn),斯諾所說的鴻溝,在今天并沒有彌合,因為兩類學(xué)者的基本學(xué)術(shù)素養(yǎng)、關(guān)心的問題和研究的范式都截然不同。但與斯諾所說不同的是,今天的兩類學(xué)者之間似乎并沒有太多敵意了,因為隨著人文學(xué)科在話語權(quán)利結(jié)構(gòu)中的整體收縮,兩者 連產(chǎn)生 敵意的基礎(chǔ)都已經(jīng)失去了。

事實上,在文學(xué)與自然科學(xué)的交融進(jìn)程中,我們可以大致區(qū)分出兩種學(xué)科跨越的方向,每一種都引起了眾多爭議。一種是將自然科學(xué)的概念引入文學(xué)理論中,但拋棄了其數(shù)學(xué)上的復(fù)雜結(jié)構(gòu),而是僅將其作為一種類比物,以幫助闡明某種特定的理念、結(jié)構(gòu)和關(guān)系。例如,當(dāng)?shù)つ釥?· 奧爾布賴特( Daniel Albright )使用 “ 波浪美學(xué) ” ( Wave-Aesthetics )分析葉芝的詩歌時,他只是借用量子力學(xué)中微粒和波之間的模糊關(guān)系,闡釋某些詩歌文本所具有的特征,比如內(nèi)部邊界的喪失、主客體與主體間界限的喪失等。他并不是說,詩歌的內(nèi)部結(jié)構(gòu)與 波具有 數(shù)學(xué)上的同構(gòu)性,因此,自然也不能將涉及波的一系列數(shù)學(xué)公式套用到詩歌結(jié)構(gòu)分析之中。顯然,這類學(xué)科跨越的方式通常由人文學(xué)者發(fā)起。在后現(xiàn)代文化理論中,我們還可以找到很多這樣的例子,比如讓 - 弗朗索瓦 · 利奧塔( Jean-Francois Lyotard )對不確定性原理的借用、 讓 · 鮑德里亞( Jean Baudrillard )對熵的借用、雅克 · 拉康( Jacques Lacan )對拓?fù)鋵W(xué)概念的借用,等等。這種做法在自然科學(xué)界引起了一些不滿,比如物理學(xué)教授艾倫 · 索卡爾( Alan Sokal )及其合著者在一本書中就批評道: “ 自然科學(xué)并非僅是可供人文科學(xué)隨時取用的隱喻庫。 ” (莫蘭, 2023 : 176 )

另一種跨越方式則是由自然科學(xué)家主動發(fā)起。他們將原本屬于自然科學(xué)的研究范式引入文學(xué)研究領(lǐng)域,發(fā)展出實證的、量化的文學(xué)研究。這個過程中有時候也會借用一些科學(xué)概念,比如信息熵、溫度等,但這類借用并不只是將概念作為某種隱喻,而是伴隨著其數(shù)學(xué)結(jié)構(gòu)的引入。比如,對文學(xué)文本的信息熵的計算,使用的正是克勞德 · 艾爾伍德 · 香農(nóng)( Claude Elwood Shannon )給出的公式,而當(dāng)我們討論文本的溫度時,其背后的機(jī)制也正是熱力學(xué)中的麥克斯韋 - 玻爾茲曼分布。在 20 世紀(jì)后半葉,隨著計算機(jī)的出現(xiàn)和自然語言處理算法的發(fā)展,對文本的讀取、數(shù)值統(tǒng)計和數(shù)學(xué)建模變得更為方便,這類量化研究就逐漸變得流行起來。本書所涉及的內(nèi)容大部分即是這一類的研究。為了與文學(xué)史考證等實證 型研究 相區(qū)別,我們統(tǒng)一將其稱為文學(xué)計算。

對文學(xué)計算的批評主要來自人文學(xué)界,他們的意見大致可以分為三類:其一,文學(xué)文本來自具有主觀性的人類,其中并不具有如物理學(xué)那樣的客觀規(guī)律;其二,量化研究只是復(fù)現(xiàn)了一些我們早已經(jīng)知曉的結(jié)論,并沒有提出和解決有意義的文學(xué)問題;其三,大部分文學(xué)計算研究只是基于詞頻的模式分析,其數(shù)據(jù)不足以支撐它所聲稱的結(jié)論,或者說,文學(xué)文本和文學(xué)概念在計算過程中被簡單化了。

對于第一類批評,已經(jīng)有大量的研究結(jié)果可以作為反駁的案例。 從齊普夫 定律( Zipf ’ s Law )到最近基于情感計算的文本敘事模式劃分,大量的研究都顯示,在看似隨機(jī)和主觀的文本中,的確存在著某些客觀的規(guī)律。這一點很好理解,因為作家的寫作過程并非完全自由,他會受到諸多客觀條件的限制:正確的語法、敘事的慣例、詞匯的有限性,等等。它們就像一個封閉的箱子一樣,將大量的隨機(jī)運動的分子約束在一起,雖然每個分子的運動軌跡是很難預(yù)測的,但作為一個整體,這個體系卻呈現(xiàn)出很多可以量化的特征,比如壓強、溫度、平均自由程、動能分布函數(shù)等。

第二類和第三類批評事實上指出了當(dāng)前文學(xué)計算研究應(yīng)該努力的方向。也就是說,多做探索性而非驗證性的工作,而且盡量超出詞頻、 句長等 簡單指標(biāo),對高層次文學(xué)概念進(jìn)行更精細(xì)的數(shù)學(xué)建模,以處理真正的文學(xué)問題。當(dāng)然,要進(jìn)行探索性的工作,通常就需要處理新的概念和新的問題,自然也就需要進(jìn)行復(fù)雜特征量的建構(gòu)。所以,從某種程度上來講,這兩個問題是一體的。

《文學(xué)計算導(dǎo)論》

劉 洋 著

北京: 科學(xué)出版社, 2025. 12

ISBN978-7-03-083198-9

必須承認(rèn),在高層次文學(xué)概念和計量的特征量之間建立穩(wěn)定而有效的連接并不容易,但也絕不是不可能完成的任務(wù)。例如,在本書 (《文學(xué)計算導(dǎo)論》,劉洋著. 北京: 科學(xué)出版社, 2025. 12) 的第四章,我提出了一種對敘事節(jié)奏進(jìn)行量化表征的方法。在文學(xué)計算領(lǐng)域,敘事研究一直相對匱乏。因為敘事研究中的要素難以量化,帶有強烈的主觀性,所以比其他文本特征更難處理。例如,研究文體風(fēng)格、人物關(guān)系網(wǎng)絡(luò)、情感分析等可以分別通過詞頻統(tǒng)計、對話關(guān)系、情感詞典等手段實現(xiàn)量化,但敘事風(fēng)格、手法、場景等要素的界定方式則極為模糊。在傳統(tǒng)的敘事學(xué)研究中,通常需要根據(jù)敘事場景的切換,將文本劃分為不同的敘事單元,這種工作通常只有具備較高文學(xué)素養(yǎng)的專業(yè)人員才能完成,因為敘事場景之間或許并不存在天然的分割線,要讓計算機(jī)準(zhǔn)確分辨是十分困難的。但是,基于敘述的兩種形式 — 展示 和 告知 — 來體現(xiàn) 出敘事節(jié)奏的特征,可以繞開場景劃分的 障礙。具體來說,我設(shè)計了一種算法,可以將這兩種敘述形式進(jìn)行自動識別,從而得到了一條敘述形式的時間序列?;谶@個時間序列,通過傅里葉變換等數(shù)學(xué)手段,就可以從中提取出與敘事節(jié)奏相對應(yīng)的特征量。

比起自然科學(xué)領(lǐng)域的概念,比如溫度、動量等,文學(xué)概念的量化不僅更難以處理,而且這些可計量的特征量與傳統(tǒng)的文學(xué)概念在匹配時往往具有與自然科學(xué)概念不同的三種特性。其一,非精確性,也就是說兩者并不是精確契合的。比如我之前提到的對敘事節(jié)奏進(jìn)行量化的特征量,其本質(zhì)上來源于從敘述形式時序數(shù)據(jù)中提取出的頻譜峰。雖然其與敘事節(jié)奏具有較強的關(guān)聯(lián),但這畢竟只是一個間接的匹配方案。此外,實際的頻譜圖通常是一個連續(xù)譜,其中的峰值可能并不顯著,呈現(xiàn)出一個平臺狀結(jié)構(gòu),這也會影響到對峰值數(shù)據(jù)的提取。所以,從概念到數(shù)據(jù),這中間其實經(jīng)過了多次近似過程。其二,非唯一性,也就是說用于表征某個文學(xué)概念的特征量并非只有一種形式。比如對于 “ 詞匯豐富度 ” 這個概念,用以表征它的特征量就有數(shù)十種之多,從最簡單的型 — 例比 ( Type Token Ratio , TTR ), 到特征 量 K ( Characteristic K ),乃至文本的信息熵,等等。其三,非普適性,也就是說這些特征量并不是在任何情況下都適用的。比如我們剛才提到的特征量 K 和信息熵,在表征詞匯豐富度時,它們都具有一個難以克服的缺陷,即對雷同文本的不敏感。如果我們將同一段文字重復(fù)一遍合并成新的文本,那么根據(jù)兩者的計算公式,其計算結(jié)果和單一文本是完全相同的,而這顯然是不合理的。這意味著,對于具有較多雷同片段的文本來說,用特征量 K 和信息熵 來作 為詞匯豐富度的指標(biāo)是不合適的。

在人工智能算法迅速發(fā)展的今天,我們越來越強烈地感到,文學(xué)計算研究不僅是可行的,而且是必要的。這種必要性至少體現(xiàn)在兩個方面。其一,傳統(tǒng)的文學(xué)細(xì)讀方法無法處理當(dāng)前迅速涌現(xiàn)的巨量文學(xué)文本。除了由傳統(tǒng)出版社出版的紙質(zhì)書籍,還有數(shù)量遠(yuǎn)超前者的網(wǎng)絡(luò)文學(xué)作品 —— 其每部作品的文本長度也幾乎比前者大一個數(shù)量級。其二,人工智能文本生成正在逐漸進(jìn)入人們的生活,其在大部分制式文章的寫作上都取得了較好的效果,但在文學(xué)創(chuàng)作領(lǐng)域仍然很不成熟。從已有的一些基于大語言模型的小說寫作實驗來看,其主要缺陷可以歸納為一點,就是缺少 “ 文學(xué)性 ” 。比如,它的敘事節(jié)奏很不穩(wěn)定,在很多不重要的細(xì)節(jié)上花費大量筆墨,而在關(guān)鍵情節(jié)上卻一筆帶過;它的比喻和描寫都極為平庸,沒有新奇性和創(chuàng)造性;它的人物缺少鮮明的個性和深刻的行為動機(jī);故事情節(jié)的套路化痕跡極為明顯;等等??朔鲜鲞@些缺陷的方法,就是加入一個文學(xué)插件,或者定制專業(yè)的文學(xué)創(chuàng)作大模型。想要向計算機(jī)系統(tǒng)傳達(dá)何謂 “ 文學(xué)性 ” ,自然需要采用計算機(jī)的語言 —— 也就是數(shù)字化的、量化的表述,這正是文學(xué)計算研究所要做的。當(dāng)我們能用量化的方式對比喻、隱喻、風(fēng)格化的描寫、敘事節(jié)奏等文學(xué)概念進(jìn)行表征以后,它們就可以作為一些重要的控制指標(biāo)參與到文本生成算法之中,幫助其增強生成內(nèi)容的文學(xué)性。

然而,即使在當(dāng)前這個普遍數(shù)字化的時代,進(jìn)行文學(xué)計算研究的困難仍然是巨大的。除了來自領(lǐng)域本身的巨大挑戰(zhàn),教育體系、學(xué)科壁壘等社會層面的客觀障礙也不容忽視。如何在學(xué)生培養(yǎng)和制度管理上克服這些障礙,是當(dāng)前發(fā)展文學(xué)計算這類跨學(xué)科領(lǐng)域所必須思考的問題。

事實上,打破專業(yè)和學(xué)科的界限,不僅是文學(xué)計算的需要,也是當(dāng)今眾多跨學(xué)科研究和前沿領(lǐng)域發(fā)展的需要。希望本書可以在跨學(xué)科研究的方法和路徑上為各領(lǐng)域的研究者提供一些有益的參考。

本文為《文學(xué)計算導(dǎo)論》(劉洋著. 北京: 科學(xué)出版社, 2025. 12)一書“緒論”,標(biāo)題為編者所加。

ISBN978-7-03-083198-9

責(zé)任編輯:王 丹 張翠霞

《文學(xué)計算導(dǎo)論》是一部深入探討文學(xué)作品量化分析方法的專著。它系統(tǒng)介紹了文學(xué)計算這一領(lǐng)域,從 19 世紀(jì)的手工文本統(tǒng)計分析到數(shù)字時代利用計算機(jī)技術(shù)的系統(tǒng)研究方法,不僅回顧了歷史淵源,還探討了如何通過數(shù)學(xué)模型、特征量建構(gòu)、數(shù)字細(xì)讀等方法解析文學(xué)作品,以揭示其內(nèi)在的隱藏結(jié)構(gòu)和普遍規(guī)律。全書覆蓋了作者歸屬與風(fēng)格分析、人物關(guān)系網(wǎng)絡(luò)、計量敘事研究、文學(xué)文本的情感計算、文本分形結(jié)構(gòu)分析及最新的人工智能技術(shù)在文學(xué)研究中的應(yīng)用等多個方面,全面展示了文學(xué)計算這一前沿的跨學(xué)科領(lǐng)域的發(fā)展現(xiàn)狀和未來潛力。

本書適合數(shù)字人文、文學(xué)、語言學(xué)、自然語言處理、復(fù)雜系統(tǒng)等領(lǐng)域的研究者以及對文學(xué)計算感興趣的研究生和本科生閱讀。

(本文編輯:劉四旦)

專業(yè)品質(zhì) 學(xué)術(shù)價值

原創(chuàng)好讀 科學(xué)品位

一起閱讀科學(xué)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
哪怕辟謠100次,如今依舊有球迷對NBA這5大謠言深信不疑

哪怕辟謠100次,如今依舊有球迷對NBA這5大謠言深信不疑

毒舌NBA
2026-02-24 07:05:56
馬杜羅向美法院提交動議,要求駁回其面臨的刑事起訴

馬杜羅向美法院提交動議,要求駁回其面臨的刑事起訴

界面新聞
2026-02-27 07:14:00
美媒:開拓者選瀚森屬于低風(fēng)險高回報 克林根安全下限是最好保險

美媒:開拓者選瀚森屬于低風(fēng)險高回報 克林根安全下限是最好保險

羅說NBA
2026-02-27 07:24:40
上海招留置看護(hù)的輔警,引熱議!網(wǎng)友說:留置看護(hù)比站崗都痛苦

上海招留置看護(hù)的輔警,引熱議!網(wǎng)友說:留置看護(hù)比站崗都痛苦

火山詩話
2026-02-27 07:36:56
向華強宣布遺產(chǎn)全給郭碧婷!向佐2兄弟不得繼承,徹底鬧翻小兒子

向華強宣布遺產(chǎn)全給郭碧婷!向佐2兄弟不得繼承,徹底鬧翻小兒子

銀河史記
2026-02-26 19:12:27
2勝8負(fù),凈輸65分!東部霸主變成紙老虎,這么打東部懸念就不大了

2勝8負(fù),凈輸65分!東部霸主變成紙老虎,這么打東部懸念就不大了

老梁體育漫談
2026-02-26 23:05:40
杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

蘭姐說故事
2025-06-09 10:00:07
《純真年代的愛情》他帶火1句臺詞,童星出身又是學(xué)霸戲紅人不紅

《純真年代的愛情》他帶火1句臺詞,童星出身又是學(xué)霸戲紅人不紅

世界更加寬廣
2026-02-26 20:19:14
年僅23歲!香港女警英年早逝,入職僅半年令人扼腕!

年僅23歲!香港女警英年早逝,入職僅半年令人扼腕!

朗威談星座
2026-02-26 04:54:45
1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實事求是

1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實事求是

帝哥說史
2026-02-25 06:30:03
300828,重大資產(chǎn)重組!今日復(fù)牌

300828,重大資產(chǎn)重組!今日復(fù)牌

證券時報e公司
2026-02-27 08:14:08
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
下課僅 1 個月!阿莫林下家曝光,曼聯(lián)球迷看完沉默了

下課僅 1 個月!阿莫林下家曝光,曼聯(lián)球迷看完沉默了

奶蓋熊本熊
2026-02-27 06:51:18
雷佳音沒撒謊!退出春晚,解散公司,性格大變的賈玲,證實他的話

雷佳音沒撒謊!退出春晚,解散公司,性格大變的賈玲,證實他的話

說歷史的老牢
2026-01-20 13:43:24
聯(lián)合國爆發(fā)爭端,凌晨中美大吵一架,美國犯下大錯,局勢已惡化

聯(lián)合國爆發(fā)爭端,凌晨中美大吵一架,美國犯下大錯,局勢已惡化

芊芊子吟
2026-02-26 11:26:11
奈飛美股盤后漲幅擴(kuò)大至13%

奈飛美股盤后漲幅擴(kuò)大至13%

每日經(jīng)濟(jì)新聞
2026-02-27 06:57:25
繼混雙之后,女雙也再次出局,這一切背后離不開王勵勤的戰(zhàn)略布局

繼混雙之后,女雙也再次出局,這一切背后離不開王勵勤的戰(zhàn)略布局

楊哥乒乓
2026-02-26 21:14:51
美國貿(mào)易代表:對“部分”國家關(guān)稅將上調(diào),對華關(guān)稅預(yù)計將維持現(xiàn)有水平

美國貿(mào)易代表:對“部分”國家關(guān)稅將上調(diào),對華關(guān)稅預(yù)計將維持現(xiàn)有水平

界面新聞
2026-02-27 07:51:29
二手房拋售狂潮愈演愈烈,一個房價危險信號,已經(jīng)出現(xiàn)4個跡象

二手房拋售狂潮愈演愈烈,一個房價危險信號,已經(jīng)出現(xiàn)4個跡象

貓叔東山再起
2026-02-26 11:50:03
正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

孤酒老巷QA
2026-02-26 11:36:58
2026-02-27 09:20:49
科學(xué)出版社 incentive-icons
科學(xué)出版社
科學(xué)出版社官方號
6008文章數(shù) 27928關(guān)注度
往期回顧 全部

藝術(shù)要聞

紫氣東來,好運一整年!

頭條要聞

牛彈琴:中國的兩個鄰國大打出手 傷亡相當(dāng)慘重

頭條要聞

牛彈琴:中國的兩個鄰國大打出手 傷亡相當(dāng)慘重

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

魅族手機(jī),終成棄子?

科技要聞

英偉達(dá)業(yè)績亮眼仍跌5% 兩大因素成核心隱憂

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
手機(jī)
本地
公開課

藝術(shù)要聞

紫氣東來,好運一整年!

數(shù)碼要聞

供應(yīng)鏈危機(jī)!蘋果或為iPhone和Mac支付兩倍內(nèi)存費

手機(jī)要聞

蘋果iPhone和iPad首批獲準(zhǔn)處理北約機(jī)密信息

本地新聞

津南好·四時總相宜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版