国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

古舊地圖的信息化

0
分享至


江西地名研究

關(guān)注我們,獲取更多地名資訊

摘要:近年人文社會科學(xué)研究中古舊地圖的使用規(guī)模和數(shù)字化處理需求不斷增加,古舊地圖的信息化迫在眉睫。文章以“數(shù)字歷史黃河”(DHYR)·圖形資料庫建設(shè)為例,介紹DHYR中圖形史料的RDF編目方案和古舊地圖地名信息自動化;通過清代基層水利單元“汛”“堡”重建黃河變遷事件研究案例,分析古舊地圖以及古舊地圖信息化方案在人文社會科學(xué)研究中的意義。RDF是用于描述知識圖譜實體及其關(guān)系的數(shù)據(jù)模型,能減少歷史地理信息化數(shù)據(jù)孤島現(xiàn)象,在DHYR中設(shè)計針對古舊地圖的編目方案和描述詞表;采用U-Net架構(gòu)模型進行古舊地圖地名OCR識別,展現(xiàn)深度學(xué)習(xí)方法在古舊地圖信息自動化提取中的能力,提高歷史地名提取的效率和準確率。

關(guān)鍵詞:地名 古舊地圖 黃河 信息化

0

前言


古舊地圖是人文社會科學(xué)研究的重要史料,在光學(xué)字符識別(OCR)、地理信息系統(tǒng)(GIS)、數(shù)據(jù)庫技術(shù)等數(shù)據(jù)庫信息化手段支持下,可以最大限度挖掘古舊地圖中的地理信息,提升古舊地圖的使用效率。歷史地理學(xué)界針對古舊地圖的信息化處理已經(jīng)進行多項實踐,如張萍等基于多種古舊地圖對西北“絲綢之路”交通路線和古代城市定位、韓昭慶研究康熙《皇輿全覽圖》投影方式、潘威等對近代灌渠體系的重建和分析,皆實踐了GIS手段在古舊地圖處理中的運用。不過,歷史地理學(xué)界將古舊地圖的信息化操作局限于GIS環(huán)境下的人工矢量化處理,限定了對古舊地圖的進一步研究和更廣泛使用。解決以上問題的方法是讓歷史地理信息化與圖情、計算機科學(xué)、信息管理等學(xué)科領(lǐng)域深度融合,在持續(xù)推動GIS在歷史地理學(xué)中應(yīng)用的同時,充分利用大數(shù)據(jù)環(huán)境下的數(shù)據(jù)庫技術(shù)、圖形計算技術(shù)、深度學(xué)習(xí)技術(shù)。通過加強對古舊地圖的管理、處理、使用和分析等多項技能,為歷史地理學(xué)、地圖學(xué)史和數(shù)字人文發(fā)展提供更多可能性。而要落實這一目標,首先應(yīng)解決古舊地圖文獻的數(shù)字化管理和圖幅內(nèi)容的自動化提取。對古舊地圖的管理既是對圖幅作為文獻的數(shù)字化和編目,也是對圖幅內(nèi)容的提取和數(shù)據(jù)化。

在歷史地理學(xué)研究中,使用古舊地圖需要信息化管理和圖幅內(nèi)容的信息化提取,兩者實際為一有機整體。研究者首先需要建立古舊地圖資料庫,采用信息化手段管理大量古舊地圖文檔,在此基礎(chǔ)上采用OCR等手段實現(xiàn)古舊地圖信息提取的自動化,之后方才進入具體研究環(huán)節(jié),即專題數(shù)據(jù)的使用層面。因此,古舊地圖的信息化管理以及圖幅內(nèi)容的自動化提取是科研工作中的重要環(huán)節(jié)。實現(xiàn)這一目標,必須引入圖情知識體系(本文所用“圖情知識體系”一詞為圖書情報學(xué)的理論與技術(shù)體系總和,是筆者作為歷史地理學(xué)工作者對圖情學(xué)路徑的一種概括),尤其是圖情學(xué)界所采用的RDF編目、語義網(wǎng)和近年來大力提倡的OCR技術(shù)等,對推動歷史地理信息化具有重要意義。本文以清代河工圖的信息化處理方法為例,通過“數(shù)字歷史黃河”(DHYR)中的圖形資料庫的設(shè)計與實現(xiàn),展現(xiàn)OCR、語義網(wǎng)技術(shù)、深度學(xué)習(xí)技術(shù)在歷史地理信息化建設(shè)中的重要作用,特別是對古舊地圖管理和使用中的重要作用。


1

“數(shù)字歷史黃河”·圖形資料庫


1.1 資料介紹

“數(shù)字歷史黃河”(DHYR)是由河南大學(xué)、云南大學(xué)共建共享共有的黃河歷史變遷古舊地圖資料庫,目的是實現(xiàn)黃河歷史變遷的數(shù)據(jù)管理、多維展示和輔助分析。黃河流域古舊地圖數(shù)量眾多,中國國家圖書館等單位建有古舊地圖管理平臺,對其已經(jīng)收藏圖形,DHYR原則上不重復(fù)收錄,專門針對尚未得到系統(tǒng)收集、整理和電子化處理的古舊地圖,力求與其他單位藏圖互為補充。該系統(tǒng)的資料管理庫有專門的“圖形資料庫”(本文記為“DHYR·圖形資料庫”),其中收錄有清代河工圖、民國地形圖、黃河流域規(guī)劃圖、晚清西方黃河調(diào)查圖、近代工程藍圖、手繪草圖等多種圖像。圖1列舉了被DHYR·圖形資料庫收錄的圖形史料,其中,圖1-1為1753年徐城北岸黃河支岔圖(局部);圖1-2為1932年渭北引涇灌溉圖(局部);圖1-3為1946年陜西省水利廳黃河規(guī)劃圖·洛河(局部)。DHYR覆蓋范圍為黃河流域的青、寧、甘、陜、豫、魯、蘇7省,內(nèi)容涉及黃河防洪工程、灌溉體系、交通布局、土地利用等,包括中、英、日等多種語言文字,已達2,100余幅,原圖收藏單位包括中國水利水電研究院、黃河水利委員會等重要機構(gòu),以及地方水利、檔案、博物館等系統(tǒng)。需要說明的是,沿黃地區(qū)的地形圖除水利部門繪制外,還有大量為軍事部門繪制,這類非水利機構(gòu)暫時不收錄于DHYR內(nèi)。


1.2 設(shè)計思路

DHYR·圖形資料庫的界面設(shè)計風(fēng)格簡潔(見圖2)。DHYR·圖形資料庫建設(shè)的主要思路包括:持續(xù)收集有關(guān)黃河的各類圖形史料;修復(fù)破損史料;對圖形進行掃描,形成高精度電子文本;建設(shè)信息化管理方案,進行高效管理;與平臺其他資料庫和數(shù)據(jù)庫實現(xiàn)鏈接;充分挖掘史料價值,推動黃河變遷研究。之所以形成以上目的,主要在于這一工作面臨多種困難,包括:經(jīng)費限制,本工作只能將經(jīng)費用于收集與整理圖幅,突出內(nèi)容建設(shè),降低平臺建設(shè)難度;管理能力不足,作為高校小型科研團隊,缺乏公共圖書館那樣成熟的信息平臺管理能力,只能犧牲平臺功能,將其維持在團隊能夠運營的水平上。實際上,這是許多高校中小型科研團隊面臨的問題,這一問題造成大量的歷史地理專題數(shù)據(jù)庫無法持續(xù)運營。


DHYR·圖形資料庫在設(shè)計上采取較保守的策略,優(yōu)先保證資料庫的穩(wěn)定運行,在這一前提下逐步嘗試新技術(shù)運用。DHYR·圖形資料庫有四大功能模塊:(1)圖幅信息模塊:對圖形史料的基本信息進行輸入、編輯;(2)查詢檢索模塊:按照圖名、編碼、繪制者、管理者、時代等多種要素進行圖幅檢索;(3)用戶管理模塊:登記、管理DHYR使用者信息;(4)數(shù)據(jù)維護模塊:對數(shù)據(jù)進行存儲、備份、還原操作。圖形資料庫是DHYR的組成部分,庫結(jié)構(gòu)采用HTML+CSS設(shè)計,后臺結(jié)構(gòu)采用SQL-Server。

1.3 編目方案

1.3.1 元數(shù)據(jù)方案和語義網(wǎng)技術(shù)

本團隊在資料管理方式上,嘗試中國歷史地理學(xué)界內(nèi)尚未被關(guān)注和使用的一些新方法,最重要的嘗試是借鑒圖情領(lǐng)域的元數(shù)據(jù)方案方法和語義網(wǎng)技術(shù),對圖形史料進行編目和元數(shù)據(jù)記錄編碼。圖幅管理的重點在于編目方案設(shè)計,而歷史地理學(xué)界尚未重視標準化規(guī)范化的資源編目的重要性,導(dǎo)致嚴重的數(shù)據(jù)孤島現(xiàn)象。DHYR·圖形資料采用圖情領(lǐng)域的元數(shù)據(jù)方案設(shè)計方法和語義網(wǎng)領(lǐng)域的RDF(Resource Description Framework)模型和編碼格式。RDF是W3C提出的用于描述知識單元及其相互關(guān)系的數(shù)據(jù)模型和數(shù)據(jù)編碼標準,是特色歷史文獻資源編目中的主流方法。RDF將元數(shù)據(jù)記錄抽象為主體(subject)、謂詞(predict)與客體(object)3個組成部分,利用標準化的數(shù)據(jù)編碼方案描述資料庫中數(shù)據(jù)記錄的每一個知識節(jié)點。統(tǒng)一采用這種標準化規(guī)范化的方法,不僅能夠?qū)崿F(xiàn)工作團隊內(nèi)部和跨團隊的數(shù)據(jù)共享,更易與圖書館系統(tǒng)中的編目數(shù)據(jù)進行互操作和整合,將個人研究融入文化基礎(chǔ)設(shè)施體系,令歷史地理學(xué)專題數(shù)據(jù)具有更為廣闊的用戶群體,共同建設(shè)知識譜系。這是促進歷史地理信息管理規(guī)范化、數(shù)據(jù)共享便捷化、豐富數(shù)據(jù)維度的重要舉措。DHYR在歷史地理學(xué)界率先針對圖形史料采用此方法,將單幅圖形本身作為主體(subject)、描述圖形元數(shù)據(jù)規(guī)范詞表中的元素作為謂語(predict)、元素值作為客體(object)。比如,《道光黃河六省河工埽壩全圖》的“題名(dc:title)”這一元素的編碼結(jié)果為:《道光河工埽壩全圖》實體dc:title“道光河工埽壩全圖”。

1.3.2 元素集(詞表)設(shè)計

在確定編目基本原則的基礎(chǔ)上,具體編目方案設(shè)計需要充分考慮古舊圖形記錄的獨特性,不能簡單地將圖情管理系統(tǒng)中對現(xiàn)代正規(guī)出版物、檔案和一般古籍的編目方案套用至本工作。因此,需要制訂有針對性的元數(shù)據(jù)方案,設(shè)計專用于古舊地圖的元數(shù)據(jù)元素集(描述字段)。通過分析DHYR工作中已經(jīng)收集的古舊地圖,發(fā)現(xiàn)一些描述字段對描述圖形具有重要作用,見表1中的“描述字段”列,包括描述性元數(shù)據(jù)和管理性元數(shù)據(jù),是設(shè)計元數(shù)據(jù)元素集的基礎(chǔ)。在此基礎(chǔ)上,借鑒國際通用的都柏林核心(DC)元數(shù)據(jù)標準規(guī)范,復(fù)用其中的部分元素,并自定義一部分元素,還復(fù)用少量上海圖書館本體詞表中的部分屬性。隨著今后工作的進展,這一方案將進行更新、擴展和修正。



表1是對DHYR中古舊圖形進行描述的字段構(gòu)成及其定義。通過這些字段,能清晰描述古舊圖形的時空信息、繪制信息和平臺管理信息。

(1)“空間范圍”字段采用經(jīng)緯度坐標體現(xiàn),這一做法可以在GIS環(huán)境中形成圖幅覆蓋范圍的空間可視化成果,更直觀地表現(xiàn)DHYR所收錄圖形史料的空間格局。

(2)“圖件標識符”“繪制人員標識符”“繪制機構(gòu)標識符”等的編訂方式尚無行業(yè)標準,在歷史地理學(xué)界也無前期成果可供參考,因此參考地理學(xué)界內(nèi)普遍使用的“郵政編碼方法”!皥D件標識符”采用7位整數(shù)進行編碼,首2位表示圖幅的歷史階段,如清代用“12”代表;第3位代表圖幅類型,如傳統(tǒng)時代的河工圖用“1”代表;后4位代表此類型序號,由“0000”開始!袄L制人員標識符”“繪制機構(gòu)標識符”采用4位整數(shù)進行編碼,首2位表示人員、機構(gòu)所處的歷史階段,后2位序號由“00”開始!袄L制人員標識符”“繪制機構(gòu)標識符”分別是“水利人物數(shù)據(jù)庫”中的人物標識碼與“水利機構(gòu)數(shù)據(jù)庫”的機構(gòu)標識碼,通過標識碼可以實現(xiàn)跨庫鏈接。

2

基于深度學(xué)習(xí)的

古舊地圖地名識別


在完成古舊地圖管理信息化的基礎(chǔ)上,需要重視古舊地圖圖幅內(nèi)容的自動提取。OCR(Optical Character Recognition)是圖形識別的一種,主流的OCR系統(tǒng)使用深度神經(jīng)網(wǎng)絡(luò),能夠?qū)崿F(xiàn)高精度的文檔內(nèi)容識別。

2.1 研制的必要性

在OCR系統(tǒng)支持下,歷史文獻識別的精度不斷提升,數(shù)字化進程大大加快,但通用OCR系統(tǒng)中的文檔分析與圖形識別方法難以直接應(yīng)用到古舊地圖的處理之中,是因為古舊地圖清晰度、幅面整潔度等要素差異巨大。比如,手繪古舊地圖中,道路、邊界線、文本等不同的地理要素互相疊加,而手寫手繪也導(dǎo)致樣式存在隨機性誤差,因而古舊地圖中地名的識別難度更大。古舊地圖中地理要素的定位和提取非常重要,傳統(tǒng)上由人工進行,近年借助機器學(xué)習(xí)等手段訓(xùn)練計算機實現(xiàn)自動提取圖幅內(nèi)容的需求日益增多,一些研究涉及從多種地圖中提取地理信息和文本信息的方法。地理信息系統(tǒng)中的地名解析(Geoparsing或Toponym Resolution)是找出非結(jié)構(gòu)化文本中提到的地名并將轉(zhuǎn)換為對應(yīng)的經(jīng)緯度坐標的過程。非結(jié)構(gòu)話文本中自動檢測識別地名是自然語言處理(Natural Language Processing,NLP)中的命名實體識別(Named Entity Recognition,NER)。本研究與文本中地名解析目標一致,都是從文本中提取地名:筆者的處理對象是圖片,即掃描地圖,使用OCR方法提取文本;后者的處理對象是已經(jīng)數(shù)字化的文本,使用訓(xùn)練機器從中識別出表示地名的短語。筆者的工作與文本中地名解析的任務(wù)部分重疊:筆者從古舊地圖中識別出的文本默認都是地名,但識別文本中的地名是文本中地名解析的核心工作,其方法能為本研究提供思路;相同的部分是都需要將識別的地名(通過OCR或NER得到)進行歧義消除(Disambiguation),確保提取的文本單元是合法的地名,OCR提取的文本內(nèi)容如何組合為正確的地名是本研究需要解決的關(guān)鍵問題。

2.2 深度學(xué)習(xí)與古舊地圖地名識別

利用機器學(xué)習(xí)方法從古舊地圖中識別地名需要大量的訓(xùn)練數(shù)據(jù),因此數(shù)據(jù)標注工作很關(guān)鍵。本研究采用逐步迭代的數(shù)據(jù)標注方法,起初使用通用的OCR檢測和識別古舊地圖中的文本,然后人工對檢測出的文本區(qū)域以及識別的文本內(nèi)容進行校對,在新數(shù)據(jù)集上訓(xùn)練新的地名文本檢測和識別模型,這樣每迭代一次模型的性能增強一次,經(jīng)過若干次迭代,系統(tǒng)就具備較高的地名檢測和識別準確率。

古舊地圖中地名文本的檢測屬于對象檢測的一種,深度學(xué)習(xí)在該領(lǐng)域取得了成功。對象檢測主要分為“兩步法”(Two-Stage)和“一步法”(One-Stage)。“兩步法”對圖片進行特征提取后,得到候選框,再進行分類及回歸,代表算法是RCNN系列的目標檢測算法。“一步法”是在提取的圖片的特征圖上進行密集抽樣,產(chǎn)生大量的先驗框,然后進行分類和回歸,代表方法包括YOLO、SSD、RetinaNet。本研究使用一步法檢測中國古舊地圖中所有的單個漢字,訓(xùn)練針對不同大小漢字的檢測模型。U-Net在智能語義分割任務(wù)中表現(xiàn)突出,最初是在醫(yī)療影像處理中得到成功應(yīng)用,然后廣泛應(yīng)用于對象檢測和語義分割任務(wù),本研究采用這種結(jié)構(gòu)的網(wǎng)絡(luò)進行字符級文本檢測。

由于文本檢測是字符級的,因此文本識別模型采用字符級識別模型。在文本識別領(lǐng)域,主流的OCR系統(tǒng)采用行(列)級別的識別模型,主要采用CTC(Connectionist Temporal Classification)算法搭配卷積神經(jīng)網(wǎng)絡(luò)疊加循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RNN)對圖片中包含的文本序列進行建模,一般而言文檔中的行和列相較于單個字符更易檢測。但是,地圖中的地名文本排列往往不像普通文獻那樣規(guī)則,而且有的地名字符間的距離較遠,所以行列級別的識別在地圖文本識別中并不像在一般文獻識別那么有效,因此使用卷積神經(jīng)網(wǎng)絡(luò)進行字符級別的檢測和識別。

2.3 工作流程

檢測到的文字形成正確的地名需要將這些字符合并組成地名詞語,使用Min-Cost Flow算法,將檢測到的文字進行適當(dāng)合并得到地名。圖片中的文本轉(zhuǎn)錄到計算機,主要包含兩個步驟:文本區(qū)域的檢測和文本的識別。前者從圖片中將包含文本的部分與圖片其余區(qū)域進行分割;后者將切割出的文本圖片進行識別,并將對應(yīng)的文本存儲到計算機。

本研究的古舊地圖文本自動提取方法包括2項關(guān)鍵步驟:一是古舊地圖中地名文本的檢測與識別;二是合并檢測到的文本形成正確的地名。第一步實際上是OCR系統(tǒng)功能:檢測和識別圖片中文本。有些中文地圖中文字數(shù)量密集,使用主流的OCR框架往往很難正確檢測出所有包含的文字,也很難一步到位地將所有文字根據(jù)視覺特點(如排列、距離)直接生成正確的地名(見圖3)。


本系統(tǒng)工作流程見圖4。第一步,采取字符級別的文本檢測,即檢測地圖中所有的字符,并使用字符識別模型識別出這些字符。第二步,首先根據(jù)檢測到的字符的視覺特點,如相對位置、大小,構(gòu)建一個K-NN的網(wǎng)絡(luò)。在網(wǎng)路中,每個檢測到的字符是一個節(jié)點,每個漢字代表的節(jié)點周圍距離它最近的K個其他漢字所對應(yīng)的節(jié)點之間,添加一條有向邊邊的權(quán)重是它們在圖片中檢測到的限界框(Bounding Boxes)中心之間的歐式距離,這里的權(quán)重在后面的算法中也稱為耗費,在構(gòu)建的這個網(wǎng)絡(luò)上使用Min-Cost Flow Algorithm將符合條件的字符連綴起來形成地名候選。后續(xù)研究將嘗試使用與該古舊地圖同時代的地名詞典(Gazetteer)對候選地名進行篩選和校對,從而獲得更準確的歷史地名。


2.4 系統(tǒng)關(guān)鍵部件

(1)文本檢測部件。在古舊地圖的字符檢測任務(wù)中,采用U-Net架構(gòu)的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠進行圖片的語義分割(Semantic Segmentation),在歷史文獻自動處理領(lǐng)域得到廣泛應(yīng)用,其中包括古舊地圖中的文本識別。因為目標是進行字符級的識別,所以字符檢測模型的數(shù)據(jù)標注采用單個字符的標注,標注的信息主要是字符的定界框(bounding boxes)。檢測出的單個字符輸入中文手寫體OCR系統(tǒng)進行識別,該系統(tǒng)能夠?qū)嗴w、繁體中文進行識別。

(2)文本識別部件。實施文本檢測的模塊需要記錄每個字符的坐標和尺寸,一方面為后續(xù)查詢定位提供服務(wù),另一方面為第二步的字符合成地名提供輔助信息。地圖中的文本標注信息具有如下特點:一個地名用的字符大小一致,大小不一致的往往不屬于同一個地名;一個地名包含的字符往往聚在一起成為方向不定的一行(排列方向可能為多種傾斜角度)。本研究的方法是:首先根據(jù)第一步中獲得的每個字符的定界框(Bounding Box),將檢測到的字符進行分層(位置與原圖中一樣),大小近似的在同一層次,以解決大小字符之間的干擾。將同一層的文本視為同一級別,利用地名文本的視覺特點組合成地名候選。

(3)中文地名合成部件。第二步類似于解析文本中包含的地名(Geoparsing),采用基于Min-cost Flow Algorithm的地名合成算法,從無結(jié)構(gòu)文本中識別出地名(自動化的實現(xiàn)需要自然語言理解相關(guān)技術(shù)),處理的是提取到的詞條,默認是地名。但OCR識別準確率難以在各種情況下都能達到100%準確率,古舊地圖中有些地名文本排列密度高、與背景疊加等原因使得提取到的詞條可能是錯誤的。因此,提取到的地名需要一個去模糊化(Toponym Disambiguation)過程,即確定提取的地名所屬歷史時期和所屬高層政區(qū)。

3

古舊地圖信息化處理

與清代黃河變遷研究


基于元數(shù)據(jù)方案、語義網(wǎng)技術(shù)和深度學(xué)習(xí)的古舊地圖管理、處理方法能夠?qū)崿F(xiàn)古舊地圖中地理信息的高效挖掘。這些方法是否能在歷史地理學(xué)科研實踐中發(fā)揮作用呢?下文以清代黃河變遷研究為例,介紹該方法在歷史自然地理研究中的應(yīng)用前景。

3.1 清代黃河下游的“汛”“堡”名稱提取

清代黃河下游依靠“汛”“堡”等基層水利管理單元實現(xiàn)修防、賑災(zāi)、工程建設(shè)與管理、河銀征收、防盜等事務(wù),是清代河政運作的基礎(chǔ)!把础币劳杏邳S河一側(cè)河岸的堤防進行劃分,“堡”則是在“汛”之下由幾個河兵或河夫駐守的據(jù)點!把础薄氨ぁ钡然鶎铀麊卧奶崛『投ㄎ,可以為清代黃河變遷研究提供定位河務(wù)運作的空間框架,能夠?qū)⒑鱼y收支、物料貿(mào)易網(wǎng)絡(luò)、河務(wù)官員流動路徑、堤防修護與決口等多項河務(wù)環(huán)節(jié)置于具體的地理空間下重新認識。但是,“汛”“堡”的整體狀況在文字性史料中并未得到全面記錄,僅有少數(shù)舉辦大型工程或發(fā)生決堤事件的“汛”“堡”名稱被記載。這一問題可以依靠清代河工圖解決。

利用DHYR·圖形資料庫,在規(guī)模龐大的清代河工圖中快速檢索到覆蓋下游全境、擁有“汛”-“堡”記錄的圖形史料。在史料搜尋方面,大致比傳統(tǒng)方法節(jié)省70%~80%的時間成本。以《道光黃河六省埽壩全圖》為例,利用本文提出的古舊地圖地名提取方法,訓(xùn)練計算機對圖幅中“汛”“堡”名稱進行快速提取,形成格式化表格,能夠快速完成“汛”“堡”名錄的制作。如圖5所示,限界框(Bounding Boxes)標定100%的“汛”“堡”名稱,為后期實現(xiàn)定位提供基礎(chǔ)。


圖5是依據(jù)此方法重建的豫東河段“汛”“堡”空間格局。與孫濤提出的黃河蘭考以下河段“汛”界數(shù)據(jù)共同構(gòu)成完整的“汛”“堡”空間數(shù)據(jù)。在此基礎(chǔ)上,根據(jù)文字性史料,可以判斷少數(shù)“堡”所在的經(jīng)緯度位置,如中牟下汛的九堡即今中牟縣九堡村,此河段一直是豫東河防重點,現(xiàn)代建有“九堡控導(dǎo)工程”。少數(shù)“堡”的經(jīng)緯度確定后,基本上可以在現(xiàn)代地圖上確定“汛”“堡”體系的基本格局,之后根據(jù)史料記錄和清代黃河下游形態(tài)、堤防格局推斷所有“堡”的位置,據(jù)此確定“汛”的范圍。

3.2 黃河重大變遷事件研究

19世紀以來,黃河下游最重要的變化即1855年(清咸豐五年)的“銅瓦廂改道”,黃河在今蘭考東壩頭一帶改道北流,奪大清河入渤海,結(jié)束了1128年以來形成的黃河“奪淮入黃海”局面,奠定了現(xiàn)代黃河下游基本格局。借助道光《豫省河工圖》(見圖6)及對其的信息化處理,可以重新認識“銅瓦廂改道”的過程、原因和影響。


重新討論“銅瓦廂改道”,首先需要準確認識決口點位置,長期以來,學(xué)界認為此次大改道決口點為黃河蘭考段的銅瓦廂,但通過閱讀清代河工檔案,結(jié)合實地調(diào)查,本研究發(fā)現(xiàn)1855年決口點為蘭陽上汛三堡。從道光《豫省河工圖》中發(fā)現(xiàn),道光年間銅瓦廂段黃河已經(jīng)緊逼河堤,銅瓦廂段形成托壩、挑水壩、雞嘴壩、格堤等復(fù)合工程構(gòu)成的復(fù)雜體系,其中緊鄰黃河北岸的挑壩和格堤體系才是銅瓦廂埽工所在,黃河北擺的現(xiàn)象在道光時期已經(jīng)非常明顯。因此,確定蘭陽上汛三堡所在位置非常重要。按前述操作方法,基于道光《豫省河工圖》,本研究確定蘭陽上汛三堡所在地(今蘭考東壩頭鎮(zhèn)東700米黃河河道內(nèi))。決口點位置的重新認識確定了決口點正是清代檔案中記錄的“蘭陽無工河段”,“銅瓦廂改道”的直接原因之一其實是清政府對“工”的布局出現(xiàn)問題,而非銅瓦廂本身工程出現(xiàn)問題。這一認識使得學(xué)界能夠重新思考1949年以來得出的一些認識,比如用銅瓦廂工程腐敗、太平天國戰(zhàn)爭導(dǎo)致清廷無暇顧及河務(wù)等解釋此次大改道的成因,而是回到清代河務(wù)制度本身,從制度結(jié)構(gòu)性不足角度重新認識大改道的原因!般~瓦廂改道”的重新認識僅是一個例證,實際上,古舊地圖在歷史時期黃河變遷(改道、決口、擺動以及管理方式)研究中的作用仍需更多案例進行驗證,進而總結(jié)為歷史自然地理的系統(tǒng)性研究方法,革新歷史地理學(xué)的研究方法。

4

結(jié)論與展望


(1)古舊地圖的信息化包括管理信息化、內(nèi)容自動化提取和專題數(shù)據(jù)利用3個環(huán)節(jié)。

(2)編目方案能提高古舊地圖的管理效率。DHYR建設(shè)嘗試采用RDF方案對平臺圖形資料庫進行編目,這一方法實現(xiàn)了圖形資料信息的標準化,在提高信息檢索效率、實現(xiàn)跨庫鏈接以及不同知識體系融合方面發(fā)揮巨大作用,能解決歷史地理信息化中的數(shù)據(jù)孤島現(xiàn)象。

(3)基于深度學(xué)習(xí)的古舊地圖地名檢測和提取技術(shù)能夠快速、準確地整理古舊地圖中的地名信息。本研究所采用的“U-Net架構(gòu)深度神經(jīng)網(wǎng)絡(luò)模型”在處理古舊地圖中提高了信息采集的準確率和完整性,效果良好。

(4)信息化手段能夠支持中小型學(xué)術(shù)團隊進行批量文獻處理、數(shù)據(jù)重建與分析,克服人力、財力限制,完成較復(fù)雜的大型跨學(xué)科研究任務(wù)。歷史地理學(xué)界有必要學(xué)習(xí)圖情知識體系,增強與圖情學(xué)界的交流。

作者:潘威 張光偉 夏翠娟 孫濤

來源:《圖書館論壇》2021年第11期

選稿:耿 曈

編輯:宋柄燃

校對:杜佳玲

審訂:汪鴻琴

責(zé)編:楊 琪

(由于版面內(nèi)容有限,文章注釋內(nèi)容請參照原文)



微信掃碼加入

中國地名研究交流群

QQ掃碼加入

江西地名研究交流群

歡迎來稿!歡迎交流!

轉(zhuǎn)載請注明來源:“江西地名研究”微信公眾號

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馮德萊恩:丹麥及格陵蘭島領(lǐng)土主權(quán)和完整不容談判

馮德萊恩:丹麥及格陵蘭島領(lǐng)土主權(quán)和完整不容談判

界面新聞
2026-01-20 18:58:20
國乒出局首人誕生!16歲天才兩戰(zhàn)全敗,WTT馬斯喀特站資格賽爆冷

國乒出局首人誕生!16歲天才兩戰(zhàn)全敗,WTT馬斯喀特站資格賽爆冷

云隱南山
2026-01-20 18:51:10
勇士大勝卻連遭打擊,巴特勒確定報銷,本月剩余賽程皆是苦戰(zhàn)

勇士大勝卻連遭打擊,巴特勒確定報銷,本月剩余賽程皆是苦戰(zhàn)

謝說籃球
2026-01-20 15:32:25
中俄新動脈,都繞開哈國,向西方打開大門的托卡耶夫,該心中有數(shù)

中俄新動脈,都繞開哈國,向西方打開大門的托卡耶夫,該心中有數(shù)

阿器談史
2026-01-19 18:41:44
1955年授銜前夕,毛主席審批上將名單后突然大怒:叫羅榮桓來見我

1955年授銜前夕,毛主席審批上將名單后突然大怒:叫羅榮桓來見我

浩渺青史
2026-01-15 16:38:54
安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

牛牛叨史
2026-01-06 12:59:43
一覺醒來,上海下雪了!多區(qū)雪量驚人!會重現(xiàn)2008年嗎?

一覺醒來,上海下雪了!多區(qū)雪量驚人!會重現(xiàn)2008年嗎?

環(huán)球網(wǎng)資訊
2026-01-20 07:54:03
41歲朱珠帶火了一種冬天新穿法:大衣+皮草圍巾+愛馬仕,時髦高級

41歲朱珠帶火了一種冬天新穿法:大衣+皮草圍巾+愛馬仕,時髦高級

明星私服穿搭daily
2026-01-20 09:01:44
中途島海戰(zhàn)的幾十年謊言:日本航母被炸時,飛行甲板其實是空的

中途島海戰(zhàn)的幾十年謊言:日本航母被炸時,飛行甲板其實是空的

史之銘
2026-01-18 17:31:05
強大德軍成片凍死在莫斯科時,為何不燒樹木取暖?蘇聯(lián)人做法很絕

強大德軍成片凍死在莫斯科時,為何不燒樹木取暖?蘇聯(lián)人做法很絕

云霄紀史觀
2026-01-06 01:56:08
收盤,成交量不對勁了!周三,A股走勢分析

收盤,成交量不對勁了!周三,A股走勢分析

郭小凡財經(jīng)
2026-01-20 15:49:46
1928年,楊宇霆被槍決前和張學(xué)良合影,注意看站姿,早已分道揚鑣

1928年,楊宇霆被槍決前和張學(xué)良合影,注意看站姿,早已分道揚鑣

浩渺青史
2026-01-11 10:36:36
鳳凰男想吃絕戶,59歲丈母娘選擇自己產(chǎn)子!得知內(nèi)情后請道歉

鳳凰男想吃絕戶,59歲丈母娘選擇自己產(chǎn)子!得知內(nèi)情后請道歉

垛垛糖
2026-01-19 11:51:44
航天英雄王亞平有多重要?國家精兵貼身保護,吃飯都有專供

航天英雄王亞平有多重要?國家精兵貼身保護,吃飯都有專供

樂趣紀史
2025-12-31 13:18:56
江蘇企退2026過渡養(yǎng)老金補發(fā)喜訊,金額可查

江蘇企退2026過渡養(yǎng)老金補發(fā)喜訊,金額可查

明天后天大后天
2026-01-20 17:54:24
你見過不會點菜的人是什么樣的?網(wǎng)友:一個炸三樣,三個過油的

你見過不會點菜的人是什么樣的?網(wǎng)友:一個炸三樣,三個過油的

另子維愛讀史
2026-01-20 19:02:12
江蘇大一女生開養(yǎng)老院,無人入住卻有近400名客戶,員工全是60后

江蘇大一女生開養(yǎng)老院,無人入住卻有近400名客戶,員工全是60后

法老不說教
2026-01-16 23:26:38
放心吧,我們不是日本,也不會有“失去的三十年”

放心吧,我們不是日本,也不會有“失去的三十年”

六爺阿旦
2026-01-19 17:10:26
中央啟動“生育保衛(wèi)戰(zhàn)”:生娃幾乎無需花費,能打動年輕人嗎?

中央啟動“生育保衛(wèi)戰(zhàn)”:生娃幾乎無需花費,能打動年輕人嗎?

今朝牛馬
2025-12-16 11:58:24
薩莉亞,我勸你別太離譜

薩莉亞,我勸你別太離譜

餐觀局
2026-01-19 21:16:06
2026-01-20 19:55:00
江西地名研究 incentive-icons
江西地名研究
分享地名研究信息、行業(yè)資訊。
3192文章數(shù) 300關(guān)注度
往期回顧 全部

頭條要聞

12歲女孩被3名男子多次性侵 當(dāng)?shù)鼐讲挥枇?自愿的

頭條要聞

12歲女孩被3名男子多次性侵 當(dāng)?shù)鼐讲挥枇?自愿的

體育要聞

新的時代!東契奇首奪全明星票王 詹姆斯落選首發(fā)

娛樂要聞

貝克漢姆長子發(fā)文決裂:全家都在演戲

財經(jīng)要聞

李迅雷:2026買房不如租房

科技要聞

收藏|這可能是CES2026最清醒一份復(fù)盤

汽車要聞

奇瑞張貴兵:墨甲不做秀技術(shù)的企業(yè) 只做痛點終結(jié)者

態(tài)度原創(chuàng)

旅游
游戲
數(shù)碼
手機
軍事航空

旅游要聞

爆款銀基模式出圈!背后的底層邏輯是啥?

對話負責(zé)人:2026年,讓玩家看到DNF手游的“改變”

數(shù)碼要聞

AMD Zen被曝高危漏洞!不好意思 早就低調(diào)搞定了

手機要聞

網(wǎng)傳iQOO 15 Ultra跑分超451萬,搭載第五代驍龍8至尊版處理器

軍事要聞

德軍13人前腳剛走 荷蘭2名軍人也撤離格陵蘭島

無障礙瀏覽 進入關(guān)懷版