人文研究數(shù)字化:一場(chǎng)方興未艾的變革
清華大學(xué)人文學(xué)院院長(zhǎng)萬(wàn)俊人30多年前在北京大學(xué)讀書(shū)時(shí),曾問(wèn)過(guò)北大歷史系教授田余慶一個(gè)問(wèn)題:“田先生,‘二十四史’您看了幾遍?”
“傻小子,沒(méi)有一個(gè)史學(xué)家能夠讀完‘二十四史’的!碧镉鄳c的回答,給萬(wàn)俊人留下了深刻印象。
如今,有了古籍?dāng)?shù)據(jù)庫(kù),輸入關(guān)鍵詞,瞬間,“二十四史”中的相關(guān)內(nèi)容就涌現(xiàn)在眼前了,檢索和閱讀的便捷性有了極大提升。讀完“二十四史”雖然仍然需要下苦功夫,但利用“二十四史”已經(jīng)越來(lái)越方便。
從紙本閱讀到檢索系統(tǒng),從檢索系統(tǒng)到分析系統(tǒng),人文學(xué)術(shù)的研究工具正在向“數(shù)字化”的方向轉(zhuǎn)變,和萬(wàn)俊人一樣,很多人文學(xué)者的研究中越來(lái)越離不開(kāi)“數(shù)字”了。
“不數(shù)字無(wú)人文的時(shí)代”到來(lái)
在信息的汪洋里,既要放寬眼界,又要盯準(zhǔn)目標(biāo),不被淹沒(méi),是學(xué)者們共同的需求和愿望。
“現(xiàn)在我們處在海量的信息中,這信息量不是宏觀,而是巨觀的!迸_(tái)灣大學(xué)資訊工程系教授、數(shù)位人文中心主任項(xiàng)潔如是說(shuō)。
從微觀到中觀,從中觀到宏觀,再到巨觀,信息視域越來(lái)越廣闊無(wú)邊。人文學(xué)者如何駕馭浩如煙海的文獻(xiàn)材料?數(shù)字技術(shù)能幫他們做什么?
“對(duì)于人文學(xué)者來(lái)講,從來(lái)不是看幾篇文章就可以開(kāi)始寫作,而是要看大量的文獻(xiàn)才敢下筆!表(xiàng)潔分析道,“因?yàn)樽髡邫z索到的文獻(xiàn)是一個(gè)系統(tǒng),要找出這些文獻(xiàn)之間的脈絡(luò)關(guān)系,是至關(guān)重要的事情!
“如果一位學(xué)者僅僅具備本學(xué)科的學(xué)術(shù)訓(xùn)練,而不具備數(shù)字思維,欠缺運(yùn)用數(shù)字技術(shù)進(jìn)行研究的能力,即使他的學(xué)術(shù)功底再扎實(shí),今后也寸步難行。”商務(wù)印書(shū)館執(zhí)行董事顧青說(shuō),“目前,我們利用數(shù)字技術(shù)進(jìn)行人文學(xué)術(shù)研究的人群還不夠多。我堅(jiān)信,在不遠(yuǎn)的將來(lái),我們不必再用‘?dāng)?shù)字人文’這樣的名號(hào)來(lái)宣示我們區(qū)別于傳統(tǒng)研究的立場(chǎng)。因?yàn)椋粩?shù)字無(wú)人文的時(shí)代’已經(jīng)到來(lái),數(shù)字人文將深刻地改變學(xué)者,尤其是人文社科學(xué)者們的知識(shí)結(jié)構(gòu)和研究路徑。”
事實(shí)上,在一些學(xué)者看來(lái),人文與數(shù)字,從來(lái)就沒(méi)有分過(guò)家。
萬(wàn)俊人從古埃及、古希臘的建筑和哲學(xué)中,指出數(shù)字人文的神妙:“埃及金字塔,至今還是一個(gè)謎。它之所以能夠歷經(jīng)4700多年的風(fēng)雨,不只有古埃及人的信仰、圖騰和崇拜因素,還有數(shù)字的因素。在一片茫茫大漠的頂端,鑄造了繁多規(guī)整和雄偉的建筑,而且是用巨大的石頭壘起來(lái),沒(méi)有精確的數(shù)字計(jì)算,是不能夠做到這一點(diǎn)的。”
萬(wàn)俊人認(rèn)為,人文學(xué)術(shù)的源頭就與數(shù)字有關(guān)。他說(shuō):“古希臘哲學(xué)家畢達(dá)哥拉斯,他的哲學(xué)源自數(shù)字。從他開(kāi)始,希臘哲學(xué)開(kāi)始產(chǎn)生了數(shù)學(xué)的傳統(tǒng)。中國(guó)古代哲學(xué)也是如此,例如《易經(jīng)》。所以,人文和數(shù)字從一開(kāi)始就是孿生兄妹,只不過(guò)在后來(lái)的歲月里,兩者走得比較遠(yuǎn)了些,看似它們已經(jīng)告別了,其實(shí)它們一直在同一條路上,與人類文明和文化同行。”
用數(shù)字方法,解決人文研究難題
數(shù)字人文的發(fā)展動(dòng)力,在于采用新的方法,解決過(guò)去難以解決的問(wèn)題。
多年來(lái),項(xiàng)潔研究團(tuán)隊(duì)一直致力于滿足人文學(xué)者對(duì)內(nèi)容數(shù)字化的需求,建立一個(gè)屬于他們自己的資料庫(kù),來(lái)處理、標(biāo)注和分析資料,使內(nèi)容和工具能夠互動(dòng)起來(lái)。
顧青回憶起30多年前,他在北京大學(xué)讀書(shū)的時(shí)候,上過(guò)一門“工具書(shū)使用”的課程,講的都是怎么使用紙質(zhì)工具書(shū)。今天,這門課程涉及的很多工具書(shū)已經(jīng)可以被數(shù)字化工具所取代,其中的一些工具書(shū)已進(jìn)入古籍收藏家的視野,實(shí)用價(jià)值遠(yuǎn)不如從前。
清華大學(xué)人文學(xué)院副教授李飛躍和中國(guó)社會(huì)科學(xué)院文學(xué)研究所助理研究員趙薇介紹,幾十年來(lái)中國(guó)人文學(xué)科的定量分析成果紛紛涌現(xiàn),用數(shù)字手段檢驗(yàn)和打破了一些人們習(xí)焉不察的定見(jiàn):
20世紀(jì)80年代,陳炳藻、李賢平、施健軍和陳大康等海內(nèi)外中國(guó)學(xué)者分別采用文體測(cè)量學(xué)的辦法,利用人工統(tǒng)計(jì)或計(jì)算機(jī)輔助手段,對(duì)《石頭記》前八十回、后四十回作者統(tǒng)一性問(wèn)題作出判定;2005年,哈佛大學(xué)包弼德與北京大學(xué)等合建“中國(guó)歷代人物傳記資料庫(kù)”(CBDB);2001年,復(fù)旦大學(xué)和哈佛大學(xué)共建“中國(guó)歷史地理信息系統(tǒng)”(CHGIS)等,這些人文學(xué)者是數(shù)字人文的先行者。
“長(zhǎng)安城圖的精準(zhǔn)化和數(shù)位化應(yīng)用”,這是臺(tái)灣中山大學(xué)中文系教授簡(jiǎn)錦松利用數(shù)字化技術(shù)進(jìn)行的一項(xiàng)研究。據(jù)他介紹,過(guò)去學(xué)界對(duì)唐代長(zhǎng)安城的了解,都是從留存下來(lái)的紙質(zhì)圖上看到的。現(xiàn)在可以對(duì)原始的古圖做數(shù)字化處理,然后放進(jìn)電子地圖里,就能看到精準(zhǔn)的長(zhǎng)安古城面貌了。
這項(xiàng)研究既有學(xué)術(shù)價(jià)值,也很有趣。比如,有了這張數(shù)字化圖,就可以知道白居易的家住在哪里,上朝要走多久;也可以知道韓愈從家里出來(lái)拜訪張繼,要經(jīng)過(guò)什么路徑;李商隱為悼念亡妻寫下了著名的《西亭》:“此夜西亭月正圓,疏簾相伴宿風(fēng)煙。梧桐莫更翻清露,孤鶴從來(lái)不得眠。”從李商隱家到他妻子娘家的居所西亭,路程并不遙遠(yuǎn),只有1.7公里。
借助中南民族大學(xué)文學(xué)與新聞傳播學(xué)院王兆鵬教授構(gòu)建的“唐宋文學(xué)編年地圖平臺(tái)”和“漢魏六朝文學(xué)編年地圖平臺(tái)”數(shù)據(jù)庫(kù),也可以了解唐宋時(shí)期和漢魏六朝時(shí)期作家的活動(dòng)情況。
“數(shù)字人文,能夠在相當(dāng)程度上幫助傳統(tǒng)的研究工作,讓學(xué)者們有更多時(shí)間去做計(jì)算機(jī)目前還不能做的研究!鼻迦A大學(xué)人文學(xué)院教授、《數(shù)字人文》期刊主編劉石說(shuō)。比如,古籍標(biāo)點(diǎn)、字句校勘、索引編纂、資料匯編,過(guò)去的學(xué)者在這些方面花費(fèi)了大量心血,如今都可以借助計(jì)算機(jī)去完成。
建立起知識(shí)的關(guān)聯(lián),是數(shù)字人文的本事
數(shù)字人文興起的前提,是人文資料和文獻(xiàn)檔案的電子化與數(shù)據(jù)化。
劉石認(rèn)為,當(dāng)今社會(huì),數(shù)字化的浪潮無(wú)所不在,也深刻地影響著包括人文和社會(huì)科學(xué)在內(nèi)的一切領(lǐng)域。數(shù)字人文,推動(dòng)了當(dāng)代文獻(xiàn)學(xué)的發(fā)展,使之形成數(shù)據(jù)驅(qū)動(dòng)、實(shí)證為先的新特征。“前幾年,人文學(xué)界有一種輕文獻(xiàn)考辨、重義理闡發(fā)的現(xiàn)象,導(dǎo)致學(xué)風(fēng)空疏的傾向,F(xiàn)在有了數(shù)字人文,你想空疏都空疏不了。因?yàn)椋瑪?shù)字人文中的大數(shù)據(jù),不就是拿數(shù)據(jù)說(shuō)話的實(shí)證研究嗎?所以,從這個(gè)角度講,文獻(xiàn)學(xué)、古籍整理,或者考據(jù)學(xué),今后不見(jiàn)得會(huì)消亡,反而會(huì)隨著數(shù)字人文的發(fā)展獲得新的活力。”
眾所周知,錢鐘書(shū)先生博聞強(qiáng)記,而他的記憶力與他的學(xué)術(shù)成就息息相關(guān)。有人提出疑問(wèn):進(jìn)入數(shù)字人文時(shí)代,學(xué)者的記憶能力還重要嗎?清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系主任、《數(shù)字人文》期刊主編孫茂松教授認(rèn)為:“實(shí)際上,電腦時(shí)代并不意味著什么都能搜索到。數(shù)字人文要做的,不是把死的知識(shí)存在那里,而是要建立起不同知識(shí)間的關(guān)聯(lián),有豐富的知識(shí)聯(lián)想,讓知識(shí)活起來(lái),進(jìn)行深入的學(xué)術(shù)融合!
“我們現(xiàn)在遇到的一個(gè)最大的問(wèn)題,就是有了大量的電子文本之后,怎樣利用這些數(shù)據(jù)庫(kù)進(jìn)行研究?”美國(guó)巴克內(nèi)爾大學(xué)東亞研究系教授陳松說(shuō)。
因?yàn),人工智能必須由人去做,才?huì)智能,才有可能做出有價(jià)值的研究。
李飛躍從教學(xué)角度來(lái)分析數(shù)字人文:“過(guò)去我們說(shuō),知識(shí)就是力量。工業(yè)化時(shí)代標(biāo)準(zhǔn)化的教育,更重視知識(shí)技能的傳授教育。如今,信息時(shí)代的教育有一個(gè)非常重要的特點(diǎn),就是更重視建立知識(shí)之間的關(guān)聯(lián),這才是力量!
正如項(xiàng)潔所說(shuō)的那樣,這些細(xì)微而生動(dòng)的數(shù)字化,“從巨觀上,穿越了不同知識(shí)和學(xué)科之間的隔斷,才能從微觀上直達(dá)知識(shí)的細(xì)節(jié)”。
“從科學(xué)革命開(kāi)始,學(xué)界有一個(gè)很大的分流,就是理工以發(fā)現(xiàn)為主,人文則以解釋為主。如今,有了數(shù)字人文這座新的橋梁,把以發(fā)現(xiàn)為主的理工學(xué)術(shù)帶到人文學(xué)界,人文學(xué)術(shù)將會(huì)有新的發(fā)展!毕愀劭萍即髮W(xué)人文與社會(huì)科學(xué)學(xué)院教授李中清說(shuō)。
“數(shù)字人文是人文社科學(xué)術(shù)研究的未來(lái),希望在信息科技領(lǐng)域中,有最懂傳統(tǒng)文化的人;在人文學(xué)術(shù)界中,有最懂?dāng)?shù)字技術(shù)的人!边@是顧青的期待,也是學(xué)者們共同的期盼。
(本報(bào)記者 計(jì)亞男 杜羽)