中国古籍数字化现状

时间:2020-01-02    来源: 人民日报    作者: 人民日报

摘要:对古籍的整理、保护和利用,就是最大限度地保护与传承中华文脉和传统文化。然而,经历了数千年的古籍是如此脆弱,经不起翻阅等直接接触,绝大多数都存放在库里,连专业研究者都很难看到。保护,就难以利用;利用,就很难充分保护。现代数字化技术的出现,才让这对矛盾迎刃而解。至此,我们方能了解2019年11月,国家图书馆(国家古籍保护中心)组织第四次古籍数字资源共享联合发布的价值——全国20家单位在线发布数字资源7200余部(件),全国古籍数字资源发布总数已超过7.2万部,普通读者也可以和研究者一样在网上免费共享古籍数字资源。古籍数字化有多重要?目前中国的古籍数字化处于什么状况?本文试图做一个简单的勾勒。

对古籍的整理、保护和利用,就是最大限度地保护与传承中华文脉和传统文化。


然而,经历了数千年的古籍是如此脆弱,经不起翻阅等直接接触,绝大多数都存放在库里,连专业研究者都很难看到。保护,就难以利用;利用,就很难充分保护。现代数字化技术的出现,才让这对矛盾迎刃而解。

至此,我们方能了解2019年11月,国家图书馆(国家古籍保护中心)组织第四次古籍数字资源共享联合发布的价值——全国20家单位在线发布数字资源7200余部(件),全国古籍数字资源发布总数已超过7.2万部,普通读者也可以和研究者一样在网上免费共享古籍数字资源。

古籍数字化有多重要?目前中国的古籍数字化处于什么状况?本文试图做一个简单的勾勒。

数字化带来古籍重新发现


对搞文史研究的人来说,占有独家资料几乎意味着初步的研究成果。


北京大学教授荣新江说,古籍数字化带来了古籍发现的新时代,数字目录和古籍全文发布后,我们可能无意中就发现重要的研究素材。过去我们只知道大的馆藏,其实很多小馆藏着珍贵的古籍。

山东大学文学院院长杜泽逊说,因为有了数字化古籍,北京大学教授张丽娟和一位年轻人在国图收藏中发现了过去不知道的十行本《尚书注疏》的元刊原印本和杨复《仪礼图》元十行原印本。元十行本,清代以来用的都是明代历次修版,原印本的发现甚至会改变原有的结论。

荣教授希望古籍数字化工作更多地跟学术界沟通,根据需要决定哪些古籍先发布。比如做海上丝绸之路研究,广东、福建、浙江一带的地方图书馆馆藏家谱变得重要。如果国家优先支持开展这类古籍的数字化,将帮助我们占据学术制高点。

古籍数字化关系文化命脉


数千年遗存下来的古籍如浩瀚之海。据统计,仅汉文古籍品种就超过20万种,版本超过50万种。


2007年,国务院办公厅发文提出,在“十一五”期间大力实施“中华古籍保护计划”,国家图书馆(国家古籍保护中心)负责摸家底、古籍修复和保护,新闻出版署下辖的相关出版社负责影印出版,全国高等院校古籍整理研究工作委员会负责古籍的整理研究和人才培养工作。

数字化浪潮改变了固有的秩序。古籍普查在线上登记,阅览在网上免费共享,数字化替身保护了图书原件。如果不拘泥于物质形态只考虑文化内涵,数字化甚至可以看作是流落海外珍稀古籍另一种形式的“回家”。

荣教授是研究敦煌学的,当国内出版社为海外收藏的敦煌文献做黑白图录时,1994年,英国已经开始做IDP(数字化的国际敦煌项目),将英、中、俄、日、德、法、韩所藏敦煌古文献的数字化资源汇聚到英国,全世界的研究者共享。荣新江惋惜我们动手有点晚:“在‘十三五’古籍出版规划讨论的时候,各出版社都在策划要出多少整理本古籍。我提出,为什么不搞古籍数字化,将国家用于古籍整理的经费支持数字化整理?”

他认为,古籍数字化关系到国家的文化命脉,国家应该设立专项基金,支持更大规模的数字化。

多头掘进 对接贯通


国家图书馆在古籍数字化方面起到了带头作用。2016年,作为“中华古籍保护计划”阶段成果的“全国古籍普查登记基本数据库”正式上线,包括书名、著者、版本年代、册数存卷的数据一目了然。

同年上线的“中华古籍资源库”备受读者欢迎。国家图书馆副馆长张志清说,因为拥有原版扫描的清晰数据图像,2016年点击率增长了1000%,2017年在此基础上又增加100%,2018年,过去排在地方志、中文图书、民国期刊之后的老四“中华古籍资源库”,页面浏览跃居第一位。

中华书局则利用已出版资源做古籍数据库。“中华经典古籍库”收录了中华书局及其他出版社正式出版的整理本古籍图书,资源涵盖经史子集各部,包含二十四史、通鉴、新编诸子集成、十三经清人注疏、史料笔记丛刊、古典文学基本丛书、佛教典籍选刊等经典系列,并提供便捷的阅读、查询、文献征引等服务。“西南联大数据库”“中华文史工具书数据库”“中华文史学术论著库”“海外中医古籍库”“历代进士登科数据库”之外,他们向外拓展,又设立了“木版年画数据库”“中华石刻数据库”。其中宋代墓志铭数据库为全国第一个在线出版的数据库。

上海图书馆是古籍收藏的大户,目前公益性发布馆藏8000余部家谱、470余部珍贵古籍。考虑到本馆影像资源丰富,但缺乏可以研究的文本资源,于是采用了“众包”模式,发动社会大众、志愿者参与馆藏文献的整理和研究,利用大家的知识盈余去共创价值。

热盼统筹 无远弗届


所有研究者都渴盼的支持检索的全文字识别,需要花费的精力和金钱都很巨大,每本书都是一个小工程。

清华大学图书馆副馆长窦天芳提出,高校图书馆各自将其保存的古籍数字化,是否有重复投入?能否国家统筹?我们需要的不仅是数字化资源而且是数据化资源,文本可检索,能自由提取人物、地点、家谱、地理信息、当时的经济状况等信息,这种方式将带来新的研究方法。说到底,就是要将古籍资源库变为古籍知识库,让社会大众很容易地识别、了解、利用。

北京师范大学教授周少川建议,在目录学书目著录上,应考虑增加新的分类,收录一批流通广泛、使用频繁的优秀古籍数据库,如“中国基本古籍库”“瀚堂典藏”“国学宝典”等应属于多功能综合古籍电子丛书;而像敦煌、家谱、方志等特色数据库,则应属于专类古籍电子丛书。数字古籍这一新品种,也应纳入古籍普查、保护的范围,这也是国家文化安全的需要。如果联合发布后,能形成全国上线数字化古籍的联网,甚至可以链接到全球中华古籍的信息,那就更好了。

古籍数据库用户艾俊川说,数字化是对古籍高效、永久的保存。古籍化身千百,不仅造福学者,也让业余文史爱好者方便使用,功德无量。

注:本站上发表的所有内容,均为原作者的观点,不代表同曦艺术网的立场,也不代表同曦艺术网的价值判断。