本报记者 杜洁芳
上世纪90年代,中国数字化王国中又增添了一位新成员,记载着中华几千年文明的古籍在计算机、互联网技术的推广普及下也扮上了新技术的妆容,开始了一段数字之旅。
几十年前,郭沫若发现了《再生缘》作者陈云贞(端生)写给秋塘的一封信,他初步认为此秋塘为陈云贞的丈夫范秋塘,但当时苦于找不到相关文献无法求证。换作今日,只要在古籍数据库中输入“秋塘”进行检索,就马上会出现清俞蛟《春明丛说》所收陈云贞致夫书:“范秋塘,淮南诸生也……”古籍数字化使古籍的阅读、检索大为便利,从而告别了过去动辄就需扎进书海仅为寻得一句出处的大动干戈。
一片繁花似锦
不同的图书馆有着不同的专长:公共图书馆以丰富馆藏恃傲,高校图书馆则以研究性、专业性强自居。数字化步伐迈得更远、更快的,非高校图书馆莫属;但是公共图书馆凭借其丰富馆藏,数字化进程也不甘人后。据统计,国家图书馆现存古籍约10万种,算上不同版本则约为30万种。全国公共图书馆目前收藏古籍的数量达3100多万册件,占国内古籍藏量的70%。因此,国家图书馆古籍馆馆长张志清认为,公共图书馆尤其是国家图书馆应该发挥古籍数字化的引领作用。
为使读者不仅能查到古籍书目,还能阅读全文,各图书馆从建立书目数据库入手,开始馆藏全文数据库的建设。依据各自馆藏特点,图书馆的数字化也各领风骚:上海图书馆从古籍善本书入手,中国科学院文献情报中心以地方志和明清人文集为特色……目前,图书馆界已经完成和正在进行的数字化项目有《四库全书》、《四部丛刊》、《康熙字典》、《中华文化通志》、《汉语大词典》、《中华古汉语词典》等。
出版社及民间力量的数字化产品也占据了很大的市场。经常去国图使用数字资源的北京师范大学的王教授说:“近年来,在文史学者中广泛使用的古籍数字化产品是一套名为《国学宝典》的数据库光盘,收入了《十三经》、《二十五史》、《资治通鉴》、诸子百家、唐诗宋词元曲等近2000种3亿汉字的先秦至晚清文献。”一些民间网站如读书中文网、国学数典网站、龙腾国学网站等也不甘寂寞,先后投入到古籍数字化的行列,虽然他们研发的产品在学术上并不成熟,却人气旺盛。
合作和服务是关键
在古籍数字化开展的近20年时间里,也存在着许多问题。在开发古籍数字化产品时,一些机构首选读者需求量高、社会影响巨大、经济效益明显的产品,造成了古籍数字化产品的杂乱无序、重复投入。如文渊阁《四库全书》就先后有3家制作单位对其进行过影像的数字化出版,电子版的《二十五史》也有不下4种。“这不仅造成资源的重复开发,也浪费了巨大的人力、物力和财力,加重了古籍数字化的成本。”
图书馆界、出版界各方缺乏合作是出现这种现象的重要原因,而缺乏统一的目录检索系统也在技术上造成这种结果。2007年,国务院颁布了《关于进一步加强古籍保护工作的意见》,正式在全国开展“中华古籍保护计划”。国家图书馆也开始建立“中华古籍特藏资源库”,首要任务就是要建立统一的中华古籍目录检索平台。
文件格式繁多,造成阅读和资料提取的麻烦,是古籍数字化的另一大屏障。使用数字化产品的人常常会遇到这样的情形:不同的数字图书馆会让你下载不同的阅读器,有时甚至会被迫下载安装七八个阅读器。“这不仅使文献的利用受到了限制,也影响了古籍数字化后的资源共享。合作和服务构成古籍数字化的两个关节点,不可或缺。”张志清说。
虽然如今古籍数字化看似“歌舞升平”,张志清却认为,古籍的数字化目前尚处于初级阶段。对于古典文献学的研究学者来说,目前的研究成果远不能满足他们的需求。“理想的数字化应该有统一的检索平台,各图书馆只掌管各自的服务器。这样,读者从同一登录界面进入,使用同一检索窗口,可以查阅古籍的全文影像,如需下载时,再去联系具体藏书的图书馆。”不仅如此,古籍数字化还需要做进一步的探究,要做到读者在数字资源库中可以了解到要查找的书最早被谁记载,怎么流传的,现在还有多少个版本,这些版本都藏在哪个馆等。