探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③)

发布时间:2024-09-10 05:17:52 来源: sp20240910

  图①:读者古籍数字科技中心工作人员对文溯阁《四库全书》数字化文件进行质检。   本报记者 王锦涛摄   图②:甘肃省图书馆依托文溯阁《四库全书》开发的文创产品。   图③:甘肃省图书馆文溯阁《四库全书》藏书馆工作人员巡查书库。   图②③均为甘肃省图书馆提供   图④:甘肃省图书馆文溯阁《四库全书》藏书馆主楼。   本报记者 王锦涛摄

  引 子

  登临兰州北山九州台,甘肃省图书馆文溯阁《四库全书》藏书馆跃入眼帘——馆楼飞檐翘角,踞北山而瞰黄河。

  自正门入楼,穿鞋套,做登记,进书库。书库恒温恒湿,1128个香樟木书箱层层叠叠,收录典籍6141函、3474种、36315册的文溯阁《四库全书》就安放于箱中。

  2023年6月,习近平总书记在中国国家版本馆中央总馆考察调研时,详细听取《四库全书》版本源流、纸张印刷、保护收藏等介绍,叮嘱工作人员:“我最关心的就是中华文明历经沧桑留下的最宝贵的东西。中华民族的一些典籍在岁月侵蚀中已经失去了不少,留下来的这些瑰宝一定要千方百计呵护好、珍惜好,把我们这个世界上唯一没有中断的文明继续传承下去。”

  《四库全书》编纂于清代乾隆年间,是我国历史上规模最大的丛书,修成后誊抄7部,分藏于紫禁城文渊阁、圆明园文源阁、盛京(今沈阳)文溯阁、承德避暑山庄文津阁、杭州文澜阁等地。目前存世三部半,分别为文渊阁本、文溯阁本、文津阁本,以及被称为“半部”的文澜阁残本。其中,文溯阁本辗转多地,于2006年入藏现在的藏书馆,也是“三部半”中唯一尚未完整影印出版的一部。

  为了让书写在古籍里的文字活起来,经过长期缜密的筹划论证,2021年8月,甘肃省正式启动文溯阁《四库全书》数字化影印出版工程。

  目前,文溯阁《四库全书》数字采集工作已全部完成,数据处理工作完成70%。从现在起至2028年,文溯阁《四库全书》将按经、史、子、集四部,分期分批推出全套影印版本。

  

  数字采集

  采集方案、流程规范和相关作业标准周密完善

  约8亿字的文溯阁《四库全书》共有多少页?数字化之前鲜有人知。

  “换算为现代书籍页码,共488万多页。”文溯阁《四库全书》数字化影印出版专职工作组组长宋学娟说。

  作为读者出版集团有限公司所属的读者古籍数字科技中心总经理,宋学娟过去两年多时间带领团队把文溯阁《四库全书》从纸上“搬进”了电脑——逐页扫描、存入,数据资源总量逾700TB(太字节)。“如果用常见的容量32GB的U盘存储,需要2.2万多个才能装下。”宋学娟说。

  文溯阁《四库全书》既是历史典籍,又是珍贵文物。若藏于高阁,难以活化利用;若活化利用,又有损坏之虞。如何破解“藏”“用”两难?2021年8月,甘肃省委宣传部制定《文溯阁〈四库全书〉数字化影印出版工作重启方案》,力求在保护的同时“唤醒”古籍。

  古籍真本由甘肃省图书馆提供,数据采集处理、影印出版等工作由读者出版集团有限公司具体实施。数字化影印出版工程分为“数字采集—数据处理—影印出版及数据库建设”3个阶段。所需经费,部分由中央文化产业发展专项资金、甘肃省财政资助,部分由读者出版集团有限公司自筹。

  数字采集,免不了要接触古籍真本,如何确保其安全无损?甘肃省图书馆和读者出版集团有限公司制定了周密完善的采集方案、流程规范和相关作业标准,“54条数字化工作流程规定,涵盖前期准备、文献出库、数据处理等全部流程。”宋学娟介绍。

  为保古籍安全万无一失,文溯阁《四库全书》藏书馆二楼会议室被改造成了数字采集室,做到原书“出库不出馆”。而从书库到采集室,平常不到一分钟的路程,藏书馆90后馆员魏乔波却要走好几分钟:戴上白色手套,细查一遍即将出库的古籍,再轻轻捧起,就像捧着一碗不能洒出的水,慢慢往楼上“移”,“就怕脚下不稳”。

  “古籍出库,要填报11类表格,层层审批。归还时,所有细节都要对得上。”魏乔波说,以其中的《提书登记表》为例,提取古籍需详细填报当日采集计划、提取数量,然后与书库管理员共同清点每一函、每一册书,包括函盒、夹板、束带、铜扣的存缺程度,每一册古籍的题名、卷数、页数,以及有无破损、污迹或霉斑等情况,“这些都要一一记录在案。一送一回路上、数据采集期间,古籍若有半点闪失,都会被及时发现。”

  数字采集作业班班长杨旭勇告诉记者,采集时必须使用古籍专用非接触式扫描仪高清扫描,且光源必须是冷光源。对采集人员,甘肃省图书馆的古籍专家也开展了多轮培训演练,“既要保证扫描精度与进度,还要避免伤害古籍,翻书的力道不能轻也不能重,要稳而有力。”杨旭勇说。

  准备周密,工作前期进展顺利,意料不到的问题还是出现了。“古籍开本大小相同,厚薄却不一样。”宋学娟翻开一本书,拿到一台扫描仪前比划道,“超3厘米厚的古籍,用这种平板扫描仪扫描,靠近订口的部分内容很难被有效采集。”

  为啥?不按压,无法扫描;按压,古籍易损,且采集到的内容会变形。怎么办?“为保证采集质量,我们追加预算,在已采购10台古籍专用平板扫描仪的基础上,又购置了两台V型古籍扫描仪。”宋学娟说,使用这种扫描仪,只需将书翻开到90度,即可完成扫描采集,问题迎刃而解。

  2021年12月23日,开机扫描;2022年5月23日,采集告竣。“整整5个月,经过人员倒班,实现每天工作16个小时、一天未休。古籍没有丝毫受损,函盒没有增加一道划痕。”阳光透过窗口,洒在黄底黑字的《文溯阁〈四库全书〉数字化工作手册》上,宋学娟长舒一口气。

  数据处理

  数字文件与古籍真本如同孪生,最大程度呈现古籍原貌

  偌大的房间里,数十名工作人员神情专注、紧盯屏幕,只听见键盘敲击声此起彼伏。在读者古籍数字科技中心的数据处理室,采集来的文溯阁《四库全书》数据,将被加工成标准的数字文件,供后续影印出版和数据库建设之用。

  “数据处理有4道流程,图版处理、一校、二校和质检存储。”宋学娟介绍,其中图版处理是关键,主要工作是拼接完整“叶”。

  叶,古籍特有的量词。不同于现代书籍,古代纸张多为单面印刷,一张纸即为一叶,书册由一叶一叶对折后装订而成。一叶,相当于现代书籍的两页。所以,数字采集到的扫描件实则都是半叶,图版处理就是让它们合二为一。

  “最初,我们先在电脑上制作一个标准叶模板,再利用智能软件,从扫描件上提取文字,贴在模板上。”宋学娟告诉记者,但实际操作中发现,智能软件可能会漏字、识错字,且原本每一叶的版式不尽相同,模板统一后,有“失真”之嫌。

  数字文件与古籍真本,如何保持孪生一般的相同面貌?“我们摒弃了标准模板,选择了逐叶拼接,最大程度呈现古籍原貌。”宋学娟说。

  图版处理不易,校对任务也很繁重。文溯阁《四库全书》数据校对人员张静从事古籍校对工作已有10年,但从未校对过如此海量内容。利用数字技术能够提速,但一些讹误很难被发现。

  不久前,张静在校对时发现,一个“丸”字疑为“九”字。经仔细核校后确认,果然是因为古籍宣纸里的植物纤维发生霉变,扫描时多出了这一“点”。

  起初,一天校对300叶是张静的上限。“刚开始时平均用力,耗时较多。”她说,而今这个数字翻了近3倍,“慢慢地,哪里容易出错、哪里容易变色,心里都有了数,效率提高不少。”

  效率高了,胆子却小了。“总担心有错误没能及时发现。”张静回忆,有次下楼吃午餐,饭刚端上来,她又起身赶忙回到办公室,“以为忘了标注一处讹误,打开电脑一看,其实已经做了记录。”

  为明确权责,避免误操作,从图版处理到一校、二校,再到最后的质检存储,文溯阁《四库全书》数据处理是条“单行道”。电脑之间不能互相访问,数据传给下一流程后,前一流程的人员将无权再改。

  “在数据处理程序软件和制度流程上,我们有一套完整设计,确保数据资源安全。”宋学娟输入账号、密码,登录数字化成果管理系统,所有成品文件呈现在眼前,函盒编码、书名、作者、朝代,以及长、宽、高和册数等基本信息,都有详细记录。“我们争取今年内基本完成图版处理工作。”她说。

  影印出版

  不少图书馆、藏书机构等正虚位以待,静待“四阁四库合璧”

  文溯阁《四库全书》影印出版,汇聚了社会各界的期待。

  西北师范大学教授赵逵夫全程参与了文溯阁《四库全书》影印出版工程专家论证会。他说,《四库全书》现存不同版本在内容、册数、卷数上皆有不同,通过数字化影印出版,方便学者比对研究,意义重大。

  兰州大学教授汪受宽也持相同观点。他曾用两年时间,带着学生对甘肃省图书馆编印的《影印文溯阁四库全书四种》进行整理、标点和精细校勘,并将收录其中的《易图说》《长安志图》《墨法集要》《璇玑图诗读法》这4种(每种各1册)书,跟文渊阁本进行对比,发现两个版本的文字、图片等存在901处差异。

  “4册书就有这么多差异,3.6万多册会是什么样?”汪受宽说,“文溯阁《四库全书》影印出版,将对文化史、史学史、文献学研究等都产生重要影响。”

  期望值高,现实问题也不少。一方面,古籍实现数字化后,盗印现象难以杜绝。另一方面,超大规模古籍的影印出版投入巨大,盈利是个难题。“变古籍为现代书籍,背后是大量的人力、物力、财力成本。”读者出版集团有限公司所属甘肃人民出版社社长、总编辑原彦平坦言。

  防止数据泄露,采集区域设置严密安保措施。宋学娟介绍,任何人出入采集区,都须经过严格安检,以防手机等电子设备进入工作区域。同时,每个工作台均安装了监控设备,每台电脑都作了加密设置。

  应对盈利难题,找准盈利点是关键。原彦平给记者详细分析:古籍影印本主要有仿真本和缩印本。前者好比是“克隆体”,从纸张到字号,从排版到装帧,与原书几乎“一模一样”;后者则是“迷你版”,内容不变,但字号变小、页数变少,册数大幅缩减。“文溯阁《四库全书》若是出全套仿真影印本,成本过高,市场较小。”

  原彦平说,文溯阁《四库全书》多达3.6万余册,数据采集、处理、编辑、出版等投入大,且多为手工完成,成本高,发行对象则主要为图书馆、文化馆、高校、研究院所等专业机构和为数不多的研究者。

  2024年1月3日,文溯阁《四库全书》经部影印出版专题工作会议召开,确定了出版方案——缩印、16开本、236册。“我们将按经、史、子、集四部,分期分批推出缩印本。如果全套出齐,预计共1500册。”原彦平说。

  走进甘肃省图书馆的古籍阅览室,其他三阁《四库全书》的影印本旁,工作人员已为文溯阁《四库全书》的影印本腾好了书架。

  “古籍影印本看似小众、销路窄,实际上,版本好、印刷精美、定价合适的古籍,自有其发行空间。”从事出版行业20多年,宋学娟对文溯阁《四库全书》影印本的市场前景颇有信心——版本独一份,价值突出,公众期待较高;自带流量和话题,营销成本较低,做到客户明确、精准供给,就能减轻销售压力。

  今年初,宋学娟带领团队参加2024北京图书订货会。文溯阁《四库全书》全套影印出版工作颇受关注,不仅有高校、图书馆、文博机构的负责人,还有销售商和个人前来咨询。“据市场调研,不少图书馆、藏书机构等正虚位以待,静待‘四阁四库合璧’。”宋学娟说。

  “在做好保护工作基础上,我们将深入挖掘文溯阁《四库全书》价值,努力在信息服务、文化创意、文旅融合上求突破,让这座资源宝库在新时代活起来、用起来。”读者出版集团有限公司党委书记、董事长梁朝阳表示。

  活化利用

  首推精选本,开发文创产品,让更多人领略古籍魅力

  “宣传推广古籍的文创产品,既要开发周边,更要聚焦古籍本身。”甘肃省图书馆馆长肖学智说,不妨跳出杯子、本子、袋子等样式,回归古籍做文创,出版精选本图书。

  汪受宽介绍,《四库全书》历来有“典籍总汇,文化渊薮”之誉,不仅囊括了从先秦至清代乾隆中期之前中国历史上的主要典籍,而且涵盖了中国传统学术文化的各个学科门类和各个专门领域。

  “卷帙浩繁通常也意味着无从读起,从这个意义上讲,让‘高冷’的古籍变畅销的书籍,就是好文创。”肖学智说。

  启函盒、取夹板、解束带,《文溯阁四库全书影印精选》露出真容。翻开书页,映入眼帘的楷书温润大方、赏心悦目。每页8行、每行21字,虽是手抄,可字的大小、间距几无差异,工整如打印一般。

  “共计40卷,分为3函、5种、18册。”肖学智介绍,为突出甘肃文化特色,这套影印精选本甄选了文溯阁《四库全书》子部所收古代陇人著作两种——《潜夫论》和《拾遗记》,另外还有《文房四谱》《法书要录》《画史会要》等书画艺术史经典作品3种。

  这样一套精装古籍,俘获了不少读者的心。“自去年5月出版发行,迄今已销售680多套,平均每天销售约2套,这在古籍中销量不低。”甘肃省图书馆文创中心负责人介绍,甘肃省图书馆10多年前就曾出版《影印文溯阁四库全书四种》,畅销至今,共售出5600多套。

  “优质的古籍,就是优质的文创。”肖学智说,近年来,甘肃省图书馆以文溯阁《四库全书》为素材,从其包装方式、撰写格式、用色寓意、人文理念等角度汲取灵感,推出了一系列文创产品,“目前,我们正挖掘文溯阁《四库全书》中的龙元素,即将推出特色伴手礼。”

  “古籍活化,不能止于开发文创产品。”肖学智说,为了让更多人乐于走近文溯阁《四库全书》,领略古籍魅力,甘肃省图书馆打造了多个文创场景——线上,推出“文溯·陇迹”等专栏,在“云”上赋予古籍新话题;线下,建成甘肃省图书馆文溯阁《四库全书》藏书馆展厅,让参观者沉浸式体验纂修、流传、保护、发展等历史场景,与“书”同行……

  “我们举办的‘千古巨制——《四库全书》展’是国内较早推出的《四库全书》专题展览,至今已在全省50多个图书馆流动展出。”肖学智介绍,今年3月,省图书馆还启动了专题展览进校园活动,未来还将推动展览进社区。

  年轻读者马瑛正是通过这个展览认识了文溯阁《四库全书》,并买了一套《影印文溯阁四库全书四种》。“带回去,让更多人了解我们的典籍瑰宝。”马瑛说。

  今年,甘肃省出台《关于以“八个一”文化品牌为抓手全力推动文化传承发展的实施方案》,其中一个“一”即为“一部《四库全书》,让中国古典文化活起来”。实施方案提出,加强文溯阁《四库全书》保护传承、整理研究、数字转化、版权开发、活化利用等,激发古籍保护利用活力。

  “影印出版,是活化利用的第一步。”肖学智说,未来还将建设完整、好用的数据库,研发音视频等产品,让文溯阁《四库全书》的“数字分身”走进千家万户。

  《 人民日报 》( 2024年05月31日 13 版)

(责编:袁勃、赵欣悦)
选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员