近年来,我国古籍数字化出版发展迅猛,涌现出大量颇有特色和价值的古籍数字化成果,例如《文渊阁四库全书》电子版、《四部丛刊》《康熙字典》《永乐大典》《中国基本古籍库》《国学宝典》《二十五史全文阅读检索系统》《全宋诗分析系统》等。这些古籍数字化成果比较成系统,功能强大,基本没有书目型数据库,除能进行多途径的全文检索外,一般都配备有各种知识辅助工具,如联机古汉语字典、年号与公元纪年对照表等,有的还提供字数、字频、词频的统计信息,行文风格、特点的概率统计,参考数据的汇聚;有的还能提供不同版本比勘校对的接口、异体字的汇聚显示、读音的自动标注和朗读、在线标点断句、背景音乐等功能。[1]
同时,我国古籍数字化出版也存在一些问题,如缺乏整体规划,各自为政,重复建设的现象比较严重,一味追求资源的规模和总量,有地方特色和专业特色的数据库不是很多,彼此之间缺少协作。随着古籍数字化出版向纵深发展,这些问题表现得日益明显,本质上,这反映出整个古籍数字化出版产业链的弱化和缺失,在古籍数字化发展中,缺乏以古籍数字化内容提供商、内容出版商、技术提供商、网络服务提供商和读者等为主体的整体协调与规划,没有可持续发展的产业链,造成古籍数字化各主体环节的割裂和恶性循环,进而对我国古籍数字化出版事业整体发展和与国际接轨的远景规划都产生致命的打击。因此,有必要就古籍数字化出版产业链的构建原则和构建方法进行比较深入的研究,使古籍数字化出版事业能更快更好地发展。
一、在古籍数字化出版产业链构建中引入国家控制与管理模式
古籍不同于普通文献的最大之处在于古籍具有重要的历史文物性、学术资料性和艺术代表性,这使得我们在进行古籍数字化出版中除需关注效益和技术问题外,还须格外关注古籍文献尤其是善本的保护问题。因此,引入国家控制与管理模式是构建古籍数字化出版产业链首先强调的问题。国家控制与管理模式在古籍数字化出版产业链上主要表现为两种形态:选题控制模式与成本效益控制模式。[2]
1. 选题控制模式
目前,在古籍数字化出版中,选题重复、选题过于随意的现象比较突出。以《文渊阁四库全书》为例,已有3家机构进行过影像数字化,一家机构进行过影像、全文文本的数字化,而一些规模更小、使用频率高、更具商业价值的古籍则数字化版本更多。[3]而在一些公益机构例如图书馆、科研院所进行的古籍数字化工作,则更多表现为一种随意,从国家申请到经费后,并没有经过科学、翔实的论证,没有建立有效的指导和监督机制,便随意选择了进行古籍数字化的命题。类似现象浪费了社会公共资源,同时对古籍也造成了不可逆的损坏。
古籍数字化出版在选题上应纳入国家的统一管理,正如王立清副教授所言:国家相关部门应成立一个古籍数字化出版选题专家委员会,对确定数字化课题、版本选择、数字化影像过程、文字校勘等整个过程进行全程监督和指导。首先,确定需要进行数字化的古籍资源。一般来说,古籍数字化的原则是能不进行数字化的古籍文献尽量不进行,因在数字化影像过程中,灯光、人为翻动甚至人体温度等都会对古籍纸张造成不可逆的损坏。因此,数字化选题需慎之又慎,经学术委员会严格论证确有必要进行数字化的才能够通过准予进行数字化。同时,将选题纳入国家统筹管理,也可有效避免数字化中重复选题的问题。其次,版本选择、文字校勘、数字化过程等都需要在专家委员会的专业技术指导下进行。古籍版本很多,选择何种版本进行数字化对于阅读和研究至关重要,版本的选定应由学术委员会讨论决定。现代的古籍数字化已不仅仅是古籍的扫描、存贮和文字转换,数字化过程应和古籍整理、古籍研究紧密结合。因此,正式出版前的文字校勘工作须尽可能做到最细最好。由于古籍文献的校勘工作费时费力,加之这方面的专业人才十分缺乏,造成目前古籍数字出版文字校勘的不严谨、不规范、错误较多,不核对原文就根本不能进行引用,长此以往,影响到的将是整个古籍数字出版行业。
2. 成本效益控制模式
古籍数字化出版最让业内惧怕的潜在问题是投入与产出的不成比例。古籍数字化出版项目往往投入资金较大,一旦选题发生偏差,对市场预期分析不准确,便会造成资金打水漂。因此,在启动数字化项目前,应对市场、用户的需求情况、投入资金、产出效益进行全面调研和分析。事实上,在控制模式科学合理分析下进行古籍数字化出版,可在很大程度上规避市场的风险。岳麓书社社长易言者在接受《出版广角》记者采访时云:“古籍图书市场从来都是不温不火的,需求不会很大,但也一直会有需求,消费群比较稳定,一本古籍图书要印多少册、多长时间销得完,都可预估,且不会存在大的误差。”[4]易社长谈到的这个问题便是古籍出版中的按需出版。按需出版是古籍数字化出版成本效益控制的有效途径之一。此外,引入第三方成本效益评估机制、建立行业内部通行的成本效益控制制度等,都是构建古籍数字化出版产业链的新的探索。
二、古籍数字化出版产业链构建以资源整合为基础,注重共享性和通用性
1. 构建可持续发展的古籍数字化出版产业链,首先须对现有出版内容和出版渠道进行统一整合
现有古籍数字化出版单位之间,其数字化内容虽各有侧重,但交叉现象仍很严重,同时,一些涉及交叉内容的古籍数字化资源,由于其版本归属问题,也影响到资源的开发。因此,首先需对不同资源提供商之间的数字化内容进行整合,加强合作,建立知识共享机制,共同开发出高质量的古籍数字化项目。其次,树立“合作开发,共建共享”的理念,将数字资源纳入共享的古籍基本数据库,搭建古籍数字资源的统一平台,分工协作,合理分配,各出版机构根据自身特点,根据自身人员配备和资金情况,按照统一规范的标准进行数字化资源开发,实现古籍数字化出版渠道的整合。
2. 对古籍数字化的出版技术进行整合,行业内部尽量使用统一的国际通用标准
目前,我国古籍数字化出版工作中最突出的问题之一是缺乏整体规划,各自为政,重复开发。以汉字字符集为例,古籍数字化出版中许多单位都使用GBK编码体系,该体系在数字化过程中对汉字的满足程度比较高,但最大的问题在于它不是国际通行的编码体系,在国内使用尚可,但随着古籍数字化出版走向国际,进行更大范围的交流便很难了,所以近年来有相关研究者指出,必须使用国际标准ISO/IEC 10646,由此才能解决古籍数字化出版的长远建设问题。[5] (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)