为了还原“历史的笔画” ——国家社科基金项目“甲骨文图文资料库”攻关记

图为“甲骨文图文资料库”收录的部分甲骨文图片

  电脑屏幕上,一行行甲骨文整齐地排列,组成一个可视化查询界面。在界面上,使用者可以快捷地检索到41832个甲骨文原形文字的音形义,还可以看到它的全部同字异形体、释文,以及刻有该文字的原始甲骨片——这是安阳师范学院历史系教授韩江苏课题组经过长达十年的艰辛奋战、两次主动申请延期结项、精益求精完成的国家社科基金项目——“甲骨文图文资料库”。

  这一资料库由甲骨文图片库、释文库、原形文字库三个数据库组成,收录了《甲骨文合集》、《补编》、《英藏》等九种甲骨著录共72264片甲骨。“收集材料最全、检索手段最快、字形原貌最准,图、文、字并举”——这是课题组的研究初衷,也是鉴定专家的一致评价。

艰难起步,矢志不渝,扳掉一只只“拦路虎”

  做甲骨文图文资料库,这样的想法韩江苏由来已久。2000年前后,醉心甲骨文研究的韩江苏感到:甲骨文发现百余年来,考辨研究成果卓著,但因为缺乏全面系统的整理,检索起来始终困难。尽管台湾成功大学的“甲骨文全文影像资料库”、香港中文大学的“甲骨文资料库”进行了尝试,但二者一个重文字,一个重图像,均不完满。

  能不能把图、文、字结合起来,开发一个既全面又便捷的信息化资料库?韩江苏找到学院计算机系教授刘永革,谈了想法。

  刘永革此前的科研与甲骨文毫无交集。然而,他被韩江苏献身科研的精神深深打动了,同时,也感动于韩江苏对自己的信任,他觉得,作为身处殷商故地的一名学者,能用现代化技术为甲骨文研究出力,是责任,也是荣耀。

  于是,在学院的大力支持下,“甲骨文信息化课题组”于2001年成立。经过两年多的梳理研究,构建图文库的理论框架逐渐形成。2004年,他们“壮着胆”申报国家社科基金课题,没想到一举成功。

  尽管课题得到立项,但接下来的工作并不如想象中顺利,学术研究道路上,“拦路虎”接二连三地出现。

  首先是经费。研究需要购买一大批甲骨文研究权威著作,仅此一项下来,项目所拨经费便所剩无几。好在学院及时下拨了等额配套资金,中国社科院、北京师范大学等单位也在资料方面为课题组大开方便之门,燃眉之急暂时解决了。

  其次是人手。学院师资有限,也没有相关专业的研究生,能投入研究的人员不多。好在计算机学院及时伸出援手——结合学生科研需求,组织大批学生承担课题基础工作,并无偿提供机房。

  第三个难题发生在课题研究过程中。课题初始阶段,主要任务是对权威资料进行扫描、裁切、编号,构建甲骨文图片库;依据相关研究成果建立释文库;建立甲骨文原形文字库。前两项虽工程浩大,但尚能克服。可甲骨文原形文字整理,却在历经一年多时间的无数次失败后,才最终找到一项“笨办法”——把用抓图软件截取的图片放大500倍,再进行黑白翻转处理,最后用photoshop绘图程序对照甲骨文原形字,一笔一画地描写复原。用这个办法处理甲骨文字,每个字需用时30分钟左右,对研究人员的细致与耐心要求极高。然而,为了神圣的科研事业,课题组成员个个咬牙坚持,丝毫未曾松懈。

两次延期,精益求精,“绝不牺牲1%的精确度”

  随着课题推进,新的难题又出现了:殷墟甲骨文时间跨度约两百年,因时代、地区、书写习惯差异造成了大量“同字异形体”,即粗看为同一个字,细看笔画结构却有差异。对此,以往的很多研究忽略不计,仅取其一作为代表。可韩江苏不愿视而不见。

  “一点一横的小差别,很可能反映出生活习俗、历史文化上的不同,包含着丰富的考古价值,不能轻易丢失。”她和刘永革商定:尽量系统整理全部甲骨文字形。

  工作量再次大幅增加。课题组全体成员加班加点,历经近三年拼搏,不但将前人整理出的4000多个甲骨文字头扩展到5249个,还整理复原了41832个甲骨文原形文字,大大充实了甲骨文字资源。

  此时,课题结项日期已日渐临近。正当大家准备为剩余工作全力冲刺时,韩江苏说出了一个令人震惊的想法:推倒所有已绘制文字,从头再来。

  究竟哪里不对?原来,先民刻写在甲骨上的文字,每一笔都有笔锋,笔画之间有鲜明的叠压关系,而计算机复原出的文字虽笔画准确,却方头方脑,也不存在叠压痕迹,故令人有“是图形而非文字”之感。

  对于韩江苏的想法,有人提出反对,理由是,如果重来,只能申请延期结项,不但影响不好,而且后续经费从哪里来?对于这样的问题,韩江苏不是没想过,但她更不愿敷衍了事:“我们是在还原‘历史的笔画’。花了国家那么多钱,费了那么多功夫,如果做出个‘四不像’,那就对不起任何人。”反对的人被说服了,大家重新聚集起来,默默地重起炉灶。

  于是,课题组提出了第一次延期申请。出于鼓励严谨学风的考虑,全国社科规划办批准了申请,延期两年结项。学校也破例追加8万元资金予以支持。

  又是一番艰苦卓绝的奋战。一批学生毕业了,新的学生顶上来。韩江苏和刘永革重新对他们进行培训,要求比此前更高:每个字绝不牺牲1%的精确度。

  两年之后,任务依旧繁重,课题组一如既往地秉持了严谨求实的学风,再次提请延期,又获批准。

  而在又一轮艰苦卓绝的“冲锋”之后,甲骨文原文字终于全部重做完毕,三个数据库都有了雏形。

  最后一步:课题组审慎对比了现有的几种检索方法,决定创新检索方式,建立可视化界面,即将甲骨文的153个部首全部显示在界面上,使用者只需点击相应部首,便可通过汉字查找、编号查找、甲骨文原形字查找三种途径,便捷准确地实现检索。

成果可贵,精神可嘉,他们在科研中不断成长

  2011年11月,历经两次申请延期后,“甲骨文图文资料库”终于迎来结项验收。结果是喜人的——5位鉴定专家不约而同地将其评定为“优秀”等级,并一致认为“值得出版”。

  “功夫不负有心人!”课题组感慨万千。刘永革和团队成员们首先想到的,是韩江苏的不易:十年来殚精竭虑,她多次累病,手术出院后第二天便回到办公室,实在支持不住,就躺在椅子上指导学生;为弥补经费不足,她贴上了数年来所有积蓄,甚至把自家的米面和燃气灶搬来给学生们做饭。

  韩江苏则满心感激:全国社科规划办两次批准延期,给予充分信任;学校上下通力支持,很多教职工为课题无私贡献;团队成员顶住了如山的压力,却从不放弃……每一项,都是完成课题研究不可或缺的强大动力和坚实保证。

  更可喜的是,这项国家级课题,对全校科研水平起到了巨大的带动作用。在一向以甲骨文研究为科研特色的安阳师院,很多教师对甲骨文的兴趣愈加浓厚,甲骨文研究开始向着跨学科的方向迈进——十年来,学院承担与甲骨文相关的国家级课题达到十余项;而刘永革于2008年获得的国家自然科学基金项目“基于甲骨文语料库的计算机辅助考释技术研究”,也得益于同韩江苏一起开展的国家社科基金项目研究;受这一项目影响,体育系、美术系一些老师开始研究甲骨文中的体育、美术文化,并取得了不菲的成绩。

  现在,“甲骨文图文资料库”课题结项已一年多了,但相关研究从未停止。“我们坚持对图文库做进一步校勘和补充。今后,至少要把原来文献中未收录的甲骨拓片和新发现的拓片补充进去。”韩江苏说,她期待着这项心血之作能早日开发应用,为科研提供更大便利;她更希望,今后国家能够整合甲骨文学术研究力量,完善甲骨文文献数字化工程。

Author: jgwybbs