12月27日,记者从安阳市甲骨文研究与传承工作新闻发布会上获悉,被誉为甲骨学研究里程碑的“殷契文渊”甲骨文大数据平台已完成三期建设,将为全世界的甲骨文研究和爱好者提供高质量服务。
据安阳师范学院甲骨文信息处理教育部重点实验室副主任高峰介绍,甲骨文大数据平台“殷契文渊”是在中国社会科学院学部委员宋镇豪的指导下,由安阳师范学院甲骨文信息处理教育部重点实验室主导建设的,先后有50多名教师和学生参与建设。该平台的建设目标是建设世界上资料最齐全、最规范、最权威的甲骨文数据平台,让浩繁纷杂的甲骨文资料实现一键获取。自2019年免费向全世界开放以来,该平台达到了126万访问量,用户包括国内外甲骨文古文字专家,古文字博士、硕士以及强基计划的本科生,古文字爱好者,书法爱好者,中小学教师等,取得了良好的社会效应。
“殷契文渊”甲骨文大数据平台已经进行了三期建设,一期硬件投入500万元,软件投入36万元,主要是搭建了基础平台,形成了基础框架,攻克了甲骨文录入、检索、展现及应用中的诸多难题,利用数字化技术收集整理甲骨文相关的各类资源,进行数字化加工,实现甲骨文相关资源的全面数字化整合,一期平台在“纪念甲骨文发现120周年国际学术研讨会”上正式发布上线。
二期软件投入80万元,主要利用知网的“知网节”技术构建了甲骨文知识网络,消除了信息孤岛,实现了甲骨文著录库、文献库、字形库三库的链接功能。二期软件和知网建立了良好的战略合作关系,将“殷契文渊”甲骨文大数据平台嵌入知网官方网站,当用户在知网数据库中检索与甲骨文相关的词汇时,检索结果页面智能向用户推送“殷契文渊”甲骨文大数据平台。另外,针对甲骨文信息处理研究领域,经过实验室师生精心整理,平台提供了甲骨文手写字、甲骨文字检测、甲骨文字识别3个开放数据集,数据大小合计3.73G,目前3个数据集被国内外各大研究机构和科研院所广泛使用,下载次数超过3.4万次,为甲骨文的“数字化”和“智能化”研究提供了强有力的数据服务。
三期软件投入80万元,主要是完善了“殷契文渊”甲骨文大数据平台的手机版,解决用户随时随地获取知识的需求,为手机用户提供不同的阅读浏览方式及个性化服务,满足了用户随时随地获取知识的需求。为了提高服务质量,三期软件建设了异机容灾备份功能,通过双机并存机制可以有效地防止服务器因为各种意外导致的系统访问断层,同时也可以作为每次网站功能更新测试的内网访问渠道,有效避免每次更新网站功能时因为服务器端环境的不一致导致的各种访问问题。
“为了进一步提高甲骨文大数据平台的数据质量和服务水平,我们计划下一步对‘殷契文渊’甲骨文大数据平台进行优化升级,在‘殷契文渊’前三期建设基础上对底层数据进行清洗、梳理、排重、优化,使底层数据更加规范易用,同时增加智能化服务,比如甲骨文图像检索,使‘殷契文渊’甲骨文大数据平台的数据质量和智能化服务水平再上一个新台阶。”高峰说。(张俊军)