数据知识信息比起模拟知识信息在信息检索方面更加容易。为此在第一阶段韩国学数据库建设工作中,把重点放在有关韩国学数据知识信息加以组织化,并通过提供互联网服务来打好韩国学知识信息的数据生态环境的基础工作。韩国学数据库所提供的主要资料简单说明如下。
藏书阁古图书DB是作为朝鲜王室图书馆的藏书阁中所珍藏的古图书加以数据库化的。15,517种书的原文图像256万个,913种3,100册书的文字信息均由此韩国学数据库来提供。
宫廷仪礼类、滕录类、五军营相关资料、乐善斋版本韩文小说等有关宫廷历史和文化的韩国宫廷文化历史资料占主流。这些资料一般多用于历史剧等的考证资料,而且还可利用宫廷服饰资料还原传统服饰等方面有用之处。以大型资料为中心,把乐善斋版本韩文古小说资料加以文字化使这方面的研究振作起来。民间编写的野史资料和日记资料汇集于韩国学数据库中。这些资料可以补充中央史资料中所不足部分。藏书阁所珍藏的八世谱系统的系谱类已文字化并正提供给读者也是此韩国学数据库的一大特征。
现对592种古图书的简单诠释,并与古图书原文图像、文字信息一道同时提供给读者,使古图书利用者用起来很方便。将来把这些简单诠释工作当成重点来推进。
古文书DB由藏书阁所珍藏并传于后世的王室珍藏古文书和全国名门望族所珍藏的古文书两种来组成。藏书阁所珍藏古文书中4,557个原文图像资料、全国名门望族的古文书中15,850个原文图像、7,030个原文文字、8,883个诠释资料正提供给读者。
财产继承文书、合同文书、法庭诉讼文书、官职任命状等全国名门望族的古文书,如教令类、疏答启状类、牒关通报类、证凭类、明文文记类、书简通告类、置薄记录类、诗文类、书画类等分文别类提供给读者,这使读者有助于详细了解朝鲜时代地方社会的生活万象。
二十二个名门望族的目录介绍如下。
○ 居昌草溪郑氏桐溪宗宅
○ 庆州良洞庆州孙氏书百堂
○ 庆州崔氏龙山书院
○ 庆州安氏顺庵宗宅
○ 罗州会津罗州林氏沧溪后孙家
○ 大田安东金氏金英汉所藏本
○ 法兴固城李氏文书
○ 尚州延安李氏息山宗宅
○ 尚州愚山晋州李氏愚伏宗宅山水轩
○ 安东葛天顺兴安氏定峰宗宅
○ 安东光山金氏后雕堂
○ 安东水谷全州柳氏무실宗宅
○ 安东金氏老稼斋金昌业后孙家
○ 安东金氏三塘金瑛后孙家
○ 骊州李氏玉山精舍独乐堂古文书
○ 议政府潘南朴氏西溪宗宅
○ 仁同张氏旅轩宗宅
○ 周村真诚李氏文书
○ 晋阳河氏丹池宗宅
○ 晋州丹牧晋阳河氏丹池宗宅
○ 晋州柳氏帽山宗宅
○ 咸阳朴氏旧唐宗宅古文书
○ 海南尹氏莲洞宗家
古文书的原文图像服务提供的是彩色画面,所以可像直接面对原文资料一样阅览资料。并在每个古文书中提供简单诠释信息为阅览提供了方便。
乡土民俗口述录音DB提供的是韩国最大的语音资料。她提供的是总共达227,300分钟的民间故事、民谣、巫歌、方言调查等用地方方言录音的资料。乡土民俗口述录音资料DB的录音资料由韩国民间文学大系中的录音资料、韩国方言资料集中录音资料集、民谣研究专家提供的韩国民谣大观录音资料等三大资源汇集而成。
韩国民间文学大系的录音资料是为研究民谣及其民间故事而从全国直接采录的资料,她对于研究民谣和民间故事的地区差别是很有意义的资料。韩国方言资料集录音资料是从全国各地采录的录音资料,她对于研究现代韩国语的语源与正在消失的方言之间的地区之差方面是个宝贵的资料。还有韩国民谣大观录音资料是民谣研究者从全国的老百姓中采录的民谣录音资料。
同时提供韩国民间文学大系录音资料的文字整理部分,这对资料的运用很有帮助。特别对韩国民谣大观资料的800曲民谣做谱写工作,再提供乐谱图像服务,这更加方便了资料的运用。
韩国文化画面资料DB是韩国学中央研究院在编写『民族文化大百科辞典』时收集的有关韩国文化的90,000件胶片资料中,把那些不用于编写『民族文化大百科辞典』的28,350件资料加以数字化,最终数据库化的资料。这些图像资料按一定主题加以分类并加上简单说明,这给读者提供了方便。
韩国史基础词典DB是把有关韩国历史、文化的主要术语按概念、人物、地名、文献、作品、制度、团体、事件、庆典、遗物、遗址、思想等区分、说明的资料加以数据化的。2,882个项目术语连同详细的资料同时提供给读者。
通过第一阶段工作打下的知识信息生态环境的基础为依据,第二阶段提高了对已形成的资料信息的活用性,继而探索了知识信息生态环境的运用方案。生态环境的活化,虽在探索阶段,但计划逐渐扩大。到目前为止开发的知识信息生态环境的活化方案如下。
在二OO五年度工作中,那些已个别构筑的日记资料以日期为中心重新整合在一起。因此有关日期和相关已构筑资料已很容易阅览、信息检索也很方便。
仪范类的古图书中有使用于宫廷仪式的各种物品、道具、服装等以精致的绘画出现在里面,也收录了大王行踪的班次图。为对朝鲜时代宫廷仪式和文化有兴趣的读者服务,以这些图像为中心做成数据库并提供服务。10,887件物品图、班次图连同简单说明提供给读者。
对乐善斋版本韩文小说的文字化工程时,对汉字语的复原也同时进行的。汇集散落在各个古小说中复原的汉字构筑了数据库。相信这个数据库会在国语词典编写中作为重要的部分来活用的。目前,已有27,333个四字成语汉字语连同实例提供给读者。
古文书的简札(书信)类发现有部分民间偏方的书信内容。在二00五年度工作中,对这些部分汇在一起按『东医宝鉴』的分类,把其中的九十九件提供了服务。虽然所提供的数量少,但对发展替代医学则是宝贵的知识信息。
二00六年度工作中,为了把用汉文写成的汉字典故文字的电脑化,集有关祖先或中国留下的汉字字形、字音、字义的研究成果于大成,构筑汉字典故DB并提供服务。『全韵玉篇』、『字汇』中正字俗字对照目录,『正字俗字对照表』、『字汇』和『康熙字典』的辨似字目录,『字电释要』、订正增补『新玉篇』、『新字典』、『训蒙字汇』、『新增类合』,灵藏寺版本『类合』、『注解千字文』、『石峰千字文』、『百联抄解』等十四种文献中,抽出有关汉字信息构筑了数据库。