关键词:电子文件元数据;元数据概念本体;元数据语言本体;智慧档案馆
摘要:论文从电子文件元数据的地位与功能,电子文件元数据的概念本体——电子文件元数据的逻辑结构体系,电子文件元数据的语言本体——电子文件元数据的形式化语言结构体系等方面,全面地论述了建立基于本体的电子文件元数据是建设智慧档案馆的关键与核心,同时指出,智慧档案馆是新时代的新生事物,其建设与发展还面临着巨大的挑战。
往期推文中,我们为大家推出了多个主题的中心研究员成果(公众号主页菜单栏“学术动态—研究员成果”中可查看)。
本期继续为大家推出“数字档案馆/智慧档案馆”专题,相关成果有以下6篇:
●丁德胜《新时代新征程档案工作呼唤智慧档案战略——智慧档案战略的概念定位、初步构想和实施路径》
●张正强《基于本体的电子文件元数据:智慧档案馆建设的关键与核心》
●王强《数字时代企业集团数字档案馆建设实践》
●章燕华《数字化转型背景下的档案信息化发展战略:英国探索、经验与启示》
●周文泓等《智慧档案馆建设研究:实践内容、行动策略、发展空间》
本期分享的论文来自张正强《基于本体的电子文件元数据:智慧档案馆建设的关键与核心》。
研究员简介
基于本体的电子文件元数据:智慧档案馆建设的关键与核心
张正强
(国防大学政治学院)
中图分类号:G270.7
引文格式:张正强. 基于本体的电子文件元数据:智慧档案馆建设的关键与核心[J]. 山西档案,2019(5):5-12.
摘要:论文从电子文件元数据的地位与功能,电子文件元数据的概念本体——电子文件元数据的逻辑结构体系,电子文件元数据的语言本体——电子文件元数据的形式化语言结构体系等方面,全面地论述了建立基于本体的电子文件元数据是建设智慧档案馆的关键与核心,同时指出,智慧档案馆是新时代的新生事物,其建设与发展还面临着巨大的挑战。
关键词:电子文件元数据;元数据概念本体;元数据语言本体;智慧档案馆
(9)为识别数字文件的形成(或捕获)环境提供支持,同时对维护文件的技术环境管理提供支持,以便可以复制文件;
(10)为高效、成功地从一种环境(或计算机平台)向另一种环境(或计算机平台)迁移提供支持,或者为其它的保管战略提供支持。
2007年国际标准化组织又正式颁布了国际标准ISO 23081-2:2007《信息与文件-文件管理过程-文件元数据第2部分:概念与实施》,该标准又进一步从八个方面再次对电子文件元数据的功能进行强调:
(1)在业务系统中捕获与管理文件;
(2)保证系统的互操作;
(3)支持文件的风险管理;
(4)保证文件的跨机构利用与检索;
(5)防止非授权利用文件;
(6)确保机构业务工作可持续地展开;
(7)确保电子文件的长期保存;
(8)确保档案系统中的元数据捕获。
2010年11月10日,联合国教科文组织向全世界发布的《世界档案宣言》中明确指出:在国际文件与档案领域要保证文件和档案的真实性、可靠性、完整性和可用性。所以,电子文件,不管其形式与结构如何,都必须具有真实性、可靠性、完整性和可用性,只有这样,才能进一步实现电子文件具有权威性的证据价值和凭证价值。由此,从这个意义上而言,概括地讲,电子文件元数据的功能:就是保证电子文件的真实性、可靠性、完整性和可用性,进而保证电子文件所应具有的权威性的证据价值和凭证价值。
(2)对于使用亚面,分出了技术环境、权限、利用、文件使用对象、语种、完整性、文件类别等子类;
(3)对于计划事件亚面,分出了事件时间、事件类型、事件描述、事件关系、触发事件等子类;
(4)对于事件历史亚面,分出了事件时间、事件类型、事件描述、事件关系、事件编号等子类;
(5)关系亚面,分出了关系标识符、相关实体的标识符、关系类型、关系时间等子类。
由此,经过以上各亚面的细分就形成了完整的电子文件元数据的属性分面,如下图2所示:
图2 属性分面
然后将电子文件元数据的实体分面与属性分面进行组配,就可以基于概念逻辑地形成一个个具体的元数据,如下图3所示:
图3 实体分面与属性分面的组配
(1)电子文件元数据语言本体的类公理是基于描述逻辑的语法表达的公理,其反映的是不同概念类之间所对应的实际电子文件对象间的真实关系,且这真实关系是公认的事实并构成了类的推理规则,通过类公理可以构建起电子文件元数据类等级结构的类系及类横向关系的类列与同位类,因此,可以对电子文件元数据进行类推理。
(2)电子文件元数据语言本体的属性公理亦是基于描述逻辑的语法表达的公理,属性可以是电子文件元数据类与类中的元数据元素之间的关系,也可以是指定特定的值,通过属性公理,其可以推理出电子文件属性与类之间的关系,因此,可以对电子文件元数据进行关系推理。
(3)由于电子文件元数据语言本体的公理是基于描述逻辑语法所表达的公理,可以将具体的电子文件元数据与电子文件元数据概念本体进行核对检查,即判断某一个体是否为某个类的实例,因此,可以进行电子文件元数据的一致性检测和实例检测。
由此,可以看出电子文件元数据语言本体的语法具有类推理的特性,属性推理的特性和一致性检测和实例检测特性,因而在建立电子文件元数据本体时运用其语言本体的语法可以从概念或属性推导出隐含的概念或属性,这就是电子文件元数据本体比传统的电子文件元数据数字化、信息化更为智能化的方面。
原文载《山西档案》2019年第5期
学生研究员学习感悟
参考文献:
[1]ISO. Information and documentation-Records management-Part1:Concepts and principles:ISO 15489-1:redline:2016(E).
[2]联合国教科文组织.世界档案宣言,2010.1.10.
[3]ISO. Information and documentation–Records management processes – Metadata for records–Part 2: Conceptual and implementation issues: ISO/TS 23081-2:2009(E) .