面向智慧服务的钢铁矿山行业知识库系统建设


打开文本图片集

摘要:对于钢铁矿山行业而言,有效、安全、智慧的档案管理在是企业的高速发展、行业的健康成长过程中扮演着极其重要的角色。知识库不仅仅是企业合同、单据或惯例存放的信息库,其内含信息还体现全方位的行业知识。行业档案知识库的有效建设,是发挥知识分享与知识创新的战略需要,同时也是形成企业高效管理与科学决策的需要,它为成功形成知识学习与知识共享创建了优良条件。本文采取了自举法在钢铁矿山行业档案知识库进行知识模式的自动获取,为企业管理档案知识库提供了一定的技术支撑。

关键词:档案知识库 矿业档案 档案服务

中图分类号:C93 文献标识码:A 文章编号:1007-9416(2015)06-0000-00

我国钢铁矿山企业已经进入低速发展时期,钢铁行业问题的复杂性、动态性愈加明显。矿山企业、乃至整个钢铁矿山行业在决策问题规模不断扩大、追求效率和工作复杂程度不断增加的背景下,能够使各环节工作效率提升,部门决策更加科学、及时和具有前瞻性,就必须要求具有更加系统、全面、响应快速准确、具有预测功能的知识系统作为支撑。

1 档案服务新思路

随着云计算、大数据、人工智能、语义网络、知识工程等相关核心技术的不断发展,档案管理及服务工作呈现出如下新态势:第一,档案管理工作逐步走向以探索事实和解释知识间的内在联系和逻辑性为主要目标,进而发挥档案部门的服务作用;第二,从海量档案文本中发现、抽取和挖掘蕴含于其中的知识已经具备可行性;第三,通过构建面向决策的档案知识库,档案知识的系统性和可用性能够得到最大程度的发挥,为企业生产过程和行业领导决策等业务环节提供高质量的档案知识服务。第四,知识管理的核心理念是知识的可重用和共享,知识管理的最终目的是能够解决工作过程中遇到的实际问题;基于档案的行业知识库构建是通过对档案资源的集成,运用先进的信息技术、机器学习、人工智能等技术,针对企业各种档案中所包含的知识进行挖掘、抽取、存储、传递、共享、利用和创新,以此提高档案中蕴藏的各种知识的利用价值[1]。

论文在知识库构建理论及技术、以及自主研发的知识管理软件的支撑下,完成了矿山企业知识库的构建,对提高矿山行业档案中的知识开发水平和层次、深化传统档案管理模式,对使企业管理由传统管理走向基于知识的管理提供了一定的指导作用。与此同时,系统建设最大程度的降低了珍贵档案资料的损坏,真正发挥档案(技术档案)对工作过程的支撑作用和对决策制定的支持作用。

2 档案知识库的构建目标

钢铁矿山档案知识库是以钢铁以及矿山的各类档案信息资源建立起来的知识库,为各类用户提供更好的服务,解决传统档案管理方式效率低下,服务水平受限等实际问题。矿山知识库系统的建立是企业乃至整个矿山行业知识共享和知识创新的需要,也是提升企业管理者决策能力和管理能力的需要,系统很好的解决了全行业知识共享的难题。钢铁矿山档案知识库正是利用以钢铁以及矿山的各类档案信息资源建立起来的知识库,为各类用户提供更好的服务。本论文构建的档案知识库以鞍钢集团矿业公司档案作为基础研究对象,系统设置了各种扩展接口,便于对系统进行拓展,以满足实现和其他企业的知识融合。

3 技术方案

鞍钢集团矿业公司电子文档管理系统是企业级智能电子文档管理系统,在实现电子文档管理的基础上,实现信息资源的共享与复用,促进企业已有资源的传播和创新能力的提升。系统分为用户管理、档案管理、知识库及知识服务三个子系统。如图1所示。

3.1 知识利用子系统结构设计

档案知识库系统是一个有关各类档案知识的集合,集合内容包括三方面,有档案知识的获取、档案知识的管理和利用三个方面。知识检索提供包括基本检索和高级检索两类,基本检索是基于数据库查询类的检索,查询条件包括年度、档案类别、档案密级、档案名称、作者、 部门;高级检索主要是针对文档的全文检索,还包括年度、档案类别、档案密级等筛选条件。系统根据用户选择检索形式,进入对应检索页面,选择对应的检索条件,根据检索条件分别进行基本SQL检索以及全文检索。

3.2 用户接口设计

通过知识引擎,将查询进行语义解释,得到用户目的意;并根据隐性要求,推理得到最终事实依据,我们将进行此类过程的模块统称为推理机构。

3.3 知识推理

利用知识,解释输入的数据或事实,推导出用户所需的结论;并根据要求,说明得出结论的依据,用于进行这种推理控制的模块称为推理机构。推理过程如图2所示。

一般来说,推理机构所具有的功能有:(1)新知识的融合、规范化、知识构建功能;(2)推理引擎与知识库完全解耦功能;(3)知识库的演化、更新功能;(4)知识库与查询问题的证据仲裁功能。

4 档案知识库的自动知识获取

4.1 自动知识构建模式

自动知识构建是指知识系统可以通过自身的学习、演化、构建等过程获取知识的能力[2]。系统通过与领域专家进行交互进行系统学习,也从海量结构化与非结构化数据中,采用人工智能技术,对已有非结构化档案数据抽取语义实体,构建知识图谱,并且通过系统的持续运行不间断的进行学习、规划出新的知识,推理判断知识库中的错误,不断更新自身,从而形成优质、高精准度的海量知识库。因此,为达到此过程,系统需要具备以下能力:

(1)从海量多源异构数据中抽取知识的能力。知识库中的大量知识主要来源于领域专家的海量多源异构以及领域相关期刊论文资源等。为了使系统具备自动知识抽取功能,需要使系统具有灵活易用的接口与专家进行交互,并对海量多源异构数据源可能自动匹配资源类型,调用相应的处理块,对知识进行初级抽取。(2)具有演化、归纳、推理的能力。由于领域专家提供的海量知识往往适用于某个具体问题,不具备泛化抽象通用能力,所以需要在理解的基础上进行分析、归纳、提炼、综合,从中抽取出专家系统的所需的知识并放入到知识库中[3]。(3)具有自我完善、仲裁协调的能力。随着知识库系统完成并上线后,知识的积累逐步增多。与此同时,知识的矛盾、证据的相异性也随之而来。因此,将新获取的知识与知识库已有的历史知识进行匹配、判断、仲裁协调是系统不断完善成长的过程。

4.2 语义抽取技术

系统的鲁棒性、可靠性是知识库系统构建必须要考虑的基本要求。本文提出一种基于《同义词词林》的语义模式自动获取方法[4]。在相同范畴的词语情境中,同义词相互具备可替代性,采用这一方式能极大提高语义的范畴;不同模式所提取信息含有交叉的语义信息,由语义信息又可获得较新的模式,此方式系统需要在系统初始化时以手式形式提供相关实例。系统生产执行中,可灵活通过词林来进行相应的语义扩展,并根据环境自动获取模型实例。知识库系统的最终输出为语义的相应模式。此方式的具体流程如下所示:

(1)系统输入。从用户获得大量非结构化的文本资源,根据不同领域的《同义词词林》,从其海量信息中以随机的方式选择性确定文本,配置人工参与方式最终获得文本的词法、语义标注后的实例。(2)内自举。根据选取最小支持度参数,从抽取的实例中学习部分模式,以此组成全新的实例,并从新实例中,推理、衍化出新模式,进而又得到新实例,周而复始,系统将穷举所有模式,最终完成内自举过程。(3)外自举。从海量非结构化文本资源中扫描匹配与知识库存在模式的备选模式,并且系统将向用户发送备选模式相对的实例。用户收到实例后,查看是否是所需内容,若确定是所需要内容,则指定资源模板的配对关系。系统将备选模式进行自举处理后,将从相似文本中去除该模式所对应的语句信息,从而免除二次处理。(4)系统输出。当新模式停止产生后,最终将语义规范输出[5]。

5 结语

钢铁矿山行业档案知识库的建设是一个庞大的、持续性的系统工程,其中将牵涉到大量形式各异的档案类型。面向智慧服务的钢铁矿山行业知识库系统建设需要系统建设者从战略高度进行整体的统筹协调、规划设计,尤其是在各方资源及管理工作上形成互动协同,稳步推进的工作机制。随着系统知识工程的不断完善与提升,管理者更要着重强化服务能力,落实服务目标,特别是要积极发挥档案编研的重要功能,整体有续促进知识库系统的不断提高。因此,需要从广泛有效地开展对科研档案及地质数据资源的深度挖掘工作,提升服务质量与服务水平,全面促使钢铁矿山行业档案管理工作的开展。

参考文献

[1] 周丹娜.企业档案管理系统的分析与设计[D].云南:云南大学,2013.

[2] 洗一栋.知识工程[M].北京:科学出版社,1992.

[3] 刘冰,申丽红,李涛.知识库系统原理探讨[J].软件导刊,2009(9):148-149.

[4] 方晓.地质专家系统知识获取技术研究[D].北京:北京交通大学,2009.

[5] 李向阳,张亚飞.一种基于自举原理的语义模式自动获取方法[J].微电子学与计算机,2005(2):189.

收稿日期:2015-05-29

作者简介:王欢(1971—),男,辽宁辽阳人,硕士研究生,毕业于长春工业大学,高级工程师,研究方向:矿山信息化。