文 献 综 述
一.背景
本体是一个知识库,通过类似描述逻辑(DL)的逻辑语言来描述特定领域的词汇,提供了一个通用的词汇表,并且提供了词汇表中所包含术语的含义及其之间逻辑关系的描述。本体实际上就是对特定领域之中的概念及其相互之间关系的形式化表达。本体通常由ABox、TBox两部分组成,TBox中定义和存储了所感兴趣领域的术语信息、概念和关系,ABox中则包含了事实信息,使用已经定义过的概念和关系来对个体进行描述。
目前本体已经广泛应用于人工智能、语义网、生物医学信息学、软件工程、图书馆学等领域[1]。而本体在这些领域往往需要构建复杂而庞大的本体,需要使用大量的概念和角色符号。例如:在不同国家和地区的健康信息系统中起着重要作用的SNOMED CT本体包含了30万多个概念,美国国家癌症研究所本体(NCI)包含6万多个术语定义,基因本体包含了40000多个概念。这么大规模的本体,导致本体难以维护和更改。在本体的后续应用中,如果我们只对本体的特定部分感兴趣,例如:当一个动物学家,只对动物本体中的濒危动物感兴趣。很明显,直接在原来的本体上进行处理会耗费大量的时间和人员精力去处理本题中多余的、不相关的部分。而另一方面,为此次应用专门重新建立一个领域本体,也是不现实的。一种可行的方法就是,在原来的本体上,删除本体中与后续工作不相关的关系和概念符号,并且保留所有剩余概念和关系符号的逻辑关系。
“遗忘”方法是一种非标准推理方法,旨在通过消除本题中的概念和关系符号,来创建一个子本体,使得本体工程师可以将注意力集中在本体的特定部分上,以对这个部分的信息进行深入分析或重构。即给定一个概念和关系符号的集合,删除本体中所有不在给定集合中的概念和关系,计算出一个新的本体,要求这个新的本体中的概念和关系具有和原本体保持一致的逻辑关系,即在删除不相关的概念和关系符号的同时,需要保留剩余概念和关系符号间的逻辑关系,而这些关系有的是被给定集合外的概念的所蕴含。
二.“遗忘”方法的应用
“遗忘”方法已经有许多方面的应用。例如:
1、本体再利用。通常,在我们需要将一个已经存在的本体在新的项目上进行使用的时候,但只有少数本体中的概念和关系是和项目是相关的,通过删除本体中不相关的关系和概念,产生一个新更小的本体,在项目中可以使用新的本体,而不用使用原本体的全部。
2、信息隐藏。基于本体的系统越来越多地用于处理敏感信息的各种应用程序中,例如医疗保健系统中。如果这些数据由不同的用户访问,则至关重要的要求是必须保留私有信息的机密性,并且用户根据其特权对数据具有不同的访问权限。例如,这种特权可能会限制某些概念和角色的可见性。处理隐藏术语的一种方法是使用黑匣子方法来限制对本体的访问,其中推理机和系统可以根据用户的特权将查询发送到仅允许使用受限语言的基于本体的系统。另一种方法就是共享删除敏感概念信息后的Uniform Interpolant或Forgetting Solution。
用于医学或军事用途的本体可能包含敏感信息,当本体被发布,共享或传播时,这些信息必须对公众或通信保密。这也与使用行业有关,以确保专有信息得到充分保护。通过删除那些与敏感信息有关的概念和角色符号,可以解决这一问题。
