设某一知识对象的 3况模型为一个打维空间,其各个维度记为七“ 二 1,2,…,?0,某一知识视图所对应的权重向量为如二〈叫,如2,…,叫 ),满足叫奋0且
2 =1。此时,如果 表明方面?在该视图中,如果岣 0则表明方面?不
1 = 1
在该视图中。显然,该权重向量61定义了知识对象在该视图中的方面组合情况,
称其为知识对象的一个视图。此时,知识对象6和&的视图相似度定义为
/1
81叫(尺似):
卜1
8.1.2政务知识检索算法
在检索算法方面,传统信息科学领域已经有了较为丰硕的研究成果,可为政务知识检索提供借鉴与参考。本节对比较典型的几种检索策略与方法作归纳研究。
最近邻法。
最近邻法(加虹诚II吨1 01,是以相似度计算为基础的检索方法。它的基本思想就是在系统知识库中找到一个与用户知识需求最接近〈亦即视图相似度最大)的知识并提交用户。实际运作中,用户提交的知识需求往往是不完备的,即用户需求特征向量通常会是知识库中各知识向量的子集。如此,以用户需求向量的各分量为标准,建立相应的视图框架;尔后,基于该视图框架,遍历系统对应知识库中的所有知识对象,计算各知识对象与用户知识需求之间的视图相似度,并将所得全部视图相似度排序,将最大值所对应的知识库中的知识作为检索结果提交给用户。
最近邻法思路自然、实施简单,并在检索算法中居于基础地位。不过,该方法也存在一些问题,主要表现在两个方面:其一,因其在检索过程中要遍历对应知识库中的所有知识,当知识库规模较大时,检索效率相对低下;其二,它以视图相似度作为知识库中各知识对象与知识用户查询要求之间接近程度的量度,视图相似度计算过程中的权重向量如何髙效、准确确定,也是一个较难解决的问题。
对于检索效率相对低下的问题,业内比较普遍的解决思路是以匕阶最近邻算法代替一般意义上的最近邻法实施检索。它的基本思路是对前述视图框架进行简化处理,即将其中不重要的方面剔除,只留下对用户检索需求相对重要的方面;当视图维度降低后,视图相似度的计算效率就会相应提高,进而提髙完整的知识检索效率。当然,视图方面的精简工作应以在系统辅助下由用户参与的“人-机”交互方式完成。
不过,上述方法并不是基于检索效率降低的根本原因(知识库规模增大、遍历次数增加)提出的,而是通过简化视图相似度计算从另一个视角谋求提升检索
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:视图,知识,检索,用户,向量