效率,其实际效果是有限的。毕竟,如前所述,用户提交的知识需求往往本身就是不完备的或相对简单的,此种情况下留给“方面精简”的空间将会非常小;强行精简的效率提升将以检索的有效性降低为代价。如此,当系统知识库规模足够大时,解决最近邻法检索效率相对低下的有效办法不应绕开产生问题的根本原因,而应采取有效的策略避免遍历对应知识库全部知识对象而仅对其中相对可能的知识对象展开相应检索计算,并能够在有效提升检索效率的同时仍能将检索的有效性维持在一个令人满意的水平。启发式检索算法〔11611118110 16106 31 与归纳检索算法( 如⑷代就是基于这一思路的典型算法。
启发式算法就是基于这样的检索思路而设计的检索方法。该方法在检索过程中通过估价函数或启发式规则实现对后续检索范围的优化选择与限制。在不对检索空间实施全部遍历的前提下,确保检索过程每前进一步都是朝着有效解决问题的方向前进,避免无意义的遍历活动,以切实提高检索效率。在0811研究领域,著名的“朽也30(1 检索算法即是典型的启发式算法,其被广泛应用
于对案例型知识的检索过程。该类算法在实施前一般要对知识库实施索引操作,使知识库中的各知识对象按逻辑距离(相似度)进行类聚,从而为迅速压缩检索空间创造条件。
归纳检索将完整的检索过程划分为归纳和检索两个阶段。它通过对知识库的归纳计算,生成具有决策树形式的索引结构(知识归类其后续的知识检索过程则依赖该索引结构展开。对于用户提出的知识查询要求,系统从索引结构树的根部开始,逐层计算决策树内部结点与用户知识需求视图间距离,据此选择最佳分支并启动下一层次的计算与判定,直至搜索到与用户知识需求足够接近的知识对象为止。同启发式检索算法一样,该方法也因其压缩了检索空间而使检索过程具有较髙的效率。不过,为了实现对检索阶段的动态支撑,对知识库的归纳操作也应动态实施,从而使决策树具有与系统知识库的实时对应性;当知识库规模越来越庞大时,其归纳操作的计算负荷将会非常严重;此外,决策树的构建质量直接影响到检索阶段的效率和有效性。
针对最近邻法视图相似度计算过程中的权重向量确定问题,业内也提出了许多解决办法与思路,如熵值法、归纳法、层次分析法、简单关联函数法等。我们认为,在政务知识检索过程中应用最近邻法时,视图相似度计算过程中的权重向量可交由知识需求主体自行确定、直接给出。权重向量表征知识检索需求,而对知识检索需求的表达与确定,知识需求方最在行、最权威;实际运作中,知识检索需求复杂多变,任何技术处理得到的权重向量都难以准确描述用户的真正知识需求;此外,采用“用户确定、直接给出”方式略去了对权重向量的计算过程,对提升系统检索效率亦十分有益。
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:检索,知识,算法,启发式,知识库