“群众”与“共产党员”之间的语义距离小。对于满足上述特征的简单枚举型方面,既然存在细分语义距离,则也可按次序枚举型方面相似度的计算方法测度其相似度。
④政务知识方面为分类树型。分类树型方面的方面值呈现层进分类的树型结构。如图8-1所示的分类树型方面“隶属单位”,树上的每个结点为该方面的一个可能取值,每一层对应一个分类层次(省、厅、局卜’下一层的分类值依赖于前层分类值,是对前一层的递进细分。显然,两个知识对象在同一方面上的取值沿分类树“自顶向下”能够归人同一类的层次越低,或说其最低公共前驱结点的位置越低,则表明两者在该方面的相似度越大。伯格曼〔06:1*2103 11〉于1998年提出了案例知识的分类树型方面的相似度计算方法。在此基础上陈鸿等作进一步补充,提出了分类树型方面的相似度计算框架。不过,他们的讨论过于复杂。笔者对其重新整理与完善,将原来7种讨论情况精简为6种,设计了政务知识分类树型方面相似度的新型计算方法。
设定X为分类树的一个内部结点,。为结点况所有子树的叶结点〃的集合丨〃1〃6、丨。当 在V到树根的路径上时,称V是凡的后继结点或是斤,的前驱结点,记为\ ”。记斤,和乂最低公共前驱结点为“(叭具丫,,满足( ,乂)〉#丨和(斤丨爲)〉乂,并且不存在结点斤使得〈(叭具)励仏八IV成立。记。任意两个叶结点下限相似度为、。引人分类树的整体基口,“、最低公共前驱结点基0 110.161 5 00(162 以及内部结点基0 (斤)概念,其意义分别为分类树的总层数、两结点最低公共前驱结点到根的层数以及内部结点~所处分类树层次。将参与方面相似度计算的方面值分为叶结点确定值、内部结点确定值、取值非确定三种情况(叶结点用小写字母表示,非叶结点用大写字母表示〉,则两个知识对象的方面值共有6种情况,其方面相似度计算方法如下。
I隶属单位丨
图8-1分类树型方面
情况一,两个方面均在分类树的叶结点上取确定值(巧,七),则两个知识对象在方面七上的方面相似度为
0-2
7 /12
情况二,一个方面在分类树的叶结点取确定值(…),另一个方面在分类树
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:结点,分类,前驱,知识,情况