知识保存地。
基于的文档知识表示与存储需要遵循50 两级标准,即结构完整性与合法性。处理器只接受结构完整的文档,不满足该标准的文档不能被正常读取和显示。因此,结构完整性标准是基本要求。结构完整性标准主要包括:①以声明作为文档的开始;②含有数据的元素必须有起始标记和结束标记;③空标记元素必须以结束;④文档只能有一个根元素;⑤元素定义可以嵌套但不能交叉;⑥各种标记必须符合相应命名规范等0
合法性标准要求文档按规定顺序包含需要的所有元素,且不包含未经声明的任何元素。010规定XIV 文档的元素清单、属性、标记、文档中的实体及其相互关系,遵守0X0规则的文档即是合法文档。通过0了0可以把以前只有通过约定才能遵守的约束条件付诸实施;070很保守,没有明确允许的就是禁止的。同时遵循结构完整性和合法性的乂姑[文档,XIV 处理程序才能将其转换为元素的树状结构,再由语法分析程序将树状结构或树的结点传送给用户端应用程序(如正)。
0X0可以包含在其所约束的X机文档中,也可独立产生外部070文件并存储于见士服务器以便被不同文档或应用所共享。对于后一种情况,要时刻意识到此时0X0的改变会自动传递给被它所约束的所有文档。改变0X0 —般要重新检查文档的合法性,并对XIV&文档作相应调整。此外,通过使用外部参数实体引用,可在X姑[文档中使用在不止一个010中声明的元素。
一般文档的XVI表示与存储可以通过如下步骤实现。
( )对组织内某一业务领域中的文档作结构分析,抽象并提取该领域某一类文档的共同属性(如标题、作者、类别)和结构。
通过070定义这类文档的通用标准和标记集,并以树型结构表明各个知识片段间的彼此联系。
基于0X0制定的标记与结构,实现一般文档到文档的转化。
图4-33是某一类文档的070示例,其指定了将该类文档转换为文档存储时所需而且必须引用的标记以及文档的结构,如必须有一个1111五子元素、一个或多个化了9011子元素、有或没有3118X111 :子元素等。当建立起组织内某一子领域文档类型的0X0后,实现一般文档到5011 文档的转化,只需要知识工程师对组织内一般业务职员进行很少的培训与练习后,就可使其迅速掌握转化与编写要领,并使其速度“几乎与文字输人速度一样快”。因此,通过基于5 11的V必页存储组织内的文档型知识不仅易于实现,而且效率很髙。图4-34演示了相应于前述―的XVI文档结构及0X0声明。
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:文档,结构,元素,标记,标准