孙 瑞
(长春工业大学人文信息学院,吉林 长春 130122)
【摘 要】基于本体的语义检索是利用本体对用户提交的查询教育期刊网 http://www.jyqkw.com
关键词 进行扩展,将经优化处理过的查询教育期刊网 http://www.jyqkw.com
关键词 组导入文本检索引擎中,对文档资源进行匹配,将查询结构进行过滤和排序后依次返回给用户,克服了因信息冗余或丢失缺点的传统检索方法,将检索到的教育资源通过分析器进一步过滤,结合语义关联度的计算方法,可以很好地解决传统基于关键字检索存在的问题,最终得到与检索要求的内容匹配度较高的教育资源。
教育期刊网 http://www.jyqkw.com
关键词 本体;语义检索;网络教育资源
0 引言
在教育领域数字化步伐迅速加快,数字化的教育资源呈现井喷式增长的今天,越来越多的用户通过网络来学习和研究,这种教育方式也呈现出无限性和复杂性的特征。传统的信息检索是采用基于关键字的匹配方式的方法,这种检索在覆盖率与检索精度等方面存在一定的缺陷,检索结果的准确率比较低,不能很好地满足用户的个性化信息需求。如何能让用户快速高效检索到符合需求的信息成为网络学习领域中急需解决的问题。具体研究内容如下所述。
1 领域本体构建研究
对本体论和语义检索进行深入学习,结合网络的教育资源建设元数据规范,构建领域本体,为语义检索奠定坚实基础。
1.1 对本体的基本概述
1.1.1 本体概念
本体的概念是把现实客观存在的事物经过分解成基本的组成部分之后研究它抽象的本质特征。随着信息技术的高科技化,本体已经广泛的应用于计算机工程领域,用来实现知识上的共享和交互。
1.1.2 分类
本体按照功能领域,根据由低到高的程度,把本体分成如下四类:
1)顶级本体
2)领域本体
3)任务本体
4)应用本体
本文主要研究的是描述特定领域中的概念和概念问的关系的领域本体。
1.2 如何构建领域本体
由于不同学科领域的具体工程不同,构建本体的方法也各有不同,本体的构造方法有很多种都是可行的,其中得到广泛应用的有骨架法、七步法、IDEF-5方法、TOVE企业建模法。另外,在实际工程构建本体时,通常在构建规则的指引下,根据具体情况的需求,寻求探索出符合自身要求的具体方法。
1.3 构建教育资源本体的过程
无论本体采用什么样的方法都基本符合Gurber提出的5条本体构造的规则:
1)明确性与客观性:在自然语言的描述下给出术语较为明确和客观的语义概念。
2)完整性:本体中的概念是能表达特定术语集合的完整含义。
3)一致性:知识推理所产生的结果与术语含义达到基本的语义一致。
4)最大单向可扩展性:在向本体中增加通用术语和专用术语的过程中,不轻易修改原有术语及其含义以保证原有文件的敏感性。
5)最少约束:应尽可能减少对建模对象的约束条件。
同时,本文在网络教育资源本体的构造中,结合软件工程思想和问题的实际情况,设计出本体构建的实际步骤。实际构造步骤分为:设计与准备阶段、本体构造阶段、测试阶段、维护与进化阶段。
2 语义相似度计算方法的研究
2.1 语义相似度的概念
语义相似度是指两概念在意义上的一致程度,在本体树中可以利用两个概念间的语义距离来进行衡量。在本文知识点本体中,知识点间相似度主要是通过蕴含关系体现。由于所有知识点位于本体概念树的最底层,因此上述构建的知识层次网络中,影响语义相似度的因素我们主要考虑如下几点:语义距离、关系类型、节点密度、语义重合度。
2.2 语义相似度的算法
语义相似度算法的语义检索的核心,是进行语义匹配的基础。其主要是利用本体理论对检索词进行语义化处理形成查询向量,通过对查询向量与资源向量相似度进行计算实现语义检索的匹配。设计一种词语间的语义相似度的计算方法,并将算法用在构建本体阶段,计算候选名词词条之间的语义相似度,由此确定本体中的概念,辅助本体的构建过程。
3 语义检索模型的设计及优化
3.1 语义检索概念
语义检索是在语义网上进行查询检索的技术,又把语义检索称为概念匹配,在语义网中传输、存储的数据不但要给用户显示出来,而且还要求让机器进行“理解、分析”,即匹配在语义上相同、相近、相包含的词语。例如,用户需要检索“操作系统”,“UNIX、LINUX、WINDOWS”也是与之相匹配的词语。与传统的检索技术相比,它能提高检索的精度和覆盖率,减少了不相关冗余的返回结果。
3.2 语义检索模型的设计及优化
本文在研究知识点本体构建、语义关联度计算方法相关技术的基础上,结合教学领域,建立一个基于本体的教育资源语义检索模型。同时,理论与实践相结合,初步设计实现了教育资源语义检索系统,并将之投入到实际平台应用中,预期会取得了较好的检索效果。
通过分析教育资源知识点本体的语义相关性特点提出了一种基于知识点本体的语义相似度的计算方法。该方法通过将概念间关系进行分离,利用概念层次结构和关联关系并考虑多种影响因素(如语义距离、节点密度等)分别计算语义相似度,进而综合量化成语义关联度。利用前两步的成果,设计一个语义检索模型,将准确的查询结果反馈给用户。
4 结束语
通过引入本体技术,建立一种稳定性强、安全性好的基于语义的检索模型,实现对网上大量的没有统一分类、无序混杂的网络教育资源的检索,能够帮助使用者全面地掌握有关的必要信息,增强决策的科学性;提高信息利用的效率,缩短获取信息的时间,使用户有更多的时间去完成更重要的工作,从而大大提高了工作效率;有利于提高信息素质,增强信息意识,熟悉检索技巧;有利于科学研究工作的顺利开展,同时可以提高科研工作的成功率,进而促进整个社会的进步和经济的发展,有着良好的推广价值。
教育期刊网 http://www.jyqkw.com
参考文献
[1]万捷,滕至阳.本体论在基于内容信息检索中的应用[J].计算机应用研究,2003,29(4):5-8.
[2]刘风华,朱欣娟.信息系统领域的本体模型研究[J].西安工程科技学院学报,2003(1):53-57.
[3]杜文华.本体构建方法比较研究[J].情报杂志,2005,10:24-25.
[4]刘群,李素建.基于《知网》的词汇语义相似度计算[J].中文计算语言学,2002,7(2):59-76.
[5]刘燕美.教育资源评论的倾向性研究及应用[D].重庆大学,2011.
[6]段寿建.基于本体和语义检索原型系统的设计与实现[D].昆明:云南师范大学,2008.
[7]杨晓淼.一种基于本体的语义检索模型[D].哈尔滨:哈尔滨工程大学,2006.
[责任编辑:汤静]