江 飞
(西安石油大学,陕西 西安 710065)
【摘 要】粗糙集理论,凭借其在处理模糊和不确定信息上的优越性,已经被广泛引用于复杂系统的故障诊断中。对粗糙集理论以及其属性约简过程进行详细的介绍,并通过典型故障实例进行验证,诊断结果表明:在保证分类结果不变的前提下,粗糙集可以查找出对故障分类起主要作用的特征,从而达到属性约简的目的,为粗糙集理论在故障诊断中的深入运用打下了基础。
教育期刊网 http://www.jyqkw.com
关键词 故障诊断;粗糙集理论;决策表;属性约简
0 引言
在现代设备的故障诊断过程中,由于计算机技术、自动化技术和网络通讯技术的快速发展及广泛应用,故障诊断技术进入了它的第三个阶段——智能化阶段。在诊断方法上也由传统的对故障源的直接测量和判断转变为对故障信号的分析研究及逻辑推理,这种方法不需要系统的精确数学模型,可以利用各种知识推理的相关技术,目前,专家系统、模糊推理和模式识别等在故障诊断领域已经取得了非常多的应用[1]。
但是,无论是传统方式,还是智能化手段,通常只有在信息准确完整的情况下才会得到满意的结果。而实际过程中所获得的信息通常是不准确的,并且当设备发生故障时,这些信号往往是冗余的,只需要少量特征信号就可以表征出该设备的整体故障信息。所以,将粗糙集理论引入到故障诊断领域中,利用其对诊断特征的压缩和约简,去除冗余的信息,从而可以大大减少诊断的计算量,提高诊断的效率。
在20世纪70 年代,波兰学者Z.Pawlak和一些波兰科学院、波兰华沙大学的逻辑学家们一起从事关于信息系统逻辑特性的研究,粗糙集理论就是在这些研究的基础上产生的。1982年,Z.Pawlak 发表了经典论文Rough Sets,宣告了粗糙集理论的诞生[2,3]。目前,粗糙集已成为人工智能领域中一个较新的学术热点,在机器学习,知识获取,决策分析,过程控制等许多领域得到了广泛的应用。
本文主要研究局域粗糙集理论的属性约简故障特征提取方法,并将该方法应用于齿轮的故障诊断中,得到对齿轮故障模式识别起主要作用的特征。
1 粗糙集理论的基本概念
粗糙集理论是一种处理不精确、不确定和不完善数据新的数学方法,其主要兴趣在于它恰好反映了人们用粗糙集方法处理不分明问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力[4]。在此基础上引入成员关系、上近似和下近似等概念来刻画不精确性与模糊性[5-7]。
1.1 信息系统
设S=(U,A,V,f)是一个知识表达系统,其中U:对象的非空有限集合,称为论域;A:属性的非空有限集合;,Va是属性a的值域;f:U×A→V是一个信息函数,它为每个对象的每个属性赋予一个信息值。
1.2 决策表
通常采用二维表格来表达信息系统数据集,这种数据表称为决策表,表中的每一列表示属性,每一行表示对象。一个属性对应一种等价关系,一张表可看作是定义的一族等价关系,即知识库。决策表是一类特殊而且重要的知识表达系统,它指当满足某些条件时,决策应当如何进行,故障诊断涉及到决策问题,因此可以用决策表这一工具来表示。
1.3 知识约简·核
在决策表中,决策表的简化首先就是化简决策表的条件属性,使得化简后的决策表具有和化简前的决策表相同的功能,但是化简后的决策表具有更少的条件属性。条件属性的简化在故障诊断中具有相当重要的意义,可以使得数据库规模大大减少,而且基于更少的条件属性可以得到相同的决策。
令P和Q为等价关系族,Q的正域记为posP(Q),且R∈P,若
posind(P-{0R})(ind(Q))= posind(P) (Q)(1)
则称R为P中Q必要的。P中所有Q必要的原始关系构成的集合称为P的Q核,记为coreD(C),在知识约简中的核是不能消去的知识特征集合。
区分矩阵:设信息系统S=(U,A,V),A为属性集合且A=C∪D,C、D分别为条件属性集和决策属性集,ai(xj)表示样本xj在属性ai上的取值,MT(i,j)表示区分矩阵第i行第j列的元素,则区分矩阵定义为:
其中∧表示析取运算,∨表示合取运算。
2 基于区分矩阵的属性约简算法
基于区分矩阵的属性约简算法,其基本步骤如下:
(1)计算决策表的区分矩阵;
(2)对区分矩阵中取值为非空集合的元素,建立相应的析取范式;
(3)将所有的析取范式进行合取运算,得到一个合取范式S,该合取范式中的每一个单独元素组成的集合为最后约简的核;
(4)输出属性约简的结果。
3 齿轮故障诊断实例
3.1 建立原始齿轮诊断信息表
分别采集齿轮剥落、断齿、裂纹三种故障状态以及正常状态下的振动信号数据各若干组,利用小波分析方法对采集的振动信号进行三层分解,然后对得到的八个频段进行重构,提取重构后各个频段的能量,由这些能量特征构成原始特征向量,并根据样本所属的故障模式类,建立齿轮故障诊断决策表。表1为根据采集数据建立的齿轮故障诊断决策表,其中C1,…,C8为条件属性,D为决策属性。
3.2 属性约简
粗糙集只能处理离散化数据,然而实验中获得的数据大多是连续的,因此,必须先对原始诊断决策系统中的数据进行离散化处理。本文采用不定长的划分区间来给定数据划分区间宽度。
按照第二节的计算方法得到整个决策表的最小条件属性集为{C1,C2,C6},获得最小决策表。
通过比较可得最小属性集的结构非常简单,仅包含决策时所必需的条件属性值和决策规则。它不仅具有原决策表的知识和分类能力,能对齿轮故障进行正确诊断,而且揭示了特征信息的冗余性。
4 结论
应用粗糙集理论进行齿轮故障诊断,从采集的齿轮参数为着眼点从其中获取诊断知识,不需要建立相关的诊断模型。所以,基于粗糙集理论的齿轮故障诊断方法,不存在对齿轮参数的主观评价,而是对参数进行客观的、定量分析,另外诊断规则的提取约简计算依据严格的数学方法。本文的研究内容为粗糙集理论在齿轮故障中的应用,但应用的一些其它难题,如诊断特征数量的选取、约简复杂性的降低等方法尚需进一步研究。
教育期刊网 http://www.jyqkw.com
参考文献
[1]叶银忠.故障诊断技术的发展趋势及我们的对策[J].自动化博览,2002,3:54-55.
[2]IEEE1516—2000.IEEE Standard for Modeling and Simulation (M&S) High Level Architecture (HLA)—Framework and Rules[S].
[3]IEEE1516,1—2000.IEEE Standard for Modeling and Simulation (M&S) High Level Architecture (HLA)—Federate Interface Specification[S].
[4]王志海,等.基于粗糙集理论的知识发现综述[J].模式识别与人工智能,1998,11(2):176-183.
[5]曾黄麟.粗糙集理论及其应用[M].重庆大学出版社,1998.
[6]刘文奇.Pawlak 代数及其性质[J].模糊系统与数学,1999,13(2):78-84.
[7]刘清,等.粗糙集理论:现状与前景[J].计算机科学,1999,24(4):1-5.
[责任编辑:汤静]