规则提取在民航领域中的应用
Application of Rule Extraction in the Field of Civil Aviation
覃伟民 QIN Wei-min
(中国民用航空华北地区空中交通管理局山西分局,太原 030031)
(China′s Civil Aviation Air Traffic Management Bureau in North China Shanxi Branch,Taiyuan 030031,China)
摘要:提升客户满意度,是增强航空公司竞争力的有效方法。但是有效收集客户满意度可能成本高,时间长。而数据挖掘为挖掘客户满意度提供了便利的方法。本文主要运用面向对象与面向属性概念格的规则提取方法,挖掘出客户的满意度,并在民航领域中的应用做了探索。
Abstract: To improve customer satisfaction is an effective method to increase the competitiveness of airlines. But effective collection of customer satisfaction may cost lots of time and money. Data mining provides a convenient method of customer satisfaction mining. In this paper, the object-oriented and attribute-oriented concept lattice rules extraction method is used to dig out the customer satisfaction, and the exploration application in the field of civil aviation has been made.
教育期刊网 http://www.jyqkw.com
关键词 : 民航;数据挖掘;概念格;规则提取
Key words: civil aviation;data mining;concept lattice;rules extraction
中图分类号:V261文献标识码:A文章编号:1006-4311(2015)20-0165-03
0引言
形式概念分析,又称为概念格理论,由Wille R于1982年提出,它是数据挖掘的一种有效方法,也是数据分析的一种有力工具。概念格的每个结点是一个(形式)概念,它由两部分组成:内涵(即概念的描述),外延(即内涵所涵盖的对象)。概念格的Hasse图则实现了数据的可视化。因此,它被认为是数据分析与知识获取的一种强有力工具,已被广泛应用于信息检索,机器学习,软件工程和知识发现等领域。
基于概念格的规则提取是数据挖掘中的一项重要内容,它的研究内容是从一个已知数据库中挖掘一组规则(又称规则集)来描述各类数据的特征依赖,并通过此规则集预测其它数据的未知类别。截至目前,该研究方向已取得一系列的理论成果。然后,基于概念格的规则提取技术的实际应用方面尚未见到相关报道,这不利于理论研究的进一步推进。
为了使得基于概念格的规则提取研究得到进一步地完善和发展,本文探索面向对象与面向属性概念格的规则提取方法在民航领域中的应用。
1预备知识
定义 1[1] 三元组T=(U,A,I)是形式背景,其中U={x1,x2…xn}为对象集,每个xi(i≤n)称为一个对象,A={a1,a2…am}为属性集,每个aj(j≤m)称为一个属性,I是对象集U和属性集A之间的二元关系。
3面向对象与面向属性概念格的规则提取技术在民航领域中的应用
3.1 数据准备
在民航的客户满意度调查过程中,分析员将收集订座系统中存储的大量历史数据,包括序号、团队标识、姓名前缀、姓名、订座记录、舱位、订座状态、订座人数、OFFICE、订座日期等数据。并将其整理成如下数据:完整姓名,订座OFFICE号,订座工作号,订座日期,订座时间,客票类型,票号代理人信息,出票OFFICE号,出票工作号,票价付款方式,航班配备的阅读材料、飞机是否晚点、飞行状况的通报、客舱卫生间清洁程度、乘务员的精神面貌、客舱座位舒适程度、乘务员的广播、客户满意度等数据。其中1表示满意,0表示不满意。对象部分x1,x2,…,x10分别表示10名乘客,属性部分用下标的字母代替。
3.2 数据处理
数据准备完毕后,整理成决策形式背景,开始对决策形式背景运用数据挖掘的技术进行规则提取。主要按照以下五步进行:
3.2.1 提取Wille概念格
根据定义3,可以提取出决策形式背景F=(U,A,I,D,J)的决策部分的Wille概念(x1、x4、x5、x8、x9、x10,d)。
3.2.2 提取面向对象概念格
根据定义6,针对条件形式背景可以提取出的面向对象概念:
1、(x2、x3、x4、x5、x6、x7、x8、x9、x10,a1、a3、a4、a6、a7)
2、(x4、x5、x9、x10,a1、a4)
3、(x2、x4、x5、x7、x9、x10,a1、a4、a6)
4、(x1、x2、x3、x6、x7、x8,a2)
5、(x4、x9,a4)
6、(x2、x4、x7、x9,a4、a6)
7、(x1、x2、x3、x4、x6、x7、x8、x9,a2、a4、a5、a6)
8、(x2、x3、x4、x5、x7、x9、x10,a1、a4、a6、a7)
9、(x2、x3、x4、x5、x6、x7、x8、x10,a1、a3、a7)
10、(x4、x5、x10,a1)
11、(x2、x3、x4、x5、x7、x10,a1、a7)
12、(x1、x2、x3、x4、x5、x6、x7、x8、x10,a1、a2、a3、a7)
13、(x2、x3、x4、x5、x6、x7、x8、x9,a3、a4、a6)
14、(x2、x3、x4、x5、x6、x7、x8,a3)
15、(x1、x2、x3、x4、x5、x6、x7、x8,a2、a3)
16、(x1、x2、x3、x4、x5、x6、x7、x8、x9,a2、a3、a4、a5、a6)
3.2.3 运用面向对象概念格的规则提取技术
根据3.2.1和3.2.2的结果,利用定理1、定义9、定义10,可知能够提取出以下非冗余面向对象概念格的规则:
r1∶a1∨a4→d
从提取的规则r1可以看出,乘客对航班配备的阅读材料满意或者对客舱卫生间清洁程度满意,则乘客满意度为满意。
3.2.4 提取面向属性概念格
根据定义11,可以提取出以下面向属性概念:
1、(x1,a2、a5)
2、(x1、x2、x3、x6、x7、x8,a2、a3、a5、a6、a7)
3、(x1、x3、x6、x7、x8,a2、a3、a5、a7)
4、(x4、x5、x9、x10,a1、a3、a4、a5、a6、a7)
5、(x1、x2、x3、x5、x6、x7、x8、x10,a1、a2、a3、a5、a6、a7)
6、(x1、x3、x5、x6、x8、x10,a1、a2、a3、a5、a7)
7、(x5、x10,a1、a3、a7)
8、(x1、x6、x8,a2、a3、a5)
9、(x1、x9,a2、a4、a5、a6)
10、(x1、x2、x3、x6、x7、x8、x9,a2、a3、a4、a5、a6、a7)
11、(x1、x6、x8、x9,a2、a3、a4、a5、a6)
12、(x9,a4、a5、a6)
13、(x1、x10,a1、a2、a5、a7)
14、(x1、x9、x10,a1、a2、a4、a5、a6、a7)
15、(x9、x10,a1、a4、a5、a6、a7)
16、(x10,a1、a7)
3.2.5 运用面向属性概念格的规则提取技术
根据3.2.1和3.2.4的结果,结合定理2、定义14、定义15,可知能够提取出以下非冗余面向属性概念格的规则:
r2∶a1∨a3∨a4∨a5∨a6∨a7∧﹃ a2→d
r3∶a1∨a2∨a4∨a5∨a6∨a7∧﹃ a3→d
从提取的规则r2和r3可以看出,顾客对航班配备的阅读材料满意、乘务员的广播、客舱卫生间清洁程度、乘务员的精神面貌、飞机是否晚点,飞行状况通报中任意事项感到满意,并且对客舱座位舒适程度情况不满意,则乘客满意度为满意。
顾客对航班配备的阅读材料、客舱座位舒适度、客舱卫生间清洁程度、乘务员的精神面貌、飞机是否晚点,飞行状况通报中任意事项感到满意,并且对乘务员的广播不满意,则乘客满意度为满意。
4结语
针对现有的基于概念格的规则提取技术缺乏实际应用,本文探讨了面向对象与面向属性概念格的规则提取方法在民航领域中的应用。具体结论是,实现了将民航数据转化成决策形式背景,构建Wille、面向对象与面向属性概念格,在此基础上成功挖掘出客户对民航服务满意度的关联形式,从而说明所研究技术在民航领域中的应用初步取得成效。
实际上,优质的空中服务质量对增加航空公司的竞争力具有重要作用,它是追求高质量、高标准、高要求的服务,时刻以消费者的利益为首要服务标准,为人民群众提供与其他交通运输行业完全不同的服务。因此,空中服务质量对民航经济效益具有深远影响。鉴于此,如何提高空中服务质量的研究有一定的效益价值。而本文通过面向对象与面向属性概念格的规则提取方法研究了空中服务满意度问题,为不断提高空中服务质量奠定了理论基础,也间接地体现了所开展工作的使用价值。
此外,本文研究成果为后续开展更多应用研究提供了有价值的参考,也为丰富现有的规则提取技术做出了一定贡献。
教育期刊网 http://www.jyqkw.com
参考文献:
[1]Wille R. Restructuring lattice theory: an approach based on hierarchies of concepts[C].in: I. Rival (Ed.), Ordered Sets, Reidel, Dordrecht-Boston, 1982:445-470.
[2]Ganter B, Wille R. Formal Concept Analysis: Mathematical Foundations, Springer, New York, NY, USA, 1999.
[3]鄂旭,邵良杉,张毅智,杨芳,李晗,杨佳欣.一种基于粗糙集理论的规则提取方法[J].计算机科学,2011(01).