文/谢瑶 郭旭梅
摘要:当今时代是大数据的时代,本文对上海市153个公园的相关因子进行统计,确定各因子权重并最终将其做了排名,找到20个具有代表意义的公园。通过大数据挖掘,对搜索引擎的检索记录进行分析研究,得出公园游憩功能。
教育期刊网 http://www.jyqkw.com
关键词 :公园;游憩;大数据;搜索引擎
引言
公园是城市中面积大、功能全的绿地,它是衡量城市建设水平的重要标志。为了进一步了解上海公园的发展状况,通过大数据挖掘,对20个公园的游憩功能进行研究分析,为优化上海城市公园规划建设,城市居民公园选择提供科学依据。
1、相关理论和技术
本文的主要理论和技术为大数据理论和搜索引擎技术。前者是指从各种各样类型的数据中,快速获得有价值的信息;后者专门为用户提供信息“检索”的服务。本文总共选取了四个搜索引擎,其中中文搜索引擎为:百度、搜搜;外文搜索引擎为:谷歌、雅虎。
2、选择上海市具有代表意义的公园
2.1 相关步骤
2.1.1 建立层次结构模型
将决策的目标、考虑的因素和决策对象按它们之间的相互关系绘出层次结构图。目标层为“选择公园”,准则层1为“文化和历史 ”“区位”“规模和特色”,准则层2为“建园历史”“历史名人、事件”“交通路线”“停车场数量”“附近商圈”“地理位置”“游乐设施”“面积”“A级景区”。方案层为“人民公园”“鲁迅公园”等上海市公园。
2.1.2 构造判断矩阵
这个阶段采用专家打分法,通过旅游专业的专家对准则层的各个因子进行打分,得到关于文化和历史、区位、规模和特色的判断矩阵为
2.1.3 层次单排序及其一致性检验
对应于判断矩阵最大特征根λmax的特征向量,经归一化后记为W。经计算准则层1的W1=( 0 . 3 8 7 3 0 1 8 7 ,0.16984127,0.442857143)ˊ入=3.018309068。一致性的检验结果CR=0.015783679<0.1。此结果的不一致性程度在容许的范围之内,有满意的一致性。准则层2的W2=(0.25,0.75)ˊ;W3=(0.171457219,0.079434046,0.0578877005)ˊ,入=4.081003075,CR=0.030001139<0.1; W4=(0.210606061,0 . 2 4 0 9 0 9 0 9 1, 0. 4 5 8 4 8 4 8 4 8)ˊ,入=3 . 0 1 8 3 1 8 5 8 8,CR=0.015791886<0.1。
2.1.4 计算最终权重
由于已经有了准则层1和准则层2的权重结果,将其进行计算得到最终权重,结果为:建园历史0.096825397,历史名人和事件0.29047619,公交数量0.029120512,停车场0.013491179,商圈0.098317206,地理位置0.028912373,游乐设施0 . 0 9 3 2 6 8 3 9 8 , 面积0 . 1 0 6 6 8 8 3 1 2 , A 级景区0.242900433。
2.2 数据处理
2.2.1 数据标准化
数据标准化的常用方法有Min-max标准化、z-score标准化、小数定标标准化和归一化。其中第一种方法是最常用的方法,其原理是对原始数据进行线性变换。设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x’。故本文中采用这一方法。
2.2.2 对各变量进行打分说明
1)建园历史
建园历史中针对历史500年以上的公园打为1分,100年到500年间的打为0.8分,其余根据Min-max 标准化方法对其进行打分,对于少量未得到数据的公园采用平均值对其进行评分。
2)历史名人、事件
对历史名人、事件影响较大的公园打分为0.8分,如上海五大古典园林、世博会、鲁迅、孙中山等;对第二类的历史名人、事件打分为0.5分,如未说明具体的烈士、炮台、举办展览、古树较多;对一般性质的历史名人、事件打分为0.3分。如犹太难民收容所、32颗百年大树。无历史名人和事件为0分。
3)交通路线
由于上海地铁系统较发达,换乘方便,居民更愿意乘坐地铁出行故将一条地铁算成两条公交的数量,再根据Min-max 标准化方法对其进行打分。
4)附近商圈
对于大型商圈四川北路商业街繁华地段、南京路步行街、陆家嘴金融中心区等打分为1分;其余商圈打分为0.5分。
5)地理位置
位于内环打分为1分,以此排序分别为0.7、0.4和0.1。
6)游乐设施
一般小区有的和路边较常见的,如儿童游乐设施和茶室各打分0.1分,篮球场、网球场等健身设施打分0.2分,喷泉0.2分,古戏台0.2分,溜冰场0.2分,舞厅0.2分,游乐设施较多较齐全的打分1分。其余的按照得分情况相加。
7)面积
先将其单位都转换成平方米,再按照Min-max 标准化方法对其进行打分,未找到原始数据的按照平均数对其进行打分。
8)A级景区
根据A级景区知名程度和宣传程度,将3A级景区打分为0.3分,4A级景区打分为0.7分,5A级景区打分为1分。
2.3 公园排名
将打分情况进行整理,分别乘相应的权重算出各个公园的最终得分情况,最终排列出排名前20位的公园。分别为古猗园、中山公园、豫园、上海野生动物园、闸北公园、方塔园、醉白池公园、张堰公园、光启公园、鲁迅公园、秋霞圃、曲水园、世纪公园、临江公园、 淞南公园、人民公园、共青森林公园、上海动物园、亭林公园、古华公园。
3、大数据理论下的城市公园游憩功能研究
3.1 网络搜索数据
前文中笔者已经得到排名前20个的公园名称,因此确定了在搜索引擎中输入的与游憩相关的六个教育期刊网 http://www.jyqkw.com
关键词 :公园+玩、公园+旅游、公园+休闲、公园+游憩、公园+娱乐、公园+度假,游憩中各功能类型的六个教育期刊网 http://www.jyqkw.com
关键词 :公园+赏花、公园+亲子、公园+划船、公园+野餐、公园+骑马、公园+锻炼。同时也确定了外文搜索引擎的教育期刊网 http://www.jyqkw.com
关键词 ,其中,与游憩相关的六个教育期刊网 http://www.jyqkw.com
关键词 为:park +play、park +tourism、park +leisure、park +recreation、park +entertainment、park +vacation,游憩中各功能类型的六个教育期刊网 http://www.jyqkw.com
关键词 为:park +flower、park +parenting、park +boating、park +picnic、park +horseriding、park +exercise。
3.2 数据结果分析
3.2.1 四大搜索引擎检索结果数量对比
如表1所示,使用四个搜索引擎检索:公园、公园+玩、公园+旅游、公园+休闲、公园+游憩、公园+娱乐、公园+度假得到的结果总数为表中与游憩相关检索结果的总计。从图1搜索结果比较中可以看得更加清楚,Google搜素引擎检索得到的结果遥遥领先,百度次之。另外,也可以看到与游憩相关的教育期刊网 http://www.jyqkw.com
关键词 检索结果要大于各功能类型教育期刊网 http://www.jyqkw.com
关键词 检索结果总计。
3.2.2 检索结果中排名前二的公园比较如表2所示,使用四大搜索引擎,对20个公园逐一检索。使用百度搜索引擎进行公园名检索,结果排名前二的公园为世纪公园100000000条记录,中山公园40000000条记录;还可以看出四大搜索引擎对公园名检索得到的结果较为一致,关于世纪公园、中山公园、人民公园的信息较多,由此,可以推断大众对这几个公园的关注度较高。
通过对与游憩相关的教育期刊网 http://www.jyqkw.com
关键词 和游憩中各功能类型的教育期刊网 http://www.jyqkw.com
关键词 进行搜索统计,可以看出各个搜索引擎检索到的结果相差很大,但是世纪公园的功能较多,在20个公园中比较突出。
3.2.3 与游憩相关的部分教育期刊网 http://www.jyqkw.com
关键词 对比
通过检索教育期刊网 http://www.jyqkw.com
关键词 “公园+玩、公园+旅游、公园+休闲、公园+娱乐”得出搜索引擎中排名前二的公园,发现结果十分接近,如表3所示。由此可以得出,玩、旅游、休闲、娱乐在大众心中的差别不大,这几个词的意思比较接近。
3.2.4 检索结果中排名前二的教育期刊网 http://www.jyqkw.com
关键词 比较
利用百度搜索引擎得到的与游憩相关的教育期刊网 http://www.jyqkw.com
关键词 “公园+玩”检索结果达103,743,800,“公园+度假”达85,323,000,位列第一、第二,因此得到与游憩相关的检索结果排名前二的教育期刊网 http://www.jyqkw.com
关键词 为:玩、度假;同理得到搜搜、Google、Yahoo排名前二的教育期刊网 http://www.jyqkw.com
关键词 为:旅游、休闲;玩、娱乐;玩、娱乐。
利用百度搜索引擎得到的按功能类型的检索结果排名前二的教育期刊网 http://www.jyqkw.com
关键词 为:亲子、锻炼;搜搜、Google、Yahoo排名前二的教育期刊网 http://www.jyqkw.com
关键词 为:亲子、划船;赏花、划船;赏花、锻炼。
由此结果可以得知大众认为公园主要是给人们提供玩、娱乐的场所,或者说公园更多地是人们休闲的场所,而不是旅游的目的地。一般的公园并不值得人们出于旅游的目的进行参观、游览。另外,从公园的功能来看,百度和搜搜的结果中都有亲子一词,得出我国人民更加注重公园的亲子功能。而外文搜索引擎Google和Yahoo中都有赏花一词,得出外国人民更加注重公园的观赏功能。在未来上海公园建设和开发过程中应当更加注重亲子、锻炼、划船这类功能的基础设施建设和娱乐设施的安置。
3.2.5 上海市公园推荐
通过检索教育期刊网 http://www.jyqkw.com
关键词 “公园+赏花、公园+亲子、公园+划船、公园+锻炼”得出搜索引擎中排名前二的公园,如表4所示。根据表中的结果,若某居民想要赏花,可以选择去人民公园,因为人民公园在表4“公园+赏花”检索记录前两位一栏中出现次数最多。同理,如果想要亲子游,则推荐去上海动物园,这也与实际情况相符。动物园是许多家庭亲子出游的首选。若想去公园划船,则推荐人民公园和世纪公园。如果是想进行健身锻炼,现在大多数的公园都可以,并不需要去特定公园,只需就近选择。
教育期刊网 http://www.jyqkw.com
参考文献:
[1] 张庆费,夏檑,乔平,杨文悦.上海公园的发展动态、分布格局与规模特征分析[J].中国园林.2001(01):58-61.
[2] 王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报.2013(06): 1125-1138.
[3] 钟瑛,张恒山.大数据的缘起、冲击及其应对[J].现代传播.2013(07):104-109.
[4] 何军.大数据对企业管理决策影响分析[J].科技进步与对策.2014(04): 65-68.
作者简介:
谢瑶,硕士,上海海事大学经济管理学院研究生,研究方向:旅游管理;
郭旭梅,硕士,上海海事大学经济管理学院研究生,研究方向:旅游管理。