主成分—聚类分析方法在城市交通发展指标评价中的应用

http://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-1-l.jpghttp://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-2-l.jpghttp://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-3-l.jpghttp://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-4-l.jpghttp://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-5-l.jpghttp://img1.qikan.com.cn/qkimages/jjgc/jjgc201624/jjgc20162429-6-l.jpg
  摘要:本文从2014年我国6个主要城市的交通发展指标数据出发,采用主成分--聚类分析相结合的综合方法,针对交通发展指标评价因子之间的相关性,对各个地区的指标因子进行分析,避免了主观判断的随意性。利用SAS统计分析软件,运用主成分分析方法对各个城市进行得分计算,在此基础上进行了聚类分析。并将单一的聚类分析结果与主成分--聚类分析综合方法得到的结果进行对比,发现综合方法得到的结果更能反映真实情况,同时也表明了主成分--聚类分析方法在交通领域中的巨大应用前景。
  Abstract: Based on the traffic development index data of 6 main cities in China in 2014, the index factors of each region are analyzed in this paper according to the correlation between traffic development index evaluation factors via the combination of principal component analysis and cluster analysis, and the subjective judgment arbitrary is avoided. SAS statistical analysis software was used to calculate the scores of each city using principal component analysis, based on which the cluster analysis was carried out. Then the results of cluster analysis are compared with those of principal component -clustering analysis, which leads to conclusion that synthetic methods are more consistent with real situations and have wide application prospects in the field of transportation.
  关键词:交通发展指标;聚类分析;主成分—聚类分析
  Key words: traffic development index;cluster analysis;the principal component-clustering analysis
  中图分类号:TP311 文献标识码:A 文章编号:1006-4311(2016)24-0076-04
  0 引言
  交通体现着城市的重要形象,是城市的命脉,有着为城市发展输送人流、物流的重要使命,作为城市发展的主要动力,交通对生产要素的流动、城镇体系的发展有着决定性的作用[1]。随着我国城市化进程的快速增长和深入推进,对城市交通也提出了更高的要求,如何处理好城市与交通的协同发展,是当下研究的难点和重点。根据区域的差异性,利用合适的分析方法,对区域进行划分,有着重要的现实意义。
  目前,交通区域划分领域中研究较多的是聚类分析方法,主要有以下的一些研究:林琴[2]等人以车站的各种接驳交通方式的构成比例数据为基础,进行聚类分析,对城市轨道交通的车站进行了分类。王志伟[3]等人运用模糊聚类分析方法,以1999年的交通事故数据对交通事故进行来了分类。杨波[4]等人利用模糊聚类分析方法根据公建、居住及绿化等指标对交通小区进行了分类。在以往的研究中,聚类分析只能给出聚类结果,不能给出各个类别的差别,只能根据经验进行区分,这往往是不合理的。文章针对这一问题提出了主成分—聚类分析方法,对指标数据进行量化,得到各个城市得分,进而得到类别得分,以此为理论依据,来分析了各个类别之间的差别。
  本文首先建立了能反映各个地区社会经济与交通发展水平的18个评价指标,然后利用SAS统计分析软件(SAS是一个模块化、集成化的大型应用软件,能机动、灵活的对数据进行处理与分析),采用聚类分析和主成分—聚类分析方法,对我国6个主要城市进行了区域化分,并对两种方法的结果进行了对比。研究结果表明主成分—聚类分析方法更好,不仅对城市进行了分类,还给出了城市交通综合发展水平的排名。分类结果可以作为政府进行交通决策的依据,让其对当地交通的发展有一个更加准确的定位,促进城市经济与交通的协同发展。
  从表5可以看到,昆明的得分仅为-1.588,在所调查的城市中分数最低,说明昆明的交通发展相对其它城市来说整体情况是最差的。而北京的得分达到了3.330,大大超出了其它城市的得分,说明北京的交通发展状况远超其它城市。
  在完成上述主成分分析的基础上,利用系统聚类分析方法对主成分得分表2进行系统聚类分析,得到如图3所示聚类谱系图。
  由谱系图可以很直观地看出各个城市的亲疏和归类情况,如果选用某固定距离作为阙值,则由谱系图可将6个城市划分成若干相似群类。本文在充分考虑各个城市交通状况和综合得分的情况下,确定阙值为4,相应的分类结果为:第一类包括昆明、武汉、广州;第二类上海;第三类重庆主城区;第四类北京。
  最后计算各个分类的综合得分,得分越高,表示交通的水平越高,交通结构相对越合理。并按照综合得分的多少对分类结果进行从大到小的排序,具体结果如表6所示。
  从表6可知,Ⅰ类城市(北京、上海)的综合得分系数为正,而Ⅱ类城市(昆明、武汉、广州、重庆主成区)的综合得分系数为负,说明Ⅰ类城市的交通发达程度明显高于Ⅱ类城市。而地方人民生活水平的质量、经济收入、城市运转效率等都与交通的发展状况息息相关。表中数据也说明了Ⅰ类城市的人民经济状况优于Ⅱ类城市。从分析可以看出,地区之间的交通发展水平是存在差异的,为了缩小Ⅰ类和Ⅱ类城市之间的差距,因加大对Ⅱ类城市的交通投入,优化交通发展结构,提高人们的生活水平。