路口交通数据的分析与挖掘研究

(整期优先)网络出版时间:2017-12-22
/ 2

路口交通数据的分析与挖掘研究

李萌萌

郑州市规划勘测设计研究院河南郑州450000

摘要:近年来人口和小汽车数量的持续增长使得大中型城市的交通拥堵问题日益严重,有限的城市道路资源已不能承受日益增长的交通量。为了缓解交通供给与交通需求之间的矛盾,一系列的交通预测模型和算法应运而生,这些预测模型的建立和算法的运行都是以大量的交通数据为基础的,从而体现了交通数据挖掘研究的重要性。而在交通流运行过程中,道路交叉口作为交通流运行的瓶颈,是导致交通拥堵的关键所在,因此,对路口交通数据的挖掘与研究是提高道路交通运行效率的有效途径之一。

关键词:数据挖掘,数据分析,交通流预测

引言

随着城市化建设的日益发展,经济快速增长导致小汽车数量迅速增加,随着交通需求的增长,城市道路经常呈现过饱和的状态,由此引发的交通拥堵问题已经严重困扰了人们的日常出行。在交通流运行过程中,道路交叉口作为交通流运行的瓶颈,是导致交通拥堵的关键所在,因此,对路口交通数据的挖掘与研究是提高道路交通运行效率的有效途径之一。数据挖掘是一个决策支持的过程,是从大的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、潜在有用的信息和知识的过程。数据挖掘用于对大量数据进行挖掘、变换、分析和建模,是路口交通管理控制策略制定和实施的基础。

一、交通流

描述交通流特性的宏观参数包括:交通量(Q)、速度(V)和交通流密度(K)。上述三个参数的关系为:Q=V*K。其中,Q为平均流量(辆/h),指单位时间内通过道路指定地点或者断面的车辆数;V为平均车速(km/h),指车辆在单位时间内通过的距离;K为平均车流密度(辆/km),指某一瞬间单位长度道路上存在的车辆数。交通量是反应交通需求的变量,速度表示了车辆在道路上的运行状况,密度则体现了车辆对道路的占有情况,它们对给定时间和区间内的交通流在整体上予以描述。交通流数据是制定路口交通信号控制策略、对道路交通进行实时控制、发布道路交通信息、诱导交通分散等一系列交通管理与控制措施的前提,是解决交通拥堵问题关键所在。

二、交通数据挖掘系统结构

交通数据采集分析及挖掘研究系统运行主要有以下几个过程:

(1)中心控制用于完成与交通信号控制中心系统的通信,完成交通数据采集工作和优化计算。中央控制与综合管理软件进行通信,接收管理软件的管理和控制指令,并向管理软件发送交通信息。通过操作员与交通控制系统的接口存储所有数据流量。

(2)区域控制负责交通流的采集控制、统计查询、信号事件统计、交通数据预测、子区域系统优化、信号自动时间控制等。一般情况下,信号系统由中心的流量优化控制。

(3)路口控制,包括交通信号,车辆检测设备等。对路口检测器采集并提供的实时交通数据进行分析和整理后上传至控制机,控制机根据该交通数据对路口不同相位的信号时间进行调整。

三、交通数据处理分析及应用

(一)交通数据处理

对于原始数据中存在的噪声数据,比如一些相同车辆的记录、无效数据、严重偏离实际的数据、机器故障而采集错误的数据等,采用基于HiveHadoop平台的Hive将上述错误数据进行删除,对有效数据的筛选。对相同车辆记录的筛选主要是通过获取在同一个方向上出现在相邻路口的该车辆的数据,主要包括车牌号、车辆出现在两个路口的时间,由于可能存在转弯的车辆,需要对该路口四个方向的车辆进行综合比对,筛选出在观测时间段内相同车辆的记录。对无效数据、严重偏离实际的数据及采集错误的数据的处理是将其删除。

(二)交通数据分析与挖掘

对数据进行分析处理是为了获取有用的信息及挖掘数据隐藏的含义,数据分析是一个对数据进行详细研究和概括总结的过程。对同一个数据进行不同的分析处理获得的数据信息也会不同,因此数据分析过程起到了关键作用。数据分析就是要将获取到的杂乱无章、毫无规律的数据进行拟合,寻找隐含在数据中的规律性,进而选取可能合适的模型进行进一步分析,并使用数理统计的方法对所选模型的可靠程度和精确程度做出推断。而数据挖掘是利用计算机技术从大量的数据中搜索出具有相关性的数据,从而发现潜在的、有价值的数据,以实现预定的目标。

交通数据具有数据量庞大、应用负载波动大的特点。为了提供更好的交通服务,需要对道路交通状况、交通流信息、交通违法行为等进行全面监测,特别是在高峰时段需要采集、处理及分析大量的交通数据。同时由于目前道路交通状况越来越复杂,交通流特性呈现随时间变化大,区域关联性强的特点,需要根据实时的交通流数据及时全面采集、处理、分析等,以满足公众出行对所发布交通信息时效性和准确性的高要求。此外交通数据应满足高可靠性、高稳定性及可共享的需求,为出行者提供安全、畅通、高品质的行程服务。

(三)交通数据应用

(1)关联规则算法在交通数据中的应用

关联规则挖掘算法主要是挖掘数据之间的内在关系,关联规则用于分析购物篮、人口普查等系统数据,已经证明了能够产生一些对实际问题有意义的规则。接下来将分析关联规则算法在交通数据中的应用,并将其应用于交通事故数据分析中,挖掘引发交通事故的原因。关联算法是挖掘交通事故各种原因常用的一种方法,这些原因包括驾驶员自身的原因、车辆原因、天气及路况等原因。通过挖掘导致交通事故发生的各种原因之间的关系或者规律等,预测不同交通条件下交通事故发生的可能性,进而有针对性的实施有效的交通管理与控制措施,预防交通事故的发生。关联规则算法常用算法是Apriori算法。该算法是挖掘产生关联规则所需要频繁项集的基本算法,利用层次顺序搜集的循环方法来完成频繁项集的挖掘工作,例如在交通事故数据库中,利用存在酒后驾驶的记录,来产生既存在酒后驾驶也存在驾驶员文化水平因数的记录,这样递归产生,最后就能显示出不同事故原因同时发生的几率。

(2)交通数据在多路口信号方案存储机制制定中的应用

由于定周期控制方案只包含一个周期,这样的控制方案存储起来要相对简单,不必采用特定的存储机制。接下来要介绍的信号方案存储机制主要是针对变周期控制方案。在对变周期控制方案进行存储时,需要获取一个初始相位序列和初始周期时间。在整个路口的信号执行过程中,相位序列是不会发生变化的,而周期时间变化的幅度主要取决于对交通流数据的预测。对信号方案的存储应考虑交通仿真的要求和实际的存储结构。交通区域内含有多种不同类型的交通路口,根据不同的类型编码值来区分不同的路口类型。由于交通流的不同也可能有不同的车道数和相位数,因此应根据路口和车道的具体情况赋予车道相应的编码值。

(3)贝叶斯算法在交通路况预测中的应用

贝叶斯数据挖掘算法是通过研究以往的知识体系,运用概率来分析某个事物或某个事件发生的可能性,这应该是与实时道路交通状况预测相符合的。对实时道路交通状况的预测是通过收集到的调查数据对以往道路交通状况的研究来推测当前或者接下来的一段时间内的道路交通状况,在该过程中运用贝叶斯网络推理对以往的调查数据进行研究,推测出将来的道路交通状况。实时的道路交通状况是一个不断发生变化的动态过程,具有很强的随机性、波动性、不确定性和偶然性,需要通过综合当前和以往的交通数据,来预测某种交通状况发生的概率。

在预测交通事故发生的概率时,可以将天气状况、道路交通状态、上班时间、车辆运行速度等因素作为贝叶斯网络推理的变量。上述几种因素都具有不确定性:天气状况可能有天气状况良好和雨雪天气两种情况,道路交通状态可分为顺畅和拥堵两种状态,上班时间可能为上班时间或者休息时间,车辆运行速度也有快速行驶和缓慢前进两种情况。利用上述几个变量可以组成贝叶斯网络模型。如果贝叶斯网络模型推算出一条道路发生了交通拥堵,就可以判定该道路发生交通事故的概率。

结束语

本文基于交通流特性分析了智能交通中路口交通数据采集和挖掘系统的结构及过程,并运用可靠的方法对采集和挖掘到的数据进行筛选,保留有效数据,确保运用到模型和算法中的数据的可靠性。通过对交通数据进行分析和挖掘,将不同的交通数据运用到不同的算法中,完成相关的交通预测和制定有效的交通控制引导策略,改善交通状况。由于交通系统数据库中的交通数据量非常大、种类多、应用负载波动大,且具有很强的不确定性和偶然性,因此在交通数据中引用数据挖掘技术能够有效的对数据进行筛选、分类、提取,可以大幅提高交通数据的利用率,更有利于交通管理控制策略的制定和实施,解决交通拥堵问题,促进交通行业的发展。

参考文献

[1]李江等.交通工程学[M].北京:人民交通出版社,2002.

[2]李兆翠.基于数据挖掘的道路交通事故分析处理系统研究[D].山东师范大学,2008.

[3]郑莹.智能交通信号灯控制系统设计与实现[J].工业控制计算机,2011,(12):104+106.

[4]程豪.基于Hadoop的交通大数据计算应用研究[D].长安大学,2014.

[5]马洪涛.基于压缩数据的数据挖掘算法的研究[D].黑龙江大学,2008.