基于大数据分析与机器学习的机场非法营运车辆识别告警系统设计

(整期优先)网络出版时间:2023-08-13
/ 2

基于大数据分析与机器学习的机场非法营运车辆识别告警系统设计

王永君

西部机场集团宁夏机场有限公司 宁夏 751400

摘要:本研究旨在设计一套非法营运车辆识别告警系统,高效准确地识别机场区域的非法营运车辆,辅助机场运管高效实施非法营运车辆治理。本文设计整合了图像识别、大数据分析、机器学习技术,利用历史车辆数据和交通流量数据,建立了车辆运行模式和异常行为的模型,通过对机场区域内车辆行为的实时监测和分析,实现了非法营运车辆识别。该系统将在机场区域非法营运车辆治理中具备广阔的应用前景和推广价值。

关键词:非法营运车辆识别;机器学习;大数据分析;软件设计

1.关键技术与方法

1.1道路监控接入

监控接入可以通过视频协议,或厂家提供的SDK实现,通过视频协议接入,可以使用ONVIFRSTP协议。通过SDK接入可通过监控厂家官网下载SDK及技术文档。推荐采用SDK接入的方式,稳定性好的同时方便控制摄像机以及调取监控摄像机的智能功能。

1.2车辆信息获取

车辆基础信息包含:(1)车牌;(2)车标;(3)通过路口时间;获取车辆信息包含两种途径,一是在路口安装了智能抓拍摄像机,可以通过SDK获取车辆通行数据。二是搭建车辆识别、车辆识别服务,对监控视频流进行图像识别和分析。本文的系统设计基于通过SDK调取智能抓拍摄像机,获取通行车辆照片和车辆识别的信息。

1.3大数据分析在交通领域的应用

利用非关系型数据库,对机场场区车辆的通行数据进行采集与存储。利用数据挖掘中的DBSCAN聚类算法在车辆通行数据中将记录在案的非法营运车辆数据进行处理提取非法营运车辆特征数据。

1.4机器学习算法在车辆识别中的应用

在对嫌疑车辆的识别中,仅能依靠车辆通行数据,为提高识别的准确性和鲁棒性,同时使用支持向量机(SVM)和决策树实现数据特征的分类。

支持向量机(SVM)是一种二分类和多分类的监督学习算法在嫌疑非法营运车辆识别中,可以将车辆数据样本分为正常通行车辆和嫌疑非法营运车辆两类。SVM在特征空间中构造支持向量通过找到一个最优的超平面来划分两类数据,得到一个最终分类的边界分类模型

决策树是基于树形结构的监督学习算法,根据车辆特征数据逐步进行分类决策。每个节点都对应一个特征和相应的判断条件,根据这些判断条件不断分割数据,直到达到叶子节点并得到最终的分类结果。车辆通行数据,通过SVM和决策树分类模型的处理后,预测最终的嫌疑非法营运车辆。

1.5数据预处理与特征工程

1.5.1 数据清洗转换

对识别、统计到的车辆数据们进行数据清洗,包括:(1)处理缺失值;(2)处理异常值;(3)数据去重。进行数值编码:(1)特征缩放实现归一化;(2)数据平滑降低噪声;(3)数据编码使用标签编码

1.5.2特征选择与构建

根据可获得车辆信息条件,选取的车辆特征包括:(1)车辆每24小时通行次数;(2)车辆到场时间;(3)车辆每次停留时长;(4)车辆通行轨迹;(5)车辆品牌; 特征构建中采用衍生特征与时间序列特征特征降维中使用主成分分析(PCA)进行数据降维。

2.数据库设计

3.1数据表设计

a.车辆信息表(vehicles_info):

- 字段:车辆ID(Vehicle ID)、车牌号码(License Plate)、车辆类型(Vehicle Type)、车辆颜色(Vehicle Color)、车辆品牌(Vehicle Brands)、车辆属地(Vehicle territory)

- 主键:车辆ID

b.车辆通行记录表(pass_records):

- 字段:通行记录ID(Record ID)、车辆ID(Vehicle ID)、通行时间(Pass Time)、通行地点(Pass Location)、是否为嫌疑车辆(Is Suspicious)、告警状态(Alert Status)

- 主键:通行记录ID

- 外键:车辆ID

c.特征提取表(feature_extraction_data):

- 字段:特征ID(Feature ID)、车辆通行记录ID(Record ID)、车辆停留时长(Vehicle_Stay_Duration)、车辆品牌(Vehicle Brand)、车辆途径点(Vehicle_Passage_Points)、车辆到场频次(Vehicle_Arrival_Frequency)

- 主键:特征ID

- 外键:车辆通行记录ID

d.车辆分类结果表(vehicle_classification_results):

- 字段:车辆通行记录ID(Record ID)分类结果(Classification Results)、分类置信度(Classification_Confidence_Scores)

- 主键:车辆通行记录ID

- 外键:车辆通行记录ID

e. 异常告警记录表(alert_records):

- 字段:告警记录

ID(alert_records_ID)、车辆通行记录IDRecord ID)、告警时间(Alert_Time)、告警内容(Alert_Content)、处理状态(Processing_Status)

- 主键:告警记录ID

- 外键:车辆通行记录ID

2.2数据库关系图示


此系统所需基本数据表的关系模型及数据依赖如下图,图(1):数据表关系图所示。

(1):数据表关系图

3.系统架构设计

3.1系统目标和需求

系统主要目标为:通过分析通行车辆信息,利用数据分析和机器学习技术识别非法营运车辆,实现对异常车辆的智能告警,帮助机场交通管理部门提高非法营运车辆治理效率。

功能需求:(1)数据采集,从不同数据源收集车辆信息;(2)数据预处理;(3)提取有意义的车辆特征信息;(4)使用机器学习SVM和决策树算法对车辆进行分类;(5)对异常车辆的实时告警和处理;(6)数据可视化展示;(7)系统配置与管理;

3.2系统组成模块

a.数据采集模块:负责从不同数据源收集车辆通行数据,包括车牌号码、车辆类型、车辆颜色、车辆品牌等数据。

b.数据预处理模块:对采集到的原始数据进行清洗、缺失值处理等预处理操作,确保数据的质量和准确性。

c.特征提取模块:基于经过预处理的数据,从车辆通行记录中提取特征数据:车辆停留时长、品牌、途径点、到场频次等。

d.数据存储与管理模块:负责将预处理和特征提取后的数据存储到数据库或数据仓库中,并管理数据的存取和查询。

e.机器学习模块:使用机器学习算法进行模型训练和分类,以识别嫌疑非法营运车辆并对其进行分类和打分。

f.告警与处理模块:基于机器学习模块的结果,实现对异常车辆的实时告警和处理,包括生成告警记录、发送警报通知。

g.系统配置与管理模块:提供管理员对系统进行配置和管理的功能,如更新模型、调整阈值、添加黑名单等。

3.3系统集成和部署

3.3.1数据集成

数据预处理模块将处理后的数据传递给特征提取模块。特征提取模块完成特征提取后,将提取的特征数据传递给机器学习模块进行车辆分类。机器学习模块根据分类结果,将异常车辆信息传递给告警与处理模块。告警与处理模块负责生成告警记录并发送警报通知。系统的可视化模块接收数据展示给用户。

3.3.2系统部署架构

系统采用CS架构。客户端部分采用桌面应用程序,提供给用户进行交互和数据展示。服务器部分包括数据处理模块、算法模块和数据库。数据库采用关系型数据库SQL Server用于存储非法营运车辆数据、日志、系统数据和非关系型数据库MongoDB用于存储车辆通行数据

4.结语

本研究旨在设计一套高效准确的机场非法营运车辆识别告警系统,通过综合运用大数据分析和机器学习技术,成功实现对机场区域非法营运车辆的识别、抓拍和告警。在机场区域非法营运车辆治理中具备广阔的应用前景和推广价值,为机场运管部门提供高效的决策支持,帮助机场实施非法营运车辆的精确治理。

参考文献

[1]王维强,牛振东,曹玉娟,. 基于ARMA-TS-GARCH有限混合模型的交通数据分析[J]. 中南大学学报(自然科学版),2010,41(5).

[2]毛国君段立娟. 数据挖掘原理与算法 [M].清华大学出版社,2007.