基于DBSCAN聚类算法对大坝安全的分析

(整期优先)网络出版时间:2022-09-05
/ 2

基于DBSCAN聚类算法对大坝安全的分析

李莉萍

青海黄河电力技术有限责任公司  青海 西宁   810000  

摘要近年来随着大坝的逐渐增多和坝高增大,对于大坝安全的要求也是逐渐变得越来越严格,本文旨在通过DBSCN聚类算法对于青海省某大坝往年数据进行分析,得到温度,降雨量,上下游水位变化的共同作用对于大坝安全重要指标接缝,渗流和水准的影响。

关键词大坝;大坝安全监测;DBSCA;聚类算法

随着科学技术的进步及水利水电事业的蓬勃发展,大坝安全监测技术也在不断发展和提高。未来的发展趋势也变为:设计优化的目的是以最小的监测工作量解决大坝安全监测中需要解决的技术问题 ,在保证安全的前提下 ,以最少的投入获得最大的效果 ,充分发挥安全监测的作用, 降低监测成本,自动化与人工观测相结合。本文采用聚类算法,对青海省某大坝历史监测数据进行分析,研究温度、降雨量、上下游水位变化的共同作用对于大坝安全重要指标接缝,渗流和水准的影响。

一、DBSCAN聚类算法

基于密度聚类的连续属性离散化方法主要由两个部分构成:第一步采用DBSCAN算法聚类,动态调整算法参数,根据最终聚类结果对连续属性进行离散化处理;第二步,合并具有相同决策属性值的相邻离散区间,降低断点数目。具体算法可以描述如下:

输入:决策信息系统I=(U, A, V, f),给定距离e,实例e邻域内包含的最小实例个数MinPits。

输出:连续属性的离散化区间。

第一步:对所有属性的取值区间进行归一化处理;第二步:计算决策信息1中决策属性对条件属性集合的依赖度

第三步:根据给定距离6和e邻域内包含的最小实例个数MinPits对信息系统中的所有实例进行聚类,使聚类得到的簇的密度;

Density(Cluster)≥MinPits

第四步:根据聚类结果对连续属性进行离散化,得到离散化后的新信息系统Disl;第五步:计算Disl中决策属性对条件属性集合的依赖度

第六步:比较离散化前后信息系统的依赖度,如果c(D)<c(Q),调整MinPits的大小,重新对信息系统中的实例进行聚类;

第七步:对于每个连续属性a ϵ C,逐个检查相邻的离散区间,如果两个相邻离散区间对应实例的决策属性值都相同,则将其合并为一个离散区间;

第八步:输出所有连续属性的离散区间。

在DSCAN算法中,需要同时对参数给定邻域半径c和实例E邻域内包含的最小实例个数MinPits进行设置。由于在离散化过程中要动态调整参数大小以控制离散化的结果,同时对两个参数进行调整难度较大。在实验中我们发现,邻域半径6取值时,需要考虑整个数据的空间距离,当 取整个数据空间的1%-2%时,可以取得较好的离散结果。因此,在聚类时,我们一般在整个数据空间的1%-2%之间选取一个数值作为事先给定的邻域半径,在聚类过程中,只根据信息系统决策属性对条件属性集依赖度的大小对实例邻域内包含的最小实例个数MinPits这一个参数进行相应的调整。

二、大坝分析

本次实验数据来源于某大坝从2001年至今近20年以来的日检测历史数据,有降雨量、上下游水位、温度等环境量数据;三项侧缝数据;测压管、地下水空等渗流参数数据;混泥土坝水准等数据几万条。

1.数据预处理

大坝数据较为繁杂有上万条,其中有一些缺失数据,不同数据的测量时间也不尽相同,不同数据的量级也不相同,很难进行下一步分析。

通过数据预处理,对数进行汇总、数据集成、变换与去离散化、进行相似度与相异度度量、去除特异点、将数据的时间轴对齐、对数据进行(0-1)规范化、进行图形化处理,分析数据的相关性,来达到初步分析的目的。

2.数据宏观分析

图1 降雨量变化图

图2 上游数位变化图

图1为对大坝环境量里的降雨量,图2为大坝水位数据的图形化,从图中可以得出青海门源的降雨量有逐年增高的趋势导致大坝平均水位也在上升。

图3 大坝缝隙变化图

图4 高程-沉积量图

对数据进行相关性比较,得到相关行较强的是上图3大坝缝隙的X-Y-Z测值读数变化曲线,上图4高程与沉积量随时间变化曲线,从图中的数据变化可以看出随着温度与水位的上升,大坝缝隙增大,反之裂缝大小回归,大坝缝隙的X-Y-Z的相关性,大坝X与Z向裂缝与Y向裂缝呈负相关,X与Z呈正相关。查阅资料可知:寒冷地区,冬季气温较低,产生的温度应力较大, 加上冰压力的作用,使得裂缝深处混凝土处于受拉状态;同时施工缝处混凝土施工质量差,造成该处混凝土抗拉强度降低,形成混凝土抗拉能力相对薄弱带。施工冷缝在温度应力的作用下被拉开,形成裂隙。在冻融循环作用下,裂缝有可能继续扩展,造成坝体老化渗漏量不断增加,与图五曲线变化趋势相吻合。

3.聚类分析

表1 DBSCAN分类

类数

渗透压

沉积量

位移

温度

2

0.851

0.902

3

0.742

0.751

4

0.322

0.427

我们开始对数据进行DBSCAN的聚类处理,先通过分成不同的几类来选出聚类效果最好的分类数目,经过测试,发现裂缝读数图在分3组时聚类效果最好,高程-沉积量图在分2组时效果最好,如上表所示。

三、结论

综上所述,在对数据进行深度分析之后,得到以下结果:①青海的降雨量在逐年增高;②降雨量与上下游水位夏天上升,冬天下降;③接缝表中的X与Y读数呈正相关,X,Y与Z呈负相关;④接缝表中的X,Y和Z读数的曲线与X,Y和Z位移量曲线几乎一致,他们也许相关变量;⑤水准表中相对沉降量与累计沉降量呈正相关,相对沉降量,累计沉降量与高程呈负相关;⑥测压管表中读数与温度基本呈正相关,渗透压力和渗透水位曲线几乎一致,而他们之间呈负相关;⑦在地下水控表中读数与水位呈负相关。

参考文献:

[1]郑辉. 基于GPRS的大坝渗流监测系统研究与实现[D].北京交通大学,2011.

[2]李凤利.白石水库大坝安全监测数据分析与预测[J].黑龙江水利科技,2020(08).

[3]杨杰,吴中如.大坝安全监控的国内外研究现状与发展[J].西安理工大学学报,2002(01).