机器学习算法在生物废水处理中的应用研究

(整期优先)网络出版时间:2023-07-27
/ 4

机器学习算法在生物废水处理中的应用研究

吴健

(浙江明境环保科技集团有限公司 浙江 湖州 313106)

摘要:利用藻-菌联合体进行生物废水处理可实现营养物吸收和资源回收,是一种从传统处理方式转变过来的新方法,旨在减轻污染并促进循环经济,然而废水处理存在滞后特征,且藻类和细菌之间的共生关系非常复杂,难以提出一种完备的数学模型快速预测废水处理结果。针对该问题,机器学习算法被证实对于预测处理过程中的不确定性非常有帮助,在实时监测、优化、不确定性预测和故障检测方面在复杂环境系统中取得了令人满意的成果。通过将这些算法与在线传感器结合使用,可以有效地预测处理过程中的瞬态操作条件,包括由于管道泄漏、生物反应器故障、有机负荷、流速和温度突发异常而导致的中断或故障。本文综述了城市生物废水中藻类生物质生产和营养物质回收相结合的生物废水处理系统中先进的机器学习方法,为进一步研究和改进生物废水处理方法提供了参考。

关键词:生物废水处理;机器学习;藻-菌联合体;过程预测


1导论

随着工业化和城市化的快速发展,生物废水处理成为一项重要的环境工程任务,生物废水处理的目标是有效地去除废水中的有机物、氮、磷和其他污染物,以减少对水资源和生态系统的负面影响,并确保废水排放符合环境法规的要求。

由城市废水中存在的氮、磷等过量营养物质所导致水生环境富营养化,为藻类生长创造完美的条件[1]。在这种情况下,自20世纪50年代以来,藻类已被用于去除露天池塘和废水稳定塘中的营养物质和化学需氧量等生物废水处理任务中[2]。于此同时,藻-菌联合体还能够生产可用于产生生物产物(酶、脂类)和生物燃料的物质,提供了附加价值。

实现藻类生物生产和处理废水的目标并不是一个简单的过程,它需要多种专业知识和先进智能技术的应用,例如基于实时监测和自动化等技术,从而加强营养物质的恢复或藻类生物量的恢复,并用于实际应用。由于藻类系统对环境变化高度敏感,因此采用实时监测和控制系统以保持藻类的最佳状态是必要手段。使用机器学习算法和动态模型在优化藻类系统性能方面展现出了较好的前景,机器学习算法具有鲁棒性和可靠性,已广泛应用于复杂系统的自动化和决策以及实时监测和数据分析任务中,在确保废水处理厂的安全和正常运行中发挥重要作用。

然而,由于废水处理厂往往缺乏适当的数据分析指南,且废水处理厂工作人员不熟悉机器学习和数据科学方法,导致在对于特定问题难以选择准确的机器学习方法,也鲜有文章介绍如何针对跨学科问题,收集和处理高质量数据。因此,对数据的分析、解释和确定问题的解决方案非常复杂,这需要学科之间的深入互动。对此,本文介绍了机器学习方法在生物废水处理中的应用情况,并阐述了其相较于传统方法的优势,最后本文讨论了当前的挑战和对未来研究的展望,为进一步研究和改进生物废水处理方法提供了参考。

2机器学习与数据处理

机器学习凭借其可解释性与泛用性,其实践效果已经得到各领域专家的认可[3,4]。典型的机器学习模型的工作流如图1所示:

图1 机器学习模型的工作流

在这个迭代过程中,数据预处理是减少数据量大小和选择感兴趣特征的重要部分,该步骤首先需要对数据进行清洗,包括离群值的去除、缺失值的填充等步骤,再通过数据标准化方法生成数据特征,利用主成分分析等方法,对特征间相关性进行分析,实现对数据的降维。在废水处理的任务中,数据预处理有助于消除监测过程中因进水流量和浓度函数、传感器漂移等设备故障而产生的不可靠和有噪声的数据。通过主成分分析、随机森林或其他算法的特征生成和选择过程可以应用于提取最相关的特征,使模型在预测过程中更加准确和高效。

在现有的各类研究中,通常需要根据数据的收集模式、开发的机器学习模型的复杂性、模型输入和输出形式,选择不同的数据量。之后,通过选择合适的机器学习算法,以便用户了解内部系统动态,从而帮助用户分配计算资源,以及快速匹配适合的解决方案[5]

3 机器学习在生物废水处理中的应用

由于废水处理存在滞后特征,对于处理后水样的检测值对于处理过程动态调控的作用有限,需要建立废水处理预测模型,实现快速预测出水各物质含量,从而来指导处理过程实现优化控制。同时,由于废水处理过程的高度非线性化,为该过程的建模提出的挑战,因此使用机器学习方法,自动化智能化地对该过程进行拟合成为了一个良好的解决方案。在使用机器学习算法进行预测时,系统的输入为由各类传感器获取到的pH指数、氮元素浓度、磷元素浓度、悬浮固体总量、溶解氧含量、化学需氧量、生化需氧量等参数,输出为藻类生物产物的预测含量以及处理后废水检测目标物质的预测含量。

3.1线性回归

线性回归是一种广泛使用且简单的监督学习算法。Ambat等人采用线性回归模型结合蒙特卡罗模拟来估计养猪场废水的生物质产量、总氮(TN)、总磷(TP)和COD去除效率[6],回归分析结果显示,COD、TN和TP浓度对生物量生产变异性的解释率为66.7%、在10天的培养过程中,COD和TN的去除率分别为79.9%和79.84%。在COD浓度为1900 mg/L的条件下,经过5天的培养,TP的去除率为98.6%。

3.2逻辑回归

逻辑回归是一种高效且流行的算法,其通过假设事件的概率与输入特征之间存在线性关系,并且使用最大似然估计法来确定最佳的模型参数,模型的参数确定后,可以将新的输入特征用于预测输出变量的概率。逻辑回归广泛应用于许多领域,如医学、市场营销、金融等。它有许多优点,包括模型解释性强、计算简单、效果良好等。在生物废水处理领域,Zhang和Hong研究了不同初始氮和磷浓度对产油藻类小球藻生长的影响[7],逻辑回归模型证实,氮浓度对藻类生长有促进作用,而磷浓度对藻类生长无明显影响。同时结果表明,小球藻的初始氮磷比应在8比1至20比1之间,以优化生物柴油的生产和二次出水处理。

3.2决策树

决策树能够从数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题的方法。Noguchi等人应用决策树来评估由多种藻类组成的混合培养物在开放式环形塘中的生物量产量[8],用于生产藻类生物燃料,结果表明该决策树算法能较好地预测其增长率,其相关系数为0.89,均方根误差为0.085。Zarkami等人基于决策树算法开发了一个盐藻丰度的预测模型[9],并在湿地的10个地点,在两个不同的深度监测了一年的处理过程,监测变量包括盐藻丰度、冰冻和晴天数、相对湿度、降水量、空气和水温、流速、pH、电导率等,结果表明日照时数、DO和钠浓度、TSS和月降水量是影响藻类丰度的重要因素。

3.3支持向量

支持向量机通过最小化经验误差,计算一个超平面将特征空间分为两个部分,已被广泛用于解决环境工程问题。Manu和Thalla的研究应用支持向量机预测生物污水处理厂的性能[10],发现该模型能够定义过程变量之间的相互关系,并预测氮的去除。Granata等人应用决策树和支持向量机对废水水质进行预测[11],其中支持向量机对TSS、TDS、BOD、COD等4个不同参数的预测表现较好。

3.4人工神经网络

人工神经网络是最早和最知名的机器学习算法之一,它可以通过使用连接权重和偏差项映射输入和输出来估计关系。Noguchi等人将人工神经网络用于估算露天池塘中藻类混合培养物的生长,模型表现出令人满意的性能[12]。López等人使用人工神经网络预测了瞬态条件下PBR中不同污染物的去除效率[13],而Guo等人使用支持向量机和人工神经网络预测了韩国蔚山某污水处理厂出水中TN的12天间隔浓度[14],以TSS、COD、TN、TP、水温和pH为输入,建立了两种预测出水TN浓度的ML模型。

4 展望与总结

基于数据驱动建模的机器学习算法已经解决了藻-菌联合体和藻类生物质生产的问题,即生物废水的处理过程,极大地帮助环境工程师了解不同污水处理厂中使用的微生物群落的复杂性和功能。

从污水处理厂运行安全的角度来看,由于公众日益关注和严格的环境法规,迫切需要开发一种智能故障检测系统。虽然主成分分析在污水处理厂稳态运行过程中的故障检测和数据分析是有效的,但其在瞬态行为中的检测能力仍有待研究和提高,传感器在瞬态条件下测量关键参数的灵敏度也有待提高。可见如何有效地监控处理过程,以应对突发故障及时调整废水处理参数,是目前需要深入研究的方向。

本文主要讨论了机器学习算法在生物废水处理中的应用研究。传统的生物废水处理方法存在滞后特征,难以提出准确的数学模型来快速预测废水处理结果,而机器学习算法被证实对于处理过程中的不确定性非常有帮助。本文首先介绍了生物废水处理的背景和目标,以及藻-菌联合体处理废水的优势。随后,重点探讨了机器学习与数据处理的关系,并强调数据预处理在废水处理中的重要性,包括数据清洗、特征生成和选择等。接着,本文详细介绍了机器学习在生物废水处理中的应用,包括线性回归、逻辑回归、决策树、支持向量机和人工神经网络等算法。通过这些算法的应用,可以预测处理过程中的瞬态操作条件和废水的特性。最后,本文总结了机器学习方法在生物废水处理中的优势和挑战,以及对未来研究的展望,为进一步研究和改进生物废水处理方法提供了参考。

参考文献

[1] Gonçalves A L, Pires J C M, Simões M. A review on the use of microalgal consortia for wastewater treatment[J]. Algal Research, 2017, 24: 403-415.

[2] Oswald W J. Ponds in the twenty-first century[J]. Water Science and Technology, 1995, 31(12): 1-8.

[3] Torregrossa D, Leopold U, Hernández-Sancho F, et al. Machine learning for energy cost modelling in wastewater treatment plants[J]. Journal of environmental management, 2018, 223: 1061-1067.

[4] Tuggener L, Amirian M, Rombach K, et al. Automated machine learning in practice: state of the art and recent results[C]//2019 6th Swiss Conference on Data Science (SDS). IEEE, 2019: 31-36.

[5] Thornton C, Hutter F, Hoos H H, et al. Auto-WEKA: Combined selection and hyperparameter optimization of classification algorithms[C]//Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. 2013: 847-855.

[6] Ambat I, Tang W Z, Sillanpää M. Statistical analysis of sustainable production of algal biomass from wastewater treatment process[J]. Biomass and Bioenergy, 2019, 120: 471-478.

[7] Zhang Q, Hong Y. Effects of stationary phase elongation and initial nitrogen and phosphorus concentrations on the growth and lipid-producing potential of Chlorella sp. HQ[J]. Journal of Applied Phycology, 2014, 26: 141-149.

[8] Noguchi R, Ahamed T, Rani D S, et al. Artificial neural networks model for estimating growth of polyculture microalgae in an open raceway pond[J]. Biosystems Engineering, 2019, 177: 122-129.

[9] Zarkami R, Hesami H, Sadeghi Pasvisheh R. Assessment, monitoring and modelling of the abundance of Dunaliella salina Teod in the Meighan wetland, Iran using decision tree model[J]. Environmental monitoring and assessment, 2020, 192: 1-15.

[10] Manu D S, Thalla A K. Artificial intelligence models for predicting the performance of biological wastewater treatment plant in the removal of Kjeldahl Nitrogen from wastewater[J]. Applied Water Science, 2017, 7: 3783-3791.

[11] Granata F, Papirio S, Esposito G, et al. Machine learning algorithms for the forecasting of wastewater quality indicators[J]. Water, 2017, 9(2): 105.

[12] Supriyanto, Noguchi R, Ahamed T, et al. A decision tree approach to estimate the microalgae production in open raceway pond[C]//IOP Conference Series: Earth and Environmental Science. IOP Publishing, 2018, 209: 012050.

[13] López M E, Rene E R, Boger Z, et al. Modelling the removal of volatile pollutants under transient conditions in a two-stage bioreactor using artificial neural networks[J]. Journal of hazardous materials, 2017, 324: 100-109.

[14] Han H, Zhu S, Qiao J, et al. Data-driven intelligent monitoring system for key variables in wastewater treatment process[J]. Chinese journal of chemical engineering, 2018, 26(10): 2093-2101.