基于LightGBM的梗丝水分智能控制

(整期优先)网络出版时间:2023-05-06
/ 2

基于LightGBM的梗丝水分智能控制

李春华,李林蔚,史清英,何林涛

红塔烟草(集团)有限责任公司玉溪卷烟厂,云南 玉溪 653100

摘要:随着市场对卷烟产品质量要求的不断提升,梗丝加料工序由于其固有的滞后特性,在环境温湿度变化较大时将导致传统水分控制模型无法及时有效地控制梗丝水分,从而严重制约了制丝工艺技术的提升。为了稳定梗丝水分,通过拓展系统输入参数来源,采用S7通信协议实时采集生产数据和环境数据并进行存储,采用基于LightGBM框架的智能模型计算出前馈加水量,嵌入至水分控制模型以完成模型的升级转型,从而提高水分控制系统的鲁棒性、实时性和准确性,提高梗丝产品质量。

关键词:梗丝;含水量;LightGBM;机器学习;

0引言

梗丝作为成品烟丝中的一种掺配物料,其质量对成品烟丝质量有很大的影响[1]。梗丝水分的稳定性和准确性直接影响到卷烟质量,同时间接影响市场对于卷烟产品的认可程度。

目前,梗丝水分控制系统通过前馈加反馈控制模型进行水分控制,如图1所示:

图1 传统梗丝水分控制系统

经过研究分析,梗丝加料设备自身对水分控制的系统包括前馈控制和反馈控制两部分,其中前馈调控为主要因素。前馈控制中的系数K1和K2主要由操作人员根据经验设定,当气候等因素发生变化时,水分误差会变大,由于梗丝加料工序自身的滞后特性,传统PID控制无法及时水分误差的变化做出准确、及时的反应,水分控制缺乏精准性,需要操作人员手动调整系数K1和K2以稳定出口水分,因此在控制上带有主观性。

机器学习技术可以通过最优算法建立起数学模型并用于实际工作。因此可以沿此思路设计梗丝“智能控水”模型,得到优化的前馈加水量,嵌入到水分控制模型中实现对水分的精准实时控制。

1设计概述

梗丝加料工序“智能控水”模型以现场设备为起点,分别经历数据采集、数据存储、数据预处理、数据集划分、参数寻优、模型训练、模型测试、实际应用等步骤。

在数据采集和存储环节,通过调用s7库连接PLC,将数据以2s一次的频率写入数据库。同时开发图形用户界面程序并将python开发的核心算法嵌入其中。

2特征变量确定和数据预处理

2.1特征变量确定

传统水分控制模型在确定特征变量时通常从物料、设备两个维度进行分析,选取的变量具有非常大的局限性。为了提供完整的特征变量,对物料、设备、环境三个维度进行细化分析,具体可分为:

(1)物料:水分仪通道、模块号、作业号、瞬时流量、累积量、入口水分、设定水分;

(2)环境:环境温度、湿度;

(3)设备:蒸汽流量、水流量、热风温度;

(4)其他:日期、时间。

2.2数据预处理

由于梗丝加料工序存在固有的滞后特性,即同一时刻所采集的数据并非同一物料的数据,因此需要将全部数据进行存储之后以队列的方式对不同变量采进行不同的延时提取,获取同一物料的检测数据,延时数值的大小与物料加工所经过的设备顺序成正比。

由于梗丝生产存在的滞后特性,加料过程的开始和结尾存在大量无效数据,需要对数据进行清洗,清洗规则如下:

①物料流量>最小限值;②入口水分>0.85*额定值;③出口水分>入口水分+0.5;

3算法模型的选择

基于对控制精度、数据复杂程度、运算速度的要求,从常用的算法模型中筛选部分模型作为备选,通过定义损失函数均方差,确定不同模型在同一训练下的损失值大小,其损失函数如下所示:

均方误差是指模型预测值y^与样本真实值yi之间差值的平方的平均值,其曲线光滑连续,且随着误差的减小梯度也在减小,有利于函数收敛。

不同模型的均方差值在经过多次测试后的结果如下图所示:

表1 部分算法模型的均方差值统计

编号

支持向量回归

LASSO回归

岭回归

XGBoost

LightGBM

Tensorflow

1

0.012

23.2

79.2

300.2

0.003

817.3

2

0.031

26.1

21.9

260.4

0.009

563.6

3

0.009

19.9

68.6

315.6

0.003

724.4

4

0.025

27.6

18.2

403.1

0.012

224.8

5

0.057

31.2

22.3

328.8

0.005

792.2

经过多次实验,通过分析均方差的大小,以及结合模型对准确性、时效性的需求,最终选定LightGBM回归算法作为前馈加水量的预测算法。

4系统设计与应用

LightGBM是基于GBDT模型的改进框架,可实现轻量级的梯度提升算法[4]。其算法思想是通过使用弱分类器即决策树进行迭代训练以获取最优参数,其训练速度更快、内存消耗更低、准确率更高。

通过选取经过预处理后的一百万条最新数据,调用numpy库中的函数train_test_split将数据集划分为训练集和测试集,测试集所占比例为5%,即50000条最新数据作为测试集,随即进入参数调优部分。通过调用对应的函数,使用交叉验证法和贝叶斯超参数优化的方法对模型进行参数寻优。

在完成超参数的优化后,进行模型训练,其训练流程如下所示:

步骤1:在开始位置,将所有数据划分为一个节点,即根节点;

步骤2:进行判断条件,如果数据不为空则进入步骤3,否则进入步骤5;

步骤3:判断样本类型是不是同一类,不是则进入步骤4,是则进入步骤6;

步骤4:划分属性并生成分支节点,回到步骤2继续循环,直到循环结束得到决策树,开始下一次的迭代;

步骤5:返回NULL后结束循环;

步骤6:将节点标记为叶子节点,跳出循环;

当模型迭代超过一定次数,或模型损失函数实际值小于限值,则认为模型训练已完成,

保存模型,生产过程中,系统采集实时生产和环境数据,通过模型计算出加水量,加水量送给PLC控制系统,作为水分控制系统中的前馈加水量,实时控制梗丝水分。

5结语

本研究涉及传统工业自动化生产的智能化改进技术,核心要点在于对智能模型与PID控制的嵌入融合。使用智能控水模型提供前馈加水量后,通过监测并采样同一品牌物料在相同外部环境的不同梗丝生产批次,梗丝水分实际值在同一批次内的最大波动分别为2.1和0.5,其水分波动得到有效控制,证实了本文提出的传统模型升级思路可以对滞后系统进行有效的参数控制,能够突破生产工艺所存在的桎梏,增强产品质量管理,从而间接产生效益。

参考文献

[1]吴俊峰.梗丝加料出口温度对梗丝质量的影响[J].硅谷,2012,(20).

[2]张云飞,袁鹏,董云. 环境温湿度对制丝水分控制的影响——基于红河卷烟厂制丝过程数据 [J]. 统计学与应用 ,2015(02):34-46

[3]史成云,崔文波,崔汝念,邹欣延. 基于机器学习的烟草生丝水分智能控制模型[J].智能科技,2022(34):25-27.

[4]李占山,姚鑫,刘兆赓,等.基于 LightGBM 的特征选择算法[J].东北大学学报(自然科学版),2021,42(12):1688-1695.