数据挖掘技术在软件工程中的应用分析

(整期优先)网络出版时间:2022-07-18
/ 2

数据挖掘技术在软件工程中的应用分析

覃泉霖

柳州市智能制造科技服务中心 545001

摘要:本文对数据挖掘技术进行深入剖析,对数据挖虐技术的主要技术流程进行探索,从数据处理效率、信息采集速度等方面,总结数据挖掘技术在软件工程中应用的意义。并从信息挖掘、软件漏洞挖掘、软件执行记录以及开源软件代码等方面,对数据挖掘技术在软件工程中的具体应用途径,以推动软件工程产业的发展。

关键词:数据挖掘技术;软件工程;应用意义;应用路径

软件工程作为当前计算机技术产业发展的重要基础,虽然计算机技术在社会产业中应用的不断深入,加强软件工程的开发研究,以软件系统提升计算机数据分析的效率,更是成为了其产业发展的基础。而数据挖掘技术作为现代计算机科学的一种,加强数据挖掘技术在软件工程中的应用,也能够进一步推动软件工程开发产业的发展。

一、数据挖掘技术概述

计算机数据挖掘技术是指从大量的数字数据中通过算法对其中存在的隐藏信息搜索的过程,是现代计算机科学的一种。在计算机数据挖掘技术的数据挖掘过程中,其技术流程主要包含有七个方面:

①定义问题。在数据挖掘开始之前,首要的任务就是对数据情况及挖掘任务进行了解,然后对目标进行明确的定位,以此为数据挖掘工作的开展奠定基础;②通过数据采集,行为描述,数据选择,数据质量评估和数据清理,构建数据挖掘库,然后通过合并与整合,构建元数据,实现数据挖掘库的加载与维护;③数据分析。数据分析是计算机数据挖掘技术中的重要技术流程,需要功能强大的计算机工具以及软件系统共同完成;④准备数据。数据准备工作是计算机挖掘技术中建立数据模型前重要的数据准备环节,包含了四个环节,即选择变量,选择记录,创建新变量,转换变量;⑤模型建立。建立模型是重复性的数据应用过程,这一环节中,需要对差异化的模型进行全面分析,以选用最佳的数据模型。模型建立过程中,先以部分数据进行模型建立,然后以其余的数据来验证建立的模型。在模型建立的过程中,有时还会存在验证集,因为测试集可能受模型特性的影响,为了充分保证数据的精准性,需要独立的数据集来验证模型的准确性;⑥模型评价。模型评价是计算机数据挖掘技术中模型建立后的主要内容,是用以评价得到的结果以及解释模型的价值;⑦实施。在数据模型建立完成并经过验证以后,其使用方法主要包含两种:第一,提供给分析人员做参考;第二,把此模型应用到不同的数据集上,以发挥其模型价值[1]

二、数据挖掘技术在软件工程中应用的意义

随着计算机产业的不断发展与完善,在社会产业中的应用也愈加深入,全面改变了产业日常工作管理模式。而软件工程作为计算机系统运行的重要技术,软件工程开发就决定了计算机系统的实际应用效果。而数据挖掘技术作为现代化的计算机技术体系,其本质就是服务于计算机软件系统的,数据挖掘技术在软件工程中的应用就有着重要意义:

第一,提升数据处理的效果。在软件工程中,涉及了大量的数据运算,计算机软件系统的数据运算能力很大程度上决定了软件开发的效率。并且在常规软件开发的数据信息预算与处理中,不仅需要大量的运算时间,其数据内还含有大量应用价值较低的数据内容,给软件工程开发造成不利影响。而通过数据挖掘技术在软件工程中的应用,就能够有效提升软件工程中数据处理的效率,并能够降低数据丢失的概率。并且,数据挖掘技术在对软件工程数据的处理中,还能够对大规模数据中应用价值不高的垃圾数据进行处理,以此提升软件系统的运行效率。

第二,提升数据处理的效率。在计算机软件工程中进行数据挖掘技术的使用,能够实现对数据的转换处理,对杂乱的数据信息进行整合,将之转变为使用形式,然后根据计算机软件运行的数据需求,对数据进行科学化调用。还能够从多个角度对数据信息的真实性进行验证,充分保证软件系统运行中数据的实际应用效果,这对于新时期的软件工程发展有着重要意义,能够全面实现软件工程中数据处理效率的提升与强化。

三、数据挖掘技术在软件工程中的具体应用

数据挖掘技术在软工程中的应用对于新时期的计算机产业发展有着积极的推动意义。而数据挖掘技术的实际应用中,也需要根据软件工程的实际需求,对于具体应用内容及方法进行研究,以发挥数据挖掘技术对软件工程的重要作用。当前数据挖掘技术在软件工程中的具体应用主要包含以下方面:

第一,信息挖掘应用。在软件工程中进行数据挖掘应用时,数据挖掘技术能够实现项目参与者与共同编辑的统一性,以此实现对全局信息的挖掘。实际应用中,数据挖掘技术能够对软件工程中变更信息模块进行挖掘,并对系统之间的内在关系进行分析,这就能够有效降低系统维护的成本,对于计算机软件系统运行具有积极意义。

第二,系统漏洞挖掘。漏洞的检测是为了找出软件中存在的一系列问题,能最快时间的修复,确保了软件的可靠性。数据挖掘技术一般应用在漏洞检测方面,要对软件进行测试并且还要满足客户的需求,总结软件测试完后的具体内容,最终来决定用某种测试方式进行测试,来制定相应的计划;手机漏洞的数据,对数据进行清理,对采取的数据进行分析,采取有关的数据,把没用的数据清理完成后,在对丢失的项目进行补救,转换为数值表示。还要选用适当的数据模型来进行训练和验证。选择挖掘方式,让它成为测试集,比较结果,找出结果最合理的方式。还要描述和分类软件的漏洞,把漏洞数据用到软件数据库,把相应位置的漏洞找出来,进行进一步的分类

[2]

第三,执行记录挖掘。在软件工程中应用数据挖掘技术时,数据挖掘技术能够对程序的路径进行分析和总结,以此对程序之间的关联关系进行分析。这一应用的本质就是跟踪软件系统的执行路径,用以技术软件系统的程序维护以及程序了解。在对软件工程执行记录的数据挖掘中,数据挖掘技术的首要任务就是对系统进行分析,对软件的变量进行记录,然后通过对目标信息数据的过滤,来最终得到相关的执行记录信息数据。

第四,开源软件挖掘。开源软件的挖掘开放性等性质,所以对这种软件的开发,要和其他的软件区别开来。在正常情况下开发软件,对参与报告等应用要有完整地记录。开发人员组成社会网络,因为它具有开放性,所以使开发的人员一直都在变化中进行。其次还要对开源软件进行动态性挖掘,方便地管理了开源项目。

而数据挖掘技术在软件工程的实际应用中,其应用方法也较为多样,主要包含了一下方面:①关联法。关联法的规则就是数据中相关的关联信息,具备了两方面的特征,其一是支持度,其二是置信度。②分类法。分类法是以分类表号对软件工程进行操作的,分类法应用数据挖掘技术的前提就是需要建立相对应的模型,对数据集进行描述并分类。而分类法中较为常用的就是判定树法,包含了网络分类法和支持向量机法。③聚类法。聚类法应用就是将数据分为多种类型,保证数据之间的相似度,不同类型的数据挖掘对象会具有明显的特征,划分法、基于密度法、模型法、网格法、层次法都属于聚类法的应用范畴[3]

结束语:

综上所述,数据挖掘技术在软件工程中的应用具有重要意义,能够有效提升软件工程数据处理的效率和质量。而数据挖掘技术的实际应用中,需要注重对其应用内容和方法的深入研究,才能够发挥数据挖掘技术对软件工程的促进作用。

参考文献:

[1]卢珊.数据挖掘技术在软件工程中的应用分析[J].长江信息通信,2022,35(04):113-115+118.

[2]孙鹏飞.数据挖掘技术在软件工程中的应用探究[J].现代工业经济和信息化,2022,12(03):136-138.

[3]米仁沙·艾尼.“互联网+”背景下数据挖掘技术在软件工程中的应用路径[J].网络安全技术与应用,2022(02):61-63.