物联网大数据聚类分析方法和技术探讨

(整期优先)网络出版时间:2019-11-22
/ 2

物联网大数据聚类分析方法和技术探讨

吴政

广州市汇源通信建设监理有限公司广东省广州市510220

摘要:文章先分析了物联网关键技术以及数据发现等相关技术,随后介绍了聚类分析方法,包括关键算法和技术流程,希望能给相关人士提供有效参考。

关键词:物联网;大数据;聚类分析

引言:物联网感知层中的无线射频技术是无线通信技术,具有准确识别目标物的功能。在RFID技术不断发展的背景下,其在制造业和电商行业中发挥了巨大的作用,随着数据复杂度的提高,和数据量的扩大,需要对数据存储和数据处理技术进行创新研究,促进大数据技术架构优化设计。

一、物联网关键技术分析

物联网其实是指通过信息传感相关红外感应器、定位系统和激光扫描器,在射频识别条件下将待测物体和网络之间进行有效连接,从而实现全方位物体识别、定位、跟踪管理和全过程监控等功能。物联网的诞生进一步改变了原有的识别技术,对现代化信息改革具有重要的促进作用。随着时代的发展,社会中的多个领域也逐渐将注意力转移到物联网领域当中。物联网相关技术包括以下三种:第一是数据处理和现代通信。现代通信是物联网基础支持,其中具有代表性的是无线智能网络。结合宽带通信的帮助,大部分领域都开始创建多媒体通信,同时相关技术也呈现出不断发展的趋势。第二是智能终端,这部分是物联网整个网络中的核心内容,其中包括智能电话和智能型PDA,可以利用传感器精确采集信息,全面识别判断各种图像。第三是信息安全。将物联网有效应用到各个领域当中,需要进一步确保信息安全,为此需要合理使用相应的加密方法对各种实时访问进行全面监控,进行系统化的安全管理和访问。对于当下的物联网而言,只有的网络状态下才能对各种物体进行准确识别。

二、数据发现

模式识别即利用逻辑关系、文字、数值等内容表征事物现象的信息,实施识别、分析和处理的过程。模式识别也可以称作模式分类,具体包括无监督和监督模式识别,两种模式之间的差异时样本类型已知状态。其中的监督模式是在已知样本类型的基础上进行识别,而无监督则是在不知道样本类型的基础上进行识别。通过计算机识别的目标可以是抽象的也可以是具体的,具体的包括图像、声音、文字等内容,而抽象的包括程度和状态等内容,模式信息即把识别对象和数字信息清除区分开来,这种技术涉及范围较广,包括人工智能、数据库、统计学等内容,是各种技术的综合。在数据挖掘中,模式发现是其中的核心内容,数据挖掘相关任务包括分类、关联、聚类等形式。数据库相关知识模式发现流程如图1所示:

在处理RFID相关事件时,应该先详细解析事件定义,随后根据事件流中各种事件的定义关系,对已形成的模式关系实施定义分析,随后按照事件之间的对应关系实施量化,在量化后距离基础上实施聚类分析。该部分定义中,先对事件进行解析,将其转化为原子事件,随后对其定义,在已经完成定义的原子实践基础上,再对现实事件中的各种关系进行定义,同时分析交易事件中的属性量化指标。原子事件即将事件定义成一个,包括事件标识符ID,也是唯一的标记;DOMAIN是交易事件中问题域实际位置;ALIAS是事件名称,和命名事件相关的一种名称;TYPE是事件种类,和问题域具有一定联系,可以是相关研发人员进行自定义操作,同时也可以是系统自带;TIME是事件出现时间;STIMULATION是激发事件的基础条件,比如快递运输中的某一物品被RFID读取后,证明该物品处于被签收状态,其中的激发因素便是被签收,如果没有被RFID识别器解读,证明该物品尚未发出,也不会出现任何事情。LAOCATION是指事件出现的位置,和事件相关性具有一定联系。

三、聚类分析技术方法

(一)关键算法

第一是平均算法,这种算法从本质上来看是以聚类划分为基础的,在近几年平均算法逐渐广泛应用开来。利用这种算法可以对相关对象进行合理划分,将其分成各种类型的簇。也因此对象组之间也呈现出一种相似性特点。如果是针对特定类型的数据分析工作,则关注点需要放在数据集和数据簇总数上,并从中挑选出可分析数据集。对各组别数据对象进行分配,便能规划处具有较强相似性的簇平均值。第二是分解奇异值算法,这种算法是以特定矩阵为基础,其中包含实数或复数的矩阵,如果该种类型的矩阵存在,便可以直接实施分解奇异值的操作。从整个矩阵范围内分析,涉及到M×M矩阵,这种矩阵类型是一种半正定和对角矩阵。分解奇异值还会涉及到共轭矩阵,并把其看做奇异值分解。从当下的实际发展状况分析,通常可以利用特定类型仿真软件分解相关数值,随后通过归纳得到函数式[1]。

第三是主成分分析算法,这种算法也可以叫做PCA分析办法,正常情况下,如果是多种算法变量,可以利用线性变换方法促进全过程实现简化变换的目标,或利用多元统计方式进行算法分析。从信息分析和数据分析两种视角入手,分析主成分其核心价值是创建对应的数据集,但不能遗漏全方位简化运算。在分析主成分的基础上,降低数据集维度,可以适当保留一些低阶的主成分,忽略高阶成分。第四是决策树学习,其属于一种概率分析图解方法,这种方法需要以事件概率为基础前提,针对不同类型的事件进行系统解析。决策树重点针对特殊期望值,保证其最终结果大于零。同时决策树还涉及到可行性判断和决策分析等方面。

图1模式发现流程

(二)技术流程

在实施聚类分析的过程中,需要按照相应的技术流程进行具体操作。聚类分析包括分布式编程和特定软件架构,重点实施多样化分布计算。立足于开源层面分析,聚类分析特点之一是HADOOP技术,为此可以将其划分为以下几个流程:第一是MAP处理过程,该阶段中,需要通过特定键形式输出和输入相关数值,用户按照自身需求创建编程定义,输入相应的节点值。第二是REDUCE处理过程,在进行REDUCE处理的过程中,需要利用分布式平台进行数据减缩处理,并为向量机提供可靠的技术支撑,促进数据信息实现归类整理。相比较之下,HADOOP从根本上摆脱了传统模式的缺陷,在选择处理策略的过程中可以进行动态调整[2]。

结语:

综上所述,物联网在进行数据处理的过程中,其中发挥出核心作用的是数据分析功能,利用聚类分析相关措施,可以从源头入手,对提高数据分析的准确性,使最终数据检测结果更加准确。当下聚类分析也广泛应用于各个领域当中,并取得了较大的成效。

参考文献:

[1]赵露,蔡瑞瑞.物联网大数据聚类分析方法和技术研究[J].集宁师范学院学报,2018,40(06):45-48.

[2]冯政军,朱琴.论物联网大数据聚类分析方法和技术[J].信息与电脑(理论版),2018(06):119-121.