基于数据挖掘技术的数据可视化分析

(整期优先)网络出版时间:2020-07-13
/ 2

基于数据挖掘技术的数据可视化分析

黄源

甘肃省军区数据信息室 甘肃兰州 730000

摘要:对于数据挖掘技术的应用来说,其能够根据用户的具体需求来进行数据的挖掘,而数据可视化的应用能够使其整体表现更加直观。在本文中,将从数据挖掘技术中数据可视化的作用出发,来探讨如何实现数据挖掘技术的数据可视化,从而使数据挖掘技术在实际应用中的效率与质量能够得到保障。

关键词:数据挖掘;数据可视化;系统设计

引言:随着信息技术的不断发展,数据的存储量也在日益的增长,这使得想要实现对数据的有效处理,就要基于数据挖掘技术的应用来获取关键信息。而为了使数据挖掘的结果更加直观,就要基于可视化技术融入来予以保障。为此,就要基于数据挖掘技术的数据可视化分析来完成对系统的优化与调节。

一、数据挖掘技术中数据可视化的作用

在数据库技术不断的成熟与发展的过程中,数据应用的大量普及,使得数据量正在以一个指数级的速度增长,而且随着计算机内存储数据量的日益庞大,人们已经不再单一的满足于对数据来进行管理,更多则是重视对数据的分析工作,并从在大量的数据中对知识与信息进行获取。这就使得数据挖掘技术逐渐走到了人们的视野当中。在近年来人们进行数据挖掘的过程中,在其理论与方法做出了大量的研究工作,从而以此作为基础,来进行挖掘工具的开发与研究。但这些工具被实际应用到大型数据集的处理时,所取得的效果往往无法保障。而可视化技术的应用,能够使数据通过可视化图表的方式进行直观表现,并基于人类特有的认知能力,实现对相关问题的决策分析。

  1. 基于数据挖掘技术的数据可视化设计

  1. 体系结构

对于基于数据挖掘技术的数据可视化设计而言,其重点方向是能够将用户的离散数据与通过数据挖掘获取的数据以图表形式进行表示,来对其整体可视性进行表现。并且能够在主要页面实现对动态数据图表的表现,而这就需要其能够良好的完成数据的动态获取、数据的传递以及图表生成等任务。因此,为了实现对图表的动态化展示就需要基于动态网页技术与web数据访问技术的应用。同时,也需要基于数据库与web之间的良好连接,来实现动态化的web数据库查询。而针对与用户进行体系结构设计的过程中,需要将其划分为三个主要部分来逐步进行体系结构的设计:

  1. 用户接口部分。在进行这一结构的设计过程中,需要其将能够实现与用户进行交互,将具有接受用户数据功能的SJP页面作为数据接口。并且对于web页面的功能需求来说,其不仅需要能够提供离散数据源的输入,也要能够提供客户端程序包下载与在用户浏览器中现场处理后图表的显示功能。

  2. 数据显示与分析。这一部分需要能够基于数据挖掘、数据可视化、回归分析等关键技术的分析与数据处理。而在完成对数据的计算与处理后,需要能够将承担图表生成的JvaaAplPet,嵌入到web页当中,从而实现与用户之间的动态交互。

  3. 数据库接口。数据库结构需要其能够与用户的客户端程序相互连接。而客户端程序中需要其能够提供对应的数据库类型、数据库、数据表以及字段选项,从而使用户能够制定对应的数据序列来进行显示。而最后被客户所选定的数据,能够由数据客户端程序传递到web页面当中,并完成可视化处理。

  1. 系统开发

在对系统结构进行开发的过程中,需要基于数据获取工具的运用,从而系统能够从外部数据源中,实现对其的定义,并对获取数据的约束规则进行定义,而可以完成对数据的格式转换、综合清洗以及数据的追加。而在建立起数据库仓库中的分析数据模型过程中,需要其能够基于对数据仓库建立与维护工具的应用,来以对应的模型进行存储、访问与维护。同时,其在具体使用的过程中,可以对数据仓库中存放的数据结构进行设计与定义,以此来建立并维护对应的主题与模型,实现对分析层次的关系的建立,并提供一些基础的数据库维护功能。例如,系统在开发的过程中,还可以基于对分析工具的应用对数据仓库中的数据进行分析,以使决策人员可以通过分析工具来对数据集进行提取与分析并展开相应的决策。分析工具的主要功能通常为查询生成工具与多维分析工具,并且其数据的分析结构能够以表格、图形等更加直观的方式来进行显示,同时也能提供数据切片、旋转与钻探等交互方法与功能。

  1. 用户操作

在实现数据挖掘技术的数据可视化过程中,要根据当前用户的具体需要与习惯来进行具体操作流程的设计与规划。作为用户操作过程中的重要内容之一,用户在进行数据源类型选择的过程中。可以根据自身的需求采取数据库或手工输入的方式来对显示数据的来源作出选择。而如果为数据库,那么系统则会根据用户的选择来对指定数据库中的表进行显示,以使用户可以进一步指定对于的显示表,而如果为手工输入操作则直接进入到下一个步骤当中。而系统在这一步骤中会列出可以选择的相关图表类型以及名称与图例,并在用户选择对应的类型后,按照系统的默认设置进行数据的显示。此外,用户可以参照页面上的具体选项来进行图表标题、签、背景色、刻度间距等内容进行图表的更新,并显示对应的结果。

  1. 数据源选择

数据源选择能够为用户提供需要显示的数据来源,而其通常包含用户数据库与手工输入两种。其中当用户选择数据源类型被制定为用户数据库后,系统将会给出相应的浏览窗口,从而使用户能够对目的数据库路径进行制定,以对应的列表中进行显示以帮助用户进行选择,而用户在完成对图表的选择后,还需要对图表的横轴与纵轴对应的字段进行显示。此外,手工输入的数据可以作为对应的页面参数直接传递到Applet,完成对图表的显示与选择,但在实际应用的过程中,手工输入数据源可以帮助开发人员与用户来对当前的可视化系统进行初步了解与测试。

  1. 图表显示设置

图表显示能够为用户提供对应图表的名称与图例来进行参照,使用户可以根据自身的数据特征来选择对应的图表类型。而现阶段中较为常见的图表类型有柱图、饼图以及曲线图三个主要类型。此外,在对显示效果进行设置的过程中,其具有对图表的大小、显示范围、标题标准进行自定义的功能,从而令图表可以更加的清晰、美观与准确,使用户的需求可以得到充分的体现。但在实际应用的过程中,分析人员通常对底层关系模型的细节并不关心,而更希望能够从一个或多个角度来看待问题,从而基于图形的特征来对数据的变化趋势进行研究,以明确不同因素对数据变化产生的影响。

(六)物理存储

在进行存储的过程中,需要注意的是,可视化分析系统的物理存储策略,通常需要面对的数据存储的细节内容。这使得其在进行构建的过程中,通常会采取关系表和多维数据库两种实现方式。其中,多维型数据库具有更好的查询性能,但如果数据整体表现稀疏,其存储空间的利用率则无法得到保障。而关系型数据库在应用的过程中则容易集成为其他存储在关系数据库中的数据,使得其能够完成对超大规模数据库的处理,这也使得其在面对数据中聚合数据分布非常稀疏的大型数据库时,具有存储空间使用效率高的优势。

论:综上所述,数据挖掘技术中数据可视化的应用,能够使关键数据的展示更加直观。为此,就要在基于数据挖掘技术的数据可视化设计的过程中,从体系结构、系统开发、用户操作、数据源选择、图表显示设置、物理存储等要点内容出发进行构成,以使数据挖掘技术在实际应用中的效率与质量能够得到保障。

作者简介:黄源(1987.06--);性别:男,籍贯:宁夏固原人,学历:本科,毕业于沈阳炮兵学院;现有职称:助理工程师;研究方向:信息整编。