简介:摘要:为认真贯彻习近平总书记提出的“实施国家大数据战略,加快建设数字中国”战略思想,认真落实大数据技术人才培养工作,学院在近年开设了云计算技术与应用专业,并设置了以Hadoop大数据技术课程。本文将从学情分析入手,并对整体教学设计、课堂教学实施与成效、教学反思与诊改等方面对课程规划与设计进行详细论述。
简介:摘要:随着互联网的普及,购物网站作为一种新兴的电子商务模式,已经快速发展成为最具潜力和前景的产业之一。在这一背景下,购物网站的搭建者对用户的行为进行分析和挖掘,已经成为关键的竞争因素之一。然而,传统的数据处理技术已经无法满足大规模数据的处理需求。本文通过Hadoop分布式框架搭建数据分析平台,运用DBeaver技术结合HDFS、Hive数据仓库等对用户的一系列购物行为进行分析,为电子商务企业提供有用的参考和指导。
简介:为了实现电梯安全事故的预警预报,研究了电梯安全大数据的挖掘方法.以电梯安全远程监管系统数据库中的电梯状态数据、基础数据、日常维保数据、故障数据以及违章数据作为数据源构建电梯安全大数据平台,包括数据采集模块、预处理模块、数据挖掘模块和数据展示模块.着重研究了改进的K-Means聚类算法和Apriori关联算法.实验表明:两种改进算法的加速比与可扩展性更好.利用聚类算法分析了各小区、不同品牌电梯的电梯故障情况以及各维保公司的故障修复率,利用关联算法分析了各小区及不同品牌电梯的特定频发故障,对电梯安全管理具有指导意义.
简介:摘要:随着生活水平的不断提高,青少年的身体发育水平有了显着提高。青少年的身体机能和健康发育相对缓慢,甚至出现衰退。本文提出了一种基于大数据的新型数据挖掘算法,用于监测青少年学生的身体健康,以克服这一问题,增强青少年的身体素质和心理健康。鉴于大数据技术在促进青少年健康发展、促进个人健康权益方面具有积极的现实意义,本文将实现常用的数据挖掘算法和Hadoop/Spark大数据处理。不同平台上的算法通过比较运行时间验证了大数据平台对数据挖掘算法具有良好的计算性能。目前的工作将证明是一个完整的身体健康数据管理系统,有效地保存、处理和分析青少年的身体检查数据。
简介:针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means聚类算法做了并行化设计和实验分析,验证了DBIK-means聚类算法在处理大数据时,能够获得较好的加速比。
简介:摘要:我校传统的课程考核综合成绩为:平时成绩(30%)+期末考查成绩(70%),这种考核对新工科要求的问题分析能力、设计/开发能力以及素养的考核评价等方面的考核不够全面和完整。本文提出从多方面来对本课程进行考核,即:基础知识学习过程考核(30%)+项目搭建过程考核(20%)+数据分析项目完成考核(30%)+期末终结考核(20%)的考核方式,符合新工科建设要求,符合工程教育目标和大数据专业毕业要求,符合以学生为中心的课程考核评价体系。