学科分类
/ 25
500 个结果
  • 简介:Hadoop可以部署在大量由廉价设备组成的集群上,构成高可靠性和良好扩展性的分布式计算系统.使用虚拟化软件VMware在实验计算机中虚拟出若干台虚拟机,组成集群,在此基础上部署Hadoop系统,然后在Windows系统中使用Eclipse进行开发环境的搭建,并运行了WordCount实例.

  • 标签: 云计算 HADOOP 虚拟化
  • 简介:随着信息化教学的推进,高校在信息化教学的发展和进步,已积累大量课程资源和课程数据,如何在这些课程资源数据进行有效存储管理,并在此基础上挖掘出有意义的数据,对课程资源进行关联归类,形成课程体系智慧学习,成为目前高校课程大数据的主要研究对象。文章以高校计算机类课程为基础,搭建Hadoop集群环境,研究基于Hadoop平台的课程平台,为高校课程信息化建设提供方案。

  • 标签: HADOOP 课程云平台 智慧学习
  • 简介:计算的出现为海量教学资源的分布存储与管理提供了新的思路与技术。为满足教育教学资源共享建设的低成本、高可靠的弹性访问与服务需求,在现有Hadoop实现技术的框架下,提出了分布式存储、访问与管理的资源共享平台,并设计了相关的平台资源存储结构和Web应用程序,为现代教育教学资源共享平台的构建提供了思路。

  • 标签: 教学资源 云计算 HADOOP HDFS MAPREDUCE
  • 简介:随着企业用户所需存储的临时文件数量不断增加,目前所有的文件存储设备已经没有办法满足企业业务的需求。针对这个问题,笔者提出了以Hadoop技术为基础,构建企业存储平台的概念,并通过Linex集群技术与计算框架等技术来最终完成大量数据的存储。存储平台主要适合应用在关键业务中以及企业事务的在案处理。存储平台能够满足企业随着业务增长而不断变化的需求,数据规模更加容易扩展。

  • 标签: Hadoop技术 云存储平台 云计算
  • 简介:摘要:本研究旨在探讨如何利用负载监控技术来优化Hadoop平台的性能。通过对Hadoop集群中的负载情况进行监控和分析,提出了一系列性能优化策略,旨在提高系统的效率和可靠性。介绍了Hadoop平台的基本架构和负载监控的重要性,详细阐述了提出的性能优化策略和负载监控技术在Hadoop平台中的应用。

  • 标签: Hadoop云平台 负载监控 性能优化
  • 简介:随着企业数据信息量的增加,大数据时代的到来为企业数据信息处理提供多种新型的技术。以往企业数据处理所用的传统框架IOE是集IBM小型机、Oracle数据库以及EMC存储所组成的大型商用数据库系统。在当今该种系统架构早已不能满足企业数据处理需求,存在着较大的数据计算、处理、带宽等方面的问题。Hadoop平台的出现,为企业数据信息处理提供更好的平台,能够实现信息高效应用。基于此,本文从传统架构IOE到Hadoop平台的应用迁移实现角度进行分析。

  • 标签: 传统架构IOE Hadoop云平台 应用迁移 实现探索
  • 简介:

  • 标签:
  • 简介:

  • 标签:
  • 简介:我们生活在一个信息爆炸时代,每天都会接收到多种信息:短信、邮件、电话……我们每天也在生产多种的信息:微博、博客、RFID……各种各样的信息充斥着这个世界,我们该如何应对和利用好如此庞大的信息?这些问题带来的挑战,让业界对“大数据”的热隋达到了前所未有的高度。

  • 标签: 数据集成平台 信息爆炸 多种信息 RFID 博客
  • 简介:在信息系统当中,日志数据也就是用户对系统的操作记录以及系统自身的运行状况记录,对日志数据的有效分析,有利于排除系统故障、明确用户访问规律等。基于此,文章就Hadoop平台下日志分析系统展开研究,首先介绍了系统的总体框架,进一步对其设计与实现过程中,日志分析处理流程设计、日志数据预处理两个操作环节进行了重点介绍,并进一步提出了针对此类系统的检测方法。

  • 标签: HADOOP平台 日志分析系统 数据预处理
  • 简介:随着互联网信息技术的突飞猛进发展,加上移动智能手机、PC电脑、传感器的广泛使用,全球数据信息总量正呈现几何倍的增长态势,并且数据结构向着半结构化、非结构化方向发展,传统数据处理技术已经远不能满足现有需要。在此背景下,Hadoop作为应用最广泛的一种开源计算平台应运而生。文章通过介绍Hadoop平台的构架与原理,对Hadoop平台的大数据处理能力进行分析,通过与传统数据处理方式的比较,对大数据下Hadoop平台的未来进行了展望。

  • 标签: HADOOP平台 大数据 数据处理 HDFS MAPREDUCE
  • 简介:摘要:随着我国网络科技技术的深入发展,大数据等高科技手段逐渐走进我们的生活,广泛应用与电商、人事部门等多个地方,而对于科技人员来说,如何高效率的处理海量的数据信息,能够推进大数据时代的进步,对此,我们设计研究了基于Hadoop的用户行为分析平台,仅供参考。

  • 标签: Hadoop 用户行为分析 平台设计
  • 简介:随着智能电网建设进程的加快。电能质量监测点不断增多,系统逐步完善。各种类型的监测和计算数据量急剧增加,呈大数据趋势。对于大数据的计算处理。计算平台具有先天性优势。文章提出并初步实现了一种基于Hadoop架构的电能质量模型,旨在整合传统计算存储资源,解决电能质量大数据的存储和计算问题。模型采用分层结构,以电网自然分层为基础,搭建分层电能质量计算平台。整体采用面向服务的架构,各层以Hadoop架构搭建子,并向上层主提供服务。基于Hadoop架构的电能质量模型不仅可以解决电能质量监测大数据的存储和计算问题,对解决智能电网中其他信息系统的大数据问题也具有参考意义。

  • 标签: 电能质量 智能电网 大数据 云计算 HADOOP SOA
  • 简介:计算的出现,有效地解决大数据时代的数据冗余、处理速度慢、空间不足等难题,满足信息化社会快速发展的数据需求。首先简介计算,大数据,几种经典的推荐算法和个性化推荐。然后把平台与推荐系统的推荐引擎结合起来,利用协同过滤算法结合MapReduce框架模式进行计算,分别基于共同好友和共同兴趣对一个微博大数据集进行处理并得出推荐结果,给用户推荐潜在关注者和关键字,并对实验结果进行分析得出结论,验证计算能有效并且快速处理大数据,提高计算机大规模数据计算处理能力。

  • 标签: 云计算 HADOOP 大数据 协同过滤 个性化推荐
  • 简介:本文以辽宁省公安厅交通安全管理局缉查布控系统大数据平台设计为例,介绍基于Had00p的大数据平台构建方法,重点介绍了基础软硬件平台的配置方法和计算依据。

  • 标签: Hadoop:大数据 缉查布控
  • 简介:北京2015年12月22日电/--企业级基础服务商青云QingCloud日前宣布,基于Hadoop的大数据集群服务现已正式推出。该服务包括三大核心组件,即HDFS分布式文件系统、YARN任务调度和集群资源管理系统,以及MapReduce并行计算系统。通过QingCloudHadoop集群服务,用户能够在2-3分钟内创建一个Hadoop集群,并且可以进行横向和纵向的在线伸缩,极大地降低了Hadoop平台的技术门槛。

  • 标签: 数据平台 HADOOP QingCloud 分布式文件系统 大数据集 并行计算系统
  • 简介:针对当前学生择业难而学校教学无法满足当前社会实际需求的问题,开发基于Hadoop分布式文件平台的岗位分析和推荐系统,借助大数据相关技术,使教师和学生能及时跟踪就业岗位需要的技能。系统基于大规模数据运算的Hadoop分布式计算平台,使用SpringMVC构建系统架构,综合运用Webmagic、Map/Reduce、K-means与Canopy算法、相似度推荐算法等技术实现就业岗位的抓取和分析。

  • 标签: 大数据 岗位推荐 HADOOP K-MEANS MAP/REDUCE
  • 简介:摘要 伴随企业信息化建设的深入推进以及物联网技术的广泛应用,大量以ERP应用系统为主的结构化数据以及过程管控、设备监测、产品运行产生的非结构化数据呈爆发式增长。为解决传统信息资源管理技术在应对大数据问题时存在的缺陷,本文提出了一种基于Hadoop生态系统的企业大数据解决方案。该方法将企业数据划分为结构化与非结构化两类。针对两类数据处理过程中的采集、存储、分析计算及应用四个阶段,阐述了系统建设的总体设计与软件架构,为企业信息化建设提供一种高效、可扩展的低成本解决方案。

  • 标签: 大数据,分布式,Hadoop,ERP