学科分类
/ 1
6 个结果
  • 简介:Hadoop系统是一种开源的包括丰富软件库的分布式系统基础框架,其作为一种并行处理引擎在大数据处理方面有着广泛的应用。Hadoop系统发展至今出现了基于MapReduce的第一代和基于YARN的第二代两个版本。两代Hadoop系统各有特点和应用场景。在实际应用中,具体选择哪种系统还需要因地制宜、统筹安排。

  • 标签: HADOOP HDFS MAPREDUCE 集群 大数据 YARN
  • 简介:Hadoop可以部署在大量由廉价设备组成的集群上,构成高可靠性和良好扩展性的分布式云计算系统.使用虚拟化软件VMware在实验计算机中虚拟出若干台虚拟机,组成集群,在此基础上部署Hadoop系统,然后在Windows系统中使用Eclipse进行开发环境的搭建,并运行了WordCount实例.

  • 标签: 云计算 HADOOP 虚拟化
  • 简介:云计算的出现为海量教学资源的分布存储与管理提供了新的思路与技术。为满足教育教学资源共享建设的低成本、高可靠的弹性访问与服务需求,在现有Hadoop云实现技术的框架下,提出了分布式存储、访问与管理的云资源共享平台,并设计了相关的云平台资源存储结构和Web应用程序,为现代教育教学资源共享平台的构建提供了思路。

  • 标签: 教学资源 云计算 HADOOP HDFS MAPREDUCE
  • 简介:随着企业用户所需存储的临时文件数量不断增加,目前所有的文件存储设备已经没有办法满足企业业务的需求。针对这个问题,笔者提出了以Hadoop技术为基础,构建企业云存储平台的概念,并通过Linex集群技术与云计算框架等技术来最终完成大量数据的存储。云存储平台主要适合应用在关键业务中以及企业事务的在案处理。云存储平台能够满足企业随着业务增长而不断变化的需求,数据规模更加容易扩展。

  • 标签: Hadoop技术 云存储平台 云计算
  • 简介:针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means聚类算法做了并行化设计和实验分析,验证了DBIK-means聚类算法在处理大数据时,能够获得较好的加速比。

  • 标签: HADOOP DBIK-means聚类算法 并行化
  • 简介:云计算的出现,有效地解决大数据时代的数据冗余、处理速度慢、空间不足等难题,满足信息化社会快速发展的数据需求。首先简介云计算,大数据,几种经典的推荐算法和个性化推荐。然后把云平台与推荐系统的推荐引擎结合起来,利用协同过滤算法结合MapReduce框架模式进行计算,分别基于共同好友和共同兴趣对一个微博大数据集进行处理并得出推荐结果,给用户推荐潜在关注者和关键字,并对实验结果进行分析得出结论,验证云计算能有效并且快速处理大数据,提高计算机大规模数据计算处理能力。

  • 标签: 云计算 HADOOP 大数据 协同过滤 个性化推荐