摘要
摘要SparkSQL2.0.X开始运用新的线程概念SparkSession,从而取代了原本的SQLContext与HiveContext,并更新了数据框架DataFrames。分布式文件系统HDFS可以为城市燃气数据提供稳定可靠的海量数据存储能力,而SparkSQL为其提供高性能的内存计算和数据分析框架。基于SparkSQL的城市燃气输配大数据分析,初步设计并实现通过分布式存储与最新的SparkSQL大数据计算技术,提升查询性能与系统可扩展性的方法。
出版日期
2018年06月16日(中国期刊网平台首次上网日期,不代表论文的发表时间)