学科分类
/ 1
2 个结果
  • 简介:摘要:网络信息量的迅猛增长,从海量的信息中准确的搜索到用户需要的信息提出了极大的挑战。网络爬虫具有能够自动提取网页信息的能力。对现在流行的网络爬虫框架进行分析和选择,在现有框架的基础上设计了一种适合资源库建设的爬虫系统,利用爬虫的自动化特性完成教学资源库的内容获取及入库工作。同时,选用 Scrapyredis对爬虫进行拓展,利用 Redis实现对目标网站资源的分布式爬取,提高获取资源的速度。

  • 标签: Python的网络爬虫程序 设计 应用
  • 简介:摘要 当前,铁路企业如何准确预判市场发展趋势,精确的掌握客户个性化需求,制定切实可行的策略成为制约铁路发展的关键。在 Hadoop和云计算等大数据技术的基础上,使用大数据分布式计算和存储平台组件,搭建数据仓库,采用面向服务架构( SOA)设计,构建基于大数据理论货运营销决策系统,建立从业务层到管理层到决策层的智能分析体系,实现集团货运数据资源的集中、整合和分析挖掘,为集团公司货运营销管理及决策支持。

  • 标签: 大数据 货运 营销 面向服务架构 数据仓库