《数据挖掘方法与应用》对数据挖掘中常用的建模算法进行系统介绍,内容涵盖了数据预处理、关联规则挖掘、聚类分析、决策树及组合算法、贝叶斯分类、支持向量机、人工神经网络等。在阐述每种算法基本理论的基础上,同时给出基于R软件的应用方法。这种理论与应用相结合的方式为读者理解和运用这些方法提供了坚实的基础,有助于读者
本书主旨是指导组织中数据治理相关角色在大数据环境下,如何对数据资产进行有效治理,更好地为组织提供数据服务。全书共10章,主要包括大数据治理与服务概述、大数据治理与服务总体框架、大数据架构治理、元数据治理、主数据治理、文档和内容治理、大数据质量治理、大数据安全治理、大数据治理能力成熟度评估模型和大数据服务等内容。本书可作
《创新方法新系统》系统介绍了创新方法新系统理论体系构建的一般路径和重要实践意义。首先,《创新方法新系统》创见性阐释了TRIZ理论、群智理论和知识图谱技术作为创新方法新系统构建过程中的重要理论来源作用,并尝试就其如何为复杂创新场景中的理论融合与创新进行了深入探索;其次,《创新方法新系统》就如何从理论和实践层面构建创新方法
本书介绍基于Python语言的网络数据采集技术的相关知识,并为采集网络中的各种数据类型提供全面指导。第1章重点介绍Scrapy框架及配置方法;第2~6章重点介绍网络数据采集的基本原理,包括如何利用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何通过自动化的手段与网站进行交互;第7、8章介绍登录
本书为大数据时代下的产物,由浅入深地介绍大数据及其相关知识,在大数据的背景下着重介绍ETL数据处理技术,同时引入数据清洗的知识,理论与实际相结合,突出所长。在理论上,本书突出重点与难点,较为系统地介绍大数据的各项基本技术。在实践操作上,本书贴近生活,切实理解,紧跟实验进行,并从中萃取精华。同时本书还介绍ETL技术的主流
本书以常见的数据分析与大数据应用方法为主线,按照数据采集、数据存储与管理、数据预处理、数据分析与挖掘的逻辑关系分析大数据时代应如何采用量化方法分析经济问题。本书在定性分析的基础上,采用大量的实例和软件操作插图来直观地解释大数据分析方法的原理和应用,为读者提供“一站式”服务。同时,通过对线性回归、逻辑回归等计量方法,主成
本书分为5篇,包括11章和3个附录。大数据基础篇包括第1章(绪论);大数据存储篇包括第2~3章(HDFS分布式文件系统、NoSQL及其HBase分布式数据库系统);大数据计算篇包括第4~7章(MapReduce分布式计算、大数据的Spark内存计算、大数据的流计算、大数据的图计算);大数据管理、查询分析及可视篇包括第8
本书主要根据作者近几年在清华大学面向研究生和本科生开设的数据挖掘:方法与应用课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研
本书将为大家全面而深入地介绍Hadoop、Spark和NoSQL平台的构建,深入浅出地讲解Hadoop、Spark和NoSQL的基础知识、架构方案与实战技巧等。通过阅读本书,读者可以对大数据平台架构有一个明确、清晰的认识,掌握Hadoop、Spark、NoSQL平台的使用技巧,从而搭建一个安全可靠的大数据集群平台,来满
本书共12章,内容包括:什么是大数据、大数据技术基础、数据采集与预处理、大数据存储与管理、大数据计算框架、分布式数据库Hbase、数据挖掘、大数据应用分析、数据可视化等。