精心选取十个大数据与机器学习的实战案例,采用迭代递进模式,边理论边实践,深入浅出,让读者在工程实践中熏陶成长,在复杂系统设计中淬炼过硬本领。十个案例全部采用国际著名机构发布的真实数据,研究领域涉及生物信息、图像处理、商业零售、银行金融、自然语言处理等。每个案例采用的数据集规模相对较大,鲜明体现了机器学习在大规模数据挖掘
本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段
第1章绪论、第2章Linux操作系统的安装、第3章Hadoop的伪分布式安装、第4章Hadoop集群的搭建及配置、第5章HadoopHDFS命令、第6章MapReduce编程入门、第7章Hive:SQLonHadoop、第8章Sqoop:SQLtoHadoop、第9章HBase:HadoopDatabase、第10章S
本书是高校的大数据导论课程教材,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”“大数据道路”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。
本书介绍了不同的场景及假设,包括感知、人工计算、同行评级、评审以及预测。书中综述了不同的激励机制,包括适当的打分规则、市场预测和同行预测,贝叶斯测真机,同行测真机,相关协议以及使它们适用的一些设置。作为替代方案,也考虑了信誉机制。同时补充了博弈论分析在预测平台、群智传感、同行评级中的应用实例。本书适合数据科学、机器学习
本书以培养大学生解决复杂工程问题能力为出发点,以满足新工科背景下社会对工程技术人才的需求为目标,着重强化大学生解决实际工程问题的能力。全书共6章,包括:计算机控制系统概述、计算机控制系统的理论基础、过程通道设计、数字控制器设计与应用、网络控制系统、计算机控制系统设计。本书内容丰富,以大量翔实的案例贯穿相关知识点的学习,
机械工业出版社本教材首先介绍了数据分析的基本概念和方法,然后通过大量实例介绍了如何使用Matlab实现数据分析,并深入浅出地介绍了数据建模过程中的有关方法。本教材共分8章,主要内容包括:数据的基本概念及其应用、Matlab基础、随机模拟、数据预处理、数据探索与分析、多元线性回归模型、聚类分析和分类。本教材可作为职业院校
本书共13章,阐述了过程控制系统的结构、原理、特点、设计及应用等问题,探讨了流程工业典型生产单元控制方案的工程设计、系统调试与运行分析。方法篇(第1~5章)详细介绍了过程特性、检测仪表、执行器和常用控制系统;应用篇(第6~10章)讲解了流体输送设备、传热设备、锅炉设备、精馏塔、化学反应器等典型单元的控制方案设计与应用;
在本书的di一部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包含超过20个供挖掘Twitter数据之用的简短代码。
本书阐述数字系统设计方法和可编程逻辑器件PLD的应用技术。引导读者从一般的数字功能电路设计转向数字系统设计;从传统的非定制通用集成电路的应用转向用户半定制的PLD的应用;从单纯的硬件设计转向硬件、软件高度渗透的设计方法。从而了解数字技术的新发展、新思路、新器件,拓宽软、硬件设计的知识面,提高设计能力。从而了解数字技术的