这是一本将数据科学三要素商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结,得到了SQLFlow创始人以及腾讯、网易、快手、贝壳找房、谷歌等企业的专家一致好评和推荐。 全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从
本书将通过具有中国特色的具体案例来讲授Python编程的基本语法规则,并通过Python语言来介绍数据科学的基本内容以及数据分析方法的基本思想。内容分为两部分,第一部分介绍Python编程的基本概念,包括常用表达式、数据类型、表格处理、数据可视化等;第二部分结合Python语言介绍数据分析方法的基本思想,比如假设检验、
本书详细阐述了培养具有数据素养的技术技能型人才所需要的大数据相关基础知识。本书在确定知识布局时,秉持的一个基本原则是,紧紧围绕大数据通识教育核心理念,培养学生的数据意识、数据思维、数据安全和数据分析能力。全书共7章,内容包括大数据概述,大数据思维,数据库基础知识,大数据分析技术及相关应用,数据可视化概论,大数据安全,大
本书系统、全面地介绍大数据技术的基础知识。全书共13章,首先介绍大数据行业与技术趋势;然后介绍大数据生态圈的各项技术,包括分布式文件系统、Hive分布式数据仓库、HBase技术原理、MapReduce和YARN技术原理、Spark基于内存的分布式计算、Flink流批一体分布式实时处理引擎、数据采集与数据装载工具、Kaf
本书全面深入地阐述了旋量理论与李群、李代数理论及其关联关系,反映了李群、李代数与机器人机构学相结合的**理论研究成果。全书共9章:第1章为绪论;第2~4章主要讲述了旋量、李群、李代数等数学理论,揭示了刚体位移的固有特性以及与速度旋量和李代数的内在统一性;第5章介绍了旋量理论在机器人运动学中的应用实例;为了更充分地展示现
本书编写的目的是使学习自动化装备与生产线设计课程的学生和在企业初步从事这方面设计工作的工程技术人员,通过本书的学习,能尽快掌握自动化装备与生产线设计理论及应用的基本方法。《BR》全书共分11章。第1章为绪论,第2章为自动化装备与生产线的基本设计方法,第3章为常用自动化传动机构与选型设计,第4章为机械制造过程自动化,第5
《大数据百科术语辞典》汉外对照系列丛书是全球首套系统研究大数据术语的多语种智能化专业辞典。本丛书对大数据知识体系进行了全面梳理,提出了九个方面的术语架构,形成了统一规范、符合国际通用规则的多语种学术话语体系;丛书系统性提供汉语与其他二十个语种的术语规范表述,以中外文对照的形式展示;丛书开创性融入知识图谱、有声点读、平台
Hadoop是当前热门的大数据处理与分析平台。《Hadoop大数据开发基础项目化教程》将大数据平台相关内容划分为8个项目,分别是大数据时代、Hadoop基础环境、Hadoop环境搭建、分布式存储HDFS、MapReduce分布式编程、Hadoop数据仓库Hive、Hadoop数据库HBas、协调系统Zookeeper,
本书介绍数据分析的统计基础、种类划分,并列举大量实例以说明数据分析方法和算法。内容主要分为4部分,第1部分为第1章,介绍一些概念,简单描述数据分析方法和一些实例;第2部分包括第2~7章,介绍描述性分析和数据预处理的主要方法,包括描述统计、多元描述分析、聚类以及频繁模式挖掘等;第3部分包括第8~12章,介绍预测性分析的主