"本书为1+X职业技能等级证书配套系列教材之一,以《数据应用开发与服务(Python)职业技能等级标准(中、高级)》为依据,由北京中软国际信息技术有限公司组织编写。本书采用项目化编写模式,共分为5个项目:项目1介绍多源数据采集与存储,主要利用Python语言对不同数据源的数据进行采集;项目2介绍数据处理,从数据探查、数
"本书是“十四五”时期国家重点出版物出版专项规划项目“人工智能重大基础研究丛书”图书,从计算机体系结构、编译系统、操作系统、作业管理等多角度,对程序实现中的算法、数据结构、程序设计语言特性、资源占用及程序运行过程等多维度,全面探讨程序性能优化的理论和方法。全书共12章,分为上下两篇。上篇第1-6章为基础部分,主要对程序
本书提供了使用Python开发机器学习应用程序的基本原理。主要内容包括:机器学习概念及其应用;数据预处理、降维;各种线性模型、集成学习方法、随机森林、提升方法;自然语言处理、深度学习等。本书跟进了机器学习的研究成果,比如近几年提出的著名算法XGBoost和CatBoost,以及SHAP值。这些方法是机器学习领域中新颖且
本书包含20余个高并发系统案例,每个案例看似相互独立,实则相辅相成。根据高并发系统的特点,高并发与高性能、高可用的关系,本书分为6篇。基础篇,概要介绍专栏所用的软件建模方法、设计文档写法、高并发架构设计方法。高并发系统的海量数据处理架构篇,讨论海量数据如何存储、如何传输、如何进行并发控制。高并发系统的高性能架构篇,讨论
本书介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫程序开发的各个方面,包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共14章,分为基础篇、进阶篇、提高篇和实战篇四个部分,内容覆盖网络抓取与爬虫编程中
本书是ClickHouse领域的集大成之作,从基础知识、实现原理、项目实战、扩展应用4个维度全面展开,表述简练清晰、案例丰富实用,既可以作为入门的标准参考书,又适合作为案头速查手册。书中内容是作者在阿里巴巴、字节跳动多年实战经验的总结,得到了字节跳动和阿里巴巴9位大数据专家的高度评价。全书共10章,主要内容如下:第1~
本书是一本在PyTorch环境下学习机器学习和深度学习的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 本书讲解清晰、示例生动,深入介绍了机器学习方法的基础知识,不仅提供了构建机器学习模型的说明,而且提供了构建机器学习模型和解决实际问题的基本准则。本书添加了基于PyTorch的深度学习内
本书主要介绍分布式数据库系统和大数据库系统的基本理论与实现技术。全书共13章,第1~10章重点介绍经典的分布式数据库系统的基本理论和关键技术、当前流行的商品化数据库系统的分布式数据管理机制,以及大数据库管理的关键技术和流行的大数据库系统。第11~13章介绍当下流行的区块链分布式数据管理技术、AI赋能的数据管理技术以及分
《DevSecOps原理、核心技术与实战》以DevSecOps体系架构为基础,围绕GitOps开源生态,重点介绍DevSecOps平台建设和技术实现细节,从黄金管道、安全工具链、周边生态系统三个方面入手,为读者介绍各种安全工具与黄金管道的集成,以及基于黄金管道之上的安全自动化与安全运营。通过阅读本书,读者可以全面了解D
本书共分为4篇19章,外加2个附录。基础篇:对Python并发编程和高性能编程所涉概念解读详细解读,对Python3.x系列版本在高并发、高性能方面所做的概念进行简单分析。高并发篇:从原理、主要模块、协程、线程、锁、优先级、同步/异步、原子性和线程池等多个方面对Python实现高并发进行深度解读。高性能篇:从代码优化、