《Python机器学习实战 真实智能案例实践指南》(印)迪潘简·撒卡尔作;徐键,张善干,祁鹏宇,丁学文,肖阳,鲁辰,鲜思锐,柯振旭译|(epub+azw3+mobi+pdf)电子书下载

图书名称:《Python机器学习实战 真实智能案例实践指南》

【作 者】(印)迪潘简·撒卡尔作;徐键,张善干,祁鹏宇,丁学文,肖阳,鲁辰,鲜思锐,柯振旭译
【页 数】 467
【出版社】 北京:机械工业出版社 , 2021.05
【ISBN号】978-7-111-66973-9
【价 格】168.00
【分 类】机器学习-软件工具-程序设计
【参考文献】 (印)迪潘简·撒卡尔作;徐键,张善干,祁鹏宇,丁学文,肖阳,鲁辰,鲜思锐,柯振旭译. Python机器学习实战 真实智能案例实践指南. 北京:机械工业出版社, 2021.05.

图书封面:

图书目录:

《Python机器学习实战 真实智能案例实践指南》内容提要:

本书帮你掌握通过机器学习和深度学习来识别和解决复杂问题所需的基本技能。本书使用了流行的Python机器学习生态系统中的真实示例,将成为你在学习机器学习的艺术和科学并成为一名成功的从业者道路上的完美伴侣。本书中使用的概念、技术、工具、框架和方法将教会你如何成功思考、设计、构建和执行机器学习系统和项目,并利用这些知识解决一些来自不同领域的实际问题,包括零售、运输、电影、音乐、计算机视觉、艺术和金融。本书将教会你解决自己遇到的机器学习问题!本书适合人工智能、机器学习、深度学习相关行业的从业者和学习者阅读。

《Python机器学习实战 真实智能案例实践指南》内容试读

第1部分理解机器学习

第1章

机器学习基础

制造智能、有知觉和自我意识的机器的想法并不是在最近几年才突然出现的。事实上希腊神话的很多传说中都有关于智能机器和拥有自我意识和智慧的发明。计算机的起源和演变在几个世纪以来一直都是革命性的,从基本的算盘开始,到17世纪的计算尺再到19世纪由Charles Babbage(查尔斯·巴贝奇)设计的第一台通用计算机。事实上,从计算机由查尔斯·巴贝奇发明的分析引擎开始,到Ada Lovelace(阿达·洛芙莱斯)在1842年编写出第一个计算机程序,人们开始怀疑和思考,可能会有一天,计算机或机器会真正变得聪明,开始能够进行自我思考。事实上,著名的计算机科学家艾伦·图灵在理论计算机科学、算法和正式语言的发展方面具有很大的影响力,早在20世纪50年代就已经涉及人工智能和机器学习等概念。这里对机器学习演进的简要介绍,只是让你了解一下几个世纪以来一直存在的东西,但最近开始引起了很多关注

随着计算机运行速度越来越快、处理性能越来越好、计算能力越来越强,以及存储容量的增加,我们一直生活在所谓的“信息时代”或“数据时代”。现在每天都在使用数据科学、人工智能、数据挖掘和机器学习等概念和方法来处理大数据和构建智能系统。当然,你们中的大部分人一定听过我刚才提到的许多术语,并且遇到了类似“数据是新的石油”这样的说法。在过去十年中,企业和组织所面临的主要挑战是使用各种方法来理解它们拥有的所有数据,并从中获取有价值的信息和见解,以便做出更好的决策。事实上,随着技术

的巨大进步,包括廉价和大规模计算、硬件(包括GPU)和存储的可用性,人们已经看到

了围绕人工智能、机器学习和最近的深度学习等领域构建的一个蓬勃发展的生态系统。研究人员、开发人员、数据科学家和工程师正在夜以继日地研究和创建工具、框架、算法、技术和方法,以构建能够预测事件的智能模型和系统、自动完成任务、执行复杂的分析、检测异常、自愈失败,甚至理解和响应人类的输入。

本章采用结构化的形式来涵盖与机器学习相关的各种概念、方法和思想。核心思想是给你足够的背景,说明为什么需要机器学习,机器学习的基本组成部分,以及机器学习目前给我们提供了什么。这将使你能够了解如何最好地利用机器学习来从数据中获得最大的收益。由于这是一本关于实用机器学习的书,接下来将在后续的章节中重点讨论具体的用例、问题和真实案例研究,所以理解正式的定义、概念和基础对于学习算法、数据管理模型构建、评估和部署都是非常重要的。本书涵盖了所有这些方面,包括与数据挖掘和机器学习工作流相关的行业标准,以便为你提供一个基本框架,可用于处理和解决实际问题。

第1章

机器学习基础

除此之外,本书还涵盖了与机器学习相关的跨学科领域,这些领域实际上都是人工智能下的相关领域。

本书更侧重于应用或实用的机器学习,因此,大部分章节的重点将是应用机器学习技术和算法来解决实际问题,对于在基础数学、统计学和机器学习方面有一定熟悉程度的读

者是有益的。然而,本书考虑到不同读者的专业知识水平不同,本章和第I部分、第Ⅱ部

分将会让你加快了解机器学习和构建机器学习流程的关键知识。如果你已经熟悉机器学习的基本概念及其意义,便可以快速浏览本章,然后转到第2章,在那里会讨论用Python构建机器学习系统的好处,介绍解决机器学习问题的主要工具和框架。

本书着重强调通过使用大量的代码片段、示例和案例研究来进行学习。书中利用

Python3,并用相关代码文件(py)和Jupyter Notebook(.ipynb)来描述本书中所有的示例,以获得更好的交互体验。我们鼓励你参考本书的GitHub仓库https:/github.com/dipanjanS/practical-machine-learning-with-python,本书将分享与每一章相关的必要代码和数据集。当你浏览本书时,可以利用这个仓库来尝试所有的示例,也可以利用它们来解决实际问题。将来我们也会在这个GitHub仓库分享与机器学习和深度学习相关的额外内容,所以请持续关注!

1.1机器学习的需求

人类可能是目前这个星球上最先进、最聪明的物种。人类可以思考、推理、构建、评估和解决复杂的问题。人类的大脑仍然是我们自己还没有完全弄明白的东西,因此在某些方面,人工智能仍然无法超越人类智能。因此,你可能会想到一个紧迫的问题:为什么需要机器学习?有什么必要花时间和精力让机器学习变得智能呢?答案可以用一句话来概括:“在规模上以数据驱动决策”。本书将在下面的章节中详细解释这句话。

1.1.1数据驱动决策

从数据中获取关键信息或见解是企业和组织大量投资于优秀员工以及机器学习和人工智能等新范式和领域的关键原因。数据驱动决策的概念并不新鲜。在运营研究、统计和管理信息系统等领域已经存在了几十年,它们试图通过使用数据和分析来做出以数据驱动的决策,为任何企业或组织提高效率。利用数据获取可操作的见解并做出更好的决策的艺术和科学被称为数据驱动决策。当然,说起来容易做起来难,因为人们很少能直接使用原始数据来做出有见地的决策。而另一个方面,我们经常利用推理或直觉,试图根据在一段时间内和工作中所学到的东西做出决定。大脑是一个非常强大的组织,可以帮助我们做到这

一点。考虑一下这些场景,比如了解你的同事或朋友在说什么,从图像中识别人,决定是否批准或拒绝商业交易等。虽然人们可以几乎不自觉地解决这些问题,你能向某人解释你如何解决这些问题的过程吗?但也许过了一段时间,你会说,“嘿!我的大脑为我做了大部分的思考!”这就是为什么让机器学习解决某些问题是困难的,比如计算贷款利息或退税

3

Python机器学习实战:真实智能案例实践指南

等常规计算程序。解决无法编程的问题本质上需要一种不同的方法,人们使用数据本身来驱动决策,而不是使用可编程的逻辑、规则或代码来做出这些决策。本书将在以后的章节中进一步讨论这个问题。

1.1.2效率和规模

获取见解和由数据驱动的决策是至关重要的,但还需要以效率和规模来完成。使用机器学习或人工智能技术的关键思想是通过从数据中学习特定的模式来自动完成处理过程或任务。人们希望计算机或机器告诉我们一只股票什么时候可能会上涨或下跌,图像是计算机还是电视机,我们的产品摆放和价格是否是最合理的,确定购物价格趋势,在问题出现之前检测故障或中断,等等!虽然离不开人类的智慧和专业知识,但仍需要高效并大规模地解决现实世界问题。

一个现实世界中的规模问题

考虑以下现实问题。假设你是DSS公司世界级基础设施团队的经理,该团队为其他企

业和消费者提供基于云的基础设施和分析平台的数据科学服务。作为服务和基础设施的提供者,你希望你的基础设施是一流的,并且对于故障和中断是健壮的。假设从圣路易斯的

一个小办公室开始,你与10名有经验的员工组成团队,并且很好地掌握了如何监控所有的网络设备,包括路由器、交换机、防火墙和负载均衡等。很快你就在基于云的深度学习服

务和GPU开发方面取得了突破,并获得了巨大的利润。现在客户越来越多,是时候把基

地扩展到旧金山、纽约和波士顿了。你现在有一个巨大的连接基础设施,每个建筑里都有数百个网络设备!现在你将如何大规模地管理这些基础设施?你是否为每个办公室雇佣更多的人力,或者你是否试图利用机器学习来处理诸如故障预测、自动恢复和设备监控等任务?你可以试着从工程师和经理的角度思考这个问题。

1.1.3传统编程范式

计算机,虽然是非常复杂的设备,但是我们可以认为它是一个白痴盒子,而另一个众所周知的白痴盒子是电视机!你可能会很惊讶:怎么可能?在这一点上,这是一个很有意思的问题。让我们思考一台电视机,甚至是一种现在市面上所谓的智能电视机。无论是在理论上还是在实践中,电视机都会做你为它设定的任何事情。它将显示你想要查看的频道,记录你稍后想要查看的内容,并运行你想要的应用程序!计算机也是做同样的事情,但是方式不同。传统的编程范式基本上是让用户或程序员使用代码编写一组指令或操作,使计算机对数据执行特定的计算,以得到所需的结果。图1-1描述了传统编程范式的典型工作流程。

从图1-1中你可以得到,计算机的核心输入是数据和一个或多个程序,这些程序基本上是使用编程语言编写的,比如Java、Python等高级编程语言,或者C或汇编语言等低级编程语言。程序使计算机能够处理数据、执行计算和生成输出。在传统编程范式中,可以很好地完成计算年度税收的任务。

第1章

机器学习基础

数据

计算机

输出

程序

图1-1传统编程范式

现在,来考虑一下前面DSS公司所讨论的实际基础设施问题。你认为传统的编程方法

能解决这个问题吗?嗯,在某种程度上是可以的。我们可能能够访问设备数据、事件流和日志,并访问各种设备属性,如使用级别、信号强度、传入和传出连接、内存和处理器使用级别、错误日志和事件等。然后,可以使用团队中网络和基础设施专家的领域知识,并基于这些数据属性建立一些基于特定决策和规则的事件监控系统。这将为我们提供一种基于规则的反应性分析解决方案,使得可以在其中监视设备,观察是否发生任何特定的异常或中断,然后采取必要的行动迅速解决任何潜在的问题。我们可能还需要雇佣一些操作人员来持续监控和解决问题。然而,仍然存在一个紧迫的问题,即在故障或问题真正发生之前,尽量避免出现更多的故障。机器学习能在某种程度上帮助我们吗?

1.1.4为什么是机器学习

现在开始讨论为什么需要机器学习的问题。考虑到你到目前为止学到的知识,尽管传统的编程范式相当不错,而且人工智能和领域专家肯定是做出数据驱动决策的一个重要因素,但仍然需要机器学习来更快更好地做出决策。机器学习范式试图考虑数据和预期的输出或结果(如果有的话),并使用计算机构建程序,也称为模型。这个程序或模型可以在将来用于做出必要的决策,并从新的输入中给出预期的输出。图1-2显示了机器学习范式与传统编程范式的相似之处。

数据

计算机

模型

(程序)

输出

(可选)

图1-2机器学习范式

5

Python机器学习实战:真实智能案例实践指南

图1-2强化了如下事实,在机器学习范式中,计算机试图使用输入数据和预期输出来学习固有模式的数据,并最终构建一个类似于计算机程序的模型,这将有助于在以后对新的输人数据点,利用从之前的数据点(知识或经验)中所学的知识进行数据驱动决策。你可能会从中受益。我们不需要手工编码的规则、复杂的流程图、案例和fthn条件,以及通常用于构建任何决策系统或决策支持系统的其他标准。基本思想是使用机器学习来做出有见地的决定。

当讨论为DSS公司管理基础设施的现实问题时,这一点就会更加清晰。在传统的编程

方法中,讨论了雇佣新员工、建立基于规则的监控系统等。如果在这里使用机器学习范式可以使用如下步骤来解决问题。

·利用设备数据和日志,并确保在某些数据存储(数据库、日志或平面文件)中有足够的历史数据

·确定可能对构建模型有用的关键数据属性。这可能是设备利用率、日志、内存、处理器、连接、线路强度、链接等。

·观察和捕获不同时间段的设备属性及其行为,包括正常的设备行为和异常的设备行为或者中断。这些结果将是你的输出,设备数据将是你的输人

·将这些输入和输出对输入到任何特定的机器学习算法中,并建立一个模型,学习内在的设备模式和观察相应的输出或结果。

·部署模型,对于设备属性的最新值,可以预测特定设备是否运行正常,或者可能导致故障

一旦你能够构建一个机器学习模型,便可以轻松地部署,并围绕它建立一个智能系统,这样不仅可以被动地监控设备,同时能够主动识别潜在的问题,甚至在出现任何问题之前修复它们。想象构建一个自愈系统,并进行24小时的设备监控。这种可能性总是存在的,你不必在每次扩建办公室或购买新的基础设施时都需要雇佣新员工

当然,前面讨论的工作流程与构建机器学习模型所需的一系列步骤相比,机器学习要复杂得多,但这只是强调,并使你在概念上而不是技术上更多地思考范式如何在机器学习处理中进行迁移,同时你也需要改变你的思想,从基于传统的方法向基于数据驱动的方法进行转变。机器学习的美妙之处在于它不受领域限制,你可以使用技术来解决跨越多个领域、业务和行业的问题。同样,如图1-2所示,你不会总是需要输出数据点来构建模型;有时输入数据不足(或者更确切地说,输出数据可能不存在)更适合无监督学习。一个简单的例子是,通过查看顾客在商店里通常购买的杂货物品,根据过去的交易数据来确定他们的购物模式。在下一节中将深人了解机器学习。

1.2理解机器学习

到目前为止,你已经看到了如何使用机器学习来解决一个典型的现实问题。除此之外,你还很好地掌握了传统编程和机器学习范式的基础知识。在本节中,将更详细地讨论机器学习。更具体地说,本节将从概念和特定领域的角度来看待机器学习。在20世纪90年代,

当研究人员和科学家开始把机器学习作为人工智能(AI)的一个子领域时,它便成名了。

6

···试读结束···

阅读剩余
THE END