《Python机器学习算法及典型案例实战》汪洪桥|(epub+azw3+mobi+pdf)电子书下载

图书名称:《Python机器学习算法及典型案例实战》

【作 者】汪洪桥
【丛书名】高等学校“十四五”规划教材
【页 数】 210
【出版社】 西安:西北工业大学出版社 , 2021.03
【ISBN号】978-7-5612-7174-2
【参考文献】 汪洪桥. Python机器学习算法及典型案例实战. 西安:西北工业大学出版社, 2021.03.

图书目录:

《Python机器学习算法及典型案例实战》内容提要:

本书全面介绍了统计机器学习和典型深度学习算法,包括监督学习-分类算法、监督学习-回归算法、非监督学习-聚类算法、特征处理方法、模型选择、卷积神经网络、自动编码器、目标检测算法、生成对抗网络等算法的基本理论,还包括机器学习的基本概念、产生、发展和机器学习模型、机器学习的Python编程环境等内容。

《Python机器学习算法及典型案例实战》内容试读

第1章机器学习概述

从较宽泛的角度理解,智能可以被认为是知识与智力的总和。其中知识是一切智能行为的基础,智力是获取知识并运用知识求解问题的能力,这些能力包括感知能力、记忆与思维能力、学习能力、自适应能力以及行为能力,其中的学习能力是智能体具有智能并不断扩展智能的重要保证。机器能否具有类似人的学习能力,逐渐成长为智能机器,并且不断积累知识并拓展自身的智能呢?这是早期人工智能、机器学习研究者自然而然的疑问,也是人工智能发展的直接推动力。

1.1机器学习的产生与发展

人工智能更直接的称谓应该是机器智能。最早提出机器智能设想的是计算机科学之父阿兰·图灵(Alan Turing),他于l950年在《思想》(Mind)杂志上发表了一篇题为“计算的机器和智能”的论文。在该论文中,图灵并没有提出研究方法,而是提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断与自己交流的对象是人还是机器,就说明这个机器有智能了,这种方法被后人称为图灵测试(Turing Test)。现代人工智能起源于美国1956年夏季的达特茅斯会议,这次专题研讨会的主题就是“用机器模拟人类智能”。当时人们对人工智能的认识也相对粗浅,认为“人工智能就是让机器的行为看起来就像是人所表现出的智能行为一样”。也就是从这一时刻开始,人们将“人工智能”与“机器智能”对应了起来,在很多场合都不严加区分。另外,关于机器的自我学习,还有一个更直观的事例。在达特茅斯会议上,一个叫阿瑟·萨缪尔的学者研制了一款跳棋程序,该程序具有自主学习功能,可总结提高。1959年这个跳棋程序就打败了设计者本人。3年后,该程序已可击败美国一个州的冠军,这其实也是机器学习的雏形了。

随着人工智能研究在定理证明、机器翻译等领域遇到瓶颈,很多当初被认为很有前景的任务都失败了,机器智能将很快超越人类智能的目标也落空了。经历短暂挫折之后,20世纪70年代中后期,以爱德华·费根鲍姆为首的人工智能研究者们痛定思痛后发现,传统人工智能之所以会陷入僵局,就是因为他们过于强调通用求解方法的作用,忽略了具体的知识。仔细思考人类求解过程就会发现,知识无时无刻不在起着重要作用。因此,他们高举“知识就是力量”的大旗宣布:人工智能必须引入知识。这一发现直接推动了专家系统这一实用主义人工智能系统的迅速发展和广泛应用。但是,好景不长,在专家系统、知识工程获得大量的实践经验后,弊端开始逐渐显现了出来,即机器如何获得大量知识的输入,而这样的输入工作都是由人来完成的,是极其费时费力的,因而专家系统性能的提升受到了限制。那么能否摆脱这种填鸭式的学

Python机器学习算法及典型案例实战

习方式,让机器自己学习、自己获取知识呢?这一动机直接推动了机器学习在后续二十多年的发展,也使人工智能学科发生重大转变,分化成符号主义、连接主义和行为主义三大不同学派。其中的连接主义学派,典型理论和应用技术包括传统神经网络、以支持向量机为核心的统计机器学习以及当前研究火热的深度学习。这些理论和技术都属于数据驱动的机器学习范畴,也代表了当前机器学习的主流。

1.1.1机器学习的定义

学习是人类具有的一种重要智能行为,而学习能力是智能行为的一个非常重要的特征。但究竟什么是学习,长期以来众说纷纭。社会学家、逻辑学家和心理学家都各有其不同的看法。按照人工智能大师西蒙的观点,学习就是系统在不断重复的工作中使自身能力得到增强或者改进,使得系统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高。西蒙对学习的定义本身,就说明了学习的重要作用。

机器能否像人类一样具有学习能力呢?阿瑟·萨缪尔的跳棋程序向人们展示了机器学习的能力,也提出了许多令人深思的社会问题与哲学问题,这就是机器的能力是否能超过人的能力?很多持否定意见的人的一个主要论据是:机器是人造的,其性能和动作完全是由设计者规定的,因此无论如何其能力也不会超过设计者本人。这种意见对不具备学习能力的机器来说的确是对的,可是对具备学习能力的机器就值得考虑了,因为这种机器的能力在应用中不断地提高,过一段时间之后,设计者本人也不知它的能力到了何种水平。

什么叫做机器学习(Machine Learning)?人们曾给出各种定义,但是,直至今日,“机器学习”还没有一个公认的和准确的定义。H.A.Simon认为,学习是系统所做的适应性变化,使得系统在下一次完成同样或类似的任务时更为有效。R.S.Michalski认为,学习是构造或修改对于所经历事物的表示。从事专家系统研制的人们则认为,学习是知识的获取。这些观点各有侧重,第一种观点强调学习的外部行为效果,第二种则强调学习的内部过程,而第三种主要是从知识工程的实用性角度出发的。为了便于进行讨论和估计学科的进展,有必要对机器学习进行定义,即使这种定义是不完全的和不充分的。顾名思义,机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。这里所说的“机器”,指的就是计算机;现在是电子计算机,以后还可能是中子计算机、光子计算机或神经计算机等等。如果上升到系统的高度,机器学习是通过经验提高系统自身的性能的过程(系统自我改进)。当前,机器学习是人工智能的核心研究领域之一,也是现代智能系统的关键环节和瓶颈。很难想象一个没有学习功能的系统能被称为具有智能的系统

1.1.2机器学习的研究意义

机器学习是关于理解与研究学习的内在机制、建立能够通过学习自动提高自身水平的计算机程序的理论方法的学科。近年来,机器学习理论在诸多应用领域得到了成功的应用与发展,已成为计算机科学的基础及热点之一。采用机器学习方法的计算机程序被成功应用于机器人下棋程序、语音识别、信用卡欺诈监测、车辆自主驾驶以及智能机器人等领域,除此之外,机器学习的理论方法还被用于大数据集的数据挖掘这一领域。实际上,在任何有经验可以积累的领域,机器学习方法均可发挥作用。

2

第1章机器学习概述

机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。现有的计算机系统和人工智能系统没有学习能力,至多也只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。对机器学习的讨论和机器学习研究的进展,必将促使人工智能和整个科学技术的进一步发展。

1.1.3机器学习的发展史

机器学习是人工智能研究领域较为年轻的分支,它的发展其实是伴随着人工智能的发展,发展历程大体上可分为4个阶段。

1)20世纪50年代中叶至60年代中叶,属于热烈时期;2)60年代中叶至70年代中叶,称为机器学习的冷静时期;3)70年代中叶至80年代中叶,称为复兴时期:

4)始于1986年,人工神经网络、支持向量机等数据驱动机器学习方法的兴起和成功应用,包括当前似乎无所不能的深度学习,代表着机器学习的最新阶段。

机器学习进入新阶段,主要表现在以下方面。

1)机器学习已成为新的交叉学科并在高校形成一门课程。它综合应用心理学、生物学、神经生理学、数学、自动化和计算机科学,形成机器学习理论基础;

2)机器学习理论方法层出不穷。强化学习、迁移学习、在线学习等新的机器学习理论形式不断出现:结合各种学习方法,取长补短的集成学习系统研究正在兴起;

3)机器学习与人工智能各种基础问题的统一性观点正在形成。例如,学习与问题求解结合进行、深度神经网络中间层特征描述与知识表达的结合、类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向:

4)各种学习方法的应用范围不断扩大并已形成商品。如采用深度学习的自然语言理解产品已被广泛商用,运用自我学习的机器人产品性能不断提升;

5)与机器学习有关的学术活动空前活跃。与机器学习相关的国际会议已成为计算机、人工智能等行业领域的标杆,代表了空前的学术影响力,指引着机器学习新的研究方向。

1.1.4机器学习分类

1.1.4.1基于学习策略的分类

学习策略是指学习过程中系统所采用的推理策略。一个学习系统总是由学习和环境两部分组成。由环境(如书本或教师)提供信息,学习部分则实现信息转换,用学生能够理解的形式记忆下来,并从中获取有用的信息。在学习过程中,学生(学习部分)使用的推理越少,他对教师(环境)的依赖就越大,教师的负担也就越重。学习策略的分类标准就是根据学生实现信息转换所需的推理多少和难易程度来分类的,根据从简单到复杂、从少到多的次序分为以下6种基本类型。

(1)机械学习(Rote Learning)

学习者无需任何推理或其他的知识转换,直接吸取环境所提供的信息,如塞缪尔的跳棋程

序、纽厄尔和西蒙的LT系统。这类学习系统主要考虑的是如何索引存储的知识并加以利用。

系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不做任何工作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不做任何的推理。

—3

第1章机器学习概述

(2)决策树

用决策树来划分物体的类属,树中每一内部节点对应一个物体属性,而每一边对应于这些属性的可选值,树的叶节点则对应于物体的每个基本分类。

(3)形式文法

在识别一个特定语言的学习过程中,通过对该语言的一系列表达式进行归纳,形成该语言的形式文法。

(4)产生式规则

产生式规则表示为条件一动作对,已被极为广泛地使用。学习系统中的学习行为主要是生成、泛化、特化(Specialization)或合成产生式规则。

(5)形式逻辑表达式

形式逻辑表达式的基本成分是命题、谓词、变量、约束变量范围的语句及嵌入的逻辑表达式。

(6)图和网络

一些系统采用图匹配和图转换方案来有效地比较和索引知识。

(7)框架和模式(Schema)

每个框架包含一组槽,用于描述事物(概念和个体)的各个方面。

(8)计算机程序和其他的过程编码

获取这种形式的知识,目的在于获得一种能实现特定过程的能力,而不是为了推断该过程的内部结构

(9)神经网络

神经网络主要用在联接学习中。学习所获取的知识,最后归纳为一个神经网络。(10)多种表示形式的组合

有时一个学习系统中获取的知识需要综合应用上述几种知识表示形式。

根据表示的精细程度,可将知识表示形式分为两大类:泛化程度高的粗粒度符号表示类和泛化程度低的精粒度亚符号(Sub-Symbolic)表示类。如决策树、形式文法、产生式规则、形式逻辑表达式、框架和模式等属于符号表示类;代数表达式参数、图和网络、神经网络等则属于亚符号表示类。

1.1.4.3按应用领域分类

目前最主要的应用领域有专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图像识别、故障诊断、自然语言理解、机器人和博弈等。

从机器学习的执行部分所反映的任务类型上看,目前大部分的应用研究领域基本上集中于以下两个范畴:分类和问题求解。

分类任务要求系统依据已知的分类知识对输人的未知模式(该模式的描述)进行分析,以确定输入模式的类属。相应的学习目标就是学习用于分类的准则(如分类规则)。

问题求解任务要求对于给定的目标状态,寻找一个将当前状态转换为目标状态的动作序列:机器学习在这一领域的研究工作大部分集中于通过学习来获取能提高问题求解效率的知识(如搜索控制知识、启发式知识等)。

1.1.4.4按学习方式分类

根据学习方式的不同,现代机器学习方法可分为以下几类。

-5

Python机器学习算法及典型案例实战

(l)监督学习(Supervised Learning)

监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。

(2)非监督学习(Unsupervised Learning)

非监督学习是指所有样本的类别都是未知的,算法通过数据特征自动产生类别属性。

(3)半监督学习(Semi-supervised Learning)

半监督学习介于监督学习和非监督学习之间,所需样本既包括已知类别样本,又包括未知类别样本,通过挖掘未知类别样本中所蕴涵的固有结构信息,对已知类别样本可能因代表性不好而造成的拟合分类器有偏差的情况进行校正。

(4)集成学习(Ensemble Learning)

集成学习是综合多个同构或异构学习机,对同一个问题进行学习,进而提高分类器的泛化能力。

1.2机器学习模型及典型问题求解

1.2.1机器学习模型

机器学习的目的是根据给定的训练样本,对某系统输入、输出之间的依赖关系进行估计,使它(这种关系)能够对未知输出作出尽可能准确的预测。作为人工智能的一个重要研究领域,机器学习的研究工作主要围绕学习机理、学习方法和面向任务这三个基本方面进行研究。典型的机器学习问题包括函数拟合(回归估计)、模式分类和概率密度估计等。

机器学习到底需要完成什么任务呢?我们以图1.1所示的一个直观任务图来描述。令

W是给定世界的有限或无限所有对象的集合,由于观察能力的限制,我们只能获得这个世界

的一个有限的子集Q,称为样本集。这里机器学习就是根据这个有限样本集合Q推算这个世

界的模型,使得其对这个世界描述为真。

泛化

模型

Q

(Model)

建模

图1.1机器学习的任务图

当然,要完成这样的任务,还必须具备三个要素。

1.2.1.1一致性假设

一致性假设是机器学习的必要条件,对应到图1.1中,这里需要假设世界W与样本集Q

具有某种相同的性质。原则上,存在各种各样的一致性假设。在统计意义下,一般假设:①W

与Q同分布:②给定世界W的所有对象独立同分布。

1.2.1.2样本空间划分

样本空间划分决定了模型对样本集合的有效性。将样本放到一个维空间,能够寻找一

6

···试读结束···

阅读剩余
THE END