《机器学习开发方法、工具及应用》潘志松编|(epub+azw3+mobi+pdf)电子书下载

图书名称:《机器学习开发方法、工具及应用》

【作 者】潘志松编
【丛书名】高等院校人工智能系列十四五规划教材 人工智能应用丛书
【页 数】 307
【出版社】 北京:中国铁道出版社 , 2021.05
【ISBN号】978-7-113-27842-7
【价 格】49.80
【分 类】机器学习-高等学校-教材
【参考文献】 潘志松编. 机器学习开发方法、工具及应用. 北京:中国铁道出版社, 2021.05.

图书封面:

图书目录:

《机器学习开发方法、工具及应用》内容提要:

本书介绍机器学习开发方法,工具及应用相关知识,全书由6章组成,第1章主要介绍机器学习的基本概念、分类等;第2章主要介绍机器学习开发架构、开发步骤;第3章-第5章主要介绍机器学习的开发工具,包括Python、NumPy、Pandas、Scikit-learn、TensorFlow;第6章主要介绍机器学习相关的10个实验,包括线性回归、决策树、人工神经网络、卷积神经网络等。本书适合作为高等院校人工智能专业,计算机专业,智能机器人专业,智能芯片专业及其他智能相关专业课程教材,也可作为人工智能应用、开发人员的参考用书。

《机器学习开发方法、工具及应用》内容试读

第1章<

机器学习基础介绍

2016年,谷歌AlphaGo以4:1战胜围棋世界冠军、职业九段棋手李世石。从技术上来说,AlphaGo的算法结合了机器学习和树搜索技术,并使用了大量的人类、计算机的对弈来进行训练。AlphaGo的获胜不仅让机器学习、深度学习为人们所知,而且掀起了人工智能的“大众热”。机器学习一直是人工智能的核心研究领域之一,随着计算机技术向智能化、个性化方向发展,尤其是随着数据收集和存储设备的飞速升级,科学技术的各个领域都积累了大量的数据,利用计算机来对数据进行分析,成为绝大多数领域的共性需求。

本章介绍了人工智能的定义与学派,机器学习的定义、应用场景及分类,各种机器学习的方法,包括线性回归、决策树、支持向量机、朴素贝叶斯、神经网络、聚类、关联规则、降维、强化学习,最后简述了多种常见的评价指标。

●●●●●1.1机器学习简介●●●●●

机器学习是人工智能的重要分支,并逐渐成为推动人工智能发展的关键因素。因此,在探讨机器学习之前,需要先对人工智能有所了解。

1.人工智能概述

(1)人工智能的定义

人工智能(Artificial Intelligence,AI)是以实现人类智能为目标的一门学科,通过模拟的方法建立相应的模型,再以计算机为工具,建立一种系统以实现其目标。这种计算机系统具有近似人类智能的功能。

(2)人工智能的关键词

人工智能有三个关键词:人类智能、计算机、模拟。

①人类智能:当前人类所知的人类智能是人脑的思维活动,包括判断、学习、推理、联想、类比、顿悟、灵感等功能。此外还有很多尚未被发现的人类智能。

②计算机:当前,在人工智能中所使用的计算机包括了计算机网络,具有物联网功能和云计算能力,是一个分布式、并行操作的计算机系统。

③模拟:计算机模拟人类智能中的功能,构造出相应的模型,这些模型就是人类智

二机器学习开发方法、工具及应用

能的模拟,又称智能模型。

人工智能的智能模型仅是一种理论框架,它需要借助计算机,通过计算机中的数据结构、算法所编写而成的软件在一定的计算机平台上运行,从而实现模型的功能。

(3)人工智能的三个学派

从1956年正式提出人工智能学科算起,人工智能的研究发展已有60多年的历史。其间,不同学科背景的学者对人工智能做出了各自的理解,提出了不同的观点,由此产生了不同的学术流派。其中对人工智能研究影响较大的主要有三大学派:符号主义、连接主义和行为主义。

①符号主义(Symbolicism)。符号主义又称逻辑主义、心理学派或计算机学派,其主要思想是从人脑思维活动形式化表示角度研究探索人的思维活动规律。

符号主义学派认为人工智能源于数学逻辑。数学逻辑从19世纪末起获得迅速发展,到20世纪30年代开始用于描述智能行为。计算机出现后,又在计算机上实现了逻辑演绎系统。该学派认为人类认知和思维的基本单元是符号,而认知过程就是在符号表示上的一种运算。符号主义致力于用计算机的符号操作来模拟人的认知过程,实质就是模拟人的左脑抽象逻辑思维,通过研究人类认知系统的功能机理,用某种符号来描述人类的认知过程,并把这种符号输入到能处理符号的计算机中,从而模拟人类的认知过程,实现人工智能

在知识表示中的谓语逻辑词表示、产生式表示、知识图谱表示,以及基于这些知识表示的演绎性推理中,符号主义学派起到了关键性的指导作用。

②连接主义(Connectionism)。连接主义又称仿生学派或生理学派,其主要思想是从人脑神经生理学结构角度探索人类智能活动规律。

连接主义学派认为人工智能源于仿生学,特别是人脑模型的研究。并从神经生理学和认知科学的研究成果出发,把人的智能归结为人脑的高层活动的结果,强调智能活动是由大量简单的单元通过复杂的相互连接后并行运行的结果。人工神经网络是其典型代表性技术。

有关连接主义学派的研究工作早在人工智能出现前的20世纪40年代的仿生学理论中就有很多研究,并基于神经网络构造出了世界上首个人工神经网络模型

P(麦卡洛可-皮特斯)模型,自此之后,对此方面的研究成果不断出现。但在此阶段

由于受模型结构及计算机模拟技术等多种方面的限制而进展不大。20世纪80年代

Hopfield模型的出现以及相继的反向传播(Back Propagation,BP)模型的出现,使人工神经网络的研究又开始走上发展道路。

③行为主义(Actionism)。行为主义又称进化主义或控制论学派,其主要思想是从人脑智能活动所产生的外部表现行为角度研究探索人类智能活动规律。

行为主义学派认为行为是有机体用以适应环境变化的各种身体反应的组合,它的理论目标在于预见和控制行为。控制论把神经系统的工作原理与信息理论、控制理论、逻辑及计算机联系了起来。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,以及对自寻优、自适应、自校正、自镇定、自组织和自学习等控制论系统进行

2

【第1章机器学习基础介绍

研究,并进行“控制动物”的研制。到20世纪六七十年代,上述这些控制论系统的研究取得一定进展,并在80年代诞生了智能控制和智能机器人系统。

行为主义学派最典型的技术就是机器人,特别是智能机器人。在近期人工智能发展的新高潮中,机器人与机器学习、知识推理相结合组成的系统成为人工智能新的标志。

2.机器学习概述

机器学习(Machine Learning,ML)以连接主义学派为主,包含部分行为主义学派,是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。

(1)机器学习的定义

机器学习是一门多领域交叉学科,它涉及概率论、统计学、凸分析、算法复杂度理论等多门学科。机器学习对数据进行自动分析,获得规律,并利用规律对未知数据进行预测、分类等,主要使用归纳、综合方式而不是演绎方式。

机器学习的研究对象是多维向量空间的数据,它从不同类型的数据(数字、文本、图像、音频、视频)出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到数据的分析与预测中去。

(2)机器学习的发展历程

机器学习的发展历程大体可分为四个阶段。

第一阶段是在20世纪50年代中期到60年代中期,属于热烈时期。在这个时期,所研究的是“没有知识”的学习,即“无知”学习。其主要研究方法是不断修改系统的控制参数以改进系统的执行能力,不涉及与具体任务有关的知识。

第二阶段是在20世纪60年代中期到70年代中期,机器学习进入冷静阶段。本阶段的研究目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。机器能够采用符号来描述概念,并提出关于学习概念的各种假设。此外,神经网络学习因为理论缺陷未能达到预期效果,机器学习的研究转人低潮。

第三阶段是从20世纪70年代中期到80年代中期,称为复兴时期。在这个时期,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和各种学习方法。在这个阶段,人工智能找到了一个新的突破口,即知识工程及其应用一专家系统。知识工程是当时人工智能界所提出的一个新方向,它有完整的理论体系,并有系统的工程化开发方法。它与计算机紧密结合,依靠当时发达的计算机硬件与成熟的计算机软件及软件工程化开发思想,使人工智能走出了应用低谷。

当前机器学习研究状态处于第四阶段,始于20世纪80年代中期。机器学习综合应用了生物学、神经生理学、数学和计算机科学等学科形成了理论基础,成为一个独立的学科领域并快速发展。其融合了各种学习方法,且形式多样的集成学习系统研究正在兴起。

由于传统机器学习太单一,只能解决简单的问题,无法解决复杂问题,因此,机器学习引入了深度学习,并产生了人工智能新的发展。深度学习(Deep Learning,DL)的

3

气、机器学习开发方法、工具及应用

概念源于人工神经网络的研究。含多个隐藏层的多层感知机就是一种深度学习结构,它能根据大脑认知的规律,进行分层识别,从多层次的输入数据中学习更高层次的抽象特征。随着21世纪的到来,以“新计算能力+大数据+深度学习”的三驾马车方式为代表的新技术带来了人工智能新的崛起,以前众多陷于困境的应用因为这种新技术的应用而取得了突破性的发展。

(3)机器学习与人工智能和深度学习的关系

图1.1.1说明了机器学习与人工智能和深度学习的关系。

人工智能

皂期的人工剪能令人兴奋不已

机器学习

机器学习开始兴起

深度学习

深度学习取得突破驱动人工智能蓬勃发展

1950年1960年1970年1980年1990年2000年2010年2020年

图1.1.1机器学习与人工智能和深度学习的关系

由图1.1.1可知,人工智能、机器学习和深度学习是具有包含关系的几个应用领域,机器学习是人工智能的子领域,而深度学习则是机器学习的分支。机器学习是一种实现人工智能的重要手段。深度学习具有相对于其他典型机器学习方法更强大的能力和灵活性。在很多人工智能问题上,深度学习方法解决了传统机器学习方法面临的问题,促进了人工智能领域的发展

3.机器学习三要素

模型(Model)、策略(Strategy)、算法(Algorithm)是机器学习的三要素。

(1)模型

模型是机器学习的最终结果,即决策函数(x)或条件概率函数P(XY),它被用来预测特定问题下未知数据的输出结果。

(2)策略

策略是机器学习过程中挑选出参数最优模型的评价准则(Evaluation Criterion)。常以经验风险最小化作为标准,是一个参数优化的过程,通过构造一个损失函数来描述经验风险,如交叉嫡损失函数、平方损失函数等。

(3)算法

算法是指机器学习过程中具体学习出模型的方法,也就是如何求解全局最优解,

机器学习开发方法、工具及应用

程的统称,其包括图像获取、人脸分割、特征获取、匹配或识别等。人脸识别技术使用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列操作。

图1.2.1人脸识别

人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年代后期,并且以美国、德国和日本的技术实现为主。人脸识别系统成功的关键在于尖端的核心算法,并使识别结果具有实用化的识别率和识别速度。人脸识别系统集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。

当前,随着机器学习的不断发展,尤其是深度学习加上大数据训练,使人脸识别的性能取得了突破性进展。深度学习在人脸识别上的具体应用包括:基于卷积神经网络的人脸识别方法、深度非线性人脸形状提取方法、基于深度学习的人脸姿态稳健性建模、约束环境中的全自动人脸识别、基于深度学习的视频监控下的人脸识别等。其中,卷积神经网络的权值共享结构网络更类似于生物神经网络,该方法通过对人脸图像的局部感知、共享权重,以及在空间和时间上的降采样,挖掘局部数据包含的特征,优化模型结构,是第一个成功训练多层网络结构的学习算法。

2.自动驾驶

随着深度学习、机器学习及大数据云计算等技术的崛起,自动驾驶(见图1.2.2)》作为人工智能发展的一个重要方向,成为计算机行业发展和研究的重要领域。低级别自动驾驶技术以高级辅助驾驶技术为主走向成熟,自动驾驶技术参与者越来越多。自动驾驶与人们的生活息息相关,这使得它成为人们迫切想要实现及能够普遍使用到生活中的技术。

···试读结束···

阅读剩余
THE END