《基于Spark的下一代机器学习 XGBoost、LightGBM、Spark NLP与Keras分布式深度学习实例》(美)布奇·昆托(Butch Quinto)著|(epub+azw3+mobi+pdf)电子书下载

图书名称:《基于Spark的下一代机器学习 XGBoost、LightGBM、Spark NLP与Keras分布式深度学习实例》

【作 者】(美)布奇·昆托(Butch Quinto)著
【丛书名】智能系统与技术丛书
【页 数】 286
【出版社】 北京:机械工业出版社 , 2021.05
【ISBN号】978-7-111-68125-0
【分 类】数据处理软件
【参考文献】 (美)布奇·昆托(Butch Quinto)著. 基于Spark的下一代机器学习 XGBoost、LightGBM、Spark NLP与Keras分布式深度学习实例. 北京:机械工业出版社, 2021.05.

图书封面:

图书目录:

《基于Spark的下一代机器学习 XGBoost、LightGBM、Spark NLP与Keras分布式深度学习实例》内容提要:

本书先简单介绍了Spark和SparkMLlib,然后介绍标准SparkMLlib库之外的更强大的第三方机器学习算法和库。通过阅读本书,你将能够通过几十个实际的例子和深刻的解释,将所学到的知识应用到真实世界的用例。

《基于Spark的下一代机器学习 XGBoost、LightGBM、Spark NLP与Keras分布式深度学习实例》内容试读

CHAPTER I

第1章

机器学习介绍

我可以向你展示常见的观,点。但是事实上,不断探索新的观,点才会更美好。

—Geoffrey Hinton1

机器学习(ML)是人工智能的一个分支,是制造智能机器的科学和工程☒。

Arthur Samuel是人工智能的先驱之一,他将机器学习定义为“使计算机能够在没有明确编程的情况下进行学习的研究领域”。图1-1展示了人工智能、机器学习和深度学习之间的关系。人工智能还涵盖其他领域,这意味着虽然所有的机器学习都是人工智能,但并非所有的人工智能都是机器学习。人工智能的另一个分支符号主义人工智能是20世纪大部分时间人工智能研究的主要方向。符号主义人工智能实现被称为专家系统或知识图谱,本质上是规则引擎,使用if-then语句通过演绎推理得出逻辑结论。可以想象,符号主义人工智能有几个关键的局限性,其中最主要的一个局限是,一旦在规则引擎中定义了规则,修改规则会非常麻烦。添加更多的规则会增加规则引擎中的知识,但它不能更改现有的知识向。相较而言,机器学习模型更加灵活。它们可以根据新的数据再进行训练,以学习新的知识或修改现有的知识。某种意义上符号主义人工智能还涉及人工干预。它依赖于人类的知识,需要人类在规则引擎中硬编码规则。另一方面,机器学习更具动态性,从输入数据中学习和识别模式,产生所需的输出。

2基于Spark的下一代机器学习

人工智能

早期的人工智能开始蓬勃发展

机器学习

对机器学习的投入和兴趣开始增长

深度学习

深度神经网络和快速的GPU

推动了前所未有的人工智能繁荣和兴趣

20世纪20世纪20世纪20世纪20世纪

21世纪

21世纪

50年代60年代70年代80年代90年代

00年代

10年代

图11人工智能、机器学习和深度学习之间的关系回

20世纪中期,深度学习的复苏使人们重新关注人工智能和机器学习之间的联系。

深度学习的复苏、高速图形处理单元(GPU)的可用性、大数据的出现,以及谷歌、

Facebook、亚马逊、微软和IBM等公司的投资,造就了人工智能复兴的风潮。

1.1人工智能和机器学习用例

在过去的10年里,机器学习取得了一系列惊人的进步。这些突破正在作用于我们的日常生活,并对你能想到的每一个方向产生影响。这绝不是机器学习用例的所有内容,但是它给每个正在发生创新变革的行业提供了很多方向。

1.1.1零售业

零售业是最先从机器学习中获益的行业之一。多年来,在线购物网站一直依靠协作和基于内容的过滤算法来实现个性化购物体验。在线推荐和高度定向营销活动为零售商带来数百万甚至数十亿的收入。亚马逊是机器学习支持的在线推荐和个性化的典范,是因应用机器学习而最受欢迎的(也是最成功的)在线零售商之一。根据

第1章机器学习介绍3

麦肯锡的一项研究,亚马逊35%的收人来自它的推荐引擎口。零售业的其他机器学习应用还包括货架空间规划、平面图优化、定向市场营销、客户细分和需求预测。

1.1.2交通运输

几乎每一个主要的汽车制造商都在研究由深度神经网络驱动的人工智能自动驾

驶汽车。这些汽车配备了支持GPU的计算机,每秒可处理最高超过100万亿次的操

作,用于实时人工智能感知、导航和路径规划。UPS和FedEx等交通运输和物流公司使用机器学习进行路线和燃料优化、车队监控、预防性维护、行程时间估计和智能地理围栏。

1.1.3金融服务

预测客户生命周期价值(CLV)、信用风险预测和欺诈检测是一些关键金融服务

领域的机器学习用例。对冲基金和投行使用机器学习分析来自Twitter Firehose的数据,以发现可能会影响市场的推文。其他常见的金融服务机器学习用例包括预测下

一个最佳行动、客户流失预测、情感分析和多渠道营销归属等。

1.1.4医疗保健和生物技术

医疗保健是人工智能和机器学习研究与应用的关键领域。医院和医疗保健创业公司正在使用人工智能和机器学习来帮助准确诊断威胁生命的疾病,如心脏病、癌症和肺结核。人工智能驱动的药物发现以及成像和诊断是人工智能最具代表性的领域。人工智能也正在彻底改变生物技术和基因组学研究的方式,激发在路径分析、微阵列分析、基因预测和功能注释等方面的创新。

1.1.5制造业

具有前瞻性的制造商正在使用深度学习进行质量检查,以检测硬件产品上的裂纹、不均匀边缘和划痕等缺陷。多年来,制造业和工业工程师一直使用生存分析来

···试读结束···

阅读剩余
THE END