《智能系统与技术丛书深入浅出Embedding 原理解析与应用实践》吴茂贵，王红星作|(epub+azw3+mobi+pdf)电子书下载

唐小刚

2022-5-4

好书推荐

图书名称：《智能系统与技术丛书深入浅出Embedding 原理解析与应用实践》

【作　者】吴茂贵，王红星作

【丛书名】智能系统与技术丛书

【页数】 308

【出版社】北京：机械工业出版社 , 2021.06

【ISBN号】978-7-111-68064-2

【分类】人工神经网络-研究

【参考文献】吴茂贵，王红星作. 智能系统与技术丛书深入浅出Embedding 原理解析与应用实践. 北京：机械工业出版社, 2021.06.

图书封面：

智能系统与技术丛书深入浅出Embedding 原理解析与应用实践

图书目录：

智能系统与技术丛书深入浅出Embedding 原理解析与应用实践

《智能系统与技术丛书深入浅出Embedding 原理解析与应用实践》内容提要：

这是一本系统、全面、理论与实践相结合的Embedding技术指南，由资深的AI技术专家和高级数据科学家撰写，得到了黄铁军、韦青、张峥、周明等中国人工智能领域的领军人物的一致好评和推荐。在内容方面，本书理论与实操兼顾，一方面系统讲解了Embedding的基础、技术、原理、方法和性能优化，一方面详细列举和分析了Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践；在写作方式上，秉承复杂问题简单化的原则，尽量避免复杂的数学公式，尽量采用可视化的表达方式，旨在降低本书的学习门槛，让读者能看得完、学得会。全书一共16章，分为两个部分：第1部分（第1-9章）Embedding理论知识主要讲解Embedding的基础知识、原理以及如何让Embedding落地的相关技术，如TensorFlow和PyTorch中的Embedding层、CNN算法、RNN算法、迁移学习方法等，重点介绍了Transformer和基于它的GPT、BERT预训练模型及BERT的多种改进版本等。第二部分（第10-16章）Embedding应用实例通过6个实例介绍了Embedding及相关技术的实际应用，包括如何使用Embedding提升传统机器学习性，如何把Embedding技术应用到推荐系统中，如何使用Embedding技术提升NLP模型的性能等。

《智能系统与技术丛书深入浅出Embedding 原理解析与应用实践》内容试读

■■■■面■■■■

■■■■■■

第一部分6

Embedding基础知识

■第1章万物皆可嵌入

■第2章获取Embedding的方法■第3章计算机视觉处理■第4章文本及序列处理

·第5章注意力机制

■第6章从Word Embedding到ELMo■第7章从ELMo到BERT和GPT

■第8章BERT的优化方法

■第9章推荐系统

:■后■■■■司量■■■■■■■■■■面■面■■■国■量■

■

■■

四磨

Chocr1第1章

万物皆可嵌入

近些年在机器学习、深度学习等领域，嵌入(Embedding)技术可谓发展迅猛、遍地开花。那么，嵌入是什么？嵌入为何能引起大家的极大关注？嵌入有哪些新进展？接下来会对这些问题进行说明。

简单来说，嵌人是用向量表示一个物体，这个物体可以是一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影等，可以说嵌入涉及机器学习、深度学习的绝大部分对象。这些对象是机器学习和深度学习中最基本、最常用、最重要的对象，正因如此，如何有效表示、学习这些对象就显得非常重要。尤其word2vec这样的Word

Embedding的广泛应用，更是带来了更大范围的延伸和拓展，嵌入技术由最初的自然语言处理领域向传统机器学习、搜索排序、推荐、知识图谱等领域延伸，具体表现为由Wod

Embedding向Item Embedding、Graph Embedding、Categorical variables Embedding等方向延伸。

Embedding本身也在不断更新，由最初表现单一的静态向表现更丰富的动态延伸和拓展。具体表现为由静态的Word Embedding向ELMo、Transformer、GPT、BERT、XLNet、

ALBERT等动态的预训练模型延伸。

上面介绍了近几年出现的一些英文热词，那么，这些词语具体表示什么含义？功能是什么？如何使用？这就是本书接下来要介绍的主要内容。本章主要涉及如下内容：

口处理序列问题的一般步骤▣Word Embedding▣Item Embedding

口用Embedding处理分类特征▣Graph Embedding

第1章万物皆可嵌入◆3

Contextual Word Embedding

口使用Word Embedding实现中文自动摘要

1.1处理序列问题的一般步骤

序列问题是非常常见的，如自然语言处理、网页浏览、时间序列等都与序列密不可分。因此，如何处理序列问题、如何挖掘序列中隐含的规则和逻辑非常重要

以自然语言处理为例。假设你拿到一篇较长文章或新闻报道之类的语言材料，要求用

自然语言处理(NLP)方法提炼出该材料的摘要信息，你该如何处理？需要考虑哪些内容？

涉及哪些步骤？先从哪一步开始？

拿到一份语言材料后，不管是中文还是英文，首先需要做一些必要的清理工作，如清理特殊符号、格式转换、过滤停用词等，然后进行分词、索引化，再利用相关模型或算法把单词、词等标识符向量化，最后输出给下游任务，具体处理步骤如图1-1所示。

特征工程

分词工具

清理

Jieba

格式化

哈工大分词器

过滤停用词

序列或

NLTK

语料

预处理

分词

下游任务

《智能系统与技术丛书 深入浅出Embedding 原理解析与应用实践》吴茂贵，王红星作|(epub+azw3+mobi+pdf)电子书下载

图书名称：《智能系统与技术丛书 深入浅出Embedding 原理解析与应用实践》