《智能搜索和推荐系统原理、算法与应用》刘宇著|(epub+azw3+mobi+pdf)电子书下载

毕勇

2022-10-17

好书推荐

图书名称：《智能搜索和推荐系统原理、算法与应用》

【作　者】刘宇著

【丛书名】智能系统与技术丛书

【页数】 257

【出版社】北京：机械工业出版社 , 2021.01

【ISBN号】978-7-111-67067-4

【分类】搜索引擎-程序设计

【参考文献】刘宇著. 智能搜索和推荐系统原理、算法与应用. 北京：机械工业出版社, 2021.01.

图书封面：

智能搜索和推荐系统原理、算法与应用

图书目录：

智能搜索和推荐系统原理、算法与应用

《智能搜索和推荐系统原理、算法与应用》内容提要：

本书分为4大部分。第一部分（第1-3章）：搜索推荐系统的基础。首先介绍数学与统计学是现代机器学习理论的基础；其次介绍搜索推荐系统的常识；最后，描述知识图谱相关基础理论。第二部分（第4-6章）：搜索系统的基本原理。主要内容包括：搜索系统框架及原理、主要算法以及搜索系统相关评价指标。第三部分（第7-9章）：推荐系统的基本原理。主要内容包括：推荐系统框架及原理、主要算法以及推荐系统相关评价指标。第四部分（第10-12章）：应用。首先介绍三种常见的搜索引擎工具；其次讲述搜索引擎和推荐系统两个方向的应用。

《智能搜索和推荐系统原理、算法与应用》内容试读

■■■■■■■■■■■■■■■■■

第一部分d/

，。。。

搜索和推荐系统的基础

·第1章概率统计与应用数学基础知识

·第2章搜索系统和推荐系统常识■第3章知识图谱相关理论

面■图■■■层■■画

题题

Chcptei1第1章

概率统计与应用数学基础知识

搜索和推荐作为算法领域相对成熟的两个应用方向，主要应用于机器学习和自然语言处理。机器学习和自然语言处理都会用到很多应用数学的知识，特别是概率与统计的一些基础知识。

本章将简要介绍概率统计和应用数学的基础知识，以便读者对其相关知识点的掌握。已经了解概率统计和应用数学基础知识的读者，可以将本章作为复习模块，也可以直接跳过阅读后面的内容。

1.1概率论基础

概率论是机器学习中重要的基础知识。下面介绍一些与本书相关的概率论知识。

1.1.1概率定义

概率是对一个事件将要发生的可能性的一种测度。概率值在0到1之间，0代表不可能发生，1代表确定发生。事件的概率值越高，它发生的可能性就越大。

假设概率值P为某个事件A发生的概率，记作P(A),(2,F,P)为一个测度空间，其中

Q表示样本空间，F表示事件空间，那么满足以下公理。

公理1：事件的概率是一个非负实数，且P(A)∈R,即P(A)≥0，A∈F。

公理2：样本空间集合的概率值为1，即P(2)=1。

公理3：任意可数的无交集的事件序列A,A2,…，满足如下条件：

-P)

第1章概率统计与应用数学基础知识5

概率是多少？

解：P(A,B,C)=P(A)×P(B)×P(C)=1111

101010010000

例2：假设一个女孩天生聪明的概率是P(A)=1/10,聪明的女孩子学习机器学习的概

率是P(B4)=1/1000,一个人学习机器学习的概率是P(B)=1/100,求一个学机器学习是聪

明女孩的概率是多少？

解：P(4AB)=P4)×P(BA)/P(B)=10×1OO0÷1O0=·

1.1.2随机变量

前文讲到的概率在许多概率模型中的试验结果是数值化的，也有一些例子中的试验结果不是数值化的，但是这些试验结果是与某些数值相关联的。比如在传输信号试验中，传输信号所需要的时间，接收到的信号中发生错误的次数，传输信号的延迟，等等，这些事件发生的概率可以用随机变量表示。

随机变量可以随机地取不同的值，取值可以是离散的，也可以是连续的。随机变量更像是一种函数，可以表示随机试验中所有可能的输出结果，如图1-1所示。

样本空间

图1-1随机变量

随机变量可以分为离散型随机变量和连续型随机变量。

离散型随机变量：如果随机变量为有限可列举的数值：x,x2,x,我们称之为离散型

随机变量。

连续型随机变量：如果随机变量X可以取实数数轴上的某个区间内的任意值，我们称

之为连续型随机变量。

1.1.3基础的概率分布

很多基础的概率分布在机器学习和深度学习领域很有用，这些概率分布也是其他复杂分布的基础。下面我们学习几种基础的概率分布。

6“◆。第一部分搜索和推荐系统的基础

1)0-1分布：P(X=)=p(1-p)l,k=0,1

其中，p为k=1时的概率(0

<1)。假设一个试验事件发生的概率为p,不发生的概率为1-p,任何一个只有两种结果的随机事件都服从0-1分布。2)二项分布B(n,p):PX=)=Cp(1-p)-,k=0,1,…,n

其中，C=kn-k

一是二项式系数。该公式可以理解为，在n次试验中有k次成功

(成功的概率为p)和n-k次失败（失败的概率为1-p),并且k次成功可以在n次试验的任何次试验中出现，则k次成功分布在次试验中共有C种不同的排列组合。

0-1分布是二项分布的特例。例3：二项分布代码，如下所示。

1.import numpy as np

2.from scipy import stats

3.import matplotlib.pyplot as plt4。并#开####并#井开#####料并###

5.#二项分布

6。井骨####井井开开######井井并##

7.def binom_pmf_test ()

为离散分布

二项分布的例子：抛掷100次硬币，恰好两次正面朝上的概率是多少？

11.

12.

n=100#独立试验次数

13.

p=0.5#每次正面朝上概率

14.

k=np,arange(0,100)#0-100次正面朝上概率

15.

binomial stats.binom.pmf(k,n,p)

16.

print(binomial)#概率和为1

17.

print(sum(binomial))

18.

print binomial[2])

19.

plt.plot (k,binomial,'o-')

20.

plt.title('Binomial:n=号i,p=号，2f'号(n,p),fontsize=15)

21.

plt.xlabel('Number of successes')

22.

plt.ylabel('Probability of success',fontsize=15)

23.

plt.show (

二项分布示意图如图1-2所示。

二项分布不断叠加后会产生一个重要的分布，就是正态分布。

3)正态分布N,p=1e

e2a2,0>0;-∞<+∞√2πo

例4：正态分布代码，如下所示。

1.def normal distribution():

11111

正态分布是一种连续分布，其函数可以在实线上的任何地方取值

正态分布由两个参数描述：分布的平均值以和方差σ

。1，

mu 0 mean

···试读结束···

阅读剩余

版权声明：
作者：毕勇
链接：https://www.58edu.cc/article/1581805078879244289.html
文章版权归作者所有，58edu信息发布平台，仅提供信息存储空间服务，接受投稿是出于传递更多信息、供广大网友交流学习之目的。如有侵权。联系站长删除。

THE END

《搜索引擎优化及推广》梦工场科技集团|(epub+azw3+mobi+pdf)电子书下载

<<上一篇

《搜索力》刘Sir著|(epub+azw3+mobi+pdf)电子书下载

下一篇>>

《智能搜索和推荐系统 原理、算法与应用》刘宇著|(epub+azw3+mobi+pdf)电子书下载

图书名称：《智能搜索和推荐系统 原理、算法与应用》