《智能搜索和推荐系统 原理、算法与应用》刘宇著|(epub+azw3+mobi+pdf)电子书下载

图书名称:《智能搜索和推荐系统 原理、算法与应用》

【作 者】刘宇著
【丛书名】智能系统与技术丛书
【页 数】 257
【出版社】 北京:机械工业出版社 , 2021.01
【ISBN号】978-7-111-67067-4
【分 类】搜索引擎-程序设计
【参考文献】 刘宇著. 智能搜索和推荐系统 原理、算法与应用. 北京:机械工业出版社, 2021.01.

图书封面:

图书目录:

《智能搜索和推荐系统 原理、算法与应用》内容提要:

本书分为4大部分。第一部分(第1-3章):搜索推荐系统的基础。首先介绍数学与统计学是现代机器学习理论的基础;其次介绍搜索推荐系统的常识;最后,描述知识图谱相关基础理论。第二部分(第4-6章):搜索系统的基本原理。主要内容包括:搜索系统框架及原理、主要算法以及搜索系统相关评价指标。第三部分(第7-9章):推荐系统的基本原理。主要内容包括:推荐系统框架及原理、主要算法以及推荐系统相关评价指标。第四部分(第10-12章):应用。首先介绍三种常见的搜索引擎工具;其次讲述搜索引擎和推荐系统两个方向的应用。

《智能搜索和推荐系统 原理、算法与应用》内容试读

■■■■■■■■■■■■■■■■■

第一部分d/

,。。。

搜索和推荐系统的基础

·第1章概率统计与应用数学基础知识

·第2章搜索系统和推荐系统常识■第3章知识图谱相关理论

面■图■■■层■■画

题题

Chcptei1第1章

概率统计与应用数学基础知识

搜索和推荐作为算法领域相对成熟的两个应用方向,主要应用于机器学习和自然语言处理。机器学习和自然语言处理都会用到很多应用数学的知识,特别是概率与统计的一些基础知识。

本章将简要介绍概率统计和应用数学的基础知识,以便读者对其相关知识点的掌握。已经了解概率统计和应用数学基础知识的读者,可以将本章作为复习模块,也可以直接跳过阅读后面的内容。

1.1概率论基础

概率论是机器学习中重要的基础知识。下面介绍一些与本书相关的概率论知识。

1.1.1概率定义

概率是对一个事件将要发生的可能性的一种测度。概率值在0到1之间,0代表不可能发生,1代表确定发生。事件的概率值越高,它发生的可能性就越大。

假设概率值P为某个事件A发生的概率,记作P(A),(2,F,P)为一个测度空间,其中

Q表示样本空间,F表示事件空间,那么满足以下公理。

公理1:事件的概率是一个非负实数,且P(A)∈R,即P(A)≥0,A∈F。

公理2:样本空间集合的概率值为1,即P(2)=1。

公理3:任意可数的无交集的事件序列A,A2,…,满足如下条件:

-P)

第1章概率统计与应用数学基础知识5

概率是多少?

解:P(A,B,C)=P(A)×P(B)×P(C)=1111

101010010000

例2:假设一个女孩天生聪明的概率是P(A)=1/10,聪明的女孩子学习机器学习的概

率是P(B4)=1/1000,一个人学习机器学习的概率是P(B)=1/100,求一个学机器学习是聪

明女孩的概率是多少?

解:P(4AB)=P4)×P(BA)/P(B)=10×1OO0÷1O0=·

1.1.2随机变量

前文讲到的概率在许多概率模型中的试验结果是数值化的,也有一些例子中的试验结果不是数值化的,但是这些试验结果是与某些数值相关联的。比如在传输信号试验中,传输信号所需要的时间,接收到的信号中发生错误的次数,传输信号的延迟,等等,这些事件发生的概率可以用随机变量表示。

随机变量可以随机地取不同的值,取值可以是离散的,也可以是连续的。随机变量更像是一种函数,可以表示随机试验中所有可能的输出结果,如图1-1所示。

样本空间

图1-1随机变量

随机变量可以分为离散型随机变量和连续型随机变量。

离散型随机变量:如果随机变量为有限可列举的数值:x,x2,x,我们称之为离散型

随机变量。

连续型随机变量:如果随机变量X可以取实数数轴上的某个区间内的任意值,我们称

之为连续型随机变量。

1.1.3基础的概率分布

很多基础的概率分布在机器学习和深度学习领域很有用,这些概率分布也是其他复杂分布的基础。下面我们学习几种基础的概率分布。

6“◆。第一部分搜索和推荐系统的基础

1)0-1分布:P(X=)=p(1-p)l,k=0,1

其中,p为k=1时的概率(0

<1)。假设一个试验事件发生的概率为p,不发生的概率为1-p,任何一个只有两种结果的随机事件都服从0-1分布。2)二项分布B(n,p):PX=)=Cp(1-p)-,k=0,1,…,n

其中,C=kn-k

一是二项式系数。该公式可以理解为,在n次试验中有k次成功

(成功的概率为p)和n-k次失败(失败的概率为1-p),并且k次成功可以在n次试验的任何次试验中出现,则k次成功分布在次试验中共有C种不同的排列组合。

0-1分布是二项分布的特例。例3:二项分布代码,如下所示。

1.import numpy as np

2.from scipy import stats

3.import matplotlib.pyplot as plt4。并#开####并#井开#####料并###

5.#二项分布

6。井骨####井井开开######井井并##

7.def binom_pmf_test ()

8.

9.

为离散分布

10

二项分布的例子:抛掷100次硬币,恰好两次正面朝上的概率是多少?

11.

12.

n=100#独立试验次数

13.

p=0.5#每次正面朝上概率

14.

k=np,arange(0,100)#0-100次正面朝上概率

15.

binomial stats.binom.pmf(k,n,p)

16.

print(binomial)#概率和为1

17.

print(sum(binomial))

18.

print binomial[2])

19.

plt.plot (k,binomial,'o-')

20.

plt.title('Binomial:n=号i,p=号,2f'号(n,p),fontsize=15)

21.

plt.xlabel('Number of successes')

22.

plt.ylabel('Probability of success',fontsize=15)

23.

plt.show (

二项分布示意图如图1-2所示。

二项分布不断叠加后会产生一个重要的分布,就是正态分布。

3)正态分布N,p=1e

e2a2,0>0;-∞<+∞√2πo

例4:正态分布代码,如下所示。

1.def normal distribution():

2.

11111

3.

正态分布是一种连续分布,其函数可以在实线上的任何地方取值

4.

正态分布由两个参数描述:分布的平均值以和方差σ

5.

。1,

6.

mu 0 mean

···试读结束···

阅读剩余
THE END