《智能搜索和推荐系统 原理、算法与应用》刘宇著|(epub+azw3+mobi+pdf)电子书下载
图书名称:《智能搜索和推荐系统 原理、算法与应用》
- 【作 者】刘宇著
- 【丛书名】智能系统与技术丛书
- 【页 数】 257
- 【出版社】 北京:机械工业出版社 , 2021.01
- 【ISBN号】978-7-111-67067-4
- 【分 类】搜索引擎-程序设计
- 【参考文献】 刘宇著. 智能搜索和推荐系统 原理、算法与应用. 北京:机械工业出版社, 2021.01.
图书封面:
图书目录:
《智能搜索和推荐系统 原理、算法与应用》内容提要:
本书分为4大部分。第一部分(第1-3章):搜索推荐系统的基础。首先介绍数学与统计学是现代机器学习理论的基础;其次介绍搜索推荐系统的常识;最后,描述知识图谱相关基础理论。第二部分(第4-6章):搜索系统的基本原理。主要内容包括:搜索系统框架及原理、主要算法以及搜索系统相关评价指标。第三部分(第7-9章):推荐系统的基本原理。主要内容包括:推荐系统框架及原理、主要算法以及推荐系统相关评价指标。第四部分(第10-12章):应用。首先介绍三种常见的搜索引擎工具;其次讲述搜索引擎和推荐系统两个方向的应用。
《智能搜索和推荐系统 原理、算法与应用》内容试读
■■■■■■■■■■■■■■■■■
第一部分d/
,。。。
搜索和推荐系统的基础
·第1章概率统计与应用数学基础知识
·第2章搜索系统和推荐系统常识■第3章知识图谱相关理论
面■图■■■层■■画
题题
Chcptei1第1章
概率统计与应用数学基础知识
搜索和推荐作为算法领域相对成熟的两个应用方向,主要应用于机器学习和自然语言处理。机器学习和自然语言处理都会用到很多应用数学的知识,特别是概率与统计的一些基础知识。
本章将简要介绍概率统计和应用数学的基础知识,以便读者对其相关知识点的掌握。已经了解概率统计和应用数学基础知识的读者,可以将本章作为复习模块,也可以直接跳过阅读后面的内容。
1.1概率论基础
概率论是机器学习中重要的基础知识。下面介绍一些与本书相关的概率论知识。
1.1.1概率定义
概率是对一个事件将要发生的可能性的一种测度。概率值在0到1之间,0代表不可能发生,1代表确定发生。事件的概率值越高,它发生的可能性就越大。
假设概率值P为某个事件A发生的概率,记作P(A),(2,F,P)为一个测度空间,其中
Q表示样本空间,F表示事件空间,那么满足以下公理。
公理1:事件的概率是一个非负实数,且P(A)∈R,即P(A)≥0,A∈F。
公理2:样本空间集合的概率值为1,即P(2)=1。
公理3:任意可数的无交集的事件序列A,A2,…,满足如下条件:
-P)
第1章概率统计与应用数学基础知识5
概率是多少?
解:P(A,B,C)=P(A)×P(B)×P(C)=1111
101010010000
例2:假设一个女孩天生聪明的概率是P(A)=1/10,聪明的女孩子学习机器学习的概
率是P(B4)=1/1000,一个人学习机器学习的概率是P(B)=1/100,求一个学机器学习是聪
明女孩的概率是多少?
解:P(4AB)=P4)×P(BA)/P(B)=10×1OO0÷1O0=·
1.1.2随机变量
前文讲到的概率在许多概率模型中的试验结果是数值化的,也有一些例子中的试验结果不是数值化的,但是这些试验结果是与某些数值相关联的。比如在传输信号试验中,传输信号所需要的时间,接收到的信号中发生错误的次数,传输信号的延迟,等等,这些事件发生的概率可以用随机变量表示。
随机变量可以随机地取不同的值,取值可以是离散的,也可以是连续的。随机变量更像是一种函数,可以表示随机试验中所有可能的输出结果,如图1-1所示。
样本空间
图1-1随机变量
随机变量可以分为离散型随机变量和连续型随机变量。
离散型随机变量:如果随机变量为有限可列举的数值:x,x2,x,我们称之为离散型
随机变量。
连续型随机变量:如果随机变量X可以取实数数轴上的某个区间内的任意值,我们称
之为连续型随机变量。
1.1.3基础的概率分布
很多基础的概率分布在机器学习和深度学习领域很有用,这些概率分布也是其他复杂分布的基础。下面我们学习几种基础的概率分布。
6“◆。第一部分搜索和推荐系统的基础
1)0-1分布:P(X=)=p(1-p)l,k=0,1
其中,p为k=1时的概率(0
<1)。假设一个试验事件发生的概率为p,不发生的概率为1-p,任何一个只有两种结果的随机事件都服从0-1分布。2)二项分布B(n,p):PX=)=Cp(1-p)-,k=0,1,…,n
其中,C=kn-k
一是二项式系数。该公式可以理解为,在n次试验中有k次成功
(成功的概率为p)和n-k次失败(失败的概率为1-p),并且k次成功可以在n次试验的任何次试验中出现,则k次成功分布在次试验中共有C种不同的排列组合。
0-1分布是二项分布的特例。例3:二项分布代码,如下所示。
1.import numpy as np
2.from scipy import stats
3.import matplotlib.pyplot as plt4。并#开####并#井开#####料并###
5.#二项分布
6。井骨####井井开开######井井并##
7.def binom_pmf_test ()
8.
9.
为离散分布
10
二项分布的例子:抛掷100次硬币,恰好两次正面朝上的概率是多少?
11.
12.
n=100#独立试验次数
13.
p=0.5#每次正面朝上概率
14.
k=np,arange(0,100)#0-100次正面朝上概率
15.
binomial stats.binom.pmf(k,n,p)
16.
print(binomial)#概率和为1
17.
print(sum(binomial))
18.
print binomial[2])
19.
plt.plot (k,binomial,'o-')
20.
plt.title('Binomial:n=号i,p=号,2f'号(n,p),fontsize=15)
21.
plt.xlabel('Number of successes')
22.
plt.ylabel('Probability of success',fontsize=15)
23.
plt.show (
二项分布示意图如图1-2所示。
二项分布不断叠加后会产生一个重要的分布,就是正态分布。
3)正态分布N,p=1e
e2a2,0>0;-∞<+∞√2πo
例4:正态分布代码,如下所示。
1.def normal distribution():
2.
11111
3.
正态分布是一种连续分布,其函数可以在实线上的任何地方取值
4.
正态分布由两个参数描述:分布的平均值以和方差σ
5.
。1,
6.
mu 0 mean
···试读结束···
作者:毕勇
链接:https://www.58edu.cc/article/1581805078879244289.html
文章版权归作者所有,58edu信息发布平台,仅提供信息存储空间服务,接受投稿是出于传递更多信息、供广大网友交流学习之目的。如有侵权。联系站长删除。