《新兴技术与科技情报》谢威主编|(epub+azw3+mobi+pdf)电子书下载

图书名称:《新兴技术与科技情报》

【作 者】谢威主编
【丛书名】科技情报系列丛书
【页 数】 378
【出版社】 北京:北京邮电大学出版社 , 2017.11
【ISBN号】978-7-5635-4938-2
【价 格】60
【分 类】科技情报-情报工作-中国-文集
【参考文献】 谢威主编. 新兴技术与科技情报. 北京:北京邮电大学出版社, 2017.11.

图书封面:

图书目录:

《新兴技术与科技情报》内容提要:

以“科技情报助力全国科技创新中心建设”为主题的2017年度论坛,共收到近百篇论文。北京市科学技术情报学会组织专家,对征集而来的所有论文进行了评议,精心挑选出了62篇具有较高学术或应用价值的论文汇集成本论文集。人选论文的主要内容包括以下几个方面:国际组织或国家有关经济社会和科技发展的新理念、新思想、新战略跟踪;“互联网”人工智能技术时代的智慧情报服务;科技情报机构在国内外智库建设中的作用等。这些基本反映了一年来北京科学技术情报学会专家学者对应用技术的研发、公共服务平台的构建、产业创新体系的强化、科技情报工作理论的探索和经验总结。

《新兴技术与科技情报》内容试读

情报信息类

新兴技术与科技情报

的效果不是特别明显,但它为语音识别奠定了基础。

2011年微软公司优化语音识别系统的技术框架),研发出基于神经网络的语言识别系统,使得样本数据特征不同维度的信息可以被抽取,且通过深度神经网络的模型训练,可以逐层进行数据特征提取,直至得到适合进行模式分类的立项特征。微软公司推出的深度网络语音识别系统,可以对比音素更小的建模单元(senones)进行建模,并提出了“深度神经网络隐马尔可夫混合模型”[],大幅度地诚少了语音识别系统的相对误差,基准测试字词错误率为

18.5%.J

Z等)提出了一种新的语音合成模型一多层感知机模型,该模型的语音识别分为以下

几步:首先,将原始文本转换为特征序列;其次,对特征序列进行映射:再次,将映射的输出特征通过算法)换算成语音参数:最后,将语音参数的声纹合成生成语音。

(二)深度学习在图像检索、识别和分类中的应用现状

最常用的深度学习模型则是卷积神经网络(CNN)模型,该模型首次由加拿大多伦多大学

教授Yann LeCun与其合作者提出,CNN模型的架构设计灵感来源于动物视觉模型,尤其是

模拟动物视觉皮层中简单细胞和复杂细胞的功能。CNN模型遂一被提出,便大大提升了图像

识别领域的效果。因其在图像识别中的强大功能,CNN模型被Krizhevsky等[)在ImageNet大规模视觉识别挑战赛(ILSVRC)们中首次应用,大获成功,Krizhevsky等获得了该次大赛图像分类和目标定位任务的第一名。随后在ILSVRC-2013]中CNN模型再添新功,Zeiler等取得了图像分类任务的第一名.9.o在ILSVRC2014比赛中,CNN模型及其优化方法山被广泛

采用,NUS小组通过融合CNN模型的网中网于其他模型,获得图像识别特征数据提取组的

第一名],平均准确率达到37%。

(三)深度学习在人脸识别中的应用现状

基于CNN的学习方法,香港中文大学依托DeepID项目I以及DeepFace项目(由Facebook委托)1,极大地提高了人脸识别的正确率1],分别达97.45%和97.35%,仅稍逊于人脸识别正确率的97.5%16]。

在人脸识别领域的最新成果表明],深度学习得到的人脸特征中,以下儿个方面都具有人类特征表达不具备的重要特征:对中度稀疏的人脸身份选择性、对局部遮挡的健壮性等。这成为深度学习应用于人脸识别的主要原因。深度学习在人脸识别上有7个方面的典型应用,具体如图1所示。

(四)深度学习在视频分类及行为识别中的应用现状

基于CNN的海量视频分类经验评估模型由Karpathy等8提出,基于该模型,Karpathy等成功地将Sports-1M数据集1]的100万段YouTube视频数据分为487类。

随着CNN在视频分类应用中的发展,其在行为识别中的应用也被拉开序幕—Ji等[町

提出一个三维CNN模型。该模型以输入帧为基础,生成特帧图通道,然后将所有特帧图通道

的信息进行结合,获得综合的特征表示。Baccouche等[2提出一种新的深度学习模型,学习人体行为的分类,该模型是以时序为基础的深度学习模型,可在毫无先验知识的前提下进行人体行为分类。

二、深度学习在情报学领域存在的问题

当前,深度学习应用于情报学领域,主要存在以下3个方面的问题。

情报信息类

基于卷积神经网络

CNN

的人脸识别方法

CFAN

深度非线性人脸形状提取方法

SPAE

基于深

CNN

基于深度学习的人脸姿态健壮性建模

DBN

深度产生式模型

约束环境中的

人脸

因式分解的三路RBM

全自动人险识别

噪声两整线性单元组成的深度学习模型

基于深度学习的

CNN

视频监控下的人险识别

3D CNN

基于深度学习的

CNN

低分辨率人脸识

别建模

DCN

其他基于深度学习的人脸相关信息的

分布式的特征表示

识别

图1基于深度学习的人脸识别算法

(一)理论问题

理论问题表现在两个方面。统计学习方面:深度模型相比于浅层模型有更好的对非线性函数的表示能力,但是,可表示性不代表可学习性,情报领域应用深度学习的方法,需要对深度学习的样本复杂度进行不断探讨,即情报领域如何控制训练样本量,才能平衡、好得到好的深度学习模型与效率的问题。计算方面:在情报学领域,如何控制好计算资源的投人与产出效率,以得到合理的深度学习模型。这两个方面的理论研究都需要不断突破。

(二)建模问题

当前,即使最大的深度学习模型参数(约为100亿数量级),也远远不及人脑,况且,由于计算成本的限制,能够运用到实际情报领域的深度学习模型的参数还远未达到这个水平。而当今的情报学领域,信息源之一就是互联网的海量富文本数据,如何发展、优化深度学习模型,提高识别率,也是亟待解决的问题。

(三)工程问题

在情报学领域,深度学习还存在其他机器学习的方法倾向,容易对训练数据过度学习,由于深度学习模型很复杂,故它需要大量的计算性能来构建。因此,在模型将要使用的生产环境中,这些被记住的特征可能会也可能不会被用到。所以,对于小数据集的简单问题,在计算开销和时间相同的情况下,平衡深度学习的效果和投入的软硬件资源,是情报学领域采用深度学习亟待解决的又一问题。

·5·

新兴技术与科技情报

三、深度学习在情报学领域的发展趋势

虽然,深度学习算法在计算机视觉和语音识别中的应用取得了突破性的进展,但仍存在一些问题。这些问题具体表现为:某种单一的深度学习方法,对于图像检索、语音识别以及视频的分类等具体应用,其效果还需要改善,需要融合不同的方法,通过平均打分的方式选择不同深度学习的方法,以提升其在情报学领域的应用。

(一)深度学习在语音识别领域的发展趋势

语音识别是情报领域随着互联网技术发展亟须解决的问题,引入深度学习可以为情报分析人员进行辅助语音识别,即借助机器理解语音信号,并将信号转化为可以自动处理的文本或者编码。现有的语音识别技术在应用的过程中。仍然存在相关问题亟须突破,如健壮性差的问题、因健壮性差而导致识别率低的问题[。诸如此类的题成为跨学科研究的热点,进而催生了深度学习理论的提出与发展,Hinton22]于2006年提出该理论之后,该理论逐步在图像处理、语音信号处理方面得到广泛的应用。

(二)深度学习在图像检索领域的发展趋势

为克服文本检索不足的缺陷,以图片信息为参照,以图像进行检索的方法也逐渐发展起来。图像检索的一般结构如图2所示。相对于文本内容,图像内容更加丰富庞大,基于内容的图像检索系统已在很多地方得以使用。

图像

提取该图像的特征

建立数据库

查询数据库

图像数据库

索引机

用户

查询接口

t

机制匹配

相似图像

图?图像检索的结构图

(三)深度学习在人脸识别领域的发展趋势

人脸识别以特征提取为基础,通过分类算法来实现机器辅助人脸自动识别,类似于人脑的机制,极大地释放了情报分析的效率。作为浅层学习模型的应用典范,人脸识别所采用的浅层学习方法,可随着数据集容量的扩大,而不断发挥更大的识别效率。因此,利用深度学习的方法来提取人脸的特征,虽然是一种浅层的学习方法,但相比传统的方法及其学习技术,它对海量人脸之间相关性的表达更加准确,分类效率也更高。

(四)深度学习在视频分析领域的发展趋势

作为多媒体内容分析的重要领域,视频目标跟踪是一个复杂且困难的研究课题,因为在现

6

···试读结束···

阅读剩余
THE END