探索历史大数据历史学家的宏观视角电子版高清完整版|百度网盘下载

编辑评论:理解历史数据分析的工具

探索历史大数据历史学家的宏观视角pdf主要描述了如何使用开源工具来分析和解读历史,量化历史。 . .文本分析的方法也是NLP的基本方法,如词频、词云、主题模型和网络分析。 .书中提供的一些开源包还不错。 . .

探索历史大数据 Historian 宏观视角电子预览

目录

大数据带给历史学家的乐趣

●第二章DH时刻

●第 3 章文本挖掘工具:技术与可视化

●第 4 章主题建模:大数据中的自我探索

● 第 5 章组织数据:可视化的基本介绍

●第六章网络分析

●第七章网络应用

●结论

书籍介绍

数字时代的到来让人文大数据越来越容易获取,这开启了激动人心的新途径和新挑战。探索大的历史数据首先要面对一个庞大的语料库。这本书解决了这个问题,描述和展示了如何搜索数据来构建文化遗产知识、研究、教学和学习:我们如何使用它们?需要注意什么?本书开辟了新的宏观视角,帮助人文学者掌握大数据开展工作。

作者介绍

肖恩·格雷厄姆(Shawn Graham),曾在北卡罗来纳大学教堂山分校、威斯敏斯特大学、匹兹堡大学等高校为本科生和研究生提供学术咨询和职业指导;同时,肖恩也是一位活跃的评论员,他的文章曾发表在《华尔街日报》、《华盛顿邮报》等媒体上。

前言阅读

一位历史学家坐在他的办公桌前,打开他的灯。她开始细读一堆 18 世纪的伦敦法庭记录,这些记录是质量很差的复印件,边读边抄录文本。在工作期间,她开始注意到用于描述年轻女囚犯的语言中有一些有趣的规律。 “我猜……”她喃喃自语,转向 OldBaileyOnline(一个在线法律数据库)进行搜索。很快,她就有了一千起涉及女囚犯的法庭诉讼。她下载了完整的副本并将其加载到文本分析工具 VoyantTools 中。没过多久,她就得到了文本中的关键词、它们的搭配以及它们随时间的使用频率的图表。她更加相信自己的猜测。使用 MALLET(一个用于处理文本的 Java 工具包),她开始在文本中寻找潜在的语义结构。经过对该算法的多次探索,结果似乎表明,每个文本的大部分内容都涵盖了 23 个常见主题。

那么,这些主题,这些单词列表是什么意思?她开始探索主题和文本之间的关系,并发现了一个似乎与国家对女囚犯施加的道德义务密切相关的话语网络。她开始探索网络的形式特征,即哪些词、哪些想法在做语义提升的繁重工作?同时,她在语料库上运行 RezoViz 工具(VoyantTools 中的一个工具)来提取文档中指定的个人和组织。她开始查阅她提取的社交网络,她能够识别出女性和警卫、儿童和男性的子社区,并专注于能够将监狱社区团结在一起的一小群人。不久之后,她对 18 世纪关于女性审判的论述,以及关键人物、组织以及它们之间的联系,形成了深入而广泛的理解。她看了看手表,两个小时过去了。满意的结果,她停止了历史宏观探索,关掉电脑,再次将注意力转向手头的成绩单。我们生活在一个人文学者需要了解如何将数字媒体用于传统人文学术研究的时代,包括他们的算法、假设、用法和中介。人文与数字媒体(也称“新媒体”)的联系可以追溯到几十年前,两者的互动促进了彼此的发展。从广义上看“新媒体”,我们可以看到,过去的传播技术的引入以及它们代表(或“构建”)人类知识的方式相应地需要新的视角和新的方法。上面的例子向我们展示了历史学家利用历史领域的“大数据”进行研究的一种可能方式。除此之外,还有其他途径。本书的三位作者探索了许多可用于历史和其他人文学科研究的大数据工具和研究视角。这些方法在不断发展和完善,本书选取了一些最有用的方法来介绍和描述,包括如何使用、注意什么、存在的问题以及宏观研究开辟的新视角。

我们为“历史学家的宏观视角”一书加上了副标题,以表明这既是一种工具,也是一种研究视角。我们并不是暗示这是历史学家在遇到大数据时“做”历史的唯一方式;相反,它只是工具箱中的一个工具,也是历史学家处理无法避免的“大”数据的另一种方式。离开。更重要的是,所谓的“宏观”(观察巨大事物的工具)恰恰体现了科学家的工作平台,他们使用不同的工具来探索不同的问题,并将记录保存在笔记本上。 .同样,(我们认为)历史学家通往大数据的道路需要一种开放的方法,历史学家保留公共记录,以便其他人可以通过保留的信息探索相同的路径,同时可能得到完全不同的结论。这是一种“生成”的方法:人文学科的大数据不仅可以印证过去的故事,还可以产生新的故事、新的视角,为我们提供新的工具和优势。

阅读剩余
THE END