格格党

手机浏览器扫描二维码访问

第一 数字人文简介(第2页)

比如,当给定一个初始的电子文本的时候,如果研究者能设定好要进行哪些数据处理,在大数据分析方法的基础上,“数字人文”

可以帮助我们高效的进行数据处理,从科学的角度帮助我们对重要的人文领域的重要问题做出一些定量或者定性的分析。

在文学研究中应用文本分析,通常会用到的一类技术被称为“自然语言处理”

“自然语言处理”

是一种基于计算机编码处理语言语义的技术方法。

随着计算机领域的蓬勃发展,数据挖掘的技术也日趋成熟,可以直接应用到文本分类、自动文摘等和文学研究相关的领域。

“由于文本存在着复杂的语义,从事自然语言处理的研究人员往往需要收集海量的语料库,以支撑文本的分析。”

[2]

狭义地来看,“大数据”

在文学研究中的积极作用是最近几年才开始逐步显现出来的。

但如果我们广义地定义“大数据”

在文学研究中的功能,那么,当我们使用互联网(如知网-ki、谷歌学术-schle、Jstor数据库)等新兴电子工具帮助我们搜索文学类文献的时候,这就已经是“大数据”

的方法在文学研究中起重要作用了。

在文献检索中用到的方法就是计算机科学领域里“机器学习”

中的“数据挖掘”

(datamining)的方法。

[3]文学研究的学者们在无形之中就潜移默化地运用了“大数据”

的直接成果,来推进文学研究的前沿。

互联网搜索工具对于文学研究的功能和作用,和现在更复杂的大数据方法的应用,事实上没有本质的区别。

它们都是不同学科相互融合的结果。

此外,这一章尤其想强调的是,所谓“大数据”

的方法本身,并不只是在于“数据”

本身的新颖程度,而更重要的是有创新的搜集数据、分析解读数据以及展示数据结果的方法。

也就是说,“大数据”

不只是关于数据,更重要的是在于发展和应用创新的方法和工具。

与其说建议人文学者使用“大数据”

,还不如说建议从事人文学科研究的学者掌握和发展出一系列和人文学科自身发展相匹配的“大数据的方法”

这样的理解方式,对于“数字人文”

的发展尤其重要。

“数字人文”

并不是说人文学科的研究被动地被其他领域“入侵”

,而应该是人文学科自身的创新。

热门小说推荐
穿越修仙界我靠卖惨走上人生巅峰

穿越修仙界我靠卖惨走上人生巅峰

一朝穿越修仙界,顾苒只想在修仙大派中做个吃喝不愁的咸鱼。但偏偏有人变着花样来找茬,顾苒表示在修仙门派中生存好难,只想回家!自此,为了早点回家,顾苒只能依靠迟到三年的不靠谱系统开始了卖惨之路。在卖惨的...

娱乐大忽悠

娱乐大忽悠

假如生活欺骗了你,不要悲伤,不要哭泣,因为明天生活还会继续欺骗你。这是一个小骗子靠忽悠和欺骗一步一步成为大骗子,呃不,是成为大明星的故事我没有说谎我何必说谎(已有百万...

镇守边关:我以肉身成圣

镇守边关:我以肉身成圣

陆凡一觉醒来,穿越到古武世界,成为大周王朝一名守卫边关的小兵。正值大周王朝式微,周边国家都虎视眈眈。战事随时都有可能爆发。还好,陆凡自带属性面板。每天吃饭睡觉,就能增加属性点。吃的越多,点数越多。在军营中别的好处没有,至少饭管够。只要他不是太过分,就没人说什么。于是,他就敞开了肚子吃,铆足了劲睡。实力不断增强,却很少有人知道。直到有一天,敌人来袭,边关告急,他才大展身手,并一战成名!整个天下都为之...

每日热搜小说推荐