香港黄大仙救世报

您的当前位置: 黄大仙救世报 > 香港黄大仙救世报 >

以大数据“全景式”显现唐诗宋词

发布日期:2019-01-23

  诚然《唐宋文学编年地图》反应不错,但也收到了一些见解,如页面卡顿、界面单调等等。除了改进这些用户休会上的问题,王兆鹏还有更多考量。

  《光亮日报》( 2019年01月21日 08版)

  “就像一句‘江流天地外,山色有无中’,我们今天读起来以为是好诗,但是如果能走到那个地方去,就会发现景致确实和诗人描写的是一样的。这时就会发明不仅是诗人写得好,而且风景就是如此,假如晓得这些,对解读一首诗必定大有帮助。”

  “全景式”显现唐诗宋词

  而这本书也进一步启发了王兆鹏:诗,不一定只是纸面诵读,还可以应用大数据,走进历史场景之中,还原当时的文学图景,进行一场读诗办法的翻新。“名诗是一棵棵树,而还原历史,则是重现那片森林。”

  经过一年的经营与总结,王兆鹏又盘算着对文学舆图进行一次更新,让唐诗宋词不仅能读,能看,更能“走进”。

  以大数据“全景式”浮现唐诗宋词

  “问汝平生功业,黄州惠州儋州。”苏轼曾给自己做了这么个总结。然而苏轼终生到底有多颠沛?光看文字可能不太好假想。然而打开《唐宋文学编年地图》,输入“苏轼”,一张中国地图上被密密麻麻地标记了位置。这张地图,就是一张直观活跃的“苏轼颠沛流离图”。

  预计2019年年中,新版本的《唐宋文学编年地图》将会上线。“原本《唐宋文学编年地图》主要是想面向学术界,新版本将更多面向大众,优化个别网民的应用体验。这将是一个尊重市场法令的产品,增强闭会感。古典文学不仅是一种读物,也能变成有科技感跟古代感的产品。”王兆鹏这样介绍。

  “我当年写博士论文的时候,就斟酌能不能用统计学的措施解读唐诗宋词,进行定量分析。那个时候不打算机,就是靠人工录入。”王兆鹏用大数据解读唐诗宋词,并非一时突发奇想,而是贯穿在他始终以来的学术脉络中。

  也正是在提升数据库安全性的过程中,王兆鹏发现了将数据库控制在本人手里的意思。“当初包括中国文献在内的诸多数据库,其所有权都在国外。当初的学术研究,谁掌握了数据库,很大程度谁就领有学术自主权,别人就可能来定义你的文献价值跟学术走向。我在整理数据的时候,深感咱们在数据库方面的薄弱,甚至是中国古典文学,有不少数据库都在国外。”

  在《唐宋文学编年地图》之前,王兆鹏及其团队曾有一部著述引发了不小的舆论战议——《唐诗排行榜》。该书运用统计学的方式得出了一份唐诗前100名的排行榜,其中排在榜首的是崔颢的《黄鹤楼》。

  数据库自主权要把持在自己手中

  读诗方式的翻新

  2017年3月,中南民族大学文学与新闻传播学院教养王兆鹏牵头打造的《唐宋文学编年地图》上线。在这张地图上,既可以查出唐宋时期某位诗人毕生的足迹与作品,也能查出一个处所曾接受过的所有诗人。该产品冲破了唐诗宋词文字浏览的“套路化”模式,变成了直观活泼的地图展示,一上线即收获广泛关注。最初上线的前两天,点击量超过220万。《唐宋文学编年地图》为何会产生这么大的影响?新版本又有哪些变革?记者就此进行了采访。

  一场读诗方式的创新——

  现在,王兆鹏考虑最多的还有一事——数据保险。“怎么防止别人入侵我们的数据库、扒走我们的整理成果,我们花了大量精力来做这件事。收拾一个数据库的劳动量非常大,但被别人‘黑’走却是分分钟的事。”

  光明日报记者 王子墨 王远方 卢璐

  为了实现这一目标,王兆鹏及其团队,与市场上的数据公司合作,不断改进。王兆鹏在采访时除了诗词名句,还一直冒出编程的专业术语,对各类技术名词信手拈来。“我是研讨古典文学的,但一点也不排斥技术。当今的技巧手段可能极大地丰富咱们对传统文学的解读方法,古典文学的学者应该多理解新的信息技术。现在的技术进步太快了,不做不到,只有想不到。懂得了技术的逻辑,会给我们的研究视线带来极大的拓展。”

  王兆鹏渴望改良后的地图,能够“全景式”呈现唐诗宋词。“比喻在地图上点开一首诗,除了文字信息,还能弹出场景画面,重现诗人写作时看到的自然景观。像李白的‘两岸青山相对出’,诗人为什么这么写,一看图片就明白了。”

  王兆鹏利用了诸多技能办法,来给数据加密,“保险”,是王兆鹏在其团队里经常提起的词。

  王兆鹏欲望,借着梳理文学地图的契机,可以打造一个翔实、全面、具备学术价值的数据库。“因为我用定量剖析的方式研究古典文学很多年,实在也暗自憋着一股劲儿,想做出一个优质的、属于中国人的数据库,争得一份学术自主权。”

  “当时很多人不懂得,觉得‘文无第一’,诗怎么可以排行呢?切实仔细阅读这本书就知道,这本书重要是还原文学评估的历史情境,哪首诗被历代文人最多地提起、引用、编入选本,这些都是有据可查的。排行榜是用数据得出的‘论断’。它不是对一首诗的价值评判,而是对一首诗影响力的评估。”

  之后,王兆鹏带领学生们与搜韵公司配合,加入的人数超过100人,历时5年,开发出了《唐宋文学编年地图》,一上线就反映不错。“直到今天我们还在不断维护,在后盾增添数据。唐宋文学的数据量太大,必须始终更新。”