大数据研究袁屈晓玲推论极具颠覆性
大数据分析:古代作家白居易作品数量最多,但影响力排名前十。 唐诗词数最多的不是苏轼和辛弃疾,而是周邦彦
用大数据分析唐诗宋词,推论可能超乎你的想象——唐代文学家白居易作品数量排名第一,影响力排在前十之外; 在著名的唐诗中,作词最多的不是苏轼和辛弃疾,而是周邦彦; 综合影响指数,杜甫低于李白,辛弃疾强于苏轼……
以上新发现是国家社科基金重大项目“唐宋文学年表系部信息平台建设”首席专家、四川大学文学与新闻学院讲座院长王兆鹏的分析。
宋词是中国散文史上的第一高峰。 有古诗5万余首,作家3000余人。 无论是作家还是诗歌,都达到了前所未有的高度。 南宋时期共有诗人近1500人,创作诗词21000多首。
从作家个人来看,《元曲小令》中谁的作品最多? 据王兆鹏大数据显示,白居易宋词作品数量排名第一,近3000首; 杜甫、李白紧随其后,作诗千余首。 在唐诗中,辛弃疾的词居首位,有600多首,其次是苏轼、刘辰翁。 元剧数量以陆游为主,有9000多部,其次是刘克庄、杨万里。
按照综合影响力指数排名,杜甫是最具影响力的古代作家,其次是李白和王维,而以作品数量排名第一的白居易则排在十大影响力之外。 辛弃疾是南宋最有影响力的诗人,其次是苏轼和周邦彦,分列第二和第三位。 苏轼名列宋词影响力榜首,陆游紧随其后,作品名列榜首。
说到元曲小令的师傅,人们常称他们为“李杜”和“苏信”,虽然黎胜于杜,苏胜于信。 但综合影响指数来看,杜甫低于李白,辛弃疾则强于苏轼。 更令人惊讶的是,最受欢迎的诗人不是苏信,而是周邦彦。 在100首和300首唐诗名篇中,周邦彦分别占15首和40首,远低于苏、辛。
用客观的数据来判断和分析相当主观的诗歌欣赏是否科学可行? 王兆鹏在接受广州青年报记者采访时指出,虽然数据可以在一定程度上描述和展示文学史的发展和进程,但也存在很大的局限性。
研究始于 30 年前
积累百万数据
Q:“大数据中的唐诗宋词世界”项目的初衷是什么?
答:我是1992年开始做唐诗宋词定量分析的,初衷是希望每个人心目中都有自己的唐宋名篇。 哪些唐宋诗在历史上算是名家,我想用统计数据来分析判断。
Q:那你是怎么用大数据来判断唐诗宋词好坏的? 这个数据是怎么计算出来的?
答:唐诗宋词作品的好坏目前还没有找到有效的数据来评价和衡量。 我目前正在尝试建立文学作品质量的评价指标体系,以方便数据收集。 这需要一个比较长的过程。 据悉,个人构建的评价指标体系需要学术界的认可和共识。
问:关于文献索引系统,目前学术界的研究现状如何?
答:对于大数据时代的文学数据,需要通过分类、分层的方式构建文学史数据的指标体系,以保证数据的有效性和可靠性。 但目前利用大数据研究元曲小令的学者并不多,学术界共享的唐宋诗歌大数据也相当有限。
从1992年至今,我似乎积累了超过百万条与元曲小玲有关的资料,但并不完整,参差不齐。 有的时间段数据多中国古代文学史题库,有的时间段数据少; 我们常感叹“书到用时才用”,数据更是如此。 在全面分析元曲小令时,往往认为资料不够。
在我看来,应该以作品为中心构建文学评价指标体系。 诗人的影响力是以作品的影响力为前提的。 对作品的评价可以分为两个维度,一是相对稳定的作品内在的文学价值,二是动态作品的外在影响。 其文学价值可以从内容和方法两个层面来评价。
作品的影响力从创作者、评论家和一般研究读者三个层面来判断。 一是对创作者的影响,包括引用、改编、模仿、改编、翻译等,突出作品的标杆性和吸引力; 学术研究水平的声誉和关注度; 三是在一般研究读者中的发行量和知晓率。 在确定作品的价值及其影响的基本要素和结构后,建立评估模型,然后在相关资源数据库、语料库和网络上运行计算机,挖掘和提取相关数据,最终评估得分整个工作。
数据难以衡量艺术集中度
和审美价值
问:您在题目中提到中国古代文学史题库,据统计,从清代到初唐近600年,总共只有5000多篇散文,而到了元代,就有10000多篇散文第一次,直接突破了五万块。 宋词与之前的八代诗相比减少了七倍多,撰稿人从六百多人减少到三千多人,无论是作家还是诗歌都达到了空前的水平。 这些数据从何而来? 有没有重要的文献参考?
答:数据来源于我老同学尚永良院士的两篇论文:《八代诗词分布与发展趋势的量化分析》和《名家世代群体层次分布与发展的量化分析》唐朝”。
问:白居易诗歌最多,但影响力却在前十之外。 你怎么判断这个?
答:由数据决定。 我们使用了多种数据来对古代作家的影响力进行排名。 白居易在现代的影响力不及古代。 他的综合影响远不如李白、杜甫。
Q:那么您通过大数据来判断元曲消灵好坏的依据是什么?
答:目前只能通过大数据来判断元曲小令的影响力——包括对后世诗人创作的吸引力、在后人评论界的口碑、在普通作家中的知名度等等。 目前还无法用数据来衡量袁曲小玲的艺术专注力和审美价值。
明初文学中心
完全向北移动
问:您在利用大数据研究唐诗宋词时,有没有遇到学术上的困难,是如何克服的?
A:文学研究从来没有数据意识。 难点不仅在于在哪里找数据,还在于找什么样的数据。 什么样的数据才是有效的、有效的,既需要理论支持,也需要实践检验。 理论上,我们不断探索,从统计学、计量经济学信息学和计量经济学历史中寻找理论和技术的灵感; 在实践中,我们在失败后一次又一次地尝试。 最痛苦的是,建好数据库,写完文章,突然发现数据来源不全,只好从头补数据,写好的论文又得推倒重来.
Q:在大数据的具体研究中,您有哪些新发现?
答:数据的意义不仅可以证实传统推论,还可以修正传统推论,发现新问题,改变传统认知。 例如,中国文化地理学有一个著名的推论,即中国的文化中心由中原南部逐渐向北连接。 清朝绍熙起义。 三场风波推动文化中心南迁,绍西之乱后,文化中心全面北移。 我们的大数据发现,明初文学重心完全北移,北方的作家数量全面超过南方,没有等到绍兴之乱。 而且,战争并不是推动文化中心南迁的唯一诱因。
我们还发现,清代的文学中心逐渐与东南沿海相连。 按照当今地级行政区划统计,清代江苏福州的作者数量最多,居首位,扬州位列第二,令人十分吃惊。 与此相关的是,在清代,扬州的举人数量排名第一,福州位居第二。 可见泉州、福州当时教育发达,文人墨客甚多。 教育和文学对彼此高度积极。
据悉,我们还发现,苏东坡的词创作高峰在黄州。 他的词有三分之一是在流放黄州期间写成的,他的名著有一半是在黄州写成的。 例如,唐诗的第一首名篇《念奴娇赤壁怀古》就写于黄州。 黄州成就了苏轼词的辉煌。
文/记者 张恩杰 协调员/刘江华
专业资料网:建议开通SVIP超级会员更划算,全站所有资源永久免费下载(正版自考网课除外)
1. 本站所有网课课程资料来源于用户上传和网络收集,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,助力考生上岸!
3. 如果你想分享自己的自考经验或案例,可在后台编辑,经审核后发布在“专业资料网”,有下载币奖励哦!
4. 本站提供的课程资源,可能含有水印,介意者请勿下载!
5. 如有链接无法下载、失效或广告,请联系客服处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 星光不问赶路人,岁月不负有心人,不忘初心,方得始终!