Web可视化在人文社科数据分析中的研究与实践

2020-04-10 07:45李可彤
湖北农机化 2020年1期
关键词:图例社科可视化

李可彤

(广西城市职业大学,广西 崇左 532200)

1 选题的依据及意义

科学技术在不停地发展,各个行业的数据信息量随着互联网信息技术的不断普及和发展而急剧膨胀。人类社会需要人文社科不断地推动,也许它显示出来的作用没有自然科学的那么明显,但是却是更加令人印象深刻、直指内心深处,对人类的教育作用是无可替代的。

数据可视化技术通过将每一种数据映射为不同的图形、符号和颜色等,同时使用计算机视觉以及界面,通过平面图形显示绘制不同的图像来直观地把生僻晦涩的大量、繁杂的数据形象生动并且清晰有效地表达出来,让人们更容易从多维度了解错综复杂的数据。ECharts是国内的一款十分优秀的可视化图表控件,它能给用户提供一些同时兼具个性化高、交互性高、灵活快速而且直观生动的优点的数据可视化图表。

2 国内外研究现状

对于人文社科的研究,国内外一直在进行着。2014年,Schich使用可视化技术针对历史杰出人物的出生地点和逝世地点,关联了当时的历史和文化,绘制了欧洲和北美的文化史图,获得了文化发展的趋势[1]。近年来,国内外更是增加了一些关于人文社科的新项目、新平台,例如国家图书馆的“华夏记忆项目”、上海图书馆的“中文古籍联合目录及循证平台”。由此可见,在社会的不断进步下,人们已经从单纯地追求物质世界逐渐转变为精神世界,人文社科的地位在不断上升,研究人文社科的数据势在必行。

信息可视化其实是对数据库数据的一种压缩并进行展示,是对复杂现象的了解、复杂数据的诠释的重要工具和途径。它可以通过详细而深入的理解,简明而清晰地表示出海量的数据。

3 数据可视化设计及其图例说明

3.1 可视化数据的主题与来源

本项目围绕的主题是人文社科中的“海上丝绸之路”“珠江-西江经济带”“漓江廉政”“就业信息”,可视化数据的来源,一是从知网上爬取的与人文社科相关的文章名、作者、文章摘要、文章关键词、发表日期;二是智联招聘网中的招聘信息,包括每条招聘信息的城市、地点、招聘公司名称、公司性质、招聘职位、学历要求、薪资以及招聘人数。

3.2 可视化实现流程

数据可视化的实现流程是从数据库中的原始数据到图表的生成的一系列过程。从数据库取数据,到数据预处理、判断类型,再到Json编码、前端解码,最后写入图例数据、交互与显示[2]。

3.3 数据可视化图例详细设计

3.3.1 饼图(Pie Chart)

饼图大多数应用于统计学里,它的原理是将一个圆形切割成多个扇形,可以用来表示不同类型的数据占数据总量的百分比,同时,通过扇形的面积可以一眼看出它们之间的大小。

本次项目研究的是以人文社科为主题的与海上丝绸之路相关的文献,本次的饼状图展示了关键词在文章中的频率,以及在饼图中的百分比,如下图1所示。点击右上角的下载图标可以保存图。由此可以帮助人们清晰直观地看出每个关键词的比例。

图1 饼图

3.3.2 柱形图(Bar Chart)

柱形图别名长图,它是由多个同一水平线上的长方形柱构成[3],一般使用在数据的比较上。通常使用在坐标系中,并且可以根据实际情景需要,将柱形图表示在正负不同的坐标系中,表示出不同的数据事件。本次垂直柱形图数据是基于漓江廉政,展示了关键词较高的词语,同时展示了较高关键词的总数。每个词语之间的差距一眼便可以看出,同时当鼠标悬浮在上面时,可以提示出每个词的词频,如图2所示:点击右上角可以折线图、柱形图切换,同时可以下载该图。

图2 垂直柱形图

将数据库中的数据输出到后台的过程中,首先对得到的数据编码成K-V类数组,因为在图例中的数据只存在于X轴或Y轴,Y轴对应于K值,X轴对应于V值,分布对应使用3个数值存储对应的K、V、K-V值,循环输出X-Y轴数值,并画出表图。然后再对图例的控制值进行自定义设置,完成后进行展示。

3.3.3 词云(WordCloud)

词云是由美国大学的副教授里奇.戈登(Rich Gordon)推出的一种用于展示多种词语及其所占比重的图例。对多种词语使用不同的颜色、位置、大小进行排布,所占比重越大,其显示在词云中的大小也就越大。该图例因其词汇组成后类似云彩的样子,又被称为文字云。利用词云,我们可以对文章进行文字排布,得到文章的词云,可以从中提炼出明显的关键词。

本次项目使用的是基于知网以海上丝绸之路为主题的文献,词云展示的是文章当中出现次数较多的词语,如图3所示。词云通过文字的大小展示出数量的大小,让人们一眼可以看出数量最多的词语。通过不同的色彩让词云图更加亮眼。

图3 词云图

4 总结

随着信息科技的不断发展,人们对界面的要求越来越高,不再满足于简单、单一的数据图表。因此,数据可视化应运而生。本论文根据人文社科数据的需要,研究Web可视化技术,选择了Echarts插件作为人文社科数据可视化的主要插件,研究了饼图、柱形图、词云。

猜你喜欢
图例社科可视化
社科成果展示
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
自然资源可视化决策系统
西安交通大学社科三刊简介
我校首次获批教育部人文社科一般项目
找拼图
找照片
如何让学生巧用图例解决数学问题