基于Tableau的交互式散点图可视化方法改进

2023-09-03 14:45李易臻
客联 2023年5期
关键词:信息可视化

李易臻

摘 要:信息可视化为人们的生活带来了便利。地图可视化输入地理数据并以地图的形式输出,适用于显示餐饮店的位置信息。本文应用交互散点图来可视化美国纽约市的餐馆地理数据。地址、名称、类别、评级、评论数量和价格通过交互式地图功能(如悬停,工具提示和点击链接打开图表)显示在地图上。

关键词:信息可视化;散点地图;可交互式

今天的人们比人类历史上任何时候都拥有更多的信息。随着大数据和互联网的发展,信息超载的问题将更加严重。信息可视化设计的目标是将不可见的信息或难以直接显示的数据转化为可感知的视觉元素,其意义在于通过提高信息或数据的可读性、可用性和美观性。其中,地理信息数据常常被应用于信息可视化方法的研究。以餐饮业为例,用户可以通过谷歌地图、餐厅网站或流行的评级平台搜索和查找餐厅,这些信息包括餐厅的位置、等级等信息。但就谷歌地图而言,如果用户输入某类餐厅的名称,谷歌地图目前仍存在无法生成所有相关餐厅的缺点。因此,本文将在现有餐厅数据可视化方法的基础上,针对上述不足或漏洞,基于 Tableau对纽约餐厅数据进行聚合、分类和整合的可视化分析设计。

在回顾观察研究时,本文将评估和比较现有的几种可视化方法,如散点图、密度图等。这些可视化方法有的基于地理空间数据,主要使用点绘图来显示信息,有的则基于文本数据,以图像大小的形式来显示定量分布。四川大学华西医院的研究人员刘桂娜等 (刘桂娜, 2020)利用Tableau地图分析技术,对中国区域医疗中心结直肠癌的地理流行病学特征进行了可视化分析。研究人员选取了分布热动态地图和扩散趋势散点图来直观展示四川省结肠癌的历年变化和地理分布特征。在北京师范大学,研究人员王峥 (王峥, 2022)等人利用时空Moran散点图应用研究了中国干旱时空聚集区的可视化信息展示图片。在不同年份,投影在平面上的位置所对应的数据颜色可以显示中国不同地区的干旱情况,而不同高度的数据值分布则代表了不同月份的干旱严重程度。

一、拟议的可视化方法

经过对所选可视化方法的分析,本研究初步设计使用Tableau和经过筛选和清洗的16833条纽约餐厅数据集创建基于地图的二维重叠分布散点图,并通过鼠标悬停互动来显示信息。某个区域内的餐厅分布越多,或者叠加的比例尺越小,散点图就会使用不同的颜色显示某个区域内餐厅的聚集情况。分布散点图可以具体显示餐厅在纽约不同区域的分布状况,通过鼠标点击或悬停可以显示餐厅的名称和基本信息。同时,为了增加餐厅的具体信息,鼠标点击后可以结合显示的具体餐厅信息了解这家餐厅的详细信息。

二、可视化方法原型构建

(一)设计新的可视化模型

對于美国纽约的一个大型餐馆数据集来说,其中包含了餐馆名称、类型、价格、位置、经纬度等复杂信息的摘要,仅靠一种可视化方法无法完整详细地展示这些数据,可视化方法也无法满足包含上述评价属性的标准。因此,本文计划生成一种使用不同颜色散点的可视化方式,并将用不同颜色显示的评分分数和餐厅排名结合起来。最后,通过交互式悬停信息显示,餐厅的详细信息将作为参考告知用户。

下图1是使用Microsoft可视化工具Power Bi创建的初始散点图,作为初步参考。首先,在简单地导入了地址和标题属性中包含的数据集后,使用 Tableau 中的地图功能简单地生成了美国纽约餐馆的散点图分布。可以看到,16833条数据可视化非常密集,所以用不同的可视化颜色来表示不同的餐厅种类,以区分不同的餐厅类型。但此时的颜色分类为Power Bi自动生成,仍然缺少颜色选择和优化。

为了优化上述模型存在的问题,仍然使用地址和标题属性下的数据集作为可视化尝试,但不同的是将地图制作工具改为使用 Power Bi 中的 Arc GIS 地图来制作不同的地图。现在生成的图表2中两张地图可以更清楚地区分不同的餐厅及其具体的行位置。不过,这种方法仍需优化和改进。

最后,除了简单的散点图,为了给用户提供更丰富、更直观的视觉信息,本文尝试利用不同的数据创建不同类型的可视化图。对于图表3,选择州属和街道属两个数据集作为展示,然后使用创建填充地图的方法来分析数据,并用颜色突出显示这些餐厅位置所覆盖的区域。这样做的好处是,用户可以通过色块快速直观地看到自己所在的位置是否在餐馆附近,还可以通过颜色的深浅来区分特定街区的餐馆数量。但在后来的模型优化当中,这一方法与散点图叠加使用会使散点的展示模糊不清,且提供有效信息的能力较差,因此放弃使用不同可视化方法叠加的情况。

(二)进行验证测试以验证设计(无差错设计)

空间:在空间上,上述每种可视化方法生成的图形都允许用户通过鼠标滚动放大或缩小来改变可视化本身的空间,从而轻松获得餐厅的准确位置和详细的定位信息。

交互性:用户可以通过放大并悬停在某个餐厅散点上来选择该餐厅,从而显示该餐厅的具体信息。在上面的示例中,只使用了标题和地址来创建模型,将鼠标悬停在上面后,用户可以清楚地看到每个点的详细文字信息。

可区分性:用不同的颜色代表不同的餐厅,虽然有些杂乱,但可以大致分辨出不同地点不同名称的餐厅的零散信息。

准确性:本文利用授课老师提供的数据集,通过添加更多信息和创建更多图形,将大大提高可视化的准确性。可视化数据可显示餐厅全名。地图点的散点大小也可以通过手动操作自动改变。地理信息的定位也很准确.

三、结果与分析

(一)改进后的可视化方法

虽然上述可视化原型在一定程度上提供了有关纽约餐馆的详细信息,但这种可视化对用户来说并不清晰。用户无法根据自己的喜好筛选想要了解的餐馆信息,也无法根据图形的颜色和大小直观地判断出更有价值的信息。同时,用户只能获得餐厅的名称和地址,而无法获得其他有价值的信息。

因此,基于上述可视化方法的缺点,本文使用Tableau生成了一种更有效的可视化方法。这就是根据类别名称字段生成不同颜色的散点图,用户可以从图表右侧的过滤器中选择自己想要的餐厅类型。其次,根据不同餐厅的标价将散点图的点设置为不同的大小。点越大,表示餐厅的价格越高。用户可以根据点的大小,直观地筛选出心仪的价格范围内的餐厅。最后,将每家餐厅的标题设置为标签,当用户放大或缩小地图时,可以看到点下方显示的餐厅名称。

除此之外,增加交互式地图的功能,使用户可以与散点地图进行互动。当用户将鼠标悬停在某个点上时,该餐厅的更多详细信息将被展示在地图界面上。这些信息包括餐厅名称、类型描述、详细地址、标价、评分分布和营业时间。

最后,创建两个新的工作表,分别使用数字格式的"评论数"和 "排名"数据来显示每家餐厅的浏览次数和排名。这两个表格被插入地图工作表的工作提示中。用户可以在鼠标悬停时看到每家餐厅的浏览次数和排名。并在地图工作表中添加两个操作,即当点击一个特定的散点时,会出现两个按钮功能,让用户可以点击进入两个详细的评论数和排名工作表。

(二)修正后的可视化构建

该可视化模型包含一个散点实时图、一个点图和一个柱形图。在这张地图上,一张街道性质的背景地图被用来显示纽约的详细街道地址。上面不同颜色的散点代表了不同类型的餐馆,而点的大小则代表了餐馆评级的价格档次。接下来,图表4右侧的筛选器可以帮助用户根据自己的需求选择餐厅。例如,如果用户想选择一家美国餐厅,那么可以手动勾选所有美国餐厅筛选器,以显示所有符合条件的餐厅。此外,用户还可以根据价格过滤器筛选出不同价位的餐厅。

将鼠标悬停在点上,可以看到与这三个点相对应的餐厅的详细信息。其中包括餐厅名称、详细地址、价格范围、类别描述、评级和营业时间。这些详细的文本信息,可以供用户查阅以了解不同餐厅的大概情况。餐厅名称也会作为标签显示在地图上散点的正下方。

创建两个新的工作表,分别用于展示详细的创建评论数和排名的条形图和点图。同样在散点图主要工作表中,这两个工作表被插入到工作提示列中。图表6中可以看到每个散点就拥有了相应的 "评论计数 "和 "排名 "的数据展示,用户可以直接通过散点悬停功能直接了解到散点相对应的排名和评论数量。同时使用条形图和点图来显示不同的数据。在点击悬停信息上的蓝色链接后,用户可以直接从散点图转向详细的两个分工作表,如图表7所示。图表8所示的两张工作表中,不同的颜色被用来表示不同级别的排名和查看次数。其中绿色代表最好的排名,红色代表最差的排名。

四、评估可视化方法及其意义

数据展示和可视化类型:评估Tableau的数据呈现可视化方法和所选择的可视化类型。本可视化使用了三种信息可视化形式:地图散点图、条形图和虚线图。信息的可读性和传达:对可视化方法的可读性和信息传达进行评估,关注图表的清晰度、标签的可读性、颜色的选择和对比度。这种可视化方法使用不同颜色的散点表示不同类型的餐馆,而散点的大小则代表餐馆的价格。

交互性和探索性:Tableau提供丰富的交互功能,允许用户探索数据并获得更深入的见解。对可视化方法进行评估,看它是否充分利用了 Tableau 的交互功能,如筛选器、参数、工具提示等,以提供更具探索性和交互性的数据体验。因此,这种可视化方法结合了各种工具提示、标签显示、颜色表示和筛选器的使用,所有这些都能满足用户的互动需求。

数据准备和清理:考虑为Tableau可视化方法准备和清理数据的过程,这样可以对数据进行整理和转换。本次练习的数据来自16800条详细的纽约餐馆数据,这些数据数量充足、涵盖主题广泛,并且设计了详细的属性。这种可视化方法的意义在于它能够以一种视觉上吸引人的互动方式展示纽约餐馆的数据。通过利用Tableau的功能,包括餐厅名称标签、颜色分类、价格范围表示、悬停细节、条形图和散点图,以及详细视图的交互式按钮,这种可视化方法使用户能够获得有价值的见解,做出明智的决策,并探索纽约餐饮业的复杂景观。

总之,新提出的使用Tableau創建的纽约餐厅数据散点图可视化为探索和分析数据集提供了一个强大而直观的工具。通过餐厅名称标签、彩色编码的散点图标记、显示价格带的标记大小、悬停细节、条形图和用于详细查看的交互式按钮等各种功能,该可视化工具为用户提供了纽约市餐厅景观的全面视图。尽管还存在缺陷和不足,但迄今为止在短时间内生成的可视化方法在一定程度上为餐厅用户提供了帮助。

参考文献:

[1] 刘桂娜,曾渝,刘健博,李立 & 汪晓东.(2020).数据库辅助研究:区域医疗中心的结直肠癌地理散发特征——结合Tableau地图分析技术的真实世界数据报道.中国普外基础与临床杂志(01),88-96.

[2] 王峥,程昌秀 & 李畅.(2022).时空Moran散点图及其在中国干旱时空聚集区识别中的应用.地球信息科学学报(07),1301-1311.

猜你喜欢
信息可视化
基于大数据的图书馆信息模式与个性化服务研究
计算机网络安全可视化研究平台设计与实现
论信息可视化设计在个人简历中的应用
标签的可视化进程初探
基于毕业生求职简历的信息可视化研究
基于CiteSpace的智库建设研究可视化分析
新媒体时代背景下的图形动画设计与制作研究
浅谈信息可视化在新闻传播中的应用
信息可视化技术在数字图书馆馆藏资源检索中的应用研究
浅析信息可视化在用户体验研究中的设计