利用大数据挖掘城市图书馆地理空间分布特征及时空演变

2019-11-05 14:41李云华赵晓明
新世纪图书馆 2019年9期
关键词:空间布局图书馆

李云华?赵晓明

摘 要 文章基于社交网络点评数据(北京市),提出利用核密度估计和统计分析探测城市图书馆的空间布局及图书馆时空变化趋势的方法,揭示城市图书馆的空间分布现状及存在的问题。同时,结合图书馆的顾客评分,对不同类型的图书馆进行用户满意度分析,检测出不同类型图书馆用户满意度的差异性,以为城市图书馆资源的合理配置、图书馆的管理、选址和类型确定及读者出行和选择等提供有效的参考依据。

关键词 图书馆 空间布局 用户满意度

分类号 G250

DOI 10.16810/j.cnki.1672-514X.2019.09.014

Spatial Distribution and Spatial-temporal Variations of Urban Library Based on Big Data

Li Yunhua, Zhao Xiaoming

Abstract Based on the social network comment data (Beijing), this paper puts forward the method of using nuclear density estimation and statistical analysis to detect the spatial layout of urban libraries and the temporal and spatial changing trends of libraries, so as to reveal the current situation and existing problems of the spatial distribution of urban libraries. At the same time, combining the librarys customer rating with different types of libraries, it carries out user satisfaction analysis and detects the differences of user satisfaction among different types of libraries, which can provide effective reference for rational allocation of resources, management of libraries, location and type determination of libraries, and the travel and selection of readers.

Keywords Library. Spatial layout. User satisfaction.

0 引言

随着信息化时代的到来,阅读对于个人成长、城市发展及国家竞争力提高都有着非常重要的意义。在城市中,作为必要的基础公共设施——图书馆,不仅具有传播知识与信息的职能,还能体现一个城市“以人为本”的理念和目标。合理的图书馆布局有利于城市的经济发展,并且影响城市居民的文化精神水平。因此,研究城市图书馆的空间结构及分布模式对于城市资源合理配置、城市文化健康发展等有着重要意义。

图书馆作为城市文化的代表性建筑,一直受到学者的关注。从研究内容来看,目前国内外学术界对图书馆的研究主要集中在以下几个方面。一是对图书馆的效率和可持续发展水平空间分布研究[1-2]。二是城市图书馆的空间分布及图书馆信息资源空间分布公平性研究[3-4]。三是对图书馆服务满意度影响因素的研究[5-9]。从研究方法来看,现有研究主要通过收集文献资料或问卷调查的方法获取研究数据,并且大多使用统计分析方法进行研究分析。但可以看出,在城市图书馆空间分布特征上的研究还比较少,研究数据和方法也比较单一,对图书馆的空间分布动态变化及其用户满意度的研究重视程度也不够。

随着“大数据”时代的到来,社会信息的传播方式发生了重大变化,特别是随着智能手机的普及,Facebook、Twitter、微博、大众点评等社交网络服务网站,为人类活动提供了重要的数据源[10]。例如,“大众点评网”是我国领先的城市生活消费平台和独立第三方消费点评网站,是为顾客提供不同空间位置的商户服务的评价平台,顾客可以根据自己的消费体验对商户服务做出满意度评价。“用户满意度”这一概念是由R.L.Oliver等最早提出,用于反映用户对一种产品或服务满足自身的需求与期望程度的感受,是对产品或服务本身的评价[11]。用户满意度已经成为消费者和商户决策的重要考虑因素,并且能够影响消费者的选择行为和商户的空间分布布局[12-16],还可以为商户分析顾客满意度提供数据支持。因此,利用大众点评网点评数据来研究城市不同类别图书馆的用户满意度,不仅有助于解决传统图书馆设施和图书馆资源研究中对用户满意度难以衡量和数据样本量不足、获取成本高等难题,而且可以为城市图书馆资源合理配置、图书馆布局、选址和类型的确定、消费出行和选择等提供有效参考。

本文以北京市为例,采集了“大众点评网”中的图书馆点评数据,提出利用核密度估计和统计分析探測城市图书馆的空间布局及图书馆的时空变化趋势的方法,揭示城市图书馆的空间分布现状及存在的问题。结合图书馆的顾客评分对不同类型的图书馆进行用户满意度分析,检测不同类型图书馆用户满意度的差异性。这些分析结果能为城市图书馆资源的合理配置、图书馆的选址和类型确定、读者出行和选择等提供支持。

1 点评数据获取与预处理

大众点评网是中国使用最普及的点评类网站,它不断产生涉及社交用户日常生活的海量点评数据,这些数据包含时间、用户评论等多种属性。本文设计了一套数据采集的方案,采用网页爬虫方法爬取大众点评上研究区域内图书馆商户数据和这些商户的评论数据,并对数据进行预处理。本文对点评数据的获取与满意度处理流程如图1所示,主要包括3个步骤。首先,爬取研究区域内的图书馆数据,从爬取结果中解析出店铺ID(用来唯一标示商户)、店铺名称、店铺亚类、店铺类别、区域名称、店铺URL、店铺经纬度坐标等信息;然后,根据店铺ID从“大众点评网”获取每个图书馆的评论地址,以获取图书馆的顾客评论数据;最后,计算每个图书馆的用户满意度和点评数量,得到每个图书馆的名称、地理坐标及用户满意度、用户点评数量。

本文从大众点评网共获取362家北京市图书馆设施数据及各自对应的用户点评信息,总数为5180条,时间跨度从2006年1月至2017年12月。不同的图书馆具有不同的职能,针对的用户群体也有所不同,本文研究对象为不同类型的图书馆。根据国际标准化组织颁布的ISO2784-1974(E)“国际图书馆统计标准”中“图书馆的分类”一章所阐述的我国图书馆的分类标准,本文将北京市图书馆划分为国家图书馆、学校图书馆、公共图书馆和其他专门图书馆(专业图书馆、科学图书馆、少儿图书馆、工会图书馆、军事图书馆、盲人图书馆)四大类。据此分类标准,北京市各类图书馆数量统计见表1。公共图书馆数量最多,有208家,数量远远高于其他类型的图书馆;学校图书馆和其他专门图书馆都有70家左右,数量相当;国家图书馆数量最少,只有14家。根据采集数据中图书馆的详细地理坐标及北京市地图,经过整理、分类和可视化分析生成图书馆设施的空间分布图如图2所示。从图2中可以发现,五环以内与五环以外的图书馆数量差异较大。

2 图书馆的空间分布特征

图书馆作为向人们提供信息和知识的社会职能设施,其空间分布状况及特征能够直接影响公众传播信息、利用信息的效率与效果[16]。因此,研究城市图书馆的空间结构及分布模式对于城市图书馆资源的合理配置、城市文化的健康发展等有着重要的意义。本文提出探测图书馆空间分布模式的核密度估计方法,分析图书馆的总体空间布局及现状、不同类型图书馆空间分布特征及时空演变特征。

2.1 图书馆的空间布局

核密度估计是一种广受欢迎的研究地理对象空间分布模式的方法,已经被应用于城市交通、城市规划、城市商业设施布局、犯罪等领域[18-23]。核密度估计能够求解给定样本点集合的分布密度函数问题,它从数据样本本身出发,研究数据分布特征,它依据核函数和带宽来计算地理点事件在平面上的密度函数分布,估计函数公式(1) 为:

其中,D(s) 代表当前位置s的密度估计值,r代表核密度估计的带宽, dis代表当前位置s到第i个点事件的最短路径距离。k()代表一个服从距离衰减的核函数,一般采用高斯核函数,如公式(2) 所示:

运用ArcGIS中空间分析工具的核密度分析,带宽设置为800米,对从大众点评网获取北京市图书馆数据进行处理,得到北京市图书馆的分布核密度。北京市图书馆主要分布在五环以内的主城区和昌平、房山、怀柔、顺义、通州5个城郊区,但主城区与郊区图书馆数量差异较大。图书馆空间分布主要围绕主城区重要的住宅小区、街道、高校等进行布局,且集中于西城区、东城区、朝阳区和海淀区。其中, 西城区、东城区、朝阳区西部、海淀区东南部分布密度较高,且集聚范围远远大于其他地区。昌平区大学城、 石景山区居民区、 丰台区东北部分布密度和范围次之。其他区县的图书馆分布较为零散,分布密度和分布范围相对较小。

总体看来,由于受经济、人口、交通、自然环境等诸多因素的影响,北京市主城区和郊区图书馆空间分布不均衡的现象比较明显。设施较好、功能较齐全的图书馆几乎均集中于城市中心地带,这反映了北京市主城区和郊区图书馆分布缺乏均衡性。

另外,分别计算公共图书馆、学校图书馆、国家图书馆和其他专业图书馆的空间分布核密度,生成四类图书馆的空间分布核密度结果,可以看出:公共图书馆数量较多,分布密度最高,且基本聚集在街道、小区等的居民住宅区;学校图书馆基本分布在各个高校内部,海淀区东部高校云集,故学校图书馆分布较为聚集,其他地区高校分布较零散,所以学校图书馆没有呈现明显的聚集现象;国家图书馆数量较少,但大多聚集分布在海淀区、西城区的高校附近;其他类型的专门图书馆分布较为零散,但基本分布在一些专门的科研机构、教育培训机构等附近。

由此可见,北京各类图书馆的位置选址顾及了区域功能需求,这是其他城市图书馆建设值得借鉴的地方。但是,大多数高校和专门图书馆多分布于市中心地带,市中心虽然人群聚集,但过于喧闹拥挤,无法保证读者的阅读环境和阅读质量。因此,学校图书馆和专门图书馆的选址不仅要顾及到人口聚集范围,还要考虑到读者所需的阅读环境。

2.2 图书馆的空间分布时空演变分析

通过研究图书馆的空间布局和现状,可以揭示城市现存图书馆的空间分布结构及其合理性。一个城市图书馆空间分布特征的形成与其时空演变机制是密不可分的。为了进一步探索图书馆的空间分布特征的形成及其合理性,我们运用核密度估计方法探测北京市图书馆的空间分布随时间变化的情况,分析图书馆的时空变化趋势及其合理性。

基于大众点评数据,我们按照年份分别计算2010年、2012年、2014年和2016年北京市图书馆的核密度,生成四个年度北京市图书馆的空间分布核密度图,如图3所示。

从图3可看出,从2010年至2016年,图书馆的数量由海淀区东南部逐渐向东城区、西城区、朝阳区等市中心区域扩展,这与北京市政治和经济中心的发展地位直接相关。通过查看北京市中心地图,可知北京市中心区域集中了众多诸如国家气象局、北京市文物局等国家机关和政府部门,以及中国中医科学院、首都师范大学等科研教育机构。而市中心以外的其他地区发展则十分缓慢,六年以来一直呈现零星分散的状态,没有形成明显的聚集现象。由此可见,北京市图书館布局由市中心逐渐向外发展,但总体上一直注重主城区的发展,而城市外围图书馆发展十分缓慢,这种不合理的演化趋势造成了主城区和郊区图书馆布局不均衡的现状。

3 图书馆用户满意度分析

读者的满意度能够影响读者的选择行为和图书馆的空间分布布局。为了进一步探索用户满意度与图书馆的关系,本文通过统计不同类别的图书馆用户满意度情况,来探讨各类图书馆用户满意度的差异性。

基于大众点评网上用户对每家图书馆的评分,本文将北京市图书馆按照顾客满意度分为三类,即图书馆满意度在4分至5分之间的为好评,满意度在3分至4分之间的为中评,满意度低于3分的为差评。经过统计,共计177家图书馆在大众点评上有用户满意度评价,满意度为“好评”的图书馆共有82家,满意度为“中评”的图书馆有61家,满意度为“差评”的图书馆有34家。其中,满意度排名靠前的图书馆有:国家图书馆学津堂、清华大学李文正图书馆、北京航空航天大学图书馆、首都图书馆南邵分馆、西城区图书馆什刹海街道分馆等。通过统计不同满意度的各类图书馆的数量和百分比,得到表2和图4,从中可以发现各类图书馆的满意度分布情况。

从表2和图4可以看出,对于公共图书馆,满意度为“好评”“中评”和“差评”的图书馆数量相当。学校图书馆相较公共图书馆数量较少,但只有不到10%的学校图书馆用户满意度较差。国家图书馆共有7家,6家(85.71%)的用户满意度较好,1家(14.29%)用户满意度较差。其他专门图书馆中,超过一半(19家)的图书馆用户满意度较好,只有约13.51%(5家)的图书馆用户满意度较差。整体来说,国家图书馆的用户满意度最好,学校图书馆和其他专门图书馆的用户满意度一般,公共图书馆用户满意度相对较差,这与图书馆的设施水平、文献资源数量、阅读环境、周围设施等都有很直接的关系。为了进一步了解哪些图书馆最受读者欢迎,笔者还统计了图书馆用户点评量,其中用户点评量较多的图书馆有:中国国家图书馆(中关村总馆)、首都图书馆、北京大学图书馆、篱苑图书馆、东城区图书馆、国家图书馆(古籍馆)等。由此可见,用户满意度较好、用户点评量较多的图书馆基本上都是国家图书馆、高校图书馆和较大型的公共图书馆。

4 结语

通过将社交网络数据与城市地理空间信息相结合,能够在一定程度上拓展传统城市设施研究的思路,并且为图书馆学或数据研究领域提供新研究方向。此次研究以社交网络点评数据为信息源,设计了能够探测城市图书馆设施的空间分布特征的核密度估计及统计分析的方法,研究了北京市图书馆设施具体的空间分布格局,并揭示了研究区域图书馆在空间上分布不均衡的现状及在時序上的变化趋势,同时揭示了四类图书馆用户满意度的差异性,发现用户满意度、点评量最好与最差的图书馆,可以为政府的图书馆设施规划和政策制定提供重要的决策依据,并能够引导图书馆管理层做好智慧管理和读者的智慧选择。

社交网络点评数据的使用虽在一定程度上避免了传统数据获取方式的缺点,能够大致揭示城市图书馆设施的空间分布特征及用户满意度情况,但社交网络应用的用户多是年轻人,这部分人群更倾向于对图书馆商户进行光顾和点评,这样就限制了样本数据的范围。另一方面,影响城市图书馆设施空间分布的因素及影响图书馆顾客满意度的因素也需要进一步的研究。

参考文献:

王惠.中国省域公共图书馆的可持续发展水平空间分布研究[J].农业图书情报学刊,2015,27(4):10-13.

王惠,赵坚.中国省际公共图书馆效率动态演进与空间分布[J].图书馆理论与实践,2016(5):75-80.

吴正荆,孙成江,褚迪.长春市图书馆信息资源空间分布公平性研究[J].图书馆学研究,2010(22):56-59.

侯海霞.西安市儿童图书馆的空间分布及其优化对策研究[J].商,2016(19):99,92.

王平,茹嘉祎.国内未成年人图书馆服务满意度影响因素:基于扎根理论的探索性研究[J].图书情报工作, 2015(19):41-46.

汤诚,李萧萧.读者满意度影响因素调查研究:以三所师范类院校为例[J].图书情报知识, 2010(3):96-100.

彭冬莲,彭备芳.读者满意度测评方法研究[J].图书馆学研究, 2005(8):52-56.

SHI X, HOLAHAN P J, JURKAT M P. Satisfaction formation processes in library users: understanding multisource effects[J]. Journal of Academic Librarianship, 2004,30(2):122-131.

MARTENSEN A, GRONHOLDT L. Improving library users perceived quality, satisfaction and loyalty: an integrated measurement and management system[J]. Journal of Academic Librarianship,2003,29(3):140-147.

景东,张大勇.社交媒体环境下用户信任度评估与传播影响力研究[J].数据分析与知识发现,2018(7):26-33.

OLIVER  R L, BURKE R R. Expectation processes in satisfaction formation: a field study[J]. Journal of Service Research,1999,(3):196-214.

张子坤.在线点评平台如何影响人们的消费行为?一个信息性社会影响的观点[D].合肥:中国科学技术大学,2010.

郝媛媛,邹鹏,李一军,等.基于电影面板数据的在线评论情感倾向对销售收入影响的实证研究[J].管理评论,2009,21(10):95-103.

GHOSEH A, IPEIROTIS P G. Designing novel review ranking systems: predicting the usefulness and impact of reviews[C]//International Conference on Electronic Commerce. ACM, 2007:303-310.

MUDAMBI S M, SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[J]. Social Science Electronic Publishing,2010, 34(1):185-200.

陈江涛,张金隆,张亚军.在线商品评论有用性影响因素研究:基于文本语义视角[J].图书情报工作,2012,56(10):119-123.

林光美.网络时代图书馆的挑战与方向[J].公共图书馆, 2007(1):19-23.

BAILEY T C, GATRELL A C. Interactive spatial data analysis[M]. Essex: Longman Scientific & Technical, 1995.

OSULLIVAN D, UNWIN D. Geographic information analysis[M]. New York: John Wiley & Sons, 2014.

SILVERMAN B W. Density estimation for statistics and data analysis[M]. New York: Chapman and Hall, 1986.

DELMELLE E, THILL J C. Urban bicyclists: spatial analysis of adult and youth traffic hazard intensity[J]. Transportation Research Record: Journal of the Transportation Research Board, 2008(2074):31-39.

ERDOGAN S, YILMAZ I, BAYBURA T, et al. Geographical information systems aided traffic accident analysis system case study: city of Afyonkarahisar[J]. Accident Analysis & Prevention,2008,40(1):174-181.

ANDERSON T K. Kernel density estimation and K-means clustering to profile road accident hotspots[J]. Accident Analysis & Prevention,2009,41(3):59-364.

猜你喜欢
空间布局图书馆
浅谈通信基础设施(传输部分)空间布局规划
图书馆
气味图书馆
欢迎到图书馆做客
湖南省区域增长极布局研究
成都市中心城区保障性住房空间分布问题研究
沈阳故宫的营建与空间布局特色分析
自然与建筑
南阳市主城区星级饭店空间布局研究
去图书馆