公共图书馆用户在线口碑情感分析
——以副省级市图书馆大众点评网评论为中心*

2021-07-01 00:48彭秋平吴思洋
图书馆论坛 2021年6期
关键词:均值大众图书馆

彭秋平,吴思洋

0 引言

2020年端午假期,东莞图书馆农民工读者吴桂春的留言引起广泛关注:“想起这些年的生活,最好的地方就是图书馆了,虽万般不舍,然生活所迫,余生永不忘你,东莞图书馆。”[1]这则留言字里行间流露出这位读者对东莞图书馆浓厚的不舍与难忘之情,反映的是读者对图书馆价值的认同。良好的评价有利于好口碑形成,用户对图书馆的认同不断深入,吸引政府加大对其投入,进一步发挥图书馆的社会价值,形成可持续发展的良性循环[2],反之,差评下的差口碑则会产生恶性循环。识别用户评价,重视口碑塑造,是图书馆营销自我、改善服务、提升价值的重要环节。Web2.0时代,除线下留言外,用户常在论坛贴吧、购物网站等网络平台上发表在线评论,以传播观点和交流体验,他们不仅是信息的被动接受者,也是信息的主动创造者、分享者和交流者[3]。用户在网络发表对图书馆的评价,往往带有强烈情感倾向,由此形成图书馆的在线口碑,影响着其他潜在用户走进或利用图书馆服务的意愿及感受。

以往分析公共图书馆(以下简称“公共馆”)用户在线口碑的研究多以新浪微博[4-5]、百度贴吧[6-7]等社交平台作为主要信息源,近年出现以大众点评网等第三方点评网站作为数据源的图书馆评价研究。吴梦菲等[8]以大众点评网上15个城市馆的总体评价、基本信息、具体评价、标签以及问答内容等方面作量化统计分析;沈菊等[9]采用内容分析法,描绘大众点评网用户评价刻画的图书馆形象;张文亮等[10]应用频数分析、偏度分析、相关性分析和情感性分析等方法对大众点评中39所省级公共馆进行研究,从读者视角分析省级公共馆的服务现状和评价情况。大众点评网是中国领先的本土生活信息及交易平台,其首创并领导的第三方评论模式中,用户可以结合自身体验和感受自由发布对商家的评论[11],成为其他用户决策前的重要参考。不同于微博、贴吧等平台的自发无序评论,大众点评网的用户评论是专门针对某一特定图书馆的使用体验进行评价,同时设有“书籍”“环境”“服务”三方面及整体印象打分,从不同角度展现公共馆的用户使用感受。

从定位看,副省级市公共馆多以其良好的服务效能、完善的体系建设等在我国公共图书馆事业发展中发挥全方位的引领作用。对于读者而言,他们在体验副省级市公共馆服务后的评价如何?这些用户评价重点关注图书馆哪些服务内容?不同服务内容下用户评论情感是否存在偏差?为解决以上问题,本文选取15个副省级市公共馆为研究对象,抓取其大众点评网上用户评论,对评论内容进行文本挖掘及情感分析,计算公共馆的用户评价情感值,并构建公共馆用户评价指标体系,关注各项指标下15个副省级市公共馆的评价情况,挖掘评论内容,提炼差评导向下公共馆发展策略,以期为公共馆改善用户口碑提供参考。

1 研究方法及数据收集

情感分析是指通过自动分析商品、服务、任务等研究对象的相关评论文本内容,发现评论者对该研究对象的褒贬态度和意见[12],多用在商品评论和网络舆情两个领域。在图书馆学领域,越来越多的学者探索应用文本挖掘、情感分析等研究方法处理非结构化数据,以分析用户对图书馆体验的评价及情感倾向。王晰巍等[13]基于“掌阅图书馆”畅销书籍的用户评论进行情感分析;Zhou Q等[14]识别亚马逊网站上学术书籍的在线评论的情感极性和情感价值等;阳玉堃[3]对微博平台用户对图书馆的评价进行文本情感倾向分析,表明用户对图书馆形象主要持积极态度;张文亮等[10]利用情感分析,对39个省级公共馆的大众点评网用户评论进行整体情感值计算,得到“用户对公共馆的评价态度是正面的”结论。已有的研究仅对用户评论进行了情感极性分类,未计算情感强度,并且未对用户评论进行指标的拆分,相关研究有待深入。本研究挖掘15个副省级市公共馆大众点评网的用户在线评论,对其进行文本挖掘与情感分析,构建图书馆评价指标体系,识别用户对每一所图书馆以及图书馆各项服务内容的情感倾向,刻画公共馆的用户口碑基本形象。

1.1 情感分析

本研究使用基于情感词典匹配的情感分析方法,对所收集到的15个副省级市公共馆大众点评网评论进行分析,该方法主要包含两个重要环节,分别为情感词库的构建以及基于词典匹配的情感分析算法。

(1)情感词库构建。本研究以大连理工情感词汇本体库[15]作为基础词典进行扩充,对分词结果标注词性,取形容词、动词和感叹词,去除在评论文本中出现过且情感词典中已有的情感词,将剩余词语按照词频倒序排列,筛选出频率大于30且具有情感倾向的词语,并按该本体库规则,人工标注情感词情感极性以及情感强度,添加入情感词典,构建基于用户在线评论文本的公共馆用户评价情感词典[16]。添加常用程度副词、否定词词典[17]并设置相应权重。公共馆用户评价情感词典、程度副词以及否定词词典共同构成了本研究的情感词库。

(2)基于词典匹配的情感分析算法。基于词典匹配的情感分析算法具体计算流程见图1[18]:利用逗号、句号等标点符号对得到的用户评论进行分句;将分句结果进行分词和去停用词操作;借助情感词典,对分句中的词语进行情感极性和强度标注;将情感词前出现的词语分别与程度副词词典以及否定词词典进行匹配,如果成功匹配则将上一步骤所标注的情感强度与该副词权重相乘;将上一步骤得到的积极情感强度与消极情感强度分别进行累加,得到积极情感分值与消极情感分值;因感叹号有情感加强的作用,故对感叹句进行处理,当发现句末是感叹号时,扫描感叹号前的情感词,若为正向情感,则将积极情感分值加2,若为负向情感,则将消极情感分值加2;将每个分句的积极情感分值进行累加、消极情感分值进行累加,当前评论最终的情感值为总的积极情感分值减去总的消极情感分值。

图1 基于词典匹配的情感分析算法流程图

1.2 研究对象及数据收集

根据1995年中央机构编制委员会印发的《关于副省级市若干问题的意见》,广州、武汉、杭州等15个城市被划为副省级城市,以发挥其中心城市的辐射作用。作为经济较发达地区公共文化服务的主要载体,这15个城市的市公共馆是我国城市图书馆体系的中坚主导力量,对我国图书馆事业的建设与发展中起着风向标的作用[19]。本研究的数据来源是大众点评网上15个公共馆的用户评论,抓取评论用户ID、评论时间、评论内容、评论点赞数以及评论回复数等字段,并清洗无效评论数据。截至2020年1月,共抓取评论数量共8,646条,各馆评论数量分布情况如表1所示。广州图书馆及深圳图书馆的用户评论数量已超1,000条,且大众点评网官方评分较高,用户关注度及好评度均表现较佳。

表1 副省级市公共馆用户评论数据抓取情况

2 公共图书馆用户评价整体情感评分

2.1 各副省级市公共图书馆情感均值计算结果

为计算各公共馆用户评论的情感均值,利用所构建的情感词库及基于词典匹配的情感分析算法,计算各图书馆每条评论的情感值,再根据每条评论的点赞数赋予权重,计算各图书馆的情感均值,计算方法如公式(1)所示:

其中,sentiment代表情感均值,N代表评论总数,sentimenti代表该条评论的情感值,ni代表该评论的点赞数加一,即该条评论认同的人数(含评论者本人),计算结果如表2所示。由表2看出,在15个公共馆中,宁波图书馆的情感均值最高,用户对宁波图书馆的评论多为好评。其中,排名靠前的公共馆多位于长三角或珠三角地区,依托雄厚的经济实力发展公共文化服务,用户评论数量较多且好评居多;而排名靠后的公共馆多位于内陆或东北地区,用户评论数量相对较少,且差评比例较高,导致情感均值偏低。

表2 各副省级市公共馆情感均值计算结果

2.2 各馆情感均值得分与大众点评网得分对比

根据美团网2020年1月8日发布的点评规则[20](大众点评网于2015年与美团网合并),大众点评网上,商户的星级和评分由用户评论计算的得出,且商户星级和评分为动态指标,根据点评用户专业度、点评质量、添加时间、诚信度、点评数量等多种要素加权由系统综合计算得出。公共馆评分包括对图书馆的整体满意度以及对“书籍”“环境”“服务”的体验感受,由此得出图书馆的用户评价星级和评分结果。从整体看,大众点评网上15个副省级市公共馆的评分均在4.50分以上(满分制为5分),其中10个公共馆的评分高达4.9分。对比15个副省级市公共馆的大众点评网评分以及用户评论情感均值,得到如图2折线图。从评分规则来看,大众点评网利用1~5分制星级打分,用户手动点亮评分星级,操作更加简单方便,使用用户相对较多,但打分区间较为狭窄,只能粗略反映用户的评价情况。情感分析依据的是用户评论内容,表达开放自由,内容丰富详实,情感复杂多元,能够较准确地反映用户的切身体验及感受。并且大众点评网评分的离散系数为0.019,基于情感分析评分的离散系数为0.151,基于情感分析的评分结果离散程度更高,更直观反映各副省级市公共馆用户口碑的差距。所以利用情感分析计算出的图书馆评价结果与大众点评网原有的评分存在一定的差异性,互为补充。

3 公共图书馆用户评价各指标情感评分

用户在作出评论时,多关注图书馆资源或服务带来的体验和感受,为了解用户口碑形成的影响因素,本研究深入剖析用户评论,构建公共馆用户评价指标体系,并分析各指标下15个副省级市公共馆的用户评价情感得分,同时就用户差评内容提出图书馆改善建议,提高图书馆服务的质量与水平。

3.1 公共图书馆用户评价指标体系构建

基于8,646条用户评论,使用Python的第三方自然语言处理库jieba库进行中文文本的分词处理,去掉停用词,对分词后词表进行词频统计并倒序排列,得到词频超200的词语共267个,通过人工标注得到与公共馆直接相关的特征词46个。以用户评价抽取的46个特征词为基础,结合柯平等[21]提出的空间、资源、服务、管理这图书馆四大要素,以及周九常[22]提出的建筑形象、服务形象、馆员形象、管理形象、文化形象、知识资源形象、基础设施形象、综合形象八个公共馆社会形象体系等理论基础,构建起涵括馆舍位置、空间体验、设施设备、馆藏资源、读者服务、馆员印象六大指标的公共馆用户评价体系(见表3)。大众点评网中,用户在评论时更关注“读者服务”这一指标,提及频率高达45.10%,主要涉及读者证办理、借阅服务、自习服务、阅读推广活动等内容。其次是“空间体验”与“馆藏资源”两个指标,均达16%左右,其中“空间体验”涉及环境装修、功能分区、阅读氛围等内容,“馆藏资源”涉及实体馆藏、数字资源等内容。在所抓取的数据中,提及“馆员印象”的频率不高,仅为1.68%,但这并不意味着用户评论不关注馆员,除“工作人员”外,用户对图书馆工作人员的称呼多种多样,但由于词频不高,不列入指标体系的特征词中。

表3 公共馆用户评价指标、特征词及出现频率

3.2 15所副省级市公共图书馆各指标评价结果

基于构建的公共馆用户评价指标体系,计算各指标情感均值,得到15个副省级市公共馆的各项指标的情感均值(见表4)。结合各指标情感均值较高及较低的公共馆,回溯带有这一指标特征词的用户评论,分析导致用户好评与差评的原因。

表4 各副省级市公共馆各项指标情感均值计算结果

“馆舍位置”中,情感均值最高的公共馆是宁波图书馆、沈阳市图书馆及长春市图书馆,这3所公共馆的馆舍位置共性特征是靠近地铁站,交通便利,周边配套设施完备,且建筑外形“高大上”,引人注意。比如,宁波图书馆“地理位置好,出来地铁口就是图书馆”;“建筑气派,面积十分大”。情感均值较低的图书馆,“位置较偏,隐藏在山中”、“周边什么都没有”、“建筑外观偏老旧”类评论偏多。

“空间体验”中,深圳图书馆与宁波图书馆情感均值突破3,其空间特征主要是环境安静舒适,适宜自习。评论认为,深圳图书馆“环境安静,人人有序拿书,阅读区也是只闻翻书之声”;“每层楼都有自习室,基本不担心没有座位”。评论认为,宁波图书馆“环境很好,很适合待一天的节奏。待在里面学习的人都很有素质不吵不闹的,能让心静下来开始阅读”。情感均值偏低的图书馆则存在“阅览室光线很不好,给人感觉很压抑”、“图书馆里弥漫着难闻的味道”类评论,用户阅览体验不佳。

“设施设备”中,用户最关注的是座位、插座以及空调问题。情感均值最高的金陵图书馆“自习室几乎都会有座位,空调四季如春,开水间每层楼都有,阅览室里面的座位也很多”;“阅览室很清静安宁,是个绝佳的休息之处”。情感均值较低的图书馆,用户表示“没有电源插座,要用电脑的人,很是不方便”,且“自习位置太少”。

“馆藏资源”中,馆藏资源丰富、更新频率快且易获取时,用户的好评更多。比如,情感均值最高的大连图书馆,用户评论其馆藏资源“超全,你想找的无论是杂志、报纸,或是专业技术方面的书籍,应有尽有”,而且“有电脑可以直接搜索想找的书籍位置,很方便”。情感均值偏低的图书馆,用户表示图书“不多”,“可以外借的书有些实在太旧”,其馆藏资源需加强建设。

“读者服务”中,借阅服务便利且自助化程度高、阅读推广活动丰富有趣的图书馆更受欢迎。情感均值排名前三的金陵图书馆、杭州图书馆以及广州图书馆在读者服务工作方面倍受好评。以广州图书馆为例,其借书时“办借书证也很简单,带上身份证就可以了……每本书的免费借书时间是1个月,差不多到期了,还会短信息通知”;“官方活动特别多,教育类的、讲座类的、现场参与类的,特别多”,得到用户较高的赞誉。情感均值偏低的图书馆,多由于安检严格、借书需交押金、开放时间较短等原因受到差评。

“馆员印象”中,用户评价受图书馆工作人员的服务态度、专业技能等因素影响。情感均值最高的长春市图书馆,用户对馆员的评价多为“态度亲和”、“热情积极”、“耐心解答提问”等。情感值偏低的图书馆,读者反映“部分工作人员上班时间闲聊”、“说话声音超大”,对于读者不文明行为不予制止,影响阅读体验。

4 基于用户评论的公共图书馆服务改进策略

整体上,用户对公共馆的评价多为好评,图书馆的服务基本能够满足用户的阅读、休闲、娱乐需求,服务效能较佳。其中也不乏差评,正是这些差评和负面认知使得潜在用户远离图书馆,认为图书馆“与我无关”[23],阻碍公共馆作用的进一步发挥,不利于提高社会影响力。这些差评反映的是用户体验较差且有待改进的服务内容,以6项用户评价指标为基础,结合情感分析方法下情感得分为负的用户差评内容,挖掘用户体验不佳的服务内容,提出公共馆改善服务质量的措施建议,改善城市图书馆的口碑。

4.1 完善周边配套设施,打造城市文化地标

副省级市公共馆,是城市文明的象征,是城市整体形象的重要组成部分,很多城市都致力于将市馆打造成“城市文化地标”,其建筑载体及周边设施便是文化地标的重要表现。在以往的馆舍规划与设计时,强调“以书为中心”,对于用户来说并不便利,逐渐转变为“以人为中心”[24],这就要求图书馆在规划和建设时要充分考虑用户的诉求。关于馆舍位置,用户差评主要集中于馆舍建筑老旧、交通不便利、周边商业化程度低、停车位稀缺等4个方面。在推进总分馆建设的过程中,一些城市开始规划建设新馆,首先,要纳入城市规划,选址在人口密集且交通便利的地点,方便用户接触图书馆,扩大服务的覆盖面;其次,建筑设计应讲究美学,提升用户利用空间的舒适体验;另外,还需考虑周边配套设施的供给,包括商业中心、餐饮服务、交通路线、停车场、相关文化机构等,形成聚合效应,吸引更多的人到馆阅读。

4.2 关注用户阅读环境,营造优质阅读空间

公共馆阅览环境直接影响着读者的阅读环境,需提供舒适宜人的照明、空气、声音、温湿度以及明显的指引标识,好的阅读环境直接提升用户阅读体验。就空间体验,用户差评多指出个别馆灯光暗淡、环境通风条件差、噪音来源多样、空调温度过低、指引标识不明显等,直接导致用户体验不佳。2015年住房和城乡建设部发布《图书馆建筑设计规范JGJ 38-2015》[25],对图书馆的室内光环境、声环境、采暖、通风与空气调节等均做了详细的规定,为图书馆调节室内阅读环境提供了参考标准。此外,图书馆需有效地设置指引标识,并合理规划动静功能区,区分噪音较大的少儿区、活动空间等动区与自习室、阅览室等静区,为不同需求的用户提供适宜的活动空间,减少干扰。

4.3 完善设施设备配置,开展定期检修维护

读屏时代下,作为“第三空间”的公共馆应始终坚持人性化服务[26],但在用户评论中,用户的一些诉求难以得到满足,包括:插座稀缺,无法满足用户手机、电脑等电子设备充电需求;阅览座位少且被长时间占座,造成资源浪费;无线网络资源不足,部分读者无法连接馆内WiFi;自助借还设备陈旧故障,无人维护检修。实际生活中,部分读者看重图书馆的自习环境,到馆内自习、学习甚至是娱乐休闲,但由于设施设备的限制,无法获得自习座位、电源插座供不应求、上网体验极差、设施故障无法使用,降低用户的使用体验,导致其对图书馆的评价大打折扣,不利于图书馆形成好口碑。为便利用户使用相关设施设备,在经费允许的条件下,图书馆应增设阅览座位、插座或充电宝租借设备、扩增WiFi容量并提速,定期检修维护馆内设施设备,有助于提高用户的满意度。

4.4 重视馆藏建设工作,引入射频识别技术

馆藏建设始终是图书馆最重要的工作之一,包括图书采编、馆藏发展、数字资源建设等。在大众点评网上用户对馆藏建设的差评多为:图书资源陈旧,更新慢;图书资源少,缺乏专业特色资源;图书乱架情况严重,难以获取特定书目。对于前两个问题,图书馆需加强馆藏建设工作,首先需剔除部分陈旧书籍,及时上架更新受大众欢迎的图书;其次要推进数字资源的建设,补充数据库、电子书、电子阅览器等资源,满足用户的数字馆藏需求;另外,在条件允许的情况下,开展特色资源建设工作,增加专业型较强的图书或地方特色文献,满足用户的研究需求。对于图书乱架的问题,可引入RFID射频识别技术,引导用户使用自助检索系统或手机定位图书系统[27],帮助读者迅速获取所需图书。

4.5 延长开放服务时间,创新读者活动形式

对于读者服务,用户最关心的是开放时间及阅读推广活动。用户指出个别馆的开放时间较短,且与公示时间不符,损耗读者对图书馆的信任。根据《公共图书馆法》,图书馆应该通过网站或其他方式向社会公告开放时间,因故闭馆或更改开放时间,应当提前公告。在条件允许的情况下,图书馆可适当延长开放时间,或设有24小时自助开放服务区域,满足因闭馆无法使用图书馆资源和服务的用户需求。此外,部分用户指出馆内阅读推广活动内容重复陈旧,导致参与热情不高。为改善这一情况,一方面,图书馆应创新阅读推广的活动内容和活动形式,引入专业机构合作,激发创新积极性和活力,打造知名读者活动品牌,带给读者多元丰富体验;另一方面,图书馆应加强活动宣传推广工作,以微信公众号、微博、短视频App等新兴媒体为载体,充分调动用户参与读者活动的热情,增加阅读推广活动的可视化和可及性。

4.6 加强馆员业务培训,调动馆员服务活力

馆员是用户与图书馆之间的重要桥梁,服务素质和态度直接影响着用户对图书馆的评价和口碑。从分析结果来看,对于馆员负面评价,多集中在:业务能力差,操作不熟练;服务态度差,服务意识低;不务正业,玩忽职守。我国图书馆尚未建立馆员职业资格制度,部分馆员并不具备专业知识和服务精神,其服务能力亟待加强。为此,首先图书馆在招聘馆员时,需加强考核,提高专业要求,组织专业的服务队伍;其次在实际工作中,对馆员加强业务培训或继续教育,不断提高业务水平和服务精神。此外,需加强监督考核机制,疏导馆员心理障碍,引导馆员走出倦怠,提高服务效能。

5 结语

挖掘用户对图书馆的评价,帮助图书馆定位自身资源以及服务的优势和不足,有助于图书馆改善服务、提升价值。在图书馆业界,为了解用户对公共馆的评价,目前最常使用的方法为问卷调查法,但问卷调查法受题目和量表的限制,有时无法准确地表达用户的使用感受,而社交媒体或第三方评论网站的环境更加开放自由,用户可以自发真实地表达出自己的使用感受,并通过网络传播影响其他用户使用意愿与体验。因此,本文选取国内最具引领作用的15个副省级市公共馆,对其大众点评网的用户评论进行情感分析以及文本挖掘,相对于传统评价方式,该方法所得出的结论更接近用户的切身感受,可作为传统评价方法的有效补充。且相对于大众点评的评分制,对用户评论进行情感计算得到的情感均值,反映用户体验后评论差异更大,更能准确体现公共馆服务的口碑差距。为了解图书馆口碑的影响因素,本文利用用户评论构建图书馆评价指标体系,相较于传统的图书馆定量评价指标,该指标更能准确地反映用户所关注的服务内容重点。通过对用户评论进行整体与分指标的情感分析以及内容挖掘可以发现,这15个副省级市公共馆的用户评论多持好评或中立态度,用户口碑良好,服务基本满足用户的需求,但其差评也不容忽视。作为中国公共图书馆事业的标杆,副省级市公共馆更应直面差评,了解导致用户差评的原因及用户真实诉求,改善图书馆各方面服务,为各地市级公共图书馆树立榜样,促进公共图书馆整体高质量发展。

猜你喜欢
均值大众图书馆
一汽-大众ID.6CROZZ
上汽大众ID.3
大众ID.4
上汽大众
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
图书馆
浅谈均值不等式的应用
均值不等式的小应用
去图书馆