基于文本挖掘的食品企业微博影响力预测研究*

2022-01-11 11:40刘灵芝王孝国肖邦明

珞珈管理评论 2021年3期

● 刘灵芝王孝国肖邦明

(1,3,5 华中农业大学经济管理学院武汉 430070;2,4,6 湖北农村发展研究中心武汉 430070)

1.引言

随着短视频直播平台和微博等新型社交媒体的兴起，新型社交媒体逐渐成为人们网上消费和获取信息的重要媒介。以新浪微博为例：2020年9月，新浪微博月活跃用户为5.11亿人次，较2019年9月净增约1 300万。2019年《中国互联网发展报告》数据显示中国网络零售市场规模已经突破31万亿元。微博作为新型社交媒体，因其具有多元实时双向互动的优势，不仅极大地变革了企业与消费者间的互动方式，也逐渐演变为企业营销的重要平台。企业可以在微博平台上收到关注、点赞、评论、转发等消费者信息反馈，大大提高了信息交流效率。根据2017年新浪微博企业白皮书发布的数据，其2016年注册的微博账号已达130万。“互联网+”时代的到来正在促使消费模式偏好不断发生改变。企业必须适应和提前预测微博营销的机制，提升企业微博互动营销的有效性，才能更扎实地立足于市场。

目前关于社交媒体的研究主要是研究社交媒体的互动内容对网民参与的影响(Castelló et al.，2016;Sundstrom &Levenshus,2017;Gong et al.，2017)，也有国内学者通过社交媒体营销的娱乐性(胡玲，2018)、网络口碑(吴敏琦，2013)等研究影响微博营销的因素以及社交媒体的使用意图。这些研究对揭示企业微博如何使用社交媒体吸引消费者、与消费者进行沟通和激励提供很多宝贵见解。然而，人们对社交媒体传播和消费者参与的内在影响机理却缺乏了解。Aleti等(2019)通过对推特文本数据挖掘得出，不同推特类型主体在社交媒体使用语言风格方面具有差异性，因此，更好地了解消费者如何对待品牌信息发布者发布微博，以及是什么促使消费者频繁地转发、点赞和评论是至关重要的。

中国有句俗话“民以食为天”。百度指数的数据显示，美食在社交媒体上的搜索热度已经超过财经、科技、生活等话题，且搜索热度不断上升。此外，与美食相关的品牌也越来越多，它们对消费产生了很大的影响。然而，目前还没有关于消费者参与食品品牌互动方面的研究，本文希望通过言语行为理论的视角对社交媒体和消费者互动的内在机理进行研究，对个人品牌和产品品牌发布微博的影响力进行预测，为品牌发布更具影响力的微博提供科学指导。以往研究表明，品牌可以控制社交媒体的通信方式和内容，但语言的分割差异可能会在消费者中表现出明显的认知效果(Aleti et al.，2019)，通过查看关于语言风格元素的微妙变化以及它们如何通过潜意识影响消费者的选择，我们可能获得品牌如何构建微博影响力预测模型的有效见解。因此，本研究以食品领域的企业微博和相关网络名人微博为对象，基于机器学习算法和言语行为理论来划分不同写作风格，以预测消费者参与社交媒体讨论行为(点赞、评论和转发)。

2.文献综述

2.1 文本内容的相关研究

我们的研究是通过观察用户对品牌内容生成的参与程度，发现品牌社交媒体吸引用户讨论的内在机理，为使用社交媒体的公司提供科学指导。社交媒体的传播不仅要关注品牌本身，还应该关注其文本内容，从而洞悉品牌应如何更好地执行其社交媒体传播策略。文本内容是社交媒体用户进行网络互动的重要载体，大多数情况下，文本语言在社交媒体中占主导地位，它既可以表达自己的情绪，也可以向外传递信息。以往的研究表明，社交媒体推文的生动程度(多媒体手段)、互动程度(动员方式、号召性语言、提问和超链接)、内容的丰富性程度、情感唤起的文字、图片和视频材料的使用会对用户的点赞、评论和转发行为产生正向影响(Ashley &Tuten,2015；青平等，2018；Araujo et al.，2015；Gong et al.，2017)。不仅如此，语言预期理论(Burgoon &Miller,1985)指出，文本内容的外围要素，如信息发布者的具体性、严谨性、心理亲密性及与观众的互动，会导致观众和订户的数量变化。随着社交媒体功能的多元化，我们知道非言语交际功能，如表情、图片、视频等正在不断流行和丰富文本内容，但是大多数情况下只能起到对文本内容补充的作用，对于是否能否定或增强文本内容，增加微博影响力倾向还尚未可知。不可否认的是，目前非言语交际功能已经和文本语言越来越紧密地联系在一起。

2.2 文本风格的相关研究

品牌微博在日常发布信息过程中使用的语言风格可能并不总是在习惯性思维意识下产生的，但信息发布者通过仔细观察和分析，可选择适合自己以及关注者的风格，以此捕捉他们的潜在受众，来满足他们的兴趣。这些研究对于认识用户的点赞、评论和转发等行为具有非常重要的贡献，对于微博影响力预测模型的构建具有十分重要的借鉴作用。目前，多数文献将重点放在推文的内容和类型上，以了解吸引消费者点赞、评论和转发的原因，而忽略了推文的风格。研究将深入探讨美食网络名人和品牌官方微博的言语行为相关的语言风格元素，即叙事/分析风格、内部/外部关注风格、积极/消极情感风格。

2.2.1 叙事/分析风格

社交媒体推文的叙事方式可以分为叙事风格和分析风格，分析风格的微博通常更加注重遵循逻辑来发布消息，而叙事风格的推文更加注重故事的线性发展。因此，分析风格应包含对复杂组织的对象和概念的更多引用，而叙事风格应由更具描述性的单词组成，例如副词或辅助动词(Aleti et al.，2019)。“如何说”对于吸引用户注意力、激发好奇心更为关键。这些理论暗示着语言、语气和魅力，在说服中起着至关重要的作用。这一观点扩展了心理学、传播学和营销研究，表明叙事是通过注意力、描述和感觉对说服产生强大影响(Hamby et al.,2015)。以往的证据表明，与更具分析性和事实论证的语言风格相比，显现出更强线性叙事风格的微博消息往往可以更好地唤起叙事内容的传播，更能带来故事引人入胜的变革体验(David &Miall,1993)。Allison等(2017)和Van Laer等(2019)发现社交媒体的说服程度取决于沟通对故事的讲述程度，叙事性的故事讲述对病毒式广告的传播具有积极的影响，广告采用叙事风格更有利于消费者对广告采取积极态度。然而，在大多数情况下，在叙事和分析风格可以被识别的基础上，消费者究竟更倾向于哪一种，至今仍未被探索。

2.2.2 内部/外部关注风格

社交媒体上的超社会关系被描述为消费者和品牌建立的友谊感，这种友谊感是在反复的接触和互动中形成的。由于品牌在某一方面或领域往往具有一定的代表性，再加上在社交媒体上更多的自我披露和曝光，就形成了用户对于品牌的一种钦佩，可以激发自己内心的渴望(孟陆等，2020)，因此消费者和用户更有可能转发、评论和点赞那些表现出更高自信和象征性资本的用户。Kacewicz(2014)通过文本分析发现，自信由更多的“我们”单词、社交单词和更少的“我”单词表示。也就是说，较高的社会地位和象征性资本与注重外部风格有关，而不是与内部注重写作和演讲风格有关。由于名人与消费者之间的关系是不对称的，消费者似乎更倾向于转推具有外部关注风格的内容。可以通过查看作者如何使用功能词的一种特定选择来捕获样式重点：人称代词(Cruz et al.，2017)。内部聚焦风格应包含更多的第一人称单数代词，而外部聚焦风格应包含更多的第二人称单数或第一人称复数代词。

2.2.3 积极/消极情感风格

情绪传染理论(Barsade,2002)指出，影响者的兴奋和激情会产生一种情绪传染，可能增加意见和订阅者的数量(Cohn et al.，2004)。于是我们将关注点转向第三种语言风格元素：情感。积极情绪可以通过诸如“快乐”“兴奋”和“激动”之类的词的频率来捕捉，而消极情绪与诸如“焦虑”“悲剧”和“自私”之类的词有关。Rimé(2009)认为不管信息的性质如何，消费者更可能共享以高度激昂的情感方式撰写的内容。一旦观众参与模仿行为，他们就会通过自己内部反应的生理反馈来体验情绪本身(Breugst et al.，2012)。根据以往的研究表明，当使用情感风格的激活度较高(例如，好与不好)或增强(例如，非常好)的单词时，消费者更有可能在网上给出较高的评分。所以，在社交媒体中，具有更能引起或激发情绪的风格的推文很可能会被共享。

言语行为理论的概念和相关实证研究表明同一条推文中捕获到的丰富信息，完全有可能触动消费者(Austin et al.，1975;Vermunt &Magidson,2016)。为了构建更高预测精准度的微博影响力模型，本研究借鉴以往的研究和言语行为理论的相关概念及实证研究，编码了来自食品行业的236个产品品牌和个人品牌的共计85 858条微博，基于机器学习算法构建了食品品牌微博影响力的预测模型，并将微博的用户信息、时间信息和文本信息进行编码放入微博影响力预测模型，很大程度上提高了微博影响力的预测准确率。

2.3 微博影响力的相关研究

微博影响力预测的研究涉及领域广泛，以往的文献主要分布在公共事件微博影响力的预测和政务微博影响力的预测等方面。由研究对象的不同，微博影响力的研究可以分为以下三种类型：

第一种是有关微博用户影响力的研究，例如舆情事件中的意见领袖(Li et al.，2019;Luqiu et al.，2019；Sofya et al.，2019)，网络社区中的核心成员等在信息传播过程中对于公众态度和舆论导向具有显著影响的微博用户影响力研究(黄敏学等，2019；Yi et al.，2018)，有关微博用户影响力的指标包括用户的粉丝数、网络中心度等，常见的方法是意见领袖识别方法和社交网络算法等。

第二种是关于微博博文的影响力，例如博文的内容形式、情感主题等因素导致微博在社交媒体平台上的流行程度(Aleti et al.，2019)、传播路径(Zaman et al.，2014)等，主要的指标包括微博博文的点赞数、评论数和转发数，主要的研究方法包括文本挖掘、情感分析等。

第三种是微博话题的影响力，也可以称之为舆情热度的相关研究，是指对特定主题进行讨论的微博的影响力研究(安璐等，2019)，如事件报道类、情感表达类、话题讨论类等。

目前，国内外有关微博影响力研究方兴未艾，李军等(2011)梳理了目前国内关于微博影响力的研究，提出了关于微博影响力的评价模型；赵阿敏和曹桂全(2014)运用因子分析和聚类分析的方法，对16家省级政务微博进行了研究，结果显示，政务微博的影响力发展水平较低，高影响力政务微博数量明显少于低影响力政务微博数量，总体来说，政务微博影响力的分布结构呈“金字塔”状；安璐等(2019)以恐怖事件为背景，利用多种机器学习模型对恐怖事件的微博影响力进行预测研究，结果表明，微博文本的聚类结果和情感分析结果均会提高微博影响力预测模型的预测性能。

这些研究对于人们加深对微博影响力的了解具有重要贡献，但是研究发现在市场营销领域，尤其是随着互联网技术和网络经济的快速发展，无论个人品牌还是产品品牌都在依靠吸引粉丝来取得良好的营销效果，如何扩大食品品牌微博的影响力对于品牌网络营销的发展至关重要。因此，本研究编码了85 858条食品个人品牌和产品品牌推文，基于深度机器学习和言语行为理论从微博文本的表达风格入手，从品牌微博中挖掘出影响微博影响力的证据，确定影响微博影响力的重要特征，为个人品牌和产品品牌预测微博影响力，发布更具影响力的微博提供理论指导。

3.研究设计

3.1 研究对象选取

本研究选择了两类微博品牌用户：个人品牌(美食博主)和产品品牌(食品品牌官方微博)。两类微博的明显区别在于，个人主页是黄色微博认证而企业主页则是蓝色微博认证。之所以选择与食品相关的个人品牌和产品品牌，是因为食品是社交媒体上讨论热度最高的话题之一，这些社交媒体的存在对食品消费产生很大的影响(Cahillane,2015)。

本研究使用Octopus 8.0软件程序从236个个人品牌和产品品牌主页收集微博。产品品牌(食品品牌官方微博)的研究样本选自中国品牌网食品行业不同类别产品的品牌榜、人气榜中排名前十位的企业，并将未开通微博账户的品牌进行手动删除；个人品牌(美食博主)的样本通过关键词搜索后，选取微博粉丝数量前100位的个人账户进行数据抓取。研究仅抓取用户的原创博文，对于转发内容不予抓取，这样可以更加明确每个账户如何发布自己的内容。由于不同用户发布的原始微博数量不同，研究从每个账户中提取的微博数也各不相同，其中发布微博最多的为161 730条，最少为109条。从中提取出相应的微博特征，包括用户信息特征(用户ID、粉丝数、发布微博总数、关注微博数量、微博认证信息、商品橱窗信息、成长速度、成长值、阳光信用评级、所在地、用户标签等)和博文信息特征(博文全文、图片数、视频时长、转发数、评论数、评论内容、点赞数、发博时间、发博客户端等)。

3.2 研究方法

为了更加直观地展现出各微博特征的影响力倾向，本研究对各微博特征进行了影响力倾向的测算，采用安璐等(2019)提出的微博影响力倾向测算指标。影响力倾向是指在某一指标下高影响力微博占比与总体高影响力微博占微博总数的比例之差，反映了在某一特征指标下微博影响力的高低占比情况，微博影响力倾向的计算方式如式(1)所示：

(1)

其中I(fi)表示指标i的影响力倾向，它等于指标i下高影响力微博的数量比指标i下总体微博数量，减去总数据集中高影响力微博的数量比总数据集中微博数量。I(fi)大于零表示指标i具有高影响力倾向，I(fi)小于零则表示具有低影响力倾向，I(fi)的绝对值越大，表明影响力倾向越明显。

3.3 微博特征选取

本研究通过R 3.6.2程序软件中的jiebaR 3.0中文分词程序包，对抓取的微博全文进行思维分析。思维分析是一种基于标准功能词典的捕捉叙事、分析风格的常用方法，思维分析结果反映了文本包含的叙事和分析风格的程度(James et al.，2015)。研究表明，更多地使用介词以及对复杂对象和概念的引用会获得更高的风格得分，代表更强的分析风格(Biber,1991)，而更多地使用副词、助动词、连词、否定词和人称代词会获得更低的风格得分，代表更强的叙事风格(Jurafsky &Martin,2009;Raphael et al.，2018;Taecharungroj,2016)。

本研究使用R 3.6.2程序软件中的jiebaR 3.0中文分词程序包，对抓取的微博全文进行关注风格分析。根据标准功能词典，内外部关注风格分析反映了文本中包含的内部和外部聚焦程度(Kacewicz et al.，2014)。根据以往研究，第一人称单数代词(我)的使用越多，内外部关注风格的分数越低，代表内部关注风格越强(Kacewicz et al.，2014)，第二人称单数代词(您)和第一人称复数代词(我们)的使用越多，内外部关注风格的分数越高，代表外部关注风格越强(Kacewicz et al.，2014)。

本研究使用R 3.6.2程序软件中的jiebaR 3.0中文分词程序包和中科院NLPIR-ICTCLAS汉语分词系统，对抓取的微博全文进行情绪风格分析。基于正面(例如，喜欢、偏爱、美好等)和负面(例如，讨厌、丑陋、伤害等)情感词典，分析文本中包含的正负面情绪风格的程度(Pennebaker et al.，2014)。根据以往研究，消极情绪词尤其是高度消极情绪词的使用越多，情绪风格得分越低，代表更高的负面情绪风格(Cohn et al.，2004)，积极情绪词尤其是高度积极情绪词的使用越多，情绪风格得分越低，代表更高的正面情绪风格(Cohn et al.，2004)。以往的研究证明，NLPIR-ICTCLAS汉语分词系统有着非常完善的情绪分析标准词典和很高的情绪分析效率。

除了微博文本的风格特征外，我们还对文本主题进行挖掘，为了将微博划分为合理的主题数量，首先通过LDA文档主题生成模型对文本向量进行聚类，划分10～20个主题，得到文本主题的特征词语，随后对不同聚类中的词语进行重要程度排序，并通过观察进行归类，形成文本主题(节日推文、美食推荐、产品宣传、参与抽奖、美食教程、明星代言、促销打折、话题讨论、心灵鸡汤、养生健康)。

本研究还从用户信息、时间信息、文本信息三方面入手采集了微博用户的粉丝等级特征、活跃度特征(用户的发博频率和关注的账户数)、认证类型特征(个人品牌为黄色认证、产品品牌为蓝色认证)、发布时段信息、字符长度、图片和视频的使用情况。

3.4 效度构建

为了对变量指标的效度进行验证，本研究在确保选中每个微博账户的前提下，随机抽取60条博文，并提取每个变量的得分，在实验人员的指导下，培训40位不熟悉研究目的独立编码者，要求编码者将每条推文分为“叙事风格”和“分析风格”、“内部关注风格”和“外部关注风格”、“积极情绪”和“消极情绪”。结果表明，40位编码者正确分类推文叙事/分析风格的平均概率是90.38%；正确分类推文内部/外部关注风格的平均概率为89.54%；正确分类积极/消极情绪风格的平均概率为93.41%。总体而言，编码者正确分类91.11%的博文类型，这个概率介于人员编码和自动文本分析之间(Krippendorff,2018)。总之，编码人员的严格验证证明研究的自动化文本分析方式是可行的。

4.实证分析

4.1 微博影响力预测模型

本研究使用Octopus 8.0自动爬虫程序从新浪微博平台采集了236个个人品牌和产品品牌的全部原创微博共计85 858条作为实验数据。使用RGUI3.6.3程序软件的tm、NLP等程序包对采集到的微博文本进行文本清洗、分词处理、情感分析和风格分析得到微博的特征数据，使用weka数据挖掘平台、随机森林算法对实验数据进行挖掘。结合以往研究和本次实验的数据分布，本研究将微博影响力高低的阈值设置为20，即微博的点赞、评论和转发数之和大于20的定义为高影响力微博，为了避免高影响力微博和低影响力微博过于接近，本研究将点赞、评论和转发数之和低于5的微博定义为低影响力微博，其中高影响力微博67 294条，低影响力微博11 390条。

随后，本研究利用weka数据挖掘平台对实验数据进行微博影响力预测模型构建，使用十折交叉检验方式对预测模型的性能进行验证和选择，模型预测结果的性能主要由Precision、Recall、F-measure、ROC Area等指标进行度量。为了构建最佳的微博影响力预测模型，本研究采用了多种机器学习算法进行模型构建，包括贝叶斯网络(BN)、J48决策树(J48)、随机森林(RF)、随机树(RT)、朴素贝叶斯(NB)、决策树(DT)、装袋算法(Bagging)等机器学习算法，各算法模型的预测效果如表1所示。

表1 各算法模型的预测效果

由表中各算法性能结果比较可以看出，随机森林算法(RF)的预测准确率(Precision)为0.856，比J48决策树和Bagging提高了0.1个百分点，比贝叶斯网络提高了1.9个百分点，比随机树提高了1.8个百分点；在召回率(Recall)上比贝叶斯网络算法等其他算法高出1个百分点以上，在ROC Area上也比其他算法有所提升，因此，随机森林算法的整体预测效果更佳。

如表2所示，结果表明，实验数据中有低影响力微博11 390条，高影响力微博67 294条，其中有8 232条低影响力微博和60 820条高影响力微博被正确分类，3 158条低影响力微博被错配到高影响力微博，6 474条高影响力微博被错配到低影响力微博，因此，低影响力微博分类的准确率为72.27%，高影响力微博分类的准确率为90.37%，预测模型的总体准确率为87.37%。该模型的预测准确率高于安璐等(2017)恐怖事件的微博影响力预测模型的准确率85.7%。

表2 随机森林算法的混淆矩阵

4.2 微博特征相对重要性分析

为了探究各个微博特征的重要性程度，本研究构建了若干个随机森林特征缺失模型，用于表示当模型缺失某项微博特征时，微博影响力预测模型的准确率损失值，损失值越大，表明在缺少某项特征时模型的准确率下降幅度越大，说明该项微博特征越重要，微博特征相对重要程度的计算公式如下：

Sigi=ln [EHRF+ELRF-(Ehi+Eli)]

(2)

Sigi表示特征i的相对重要程度，EHRF表示整体随机森林模型中低影响力微博被错分到高影响力微博的个数，ELRF表示高影响力微博被错分到低影响力微博的个数；Ehi表示在缺失特征i的模型中低影响力微博被错分到高影响力微博的个数，Eli表示高影响力微博被错分到低影响力微博的个数，结果如图1所示。

图1 各微博特征的相对重要程度

由实验结果可见，用于预测的8个微博特征中缺失任何一个都会对预测模型的准确率造成负面影响，因此本研究认为实验中所采用的所有微博特征对于预测食品品牌微博影响力都是必要的。随机森林算法的分类器特点是单个特征对于总体模型的影响会在模型构建的过程中被相对弱化，因此实验中缺失的微博特征对模型准确率造成的负面影响比实际数值可能会更大，这更能说明实验中采取的微博特征都是十分必要的。

另外，从图1不难看出，在各微博特征中，微博用户的活跃度信息和文本主题缺失对于整体模型准确率的负面影响最大，其次是用户粉丝信息、情感风格、叙事/分析风格和内外部关注风格，说明在预测模型中添加文本的风格特征和文本主题非常重要。

4.3 微博特征的影响力倾向分析

为了进一步探究食品品牌发布的高影响力微博的特点，本研究使用安璐等(2017)提出的关于测量微博特征影响力倾向的方法。该指标主要是通过统计某一特征情况下的高影响力微博所占比重，减去总的高影响力微博在总微博数中所占的比重，以此来表示微博特征的影响力倾向，计算方法如公式(1)所示。根据公式得到所有微博特征的影响力倾向如表4所示，分别基于用户信息、文本信息、时间信息对微博特征的影响力倾向进行分析。

表4 微博特征的影响力倾向

续表特征特征值影响力倾向文本信息文本内容文本风格文本主题字符长度50以下0.002高50～1000.017高100～1500.110高150以上0.156高是否使用图片是0.202高否-0.032低是否使用视频是0.098高否-0.040低叙事/分析风格叙事-0.041低分析-0.024低内部/外部关注风格内部-0.012低外部0.091高积极/消极情感风格积极0.017高消极0.037高中性0.055高节日推文0.021高美食推荐0.126高产品宣传-0.061低参与抽奖0.105高美食教程0.216高明星代言0.311高促销打折0.024高话题讨论-0.038低心灵鸡汤-0.058低养生健康0.102高时间信息发布时段00:01—6:00 深夜0.105高6:01—8:30 清晨-0.140低8:31—12:00 上午-0.008低12:01—14:00 中午0.084高14:01—18:00 下午-0.008低18:01—24:00 晚上0.124高

(1)用户信息。实验结果显示，粉丝数等级越高，微博影响力倾向就越高；食品企业微博中个人品牌相对于产品品牌在网民中具有更高的影响力倾向；用户活跃度主要通过总发博量和关注数来体现，一般总发博量越多，越容易使信息为用户捕捉到，从而为关注和点赞量增加可能性，微博影响力倾向就越高。

(2)文本信息。在文本结构特征中，简短的推文很难叙述详细的故事，出现情绪高涨或剧情急剧转变，一般而言字符长度越长，影响力倾向越高；使用图片或者视频的微博，相对于简单的微博条文而言更容易被网民关注；具有叙事和分析风格的推文并未产生正向的影响力倾向；外部关注风格微博的影响力倾向高于内部关注风格微博；不同文本情感的微博影响力倾向均较高，这说明微博用户的情感是多样性的，能够引起网民广泛的参与热情。但是，相对于情绪化的文本风格，网民更愿意参与探讨具有消极情绪的微博，对于食品企业微博而言，消极情感的文本更容易受到关注。从主题分类来看，美食推荐、美食教程、养生健康类等与食品密切相关的微博影响力较高，同时我们发现，明星代言和设置转发抽奖等微博也会产生较高的微博影响力。

(3)时间信息。时间特征下的发布时间段，以日为周期，按照微博用户的规律作息，一天24小时分为6个时段。通过实验可以发现，不同时间段的微博影响力倾向具有明显差异，中午、晚上、深夜时间段发布微博的影响力倾向高，上午和下午以及清晨时间段发布微博的影响力倾向低。总体而言，在微博发布的过程中，影响力倾向数值体现了网民的生活习惯，合理计划发布微博时间也是极为重要的。

5.结论、局限、展望

5.1 结论与讨论

本文采用基于深度机器学习和言语行为理论的食品品牌微博影响力预测模型，通过对品牌发布的微博进行编码放入微博影响力预测模型，构建了若干个随机森林特征缺失模型，发现各微博特征均会对预测模型的准确性产生积极影响。具体而言，对于食品企业，微博影响力的重要因素从高到低依次为：活跃度信息、文本主题、用户粉丝信息、文本风格、时间信息、认证信息。

通过言语行为理论的视角，具体展示了语言风格如何影响消费者。首先对于食品品牌而言，重点必须放在外部，这个结果符合Aleti等(2019)认为消费者很可能转发外部关注的推文，以此增强与品牌的社交关系。其次最常见的推文类型未必是最有效的口碑或形成较高的影响力，例如叙事风格推文在食品企业是最常见的，但是并没有产生显著的正向影响力倾向。关于情感风格，对于食品企业而言，负面的信息更容易引起讨论和关注以及转发，网民普遍认为它们在判断和决策时有更强的参考价值。文本主题特征是微博内容的细分特征，从主题分类来看与美食相关的微博特征会产生明显的影响力倾向，不仅如此，促销打折、明星代言、设置转发抽奖等较高影响力倾向的微博类型表明品牌与消费者的互动手段正在不断多元化。

一般来说，食品品牌微博中个人认证类型相对于企业认证类型在网民中具有更高的影响力倾向。品牌微博在发布的过程中应保证微博发布频率和质量，才容易使信息落在用户的视觉带，从而增加粉丝量和点赞量，提升微博影响力倾向。图片和视频通常来说承载更加丰富的信息，相比文字而言具有更强的感性认知，网民可以通过自己的观察提炼出核心内容，使记忆更加深刻。《2020微博用户发展报告》显示，中午和晚上是微博用户活跃度最高的时段，我们的研究也证实了，相对来说中午和晚上发布的微博影响力高于其他时段。

5.2 研究意义

目前有关食品企业社交媒体营销的研究尚很匮乏，以往的研究多是关于社交媒体传播的内容和意图。本研究丰富了食品品牌社交媒体与消费者互动的内在机理研究，通过分析食品行业在网络营销领域的信息交流行为，基于言语行为理论对食品企业微博的特征进行分析，利用机器学习技术对食品行业进行影响力预测，提供了更细微的推文特征和结构，对于揭示消费者在食品营销领域的关注点、行为方面具有重要的意义，展示了不同的微博文本特征、主题和风格是否会对消费者互动产生积极影响，对于食品行业的网络名人合理地预见并且有计划地开展网络营销工作，科学地发布微博具有重要的意义，有助于他们更好地执行社交媒体传播的策略。

研究表明，文本主题、语言风格、认证信息和时间信息等都会对食品企业微博影响力倾向产生影响。换句话说，食品品牌微博发布者需要关注网民所关注的点，学会用网民感兴趣的方式与他们交流。在营销实践中，食品企业品牌在微博内容发布方面应尝试采用不同的手段：明星代言、发布促销打折信息、参与转发抽奖等，并且选择合适的发博时间，符合网民的日常生活规律和使用习惯；同时要提高微博发布频率，增加网民对于产品信息的接受频率。我们的研究表明，个人品牌的美食博主相对于企业微博影响力倾向更高，在网民眼中个人品牌博主具有客观性并且带有“网络名人效应”，大众更乐意接受个人品牌的评价，所以食品企业还要多与个人品牌进行合作，联合进行产品宣传，能获得更高的产品关注度和更好的产品态度。对于食品品牌微博写作风格方面，应优先考虑外部关注风格，因为需要通过传递自身的感受或者信息来影响他人的选择；品牌微博合理使用带有负面情绪的推文可以增加受众的关注、评论或者转发，从而产生“负面信息效应”。

5.3 存在的局限和展望

本研究还存在如下局限，希望在未来进一步完善：

首先，微博特征的划分结构仍需要加以补充，例如文本风格方面的二分法的推文类型过于单一，随着微博功能的多元化和品牌官微作用的多元化，未来可以通过对相关变量进行聚类分析，尝试将微博划分成不同文本风格组合，做进一步的补充。

其次，发博时间以日为周期仍然过于单一，增加对工作日/节假日或者以周/月为周期的研究等。

最后，随着社交媒体形式的丰富，扩宽社交媒体平台的研究范围很有必要。当然，如果我们需要着重研究某种产品或者某个企业，未来可以更多地围绕产品属性展开，结合某种产品的特性进行具体研究。