基于文本挖掘技术的印媒中美关系报道情感立场分析

2021-05-29 17:20姜坤刘苗
对外传播 2021年2期
关键词:文本挖掘中美关系

姜坤 刘苗

【内容提要】本研究以“中美关系”“中美”“习近平 特朗普”为关键词,检索2018年1月至2020年5月期间四家印度主流媒体关于中美关系的新闻语料,进行印媒新闻话语的情感立场分析。研究发现:1.印度“亲美厌华”的情感倾向明显,对华负面形象刻画较多;2.印媒报道中还存在不少刻意歪曲的不实报道;3.印媒对中美关系的报道叙述技巧,具有显著的互文性特征;4.四家印媒之间的情感立场倾向都持负面倾向性,但也存在差异。

【关键词】印度媒体 中美关系 情感立场 文本挖掘

批评话语分析通过分析语言,解释语言运用中隐含的意识形态和其中所体现的权利关系。①媒体作为话语权力与知识交融的场所,构建并折射现实社会与政治生活,是国家形象的重要传播载体。在传播国家形象时,媒体掌握着对公众议程设置的权利,决定着国家形象的传播内容及传播方式。②

本研究运用基于大数据的文本挖掘手段,对印度媒体有关中美关系的报道语料进行情感立场分析,分析从三大维度进行:其一,对四家媒体报道的情感倾向进行分析;其二,结合具体语境对相关语料的高频情感词进行分析;其三,对媒体转载情况进行分析,并结合媒体的转载特征分析其立场倾向。笔者力求通过对印媒相关语料进行多维度的情感分析,剖析印媒背后的政治立场和意识形态,为新冠肺炎疫情蔓延以后的新国际环境下中国顺利开展周边外交提供参考。

一、媒体及语料来源

《印度时报》于1838年开始出版发行,是发行量最大的印度英文报纸,不仅在印度,在世界范围内的影响力也不容小觑。《印度斯坦时报》是印度排名靠前的英文日报,于1924年开始出版发行,其读者数量巨大,是仅次于《印度时报》的当地英文报纸。《今日印度》是印度排名第一的英文杂志,于1975年开始出版发行,是当地读者量最大的英文杂志。《印度快报》是最具影响力的印度英文日报之一,于1958年开始出版发行,在创办初期日发行量就已超过60万份,如今发行量更是巨大,是印度最具影响力的报团报系。这几家媒体在印度的影响力巨大,其报道中有关中美关系的观点会影响印度民众的看法,在当今中国外部舆论环境艰难的状态下,这几家媒体的报道特点非常值得密切关注。

因此,本文以印度这四家主流媒体为研究对象,用关键词检索的方法,在四家媒体的官方网站中分别以“中美关系”“中美”“习近平 特朗普”为关键词进行多次检索,检索时间为2020年6月,检索的媒体语料发表时间为2018年1月至2020年5月。之所以将检索语料开始时间定于2018年1月,是考虑到2018年以后中美关系变得异常紧张,本研究重点考察中美贸易摩擦全面升级之后的印媒报道话语,聚焦中美冲突升级形势下印媒的相关报道特点。从检索结果中筛选与中美关系相关的报道,最终共筛选出相关报道900篇。其中,《印度时报》215篇,《印度斯坦时报》202篇,《今日印度》271篇,《印度快报》212篇。

二、数据统计及分析

本研究的研究语料是印度媒体有关中美关系报道的新闻和网络文本,研究工具为统计软件R和语料库工具AntConc。根据其话语特点,使用R的文本挖掘功能进行文本情感分析,按照以下步骤分析和解释数据:首先对四家媒体的中美关系相关报道进行整体情感倾向分析;其次对研究语料的情感高频词进行分析,结合共现语境剖析情感积极词和消极词的具体指代含义;最后结合其相关报道的转载特征进行媒体情感立场的剖析。

(一)情感倾向分析

表一为四家印度媒体中美关系相关报道的情感分析表。具体处理方法为在R软件中导入bing版本的情感分析词典,③对所研究语料的积极情感词和消极情感词进行情感赋值,积极情感词为正向分值,消极情感词为负向分值,通过计算文本的整体情感分值,来把握相关语料的情感态度。整体文本的最终情感赋值若呈正向分值,说明媒体对所报道的事件持积极立场,正向分值越高,则代表媒体的积极立场倾向越显著;反之,呈现负向分值则说明媒体对相关报道呈消极态度,负向分值越高则意味着媒体的负面立场倾向越明显。通过表1数据,可以清晰地观察到印媒对中美关系相关报道的情感立场:1.四家媒体的情感立场整体呈明显负面倾向态度。具体来看,四家媒体整体语料的情感值为-2888,而四家媒体各自的报道文本情感值也均为负向分值,这说明本研究所选取的四家媒体对中美关系的相关报道均持明显的消极情感态度。2.四家媒体的情感态度呈现细微差异。虽然四家媒体相关报道语料的情感分值均为负向分值,但仔细观察,《印度时报》和《印度斯坦时报》两家媒体的负向情感值又明显高于《今日印度》和《印度快报》两家媒体。四家媒体的情感倾向存在差异性,《印度时报》和《印度斯坦时报》的相关报道情感立场更为消极。

(二)情感高频词分析

图1、图2是印度四家媒体有关中美关系报道的情感值贡献词图,笔者运用统计软件对本研究语料进行情感分析后,分别筛选过滤出本语料中情感值贡献最高的前20位积极词和消极词,并聚焦图中出现的高频情感积极词和消极词,使用语料库的语境共现功能,对每个高频情感词进行仔细研读,最终挑选出病毒(virus)、争端(dispute)、担忧(concerns)、威胁(threat)作为消极情感词的典型代表,赢得(win)、保护(protect)、智能(intelligence)、优势(advantage)作为积极情感词的典型代表进行聚焦性深入分析。

1. 消极情感词

(1)病毒(virus)

与“病毒”相关的报道,用语大多引用美方的话语。通过分析可以看出其报道特点:第一,病毒通常与中国、中国人、武汉等代表中国的词搭配,且与此相关的新闻大多在报道美国总统或高级官员命名或改口的事件,表明印媒关注中美之间的微妙关系,且其立场较偏向于美国;第二,在提到病毒时,通常用“源自武漢”或“由武汉实验室制造”等修饰,强调病毒发源于中国甚至源于中国实验室。此类报道多引用美国总统及高级官员的话语;第三,报道美国认为新冠病毒蔓延的责任属于中国,中国应该为此承担责任;第四,报道美国指责中国隐瞒疫情,错过了防控的关键时期,并认为中国刻意将病毒散播至海外。通过具体分析其共现语境,“病毒”一词在印媒报道的话语使用中,多偏向于否定中国,对中国污名化或推卸责任这一潜在意图。

(2)争端(dispute)

“贸易争端”出现的频率最高,说明印媒十分关注中美贸易摩擦。相关文本大多讨论的是中美贸易摩擦的初始阶段,集中讨论美国对中国钢、铝等提升关税。此外,媒体还聚焦中美贸易战摩擦的升级,例如:“中美贸易冲突在八月份进一步升级,双方都对对方征收了报复性关税(The trade dispute between the US and China widened in August, with each side imposing retaliatory tariffs on the other)。”此类报道在语料中出现的较多,其关注点在于贸易冲突升级的背景下,双方进行相互牵制所采取的具体措施。通过这几项文本大致可观察到印媒密切关注中美贸易摩擦的各个阶段。除此之外,“争端”还指代美国与中国技术政策的争端等。

(3)担忧(concerns)

“担忧”相关文本讨论多以美国视角看问题,这表明了印媒的立场。第一,站在美国的立场上,描述美国担忧中国的某些行为对美国造成的不利影响。例如:“白宫发言人:美国总统特朗普对中国不公正的贸易行为感到担忧,并试图阻止此类行为以及中国窃取美国知识产权的行为(US President Donald Trump is concerned about Chinas unfair trade practices and striving to stop Beijing from such practices and theft of American intellectual property, the White House said on Thursday)。”在此类报道中,“担忧”一词的主语基本都是美国,内容多为美国担忧中国对其在网络等方面的威胁,并将中国刻画为不守规则的形象。第二,报道中关于美国对西藏等问题的干涉,通过引用美方政要的话语被描述成美方对西藏等问题的合理关切。

(4)威胁(threat)

情感消极词“威胁”所涉及到的报道大致可归纳为三类。第一,大多是指中国对美国制造的威胁。例如,美国禁止美国公司安装对其公司造成威胁的中国制造的电信设备(华为等),例如:“在贸易紧张局势升级的情况下,特朗普于5月15日签署了一项行政命令,禁止美国公司安装对国家安全构成威胁的外国制造的电信设备,此举显然旨在禁止华为进入美国网络(Escalating the trade tension, Trump signed an executive order on May 15 barring American companies from installing the foreignmade telecom equipment posing a national security threat, a move apparently aimed at banning Huawei from US networks)。”在此类报道中,媒体虽未提及中国制造的威胁性,但却肯定了美方的观点。这也证明了印媒的舆论倾向与立场。第二,报道美方认为他们面临被中国窃取知识产权的威胁。这些无端指责是毫无根据和道理的。但印媒却如是报道,由此可见印媒政治立场明显偏向美方。第三,报道中美关于增加关税的问题。

2.积极情感词

(1)赢得(win)

第一,“双赢(win-win)”出现的频率较高,且基本有关双赢的倡议都是中国提出的,说明中国一直提倡与美国达成共赢,印媒也十分关注这一点,其承认中美关系的变化牵动世界经济、政治等发展走向,双赢不仅是中美双赢,更是两个大国与世界其他国家之间的共赢。印媒引用中国媒体报道中中国政要的话语,说明印媒中也存在传达中国声音的新闻。第二,关注中美冲突中的小事件,例如特朗普指责中国试图干涉美国总统大选,原因是其对中国实施贸易战。第三,相关新闻报道美国总统声称他们在贸易战中很容易获胜或他们已经赢得了某阶段的胜利,表明印媒关注中美贸易摩擦中的各个阶段,且都站在美国立场进行报道。

(2)保护(protect)

“保护”所指代之意多与中美双方保护各自的利益相关。美方认为中国试图窃取美国的技术成果以求中国的发展,故其采取措施保护其成果不被窃取,同时美方指责中国窃取技术的行为。通过分析积极词汇“保护”,笔者发现在印媒报道中,即便是积极词汇,对中国而言很多也具有消极情感意义。

(3)智能(intelligence)

“智能”一词关联文本多描述美方指控中国窃取美国机密以促进中国人工智能发展,以及美方阻碍中国人工智能的发展。例如:“特朗普政府周一宣布将在黑名单中增加28个实体企业,其中包括一些中国领先的人工智能公司(The Trump administration announced Monday that it would add 28 more entities to that blacklist, including some of Chinas leading artificial intelligence firms)”。由此可见,“智能”虽为积极词汇,但总体舆论倾向对中国不利。

(4)优势(advantage)

“优势”一词的英文具有利用、優势等词义。作“利用”之意时大多表达中国利用美国得到发展。例如:“特朗普声称中国已经利用美国很多年了(Trump alleged that China has taken advantage of the United States for many, many years)”。而当指代“优势”之意时,其关注点在于中美之间对抗时各自的优势。

(三)转载情况分析

表2是印度四家媒体有关中美关系报道的转载来源情况表。通过分析发现,印媒转载西方媒体报道的数量惊人,总共900篇报道中转自路透社的有193篇,美联社有69篇,彭博社有64篇,法新社有57篇,《纽约时报》有21篇,“德国之声”有1篇,总计转载西方媒体报道405篇,占总语篇数量的45%,比例之高可谓惊人。此外,印媒转载引用西方媒体报道话语的互文性特征显著。在互文理论中,克里斯蒂娃认为任何文本不可能全都是作者全新的内容,必然吸收了前人文本精髓,因此对文本的理解,同词语的理解意义,所涉范围不仅是单个文本,而是要扩展、延伸到其他相关文本。④因此,从转载特征来分析,印媒的情感立场倾向势必是与西方主流媒体立场一致的。

三、结论

综上,印度媒体有关中美关系报道的情感立场大致可归纳为如下几个特征:第一,印媒有关中美关系报道话语的情感立场倾向明显,大都与英美主流媒体态度保持一致,亲美厌华倾向明显,中国在其报道中多被构建为负面消极的国家形象。第二,印媒报道中还存在不少不实报道。例如:印媒对西藏问题的报道,以及指责中国窃取美国研究成果的报道,这些报道毫无根据。第三,印媒转载引用西方媒体报道话语的互文性特征显著。第四,四家印度媒体之间的情感立场虽都持负面倾向性,但也存在细微差异,《印度时报》和《印度斯坦时报》的负面立场倾向比另外两家更为明显和严重。

当今中美关系紧张,贸易战、舆论战持续升级,在西方主导话语权、中国话语权式微的国际舆论大环境下,中国应该对加强外媒报道话语的研究力度,增强国际议题的主导能力,力求突破当今面临的舆论困境。

作者:曲阜师范大学翻译学院讲师;曲阜师范大学翻译学院本科生

「注释」

①潘艳艳:《美国媒体话语霸权下的中国海上力量构建》,《外语研究》2014年第2期。

②刘文宇、毛伟伟:《非洲报纸媒体中中国形象的语料库辅助话语分析》,《外语研究》2020年第2期。

③使用文本挖掘功能进行情感分析时,常用的情感词典有afinn、bing、nrc等几种版本,本文采用的是bing版本的情感词典。

④徐赳赳、毛浩然、徐朝晖:《克里斯蒂娃的语言观》,《当代修辞学》 2020年第4期。

责编:李倩

猜你喜欢
文本挖掘中美关系
数据挖掘技术在电站设备故障分析中的应用
中美关系已不是说翻就翻的“小船”(观察家)
基于LDA模型的95598热点业务工单挖掘分析
文本数据挖掘在电子商务网站个性化推荐中的应用
从《远程教育》35年载文看远程教育研究趋势
慧眼识璞玉,妙手炼浑金
文本观点挖掘和情感分析的研究
“冷战与中美关系”学术研讨会在西安举行