老年话语的计算机自动文本分析:进展与前景

2022-05-13 18:50黄立鹤曲惠宇杨晶晶
语言战略研究 2022年3期

黄立鹤 曲惠宇 杨晶晶

提 要 使用计算机自动文本分析来考察老年人话语产出特征,是智能技术在老年语言学领域中应用的一个重要实例。Coh-Metrix和LIWC是国内外最常用的两种自动文本分析工具,在国外老年语言学研究中已被广泛使用。前者及其衍生工具侧重语篇分析,从语篇结构特征评估老年人群的话语连贯性、衔接性;后者侧重从词汇入手进行语言心理特征测量,考察老年人的思维方式、内心状态及人格特征。两种工具对老年失智症等疾病的早期诊断和评估具有重要临床意义。未来研究应关注自动化转录和切分的可行性,利用此类工具对失智症患者进行长期追踪研究以提高病程判断的精准度,进一步评估此类方法能否在临床上检测老年人认知水平的变化过程。我国应加快建设老年人话语语料库,同时开展针对汉语自动文本分析工具的开发。

关键词 自动文本分析;语篇特征;言語产出障碍;老年语言学

中图分类号 H002 文献标识码 A 文章编号 2096-1014(2022)03-0088-09

DOI 10.19689/j.cnki.cn10-1361/h.20220307

The Application of Computer Automatic Text Analysis in the Study of Gerontolinguistics:

Progress and Prospects

Huang Lihe, Qu Huiyu and Yang Jingjing

Abstract The use of computer automatic text analysis in the study of the elders discourse is an essential application of artificial intelligence in the field of Gerontolinguisitcs. Coh-Metrix and LIWC are two most commonly-used automatic text analysis tools, which have been widely used in the study of Gerontolinguistics abroad. Coh-Metrix evaluates the coherence and cohesion of the elders discourse from the perspective of discourse structure features. LIWC mainly measures the elders vocabulary to investigate their thinking mode, inner state, and personality characteristics. Both tools demonstrate the feasibility of computer-automated text analysis for early diagnosis of dementia with important clinical implications. Future research can focus on the automatic transcription and segmentation, conducting long-term follow-up research on dementia patients to improve the accuracy of diagnosis and early detection of cognitive function changes in clinical trials. This paper also suggests to speed up the construction of a Chinese elders discourse-tagged corpus and develop automatic text analysis tools for the Chinese language.

Keywords automatic text analysis; textual characteristics; speech production disorder; Gerontolinguistics

一、引 言

近年来,随着全球人口老龄化程度的持续加深,对老年人话语产出特征的研究在国内外广泛开展。与记忆、思维等认知过程相似,人类语言产出能力也会随着自然年龄的增长或疾病侵袭而逐渐衰退(Burke & Shafto 2004)。

与年轻人相比,老年群体有其独特的话语产出特征。国内外学者对不同年龄段群体进行对比分析后发现,老年人在词汇提取、词汇丰富度、句法复杂度、口语流利性等方面均有不同程度的衰退,具体表现为:(1)词汇提取困难。在言语产出方面,老年人比年轻人经历更多的“舌尖现象”,即知道自己想要表达的词汇,却不能成功提取词汇的发音(Burke et al. 1991;Heine et al. 1999);在书写产出方面,老年人更容易出现提笔忘字现象(何洁莹,张清芳2017),在听写单词时正确率也比年轻人低,尤其是对高频单词的拼写(MacKay & Abrams 1998);此外,老年人在日常交流沟通中产出句子的精确度和词汇丰富度都有所下降,具体表现为较少使用情态助动词以及带有情态动词的动词词组或句法结构(Kynette & Kemper 1986),较少使用“you know”“I mean”等插入语(Kemper & Sumner 2001)。(2)句法复杂度下降。这一点不仅表现在老年人的口语交际上,在书面表达上也有所体现,如较少产出带有内嵌从句的句子,尤其是带有左分支嵌入结构的句子(Kemper 1987)。(3)口语流利性下降。随着年龄的增加,老年人口语中大量出现各种非流利现象,如对某一内容无意识地重复(Sitek et al. 2015)、由于大量使用填塞语造成的非流利性填塞(Nicholas et al. 1985)、无特定交际目的的大量停顿(Ahmed et al. 2013)等。除了以上3点,老年人在语音韵律、句法语义、语用话语等方面也都有显著特征。语言是揭示认知功能的重要指标之一,鉴于老年人语言的独特性,开展老年人话语产出特征研究可以厘清语言随年龄及认知状态的变化情况,有助于认知功能障碍等相关疾病的诊断和预测,对延缓语言能力衰退也具有重要意义。

目前,基于人工智能的老年语言学研究正逐步展开。通过与老年语言学研究成果相结合,人工智能可以帮助实现相关疾病的风险预测、智能诊断、个性化治疗与智能康复(黄立鹤2019)。使用计算机自动文本分析工具研究老年人话语产出特征就是智能技术在老年语言学领域中应用的一个重要实例,相关研究不仅提高了分析的效率和准确率,也解决了以往难以从大规模老年话语中精确提取和分析话语特征的问题,从而可以更科学、系统地描写老年人话语产出能力,为人工智能在老年语言学领域基于老年语言特征的风险预测、智能诊断等应用提供基础数据。

二、计算机自动文本分析概述

文本是丰富的资源,不仅可以反映说话人的语言能力,也可体现说话人的思维方式、内心状态,甚至人格特征(张信勇2015),因此文本分析方法被广泛应用于各个领域的研究中。早期的文本分析采用人工手段,研究人员根据研究需要手动标注文本,但随着文本数量的增多和篇幅的增长,这种传统方式逐渐暴露了其工作量大、耗时长、成本高等缺点(Aluísio et al. 2016),阻碍了文本分析在相关领域的应用和发展。随着计算机技术的发展,计算机自动文本分析应运而生。自动文本分析可在有限时间内快速高效地实现对复杂文本信息的解码和统计,不仅提高了研究效率,还一定程度上避免了人工标注误差,使得研究结果更具客观性和科学性(Toledo et al. 2018),近年来得到越来越多学者的重视,并被广泛应用于语言学、管理学、政治学等学科。

文本分析法是语言学常用的研究方法之一,该方法不仅可以从句法、语义、文体等不同方面对文本进行分析研究,也可以与语音学、语用学等传统语言学领域相结合,为传统语言学研究提供新视角(Stubbs 2005)。在语言学研究中,该方法既可用于探索不同人群某一语言特征的差异,如Reid(1992)使用自动文本分析工具Writers Workbench(WWB)调查了不同语言背景的演讲者在使用衔接手段方面是否具有差异;也可用于探索某一特定语言目的的实现方式,如对语篇主题展开特定分析(Gómez-González 1998;Green et al. 2000)。社会问题也是文本分析关注的重点之一(Sarangi & Coulthard 2000)。在社会语言学研究中,计算机自动文本分析被广泛应用于政治文本分析、媒体文本分析、性别与身份研究等多个领域,如Diermeier et al.(2011)使用文本分类算法分析了第101至108届美国国会期间参议院的立法演讲记录,从中提取最能代表保守派和自由派立场的信息,并预测第108届国会参议员的意识形态立场,准确率高达94%。总的来看,计算机自动文本分析在探索与分析语言特征方面有着显著优势。

如前所述,老年群体具有独特的话语产出特征,计算机自动文本分析为开展老年人话语产出的句法复杂度、词汇丰富度、语篇流利性等方面的研究提供了技术支持,也为探究老年期的内心状态和思维方式提供了新的路径与视角,相关研究成果可应用于老年群体的语言能力评估、疾病预测与诊断,兼具研究意义与临床价值。在目前主流的自动文本分析工具中,Coh-Metrix和“语言探索与字词计数”软件Linguistic Inquiry and Word Count(LIWC)应用广泛。前者包含数百项测量指标,可对文本篇章结构特征进行详细总结,反映说话人的语言运用能力;后者从语言的心理特征出发,对说话人的内心状态、情感特征进行分析。本文分别从篇章结构视角和心理测量视角出发,介绍这两种工具的特征及其在老年语言研究中的应用。

三、篇章结构视角:Coh-Metrix工具

计算机自动文本分析工具Coh-Metrix由美国孟菲斯大学的McNamera等人开发,整合了词性赋码器、模式分类器、句法分析器、浅层语义分析器等自然语言处理分析技术和语篇分析领域的最新理论,可以实现对文本的表层和深层特征的自动量化(杜慧颖,蔡金亭2013;McNamara et al. 2014)。Coh-Metrix可对200多项指标进行分析,涵盖了指称衔接、潜在语义分析、词汇多样性、情景模式、句法复杂度等11个模块,是一款可从多个层面进行文本分析的计算语言学工具(Graesser et al. 2014;江进林2016)。

随着国内外基于Coh-Metrix的研究逐渐增多,该工具应用范围不断扩大,在语言习得、外语教学与研究、认知语言学等多个研究领域均发挥了作用。例如,在二语写作领域,Crossley & McNamara(2011)对中国香港高中生撰写的1200篇英语作文分析显示,词汇多样性、词频、词汇意义关联度等指标可以预测作文质量;秦朝霞和顾琦一(2011)对国内某高校英语学习者的204篇英语写作文本进行分析,发现学习者对作文话題的熟悉程度并不影响其对连接语的整体使用,但会对照应类和词汇重复类衔接手段的使用产生影响。综合已有研究发现,Coh-Metrix在二语写作研究领域的应用主要有两类:一类采用量化比较的方法,将母语为英语的学生和二语为英语的学生作为比较对象,以揭示二语学习者英语写作特点。此类研究多采用Coh-Metrix测量指标中的连接语、照应、词汇重复等衔接性指标进行数据测量与分析。另一类是探究Coh-Metrix某些指标与写作文本质量的关系,为二语写作教学提供建议与启示。此类研究多通过测量Coh-Metrix的词频、词汇多样性、词汇同指关系等指标进行文本分析。

目前,Coh-Metrix在老年人话语产出特征研究的应用主要致力于阿尔茨海默病、轻度认知障碍等疾病的早期诊断,该类研究也激发了针对失智症人群而开发的Coh-Metrix-Dementia创建与发展(Cunha 2015)。Coh-Metrix-Dementia利用自然语言处理以及机器学习技术,旨在自动检测失智症患者的语言和认知衰退状况,以发现有助于失智症诊断的高敏感性语言特征,实现对失智症的自动诊断和分类(Cunha 2015;Aluísio et al. 2016)。Coh-Metrix-Dementia在Con-Metrix原有指标的基础上纳入了25个新指标,涉及非流利性、潜在语义分析、词汇多样性、句法复杂度和语义密度等领域。Aluísio et al.

(2016)从认知健康老年人、阿尔茨海默病患者和轻度认知障碍患者的叙述性语言测试中提取了73个语言特征进行分析,考察了Coh-Metrix-Dementia对这3类老年人群进行自动分类的能力。为了评估Coh-Metrix-Dementia指标在分类和回归任务中的表现,该研究分析了上述3类老年人对灰姑娘故事口头叙述的转录文本,共采用7种分类方法和4种回归方法来预测被试所属组别,结果显示Coh-Metrix-

Dementia成功鉴别3类人群的准确率达81.7%,鉴别认知健康老年人和轻度认知障碍患者的准确率高达90%。这些研究表明,Coh-Metrix-Dementia是帮助筛查与诊断老年语言障碍的有效工具。但目前该类研究采用的数据集规模有限,还需要更多的数据样本来建立稳定的回归或分类模型。

在相关研究基础上,Toledo et al.(2018)利用Coh-Metrix-Dementia对比分析了60名年龄在60岁以上的健康老年人、轻度阿尔茨海默病患者、轻度遗忘型认知障碍患者个人叙述中的语言特征,旨在验证故事叙述任务是否能够区分3类老年人群,并同时使用定量参数和定性参数来验证3组人群在信息量、整体连贯性等宏观结构方面的表现。表1列出了Coh-Metrix-Dementia中可提供有关宏观结构信息的测量指标。该研究使用SPSS14.0进行数据分析,运用Kruskal-Wallis非参数检验比较3类人群在所关注指标方面的表现,当有显著性差异时进行Tukey多重比较。结果表明,轻度阿尔茨海默病患者的整体表现较差,具体表现为信息量更少、整体连贯性和叙事结构更差等。该研究证实了轻度阿尔茨海默病患者话语宏观结构的病理性变化,与先前研究的结论相互印证(Cuetos et al. 2007)。未来研究还可以从单个域出发,探究该类人群话语的微观结构变化。在国内,黄立鹤、杨晶晶(2022)利用Coh-Metrix汉语版,分析了母语为汉语的阿尔茨海默病患者的看图说话语料,发现信息量少、信息密度低、语篇概念相似度高等问题。

研究表明,失智症引起的认知退化可能在首个认知效应被察觉之前数年甚至数十年就开始了(Sperling et al. 2013),因此寻找能够及早体现认知衰退的语言标志物十分重要。Coh-Metrix从篇章结构特征出发,通过评估老年人群的话语连贯性、衔接性等特点,有望实现对失智症的早期发现、自动诊断与分类,具有临床意义。

四、心理测量视角:LIWC工具

LIWC是一款基于心理学的计算机自动文本分析工具,主要包括词典和程序主体两个部分,前者定义了词语归属的类别名称以及字词列表,后者通过将文本中的词语和词典一一对比,量化因果词、情绪词、认知词等心理词类以反映人类口头和书面语言中存在的各种情感、认知和结构成分(Pennebaker et al. 2007)。国内已有学者对LIWC 2007进行了介绍,该版本包含22个语言性类别、32个心理特性类别、7个个人化类别、3个副语言学类别以及12个标点符号类别,共80个字词类别,可用于对文本情感、心理特征、语言流利度等的综合考察(张信勇2015)。目前,LIWC已经更新到LIWC-22版本,最新版本在原有版本的基础上增加了辅助处理模块,包含构建词典、可视化记录词频词云和主题模型等8种功能(Boyd et al. 2022),方便研究者对多个文本文件进行高效处理。

作为一个测量语言心理特征的工具,LIWC在心理学领域应用广泛。例如,Rude et al.(2004)使用LIWC 2001对目前、曾经及从未处于抑郁状态3类大学生群体的作文进行了语言差异检查,针对作文中出现的单数第一人称代词、复数第一人称代词、社会关系(如对朋友、家人等的提及)等语言特征展开测量分析。结果发现,相比从未处于抑郁状态的被试,有抑郁经历者更多地使用负面情感词;更多地使用单数第一人称代词,表明该类人群更倾向于关注自身;代词的使用与社会关系的质量也与抑郁状态相关。Simmons et al.(2008)调查分析了98名强迫症或急性焦虑症且伴有恐惧症的门诊患者,利用LIWC对患者与其主要亲属互动过程的录音以及对其亲属进行的半结构式访谈录音材料进行文本分析,主要测量指标包括单数第一人称代词、第二人称代词、单数第三人称代词等。结果表明,第二人称代词的使用可以预测不良亲密关系。除此之外,LIWC在分析语词特征与思维过程、情绪情感、社会关系等的研究中也被广泛应用(张信勇2015)。LIWC在心理学研究领域的應用,有力证实了文本分析是探索人类心理机制的有效方法,也说明LIWC工具可以为探索老年人心理认知过程提供路径。

与在其他领域的应用类似,LIWC在老年人话语产出特征研究中使用的测量指标需根据研究目的而定。该工具主要被用于探究健康老年人和特殊老年群体的语言特征,以及诊断检测阿尔茨海默病和轻度认知障碍等疾病。

(一)探究个体正常衰老过程中的话语特征

Pennebaker & Stone(2003)利用LIWC中的过去时动词、将来时动词、因果关系词等14个与人格和衰老有关的测量指标,使用共时文本和历时文本,分两个项目横向和纵向探索了语言使用与衰老之间的关系。第一个项目使用的共时文本是来自3个国家的3000多名被试对生活中情感经历的书面或口头叙述,第二个项目的历时文本来自过去500年中10位著名小说家、剧作家或诗人的作品。研究基于相关分析和方差分析两种统计方法来探究语言特征(包括线性和曲线变化)随被试年龄变化的程度。两项研究都表明,随着年龄的增长,人们使用积极情感词和使用未来时态的频率增高,使用消极情感词、自我指称以及过去时动词的频率降低,并表现出认知复杂性增加的一般模式。这说明对语言使用情况的分析可以代替现在普遍使用的用自我报告来揭示人格和发展过程的方法,对心理学领域的相关研究具有启示意义。

(二)探究特殊老年群体的话语产出特征

Shibata et al.(2016)通过LIWC调查分析了母语为日语的阿尔茨海默病患者口语单词的特征。18名被试根据简易精神状态检查量表(Mini-Mental State Examination,MMSE)的测试分数被分为健康对照组(测试分数为22分及以上的被试)和阿尔茨海默病组(测试分数为21分及以下的被试),研究对被试与医务人员之间的对话进行了文本分析。由于LIWC当时只适用于英语语种,该研究通过翻译英语LIWC来制作日语LIWC,删除了与目标疾病无关以及不可翻译为日语的单词种类,最终提取了22种与疾病相关的单词类别作为测量指标。结果显示,与健康被试相比,患有阿尔茨海默病的被试对非人称代词的使用更加频繁。该研究证明了LIWC在阿尔茨海默病患者等特殊老年群体话语产出特征研究上的适用性。

(三)探究失智症老年患者的语言心理特征

一些研究表明,神经退行性疾病患者可能出现焦虑、抑郁、情感淡漠等情绪症状(Levenson et al. 2014),对与语言产出相关的神经认知系统产生影响,如工作记忆、语音回路、发音模式、词汇选择等(Cummins et al. 2015),这为临床上通过语言特征鉴别患者提供了可能。Asgari et al.(2017)利用LIWC对14名患有轻度认知障碍的被试和27名具有完整认知能力的被试临床试验中非结构化对话进行分析,以期通过老年人话语内容区分轻度认知障碍患者和认知健康老年人。研究采用了支持向量机(Support Vector Machine,SVM)和随机森林分类器(Random Forest Classifier,RFC)两种机器学习算法来训练统计模型以区分两类被试,并使用了五折交叉验证方案来检验实验结果独立于研究数据集的能力。结果表明,使用LIWC获得的语言特征可以有效区分轻度认知障碍患者与健康老年人群,准确率达84%。研究还发现,与LIWC单词词典中的其他类别相比,从属于“相对性”类别的单词子类别中提取的语言特征明显更易发现轻度认知障碍诊断的线索。Shibata et al.(2016)和Asgari et al.(2017)的研究都有力说明了对口语的语言心理特征分析可能是早期检测与诊断阿尔茨海默病和轻度认知障碍等失智症的有效途径。

总的来说,LIWC工具在老年人话语产出特征及老年语言学研究中的应用,有利于通过对语言特征的分析来揭示健康老年人以及特定老年人群的内心状态和心理特征,从该视角帮助阿尔茨海默病等老年疾病的评估和诊断。

五、结 语

计算机自动文本分析是一种可以识别个体早期语言障碍疾病的有效工具,且与传统的人工手动分析相比,该类方法更具客观性、准确性和高效性。本文介绍了Coh-Metrix和LIWC两种自动文本分析工具的特点、作用及其在老年人话语产出特征研究中的应用。Coh-Metrix通过词汇多样性、句法复杂度等指标测量文本的衔接性、连贯性,从篇章结构的角度反映老年人的语言能力;LIWC基于心理学,通过文本单词归类分析考察老年人的思维方式、内心状态及人格特征。两种工具从文本的不同方面入手,前者侧重语篇,后者侧重词汇。二者的研究视角也有所不同,前者从语篇结构视角出发,着眼于文本的语言产出特征;后者从心理测量视角出发,着眼于文本的语言心理特征。虽然侧重不同,但二者在老年人话语产出特征研究及老年语言学研究的应用,体现出利用计算机自动文本分析工具对失智症进行早期诊断和评估的可行性,在老年认知健康日益受到重视的今天具有重要的临床意义。

然而,两种工具目前尚存在不足,如LIWC在分析文本时没有充分考虑单词所在的语境,可能对反讽、隐喻等修辞的分析存在偏差;自动文本分析前需要人工转录话语内容、手动切分编辑句子,耗费较多的时间与精力。未来研究可以从多方面入手,进一步推动计算机自动文本分析在老年人话语产出特征研究及老年语言学研究领域的应用。首先,可以探索自动化转录和切分的可行性,在加快分析进程的同时也能消除手动注释造成的研究误差。目前,已有面向汉语的分词与标注工具问世(如百度LAC等),未来可考虑将这一算法功能纳入分析程序。其次,目前研究多集中于利用计算机自动文本分析工具对语言本文的分析来鉴别和诊断失智症,今后可进一步尝试利用此工具考察老年人或失智症患者语言能力随年龄或病程发展的动态变化,从而提高对患病程度判断的精准度。同时,未来研究可面向更大规模和多样化的老年队列,尤其是应用于临床实践,结合老年人的年龄、性别、教育程度和失智症家族史等人口统计学信息来调整预测参数,提高筛查准确性,并和老年人其他神经心理测评结果相结合来探讨与语言能力相关的认知基础。此外,目前相关研究中鲜有以母语为汉语的研究对象,这可能与LIWC等自动文本分析工具尚无法与汉语匹配有关,因此未来研究可以从两方面入手:一方面加快建设中国老年人话语语料库,为我国老年群体话语产出特征研究及其他相关研究提供语料基础,建设时可对标国外已有的DementiaBank等共享数据库;另一方面,要充分利用中国老年人话语语料库,开展针对汉语的自动文本分析工具的开发,或对Coh-Metrix等现有工具进行后续优化等,加强对以母语为汉语的老年群体话语产出特征的定量研究及定性定量相结合的研究。

参考文献

杜慧颖,蔡金亭 2013 《基于Coh-Metrix的中国英语学习者议论文写作质量预测模型研究》,《现代外语》第3期。

何洁莹,张清芳 2017 《老年人書写产生中词汇频率和音节频率效应的时间进程:ERP研究》,《心理学报》第12期。

黄立鹤 2019 《充分利用人工智能推进老年语言学研究》,《中国社会科学报》3月5日第003版。

黄立鹤,杨晶晶 2022 《基于Coh-Metrix的汉语阿尔茨海默病患者语篇语用障碍分析》,《语言文字应用》第1期。

江進林 2016 《Coh-Metrix工具在外语教学与研究中的应用》,《中国外语》第5期。

秦朝霞,顾琦一 2011 《写作话题熟悉度与国内习作者书面语语篇衔接手段运用——基于一种自动测量方法的对比研究》,《西安外国语大学学报》第1期。

张信勇 2015 《LIWC:一种基于语词计量的文本分析工具》,《西南民族大学学报》第4期。

Ahmed, S., A.-M. F. Haigh, C. de Jager, et al. 2013. Connected speech as a marker of disease progression in autopsy-proven Alzheimers disease. Brain 136(12), 3727–3737.

Aluísio, S., A. Cunha & C. Scarton. 2016. Evaluating progression of Alzheimers disease by regression and classification methods in a narrative language test in Portuguese. The 12th International Conference on Computational Processing of the Portuguese Language, July 13–15, Tomar.

Asgari, M., J. Kay & H. Dodge. 2017. Predicting mild cognitive impairment from spontaneous spoken utterances. Alzheimers &

Dementia: Translational Research & Clinical Interventions 3(2), 219–228.

Boyd, R. L., A. Ashokkumar, S. Seraj, et al. 2022. The development and psychometric properties of LIWC-22. Austin, TX:

University of Texas at Austin.

Burke, D. M. & M. A. Shafto. 2004. Aging and language production. Current Directions in Psychological Science 13(1), 21–24.

Burke, D. M., D. G. MacKay, J. S. Worthley, et al. 1991. On the tip of the tongue: What causes word finding failures in young and older adults. Journal of Memory and Language 30(5), 542–579.

Crossley, S. A. & D. S. McNamara. 2011. Understanding expert ratings of essay quality: Coh-Metrix analyses of first and second language writing. International Journal of Continuing Engineering Education and Life Long Learning 21(2–3), 170–191.

Cuetos, F., J. C. Arango-Lasprilla, C. Uribe, et al. 2007. Linguistic changes in verbal expression: A preclinical marker of Alzheimers disease. Journal of the International Neuropsychological Society 13(3), 433–439.

Cummins, N., S. Scherer, J. Krajewski, et al. 2015. A review of depression and suicide risk assessment using speech analysis. Speech Communication 71, 10–49.

Cunha, A. L. V. D. 2015. Coh-Metrix-Dementia: Análise Automática de Distúrbios de Linguagem nas Demências Utilizando Processamento de Línguas Naturais. Doctoral dissertation, Universidade de S?o Paulo.

Diermeier, D., J.-F. Godbout, B. Yu, et al. 2011. Language and ideology in congress. British Journal of Political Science 42(1), 31–55.

Gómez-González, M. A. 1998. A corpus-based analysis of extended multiple themes in PresE. International Journal of Corpus Linguistics 3(1), 81–113.

Graesser, A. C., D. S. McNamara, Z. Cai, et al. 2014. Coh-Metrix measures text characteristics at multiple levels of language and discourse. The Elementary School Journal 115(2), 210–229.

Green, C. F., E. R. Christopher & J. L. K. Mei. 2000. The incidence and effects on coherence of marked themes in interlanguage texts: A corpus-based enquiry. English for Specific Purposes 19(2), 99–113.

Heine, M. K., B. A. Ober & G. K. Shenaut. 1999. Naturally occurring and experimentally induced tip-of-the-tongue experiences in three adult age groups. Psychology and Aging 14(3), 445–457.

Igarashi, T., S. Okuda & K. Sasahara. 2021. Development of the Japanese version of the linguistic inquiry and word count

dictionary 2015 (J-LIWC 2015). Frontiers in Psychology 665.

Kemper, S. 1987. Life-Span changes in syntactic complexity. Journal of Gerontology 42(3), 323–328.

Kemper, S. & A. Sumner. 2001. The structure of verbal abilities in young and older adults. Psychology & Aging 16(2), 312–322.

Kynette, D. & S. Kemper. 1986. Aging and the loss of grammatical forms: A cross-sectional study of language performance. Language & Communication 6(1–2), 65–72.

Levenson, R. W., V. E. Sturm & C. M. Haase. 2014. Emotional and behavioral symptoms in neurodegenerative disease: A model for studying the neural bases of psychopathology. Annual Review of Clinical Psychology 10, 581–606.

MacKay, D. G. & L. Abrams. 1998. Age-Linked declines in retrieving orthographic knowledge: Empirical, practical, and theoretical implications. Psychology and Aging 13(4), 647–662.

McNamara, D. S., A. C. Graesser, P. M. McCarthy, et al. 2014. Automated Evaluation of Text and Discourse with Coh-Metrix. New York: Cambridge University Press.

Nicholas, M., L. K. Obler, M. L. Albert, et al. 1985. Empty speech in Alzheimers disease and fluent aphasia. Journal of Speech, Language and Hearing Research 28(3), 405–410.

Pennebaker, J. W. & L. D. Stone. 2003. Words of wisdom: Language use over the life span. Journal of Personality & Social Psychology 85(2), 291–301.

Pennebaker, J. W., C. K. Chung, M. E. Ireland, et al. 2007. The development and psychometric properties of LIWC 2007.

Retrieved from http://www.liwc.net/LIWC2007LanguageManual.pdf.

Reid, J. 1992. A computer text analysis of four cohesion devices in English discourse by native and nonnative writers. Journal of Second Language Writing 1(2), 79–107.

Rude, S., E.-M. Gortner & J. W. Pennebaker. 2004. Language use of depressed and depression-vulnerable college students. Cognition & Emotion 18(8), 1121–1133.

Sarangi, S. & M. Coulthard. 2000. Discourse and Social Life. London: Longman.

Shibata, D., S. Wakamiya, E. Aramaki, et al. 2016. Detecting Japanese patients with Alzheimers disease based on word category frequencies. Proceedings of the Clinical Natural Language Processing Workshop, 78–85.

Simmons, R. A., D. L. Chambless & P. C. Gordon. 2008. How do hostile and emotionally overinvolved relatives view relationships? What relatives pronoun use tells us. Family Process 47(3), 405–419.

Sitek, E. J., K. Kluj-Koz?owska, A. Barczak, et al. 2015. Overlapping and distinguishing features of descriptive speech in Richardson variant of progressive supra-nuclear palsy and non-fluent progressive aphasia. Post?py Psychiatrii i Neurologii 24(2), 62–67.

Sperling, R. A., J. Karlawish & K. A. Johnson. 2013. Preclinical Alzheimer disease-the challenges ahead. Nature Reviews Neurology 9(1), 54–58.

Stubbs, M. 2005. Computer-Assisted text and corpus analysis: Lexical cohesion and communicative competence. In D. Schiffrin et al. (Eds.), The Handbook of Discourse Analysis. New Jersey: Wiley-Blackwell Publishers Ltd Hoboken.

Toledo, C. M., S. M. Aluísio, L. B. Santos, et al. 2018. Analysis of macrolinguistic aspects of narratives from individuals with Alzheimers disease, mild cognitive impairment, and no cognitive impairment. Alzheimers & Dementia: Diagnosis, Assessment & Disease Monitoring 10, 31–40.

責任编辑:韩 畅