多体裁学术文档信息单元相关性研究
——基于任务与语言功能单元关系的探索

2021-07-17 14:59马翠嫦

情报学报 2021年6期

马翠嫦

（中山大学图书馆，广州 510275）

1 研究背景

用户需求与文档信息之间的相关性匹配是信息检索系统的核心。相关性判断的研究，一方面，已从基于文档主题的相关性匹配评价模式走向更多元化的发展方向，在可能影响检索效果的众多的情境因素中，任务与文档体裁之间的关系被证明是具有稳定性和普遍性的[1]。另一方面，数字和网络环境下信息组织与检索对象的粒度逐步从文档整体细化至局部信息单元[2-6]，因此，用户需求与文档之间的相关性问题亟待深入至信息单元的层面进行探索和检验。

顺应这一趋势，有研究者在任务与文档体裁关系研究[1]的基础上，按照体裁结构规律将期刊论文整体划分为细粒度信息单元-语言功能单元，进而探索任务与语言功能单元二者对信息对象感知有用性的影响[7]，提示了从体裁角度建立任务与文本信息单元之间关联关系的可能性。然而，已有研究仅着眼于期刊论文阅读过程中的局部信息利用和文内导航等问题，未纳入交互式检索研究框架，亦不能解决现实网络学术文档搜寻中常面临的多体裁文档细粒度检索的问题。

因此，本文延续交互式检索研究框架下任务与文档体裁关系研究的脉络，借鉴体裁理论将各类文档体裁细化至语言功能单元层面，探索图书情报领域常用信息任务、多体裁语言功能单元等因素及其交互作用对感知有用性的影响，从信息单元的层面检验相关性判断中基于任务和多体裁语言功能单元的情境和认知标准，探索任务与文档体裁相关关系的底层机理与解释机制。

2 理论基础

2.1 情境相关性与认知相关性

相关性用于衡量用户需求与信息对象的匹配程度，是信息检索理论最基本的概念。图书情报学领域教授Saracevic将相关性定义为信息或信息对象与检索环境的关系[8]。相关性标准的研究是面向用户相关性研究的核心课题[9]，Saracevic[10]提炼的相关性五个表现形式较为经典，包括：系统或算法相关性、论题或主题相关性、认知相关性或适切性（pertinence）、检索情境相关性或者效用、动机或情感相关性。然而，现实世界中，相关性的复杂性和主观性使得信息检索研究者和实践者将注意力集中在相对静态和可测量的主题相关性概念上，而忽略了情境相关性或效用等动态和主观的概念[11-12]。

情境相关性（situational relevance）是指信息或信息对象与用户情境、任务、面临的问题之间的关系[8,13]。Schamber等[14]和Borlund[11]均建议采用情境相关性评估用户与信息系统的交互。Freund[13]指出，用户执行的任务已被识别为情境相关性最主要的影响因素之一，并且情境相关性检索可在支持论题相关性基础上辅助识别任务相关体裁的信息资源，是介于论题相关性检索和个性化信息检索之间的中间层次，因此，情境相关性在大规模文档检索中具有更大的价值。而探索和建立任务与体裁关系，则是衡量情境相关性的思路和方法。

在语言学领域，Sperber等[15]和Wilson等[16]提出，相关性的认知原则和交际原则，并由此提出明示-推理交际模型（ostensive-inferential communication model）和相关性话语解读机制（relevance-theoretic comprehension procedure）[15-16]，对交际过程中接受者解读相关性话语的过程进行阐释[16]。Unger[17-18]率先构建了体裁与相关性的联系，并指出体裁信息通过为用户推理过程提供关于语境的假设对用户理解过程产生贡献，从而调整用户的相关性期望，因而Unger提出将体裁融入相关性话语解读机制的理论主张。Yus[19]认为，博客模板可触发用户对博客体裁的识别，节省用户精神上的努力，引导其走向特定的解释路径和对博客信息的特定期望。由此可见，语言学领域相关理论与模型明晰了体裁对用户相关性认知与期望的影响，可为交互式检索领域对体裁的应用提供理论基础。

2.2 体裁的情境、认知特性与语言功能单元

体裁是社会（社群）所产生和所认知的具有典型结构、内容和交际功能[20]的传播行为类型[21-22]。社会行动学派认为，符号（体裁）意义的可识别性很大程度上属于情境与行动认知问题[13]。体裁在知识生产和传播的系统中，在作者与读者之间或学术界内，按照规定的形式和内容进行知识传播的本质，使其同时具备交互式检索情境的特性和社群认知特性。Bruce[23]更提出了体裁认知的两个层次：作为社会体裁的文档整体和与作为认知体裁的具有特定修辞目的文本片段。体裁情境特性被认为有助于明确文档的使用方式，从而帮助检索相关性判断[15]，其稳定的文体和特征有助于用户以较少的认知努力处理信息[24]。

体裁围绕特定的传播目标，形成具有相对稳定语言功能单元组成的文本结构模式，使得该体裁的文档可以划分成更小粒度的体裁单元，如研究论文可分为介绍、方法/数据、结果、讨论/结论（Ⅰntroduction,Method/Data,Result,Discussion/Conclusion，以下简称ⅠMRD）等四部分。对此语言学家Swales[25-26]提出体裁分析的方法，其认为体裁的总体交际目的通过一系列语轮和语步实现，一个语轮是具有特定交际功能的文本的一部分，每个语轮都由一组语步组成，并实现其交际目的。Zhang等[7]将具有独立意义的语轮和语步单元合称为语言功能单元。国内研究人员借鉴体裁分析的方法对中文学术论文的语轮和语步构成进行探索[27-28]。Ma等[29]在期刊论文的基础上进一步拓展了体裁的类型，构建了图书情报学领域中文期刊论文、网络百科词条、学术博文等体裁的语言功能单元类型体系。

由此可见，任务与体裁关系是衡量情境相关性的思路和方法，按照体裁理论划分的学术文档细粒度信息单元蕴含符合社会认知的、作者需向读者传递的目的和意图，可激起检索者阅读检索结果时的期望与理解路径，可为多种体裁学术文细粒度单元划分与情景相关性的利用提供依据与方法。

3 文献回顾

3.1 作为交互式检索情境因素的任务与体裁

任务作为情境检索研究的常见对象，被定义为信息查寻和搜寻的动机[30-31]，也可被定义为与系统交互过程中的认知活动[40]或对不同类型信息的搜寻行为[32-33]。任务类型按照范围大小划分可包括：工作任务、信息任务、信息查寻任务、信息搜寻任务和系统交互任务[13,30,34-37]。

已有研究表明，任务对于网络环境下信息对象相关性评估有较明显的影响。例如，有研究者采用不同的搜寻任务对XML检索中测试文档的分级有用性进行分析，研究发现，信息采集型任务识别的相关信息最多，其次是决策型任务，最少的是事实搜寻型任务[38-39]。也有研究者发现在背景搜寻、决策支持和信息采集的三类任务下，用户对于网页内容、布局等特征的评价分布较为接近，但采集信息和背景搜寻任务下对链接提及得更为频繁。另一研究也采用近似的方法，对程序型任务和事实查找型任务下，文档HTML特征出现频率与相关性间关系进行探索，发现一些任务对联系信息、表单和表格等类型要素的利用频率存在影响[40-41]。此外，有研究发现，任务复杂性对相关性判据的选择存在显著的影响[42]。

体裁，作为信息对象的重要特征，是交互式检索和情景相关性概念构成的基础，但在实证研究层面，交互式信息检索和情景相关性领域却较多地关注用户相关变量，而忽略对信息对象体裁的探索。然而，仍有学者开展基于体裁结构的信息交互研究，例如，Clark等[43-44]学者通过眼动分析的方法，分别对用户与各类电子邮件、维基百科词条等不同体裁的信息单元交互进行研究，探索用户扫描和跳读过程中的视觉路径、行为策略和体裁的结构化线索对信息获取的意义。这些研究揭示了体裁结构特征对于用户交互行为的影响，提示体裁结构在辅助相关性判断方面的效率与效用优势，但并未对体裁单元进行系统划分，也未对体裁单元与任务之间的关联关系进行深入探索。

3.2 任务与不同层级体裁关系研究

在可能影响信息检索的众多情境因素中，体裁和信息任务等因素早已被认为是交互式信息检索和人机交互概念构成的要素与基础[45-48]，而对二者关系的研究也从体裁整体深入到体裁单元。

Freund等[31,49]以软件工程工作领域为例，探索以工作任务和文档体裁为主体的情境因素，在用户信息搜寻和选择中的关系中，发现任务对于文档相关性和有用性的判断过程会有影响，从而构建用户信息行为下包含用户背景、搜寻背景、工作任务和信息任务四个构面的任务-体裁理论框架。随后，Freund[13]进一步探索这些因素对于信息源选择的影响，构建信息源选择的情境模型，得出影响情境因素的文档因素，并形成信息源选择策略。为检验跨领域效用，Freund[1]以软件工程工作领域和电子政务使用情境为例，在人机检索研究框架下，探索任务与文档体裁对于感知有用性的跨领域影响，为感知有用性作为独立于任务类型、文档体裁和两者关系因素的独立变量提供证据。Ku[50]探索了大学教育背景下，教员的教学任务与相关文档体裁之间的关系，研究发现任务和体裁的评估标准具有触发任务与体裁关联的功能，任务是评判与决定体裁的标准。

有图书情报学领域学者从任务与期刊论文语言功能单元的角度研究信息单元的利用，例如，Vaughan等[51]的研究要求专业用户按照ⅠMRD结构对期刊论文内的段落进行分类和语言功能编码，从而识别五类功能单元。Zhang等[7]利用语轮分析法探索、发现功能单元和用户信息使用任务之间的关系，以及特定信息使用任务与各组功能单元之间的关系。此后，Zhang[52]进一步构建了期刊系统原型检验任务和语言功能单元关系，证明了语言功能单元可在各种程度上支持导航、细读、理解和期刊文章信息的使用，可用于提高阅读过程和阅读结果的有效性。

因此，学界对于任务与不同层级体裁关系研究的领域主要集中在软件工程、电子政务、心理学等领域，并初步显示出二者关系的跨学科稳定性，但任务与细粒度体裁单元关系的研究，亦仅限于期刊论文语言功能单元对于阅读和信息使用的效用，并未从交互式检索的框架下探索任务与多种体裁细粒度信息单元之间的关系，而多种体裁的细粒度检索却正是用户普遍面临的检索需求。

3.3 任务与体裁关系研究中的用户群体

用户经验和专业程度被认为是可区分任务与体裁间关系的变量。例如，Dillon等[53-54]对于体裁利用的研究区分了专家和新手用户群体，指出专家无需外在线索就可以在头脑中形成体裁的形式或结构；而新手只能从没有任何参考形式或结构的语言中进行逻辑推理。Freund[1]研究专业性与任务、体裁等情境因素对感知有用性的影响，发现专业性与感知有用性存在联系，但不存在与任务和体裁的交互效应。

4 研究方法

围绕研究目标，本文在跨体裁网络资源语言功能单元类型体系[29]的基础上，开展了两轮问卷调查：第一轮调查明晰各类信息任务下，各体裁语言功能单元的有效性；第二轮调查探索各体裁语言功能单元、信息任务等因素以及其交互关系对于信息对象感知有用性的影响。

4.1 任务与语言功能单元的操作系定义

按照交互式检索框架下任务与体裁关系研究的任务设计脉络[1,7]，本文将任务定义在信息任务的层次，并借鉴Taylor[55]信息使用模型所划分的类型来定义信息任务类型。由于期刊论文是本文中语言功能单元体裁的主要来源之一，本文综合考量Zhang等[7]针对期刊论文语言功能单元设计的信息任务和Freund[1,49]针对多类型体裁设计的信息任务，选择其中具有明显的情境相关性的任务类型，以便形成一致的分析与比较框架。在此基础上，本文以图书情报领域“引文分析”论文写作为具体工作任务背景，按照学科领域网络资源利用的需求设计信息任务如下。

跟进了解：了解“引文分析”领域的最新研究进展和成果；

参考事实：参考“引文分析”主题相关的具体事实性信息，例如，数据、现象；

参考论断：参考支持用户某个观点的论断、主意或建议；

学习背景：去了解“引文分析”主题正在开启的新的领域；

学习如何做：去学习如何使用“引文分析”的具体工具获取数据和结论。

语言功能单元，是指按照Swales[25]的体裁分析理论和语轮分析法识别的、承载体裁传播目标以及相应语言学功能的文本信息单元。本文以Ma等[29]所识别的图书情报学领域4类网络学术文档体裁（包含的55种语言功能单元）为基础，合并功能交叉的3种类型后得到52种作为研究对象的语言功能单元，包括在线题录摘要4种、网络期刊论文28种、网络百科词条12种和网络博客文章8种类，如表1所示。

4.2 问卷设计

第一次问卷调查是由信息任务有效性调查和各任务下各类体裁语言功能单元有效性调查两部分组成。其中，在信息任务有效性的调查中，被试者被问及其在执行5类信息使用任务时，使用网络论文题录、OA（open access）期刊论文、百科词条和博客文章的频率，并进行排序。采用5刻度的里克特量表进行测量，以1表示几乎不采用，5表示最常采用。被试者可在已有类型的基础上提出新的任务类型；在对各体裁语言功能单元认可程度的调查中，为了减少被试者对语言功能单元类型理解的歧义，每个类型都以一句话标注该类型的定义，并作为一个独立选项以供评分。调查问及被试者认为每种功能单元出现在相应构成中的频率，并进行评分。采用5刻度的里克特量表来表示频率，1表示从不出现，5表示经常出现。被试者可以在已有类型的基础上提出新的语言功能单元类型。

第二次问卷调查的目的在于明晰每种语言功能单元、信息任务、网络文档使用频率等及其交互作用对于信息对象感知有用性的影响。此次调查问卷为被试者呈现了第一次调查中出现的5种情境，被试者被问及在每种情境下各类资源语言功能单元的有用性如何。该调查采用5刻度的里克特量表进行测量，其中，1表示几乎没有用，5表示非常有用。在调查一结果整理的基础上，本次调查采用4种体裁下的49种功能单元，包含在线题录文摘要4种、期刊论文26种、网络百科词条12种以及学术博文7种。

表1 图书情报学领域网络学术文档跨体裁语言功能单元类型体系

4.3 被试者

本次两轮调查从2019年10月17日开始，至10月30日结束。通过全国范围内向具有“引文分析”研究和工作经验的教研人员发送招募通知，采取分层抽样的方法，招募图书情报领域的教研人员、博士研究生、硕士研究生等各个层次被试人员。参考Zhang等[7]问卷调查中的被试者数（13人）和Freund[1]两次问卷调查的被试者数（20人和25人），第一轮调查共招募被试人员48人，专业均为情报学或图书馆学，包括硕士研究生27人、博士研究生15人、教研人员6人。第二轮调查人员均来自第一轮调查，共44人，包括硕士研究生26人、博士研究生13人和教研人员5人。第一轮调查酬金为35元人民币，第二轮调查酬金为65元人民币。第一个调查平均用时15分钟，第二次调查平均用时65分钟。

5 研究结果

5.1 任务与语言功能单元的有效性

对各信息任务下、各体裁文档使用频率的评分与排序结果表明，两类评价方式的结果具有较高一致性。按照信息任务评分从高到低分别为：跟进了解（M=3.54）、学习背景（M=3.44）、学习如何做（M=3.43）、参考论断（M=3.22）、参考事实（M=3.18）。而按照排序，“学习如何做”排名最后，“参考事实”排在中间，这说明虽然“学习如何做”按照频率评分不低，但与其他任务相比，各类体裁对于这类任务的支持稍低于其他类型的任务。即使如此，由于各类任务平均分较高、差距非常小，因此，排序结果的差别只能说明各类体裁文档支持这些任务上的差别，而这些任务对于各类文档的效用均非常明显。此外，有被试者列举了新增任务，但都可归属本文提出的任务中。

语言功能单元评价方面，被试者按照5刻度的里克特量表对每类资源各构成中的语言功能单元出现的频率进行评分，评分均值在2.6～4.54。绝大部分语言功能单元均值的标准差小于1，表明被试者对于语言功能单元的评分具有较高的一致性。在所有语言功能单元中，有3类语言功能单元的均值小于3分，分别是OA论文结论/讨论部分、研究结果部分包含的“下文提要”以及学术博文包含的“博主在文章论题以外插入题外话题”。这就提示了这3类语言功能单元不如其他类型那么常用，而“下文提要”类语言功能单元在Zhang等[7]的研究中也被评为不常用。因此，本文在第二次调查中移除了这3个类型的语言功能单元，剩余49个语言功能单元。

5.2 任务、语言功能单元和使用频率及其交互作用

调查二首先对被试者按照五个信息任务下语言功能单元的感知有用性得分进行内部一致性的信度检验，发现得分的Cronbach'sα值均大于0.968，因此，符合内部一致性标准。后续调查采用一般线性模型（general liner model，GLM）中单因变量多因素方差分析方法（univariate analysis of variance，UNⅠANOVA）分析任务、语言功能单元、网络学术资源使用频率等变量及其交互作用对信息单元感知有用性的效用。

对于各因素及因素间效用的一般线性模型分析结果提示，不仅任务、功能单元和网络学术资源使用频率三个因素对有用性得分存在显著影响，而且任务和功能单元的交互作用F(192,10045)=1.918、P＜0.05，以及任务和网络学术资源使用频率的交互作用F(8,10045)=3.273、P＜0.05，均对有用性得分也存在显著影响。从η2p值可以看出这些因素对于有用性得分影响的大小，任务和网络学术资源使用频率的交互作用影响非常小（0.3%），而任务和功能单元交互作用影响则较大（3.5%），如表2所示。

表2 因素间效用的GLM分析

由表2可见，网络环境下图书情报学领域多体裁语言功能单元、信息任务和网络学术资源使用频率3个因素以及信息任务与语言功能单元的交互作用，对信息对象的感知有用性存在显著的影响。

5.3 网络学术文档使用频率对任务下语言功能单元感知有用性的影响

图1显示，网络学术文档使用频率高、中、低3个层次的被试者，在5个搜寻任务下有用性得分的非加权均值分布图。该图显示，高频被试者（每天使用网络学术资源）和低频被试者（一个月只用2～3次网络学术资源）在五种搜寻任务下的感知有用性均值较高，且差距不大，而中频被试者（一周使用网络资源2～3次）在五种搜寻任务下的感知有用性均值均较低。此外，不同任务下有用性得分的差距较为类似，这就呈现出了形状相似的任务与感知有用性的关系图谱。可见，不同网络文档使用频率可区分各任务下感知有用性水平。

图1 网络学术文档使用频与搜寻任务下的有用性得分均值

Dillon等[53-54]证明了基于体裁的语言功能单元划分对于缺少经验者的效用，这与本文结果中，网络学术文档低频被试群体的感知有用性得分较高一致。而本文的结果中，中频被试者群体比较小，且有用性得分最低，该群体的低使用率也许是由其对于文档整体感知有用性水平较低而引起的。

5.4 基于感知可用性的任务与语言功能单元关系分析

采用单因素方差分析（one-way ANOVA）的方法对不同任务下各语言功能单元有用性差异进行分析，结果如表3所示。

表3 不同任务下各类语言功能单元感知有用性差异与分布

表3呈现了5种任务下各类语言功能单元感知有用性评分的均值和显著性检验结果，表明各任务下、各类语言功能单元的感知有用性均值存在显著差异。通过感知有用性的全局比较发现，最高分与最低分的语言功能单元均出现在“学习如何做”的任务下，分别是OA论文中的“介绍分析方法与程序”（M=4.34）和网络百科人物词条中的“列举所获荣誉”（M=2.14）。进一步对5种任务下的跨体裁语言功能单元的感知有用性均值进行分析，研究发现，“跟进了解”任务得分最高（M=3.51，F=5.915），其次是“学习背景”（M=3.38，F=3.050）和“参考事实”（M=3.32，F=3.554），可见这些任务下的语言功能单元普遍显示出较高的感知有用性。“学习如何做”任务下各类语言功能单元感知有用性均值最低（M=3.01，F=7.690），说明该任务下感知有用性差异最大，只有部分体裁的部分语言功能单元显示出较高的感知有用性。

为进一步了解各任务下高有用性单元的分布规律，本文从体裁的角度对5类任务下高有用性单元进行分析发现，虽然百科词条和学术博文均包含任务相关的高有用性单元，但各任务下均值最高的语言功能单元分别属于OA论文和题录摘要两类体裁。其中，一些任务下的高有用性单元集中于特定体裁，且几乎覆盖体裁的整体或大部分，如“跟进了解”任务下，高相关的语言功能单元出现在除“方法/数据”外的OA论文的大部分、题录摘要的全部以及学术博文的“发表观点”全部。反之，一些任务下的高有用性单元分散于各体裁中，如“学习如何做”任务下，高相关语言功能单元分散于题录摘要、OA论文的“论证/论述”“方法/数据”“结果”部分的零星语言功能单元上，以及学术博文的“发表观点”的单个语言功能单元上。由此可见，随着任务的不同，各体裁相关的高有用性语言功能单元呈现集中或分散分布的现象，这就为主题相关性基础上，不同体裁、不同层级信息片段的多粒度相关性判断提供依据。

对各语言功能单元在五类任务下感知有用性均值比较发现，OA论文论证/论述部分的“论证作者立场”和结论/讨论部分的“讨论结果”的均值最高（M=3.67），其次还有OA论文论证/论述部分的“得出结论”（M=3.63）和结果部分的“呈现结果”（M=3.62）。而百科词条中的“列举所获荣誉”单元的均值则小于3分。因而，这些语言功能单元按照均值大小可以划分为三类：第一类，是得分最高的前四种单元，其在大部分任务下都非常有用，可视为通用型的核心信息单元；第二类，语言功能单元均值排在第一类之后，只对于部分任务有显著价值，是面向特定任务的专用型核心信息单元；第三类，是最低分的语言功能单元，与所有任务的相关性都不大。因此，同一语言功能单元对于不同任务类型显示出不同的有用性；不同语言功能单元类型对于各类任务的有用性适用范围也可分为不同的层级。

为明晰任务与语言功能单元关联的机理，对五种任务下感知有用性均值最高的五种语言功能单元进行关联关系分析，发现这些语言功能单元均为不同类型，且其承载的交流目标与相应信息任务紧密联系：①学术论文结果部分的“评论结果”（M=4.18）是为了比较、评估和总结研究结果，甚至进一步提出研究问题和提示，信息利用者可由此跟进了解相关研究情况。②学术论文结果部分的“呈现结果”（M=4.11）是为了分析、抽取和陈述结论数值数据的含义，报告研究发现，信息利用者可参考相关事实性结果。③学术论文论证/论述部分的“得出结论”（M=3.86）是为了形成逻辑性结论和启示，并总结主要观点，信息利用者可由此获取和参考相关论断。④学术论文导言部分的“回顾已有研究”和“介绍论题背景”（M=3.91）都是为了呈现已有研究基础和知识背景，信息利用者可由此学习论题相关的知识背景。⑤学术论文方法/数据部分的“介绍分析方法与程序”（M=4.34），是为了介绍研究数据的类型与范围、搜集标准、搜集工具和搜集过程，信息利用者可由此学习如何开展引文分析相关研究。

通过上述对感知可用性均值的全局性分析，本文明晰了各任务下、各体裁语言功能单元感知有用性的分布范围，通过按任务的纵向分析探索了不同任务下感知有用性在体裁内和体裁间的分布规律；通过按语言功能单元的横向分析区分了语言功能单元感知有用性在不同任务下的差异；通过任务与高有用性单元的关联探索明晰了任务与体裁单元间关联的机理。因此，相关结果从任务、语言功能单元以及二者关联机理等多个层面为任务-体裁-感知有用性关系提供了底层的解释机制。

6 结论

本文以情境相关性理论和体裁理论为基础，以图书情报领域4种体裁的网络学术文档为例，在交互式检索框架下探索用户信息任务、用户网络文档使用频率、语言功能单元等因素，以及其交互关系对于信息对象感知有用性的影响，发现了多体裁网络文档中任务-语言功能单元-感知有用性的显著关系以及不同网络文档使用频率对于各任务下感知有用性水平的区分，在基于感知有用性差异的相关性谱系的基础上，探析任务与体裁关联的底层解释机制。

体裁的社会交际目的由其所包含的语轮和语步组成，体裁与任务之间的关系最终落实到承载体裁交际目标的语言功能单元上，这就有必要全面和深入地探索任务与各体裁下语言功能单元间的关系，从底层探索二者相关机理与解释机制。本文与Freund关于任务与体裁关系的系列研究呼应[1,13,49]，完善和细化相关性判断中的情境和认知标准，从语言功能单元层面建立细粒度体裁单元与任务的关联谱系，为任务与体裁关系的深层机理与机制寻求解释，从而推动交互式检索与检索相关性理论的发展。

本文将体裁类型拓展至包含期刊论文在内的图书情报学领域常用学术文档体裁。结果表明，期刊论文语言功能单元与信息任务之间的关系与Zhang等[7]的研究基本一致，表明任务-体裁细粒度信息单元-感知有用性关系的跨学科稳定性。研究结果中网络百科词条、学术博文等体裁的语言功能单元与信息任务及其交互关系对于信息对象的感知有用性也存在较显著的影响，表明任务-体裁细粒度信息单元-感知有用性关系的跨体裁稳定性。

本文通过用户评价检验了多体裁网络文档语言功能单元分类体系的有效性[29]，证明了多体裁语言功能单元在不同任务下感知有用性的差异，由此形成了任务与语言功能单元关联关系的具体分布谱系，为细粒度情境检索提供参考。因此，后续研究可在此基础上进一步探索任务与语言功能单元间的动态关联机制、语言功能单元的划分、组织与呈现等问题，不仅可以丰富基于用户对体裁规则认知的信息单元识别、交互、重组与服务的理论体系，而且促进信息组织、人机交互、智慧图书馆等理论的发展，实践上可为基于信息单元的智能信息组织与服务提供方法参考，提高网络学术信息资源开发与利用效益。

多体裁学术文档信息单元相关性研究——基于任务与语言功能单元关系的探索