数字时代的法律实践:一份人工智能法学课程大纲

2019-02-19 01:08凯文艾希礼杨安卓陈晓莉
法治现代化研究 2019年1期
关键词:文档规则案例

[美]凯文·艾希礼 著 杨安卓 陈晓莉 译

一、导 论

当前,法学院应该开设一种“人工智能(AI)与法律”研讨班,为法律专业学生讲授一些数字时代的法律推理和法律实践的课程。“人工智能与法律”是人工智能/计算机科学研究的一个子领域,致力于设计能够执行法律推理的计算机程序——计算模型。这些计算模型可以用于建立法律实践和教学的辅助工具以及研究法律推理,从而促进认知科学和法理学的发展。今天,在一定的条件下,计算机程序可以根据法律条例进行推理,可以适用判例,甚至可以像律师一样进行辩论。

我们应该在部分法学院开设关于“人工智能与法律”的研讨班,这样就能够为学生讲授有关法律和法律推理的基本技能,包括:①法律规则固有的模糊逻辑和语义歧义;②与法律规则本身同样重要的对法律规则的推理;③ 从一般法律问题中辨认出重难点的挑战;④关于法律规则基础价值的争论方式。

“人工智能与法律”的研究者从惨痛的教训中吸取了经验。正如每个程序员都知道,要让程序执行一项任务,需要详细地安排一系列步骤(或者通过机器学习提供许多带标注的实例)。如果程序要将某些输入转换为某些输出,如输出一个法律结论和解释,则需要详细说明推理的每个步骤。在这个过程中,研究者需要解决学生在法律教育中发现或应该发现的所有问题。例如,研究者必须解释学生们提出的这些问题:在法律规范中通常出现的某些概念没有明确规定含义的情况;不明确法律规范有哪些例外的情况;法规的逻辑可能很模糊的情况;在解释法规应该如何应用于问题时,还存在除了问题、规则、应用和结论(IRAC)之外其他有用的法律论证模式的情况;对某些案例而言,类推比另一些法律论证模式更有效的情况。

通过让学生关注这些给试图用计算机为法律推理建模的科学家们带来麻烦的问题,学生就可以以一种新的方式学习有关法律和法律推理的基本原理。正如他们的研究论文所证明的,“人工智能与法律”研究者习惯性地“追溯至元问题”,他们使法律推理的过程清楚明确,而这些过程在法律教育中常常被隐晦地处理。他们具体化了过程的步骤,并用扩展的示例进行了说明。考虑到人类和计算机之间的认知差异,法律专业的学生不会像计算机一样执行这些步骤,但是关注这些过程会使法律专业的学生对法律推理中的漏洞和误区更加敏感,而这些漏洞和误区正是法律推理所要解决的,结果便会提高学生认真阅读法律资料的能力、准确起草法律文件的能力、合理管理法律风险的能力和有效管理信息的能力。

将计算模型与律师、法官和法律学生在日常实践中实际执行的任务以及他们实际使用的文本联系起来,是“人工智能与法律”的一个持续挑战,越来越多的人正在应对这种挑战。一些计算机程序正在帮助荷兰的移民局根据大量的管理规定来处理客户,同时向监管者提供信息,说明如何根据程序的执行来改进规定。计算机程序还从现代诉讼活动所产生的大量电子文档中,学习选择和聚类那些与当事人的诉讼理路最接近的文档,这些文件的选取基于诉讼当事人对与证据和辩护相关或不相关的小组文件所做的标记。

今天,随着电子发掘、①诉讼审前发现,是指处理当事人查阅对方当事人和其他人手中的材料请求,来披露事实和形成审理证据。电子发掘涉及审前发现中电子存储信息的收集、交换和分析。大型诉讼通常涉及数以百万计的电子文档,这是对传统的使用关键字搜索来检索文档,然后手动检查它们的相关性的方法的一个挑战。法律信息检索、基于网络的电子合同信息的语义处理、法律论证计算模型等技术的进步,学生在实践中使用甚至依赖这些系统的机会正在增加。学生越来越精通计算机,他们从小就与互联网相连,他们见证了IBM的“危险的沃特森”(JeopardyTM-winningIBMWatson)程序,这个程序能够瞬间吃透数百万页的文本,回答问题比最优秀的人类选手更快、更准确。今天的学生相信,智能计算机在法律实践中可以扮演更重要的角色。通过让学生思考像沃特森(Watson)这样的程序如何回答法律问题并解释其答案,“人工智能与法律”研讨班可以引发学生的这种兴趣。研讨班鼓励学生思考法律推理和法律实践的过程,以及这些过程如何利用信息。如下所述,鉴于法律服务和法律就业市场的发展,学生从计算机程序的角度思考是有用的。研讨班还告诉学生一些新的数字文档技术如何工作,它们能做的和不能做的,它们如何测量性能,它们如何评估技术主张,以及如何成为精明的消费者和技术用户。

通过“人工智能与法律”研讨班,本文为法律专业学生做好数字时代的准备提供了指导和案例。在介绍了人工智能科学及其在法律中的应用之后,本文给出了最新的“人工智能与法律”研讨班的教学大纲。本文以《教学大纲》为框架,介绍了人工智能与法律课程的一些特点,阐明了“人工智能与法律”课程在法律实践中关于用法律规范与案例进行推理、法律论证、数字文档技术甚至规范等方面的重要教学经验。

二、关于人工智能与法律概要

如前所述,人工智能是计算机科学研究的一个分支,其研究重点在于计算机建模行为,当人类执行建模行为时,行为通常被认为是智能的。②Semantic Information Processing (Marvin Minsky,ed.,1968).所谓智能行为的计算模型,是指能够执行或模拟行为的计算机程序。“人工智能和法律”研究者建立了法律推理的计算模型,这些模型是执行或模拟法律推理的计算机程序。如果程序的输入是对法律问题的描述,那么它的输出可以包括法律问题的解决方案和解释。法律问题的解决除了需要一个决定或预测之外,还经常需要合理的解释。事实上,支持决策的论据可能比决策本身更重要,否则人类用户无法判断是否要依赖其给出的法律建议。对解释和论证的关注是“人工智能与法律”对人工智能研究作出贡献的一个关键领域。

像计算机程序一样,计算模型可以按照程序的输入、输出以及将前者转换为后者的中间步骤来描述。中间的一组步骤(或算法)将输入的问题描述转换为输出。在指定AI程序的输入/输出(I/O))行为时,三个问题尤其相关:① 知识表示和搜索,即输入和用于分析它们的信息如何在可以系统搜索的问题空间中表示?②推理控制机制,即在效率和相关性方面,对解决方案的搜索由什么支配?③ 学习,即为了提高性能,程序如何从错误和成功以及其他信息来源中学习?③Neil Stillings,Steven E.Weisler,Christopher H.Chase,Mark H.Feinstein,Jay L.Garfield,Edwina L.Rissland,Neil A.Stillings&Steven W.Weisler,Cognitive Science:An Introduction 140-142,177,192(2d ed.1995).

在“人工智能与法律”程序的案例中,只有少数能接受自然语言文本输入的问题,或用文本表达的案例或法律规范。更多的情况是问题以专门的表示形式呈现,例如,作为专家系统④Donald A.Waterman&Mark A.Peterson,Models of Legal Decisionmaking14(1981)[“专家系统”是体现人类专家提供的专业知识和知识的计算机程序,使用人工智能技术为(用户)提供推论]。产生的问题的答案,或作为问题中出现的维度因素列表,如加强或削弱一方声明的陈规定型事实模式。⑤Kevin D.Ashley,Reasoning with Cases and Hypotheticals in HYPO,34 Int'l J.of Man-Mach.Stud.753,763-764(1991).类似地,程序知识库中的规则可以用逻辑表达式和案例来表示,正如问题也可以用要素来表示。在讨论一些具有代表性的“人工智能与法律”方案时,重点将放在如何系统地寻找解决办法以及学习上,例如如何检测案例文本中的因素或如何对法律规范的文本进行分类。

在理论上,以及往往在实践中,人工智能或“人工智能与法律”程序的问题解决行为可以按照类似于应用于人类问题解决的相关性和性能度量来评估(例如在给定输入下的预测准确度、覆盖范围、精确度、召回以及输出的解释的充分性)。此外,人工智能程序可能受到修改的图灵测试,其中人类法官与源进行互动,向源提出问题和接收反馈。法官在对源的性质不知情的情况下,试图确定源是人还是机器。⑥Amela McCorduck,Machines Who Think 70(2d ed.2004).

“人工智能与法律”程序的算法,即将输入的法律问题描述转换成输出的解释方案的一组中间步骤,这从法律教学的观点来看可能特别有趣。在将法律推理过程分解为一组步骤的过程中,研究者明确了一些在教学或法理学陈述中经常被遗漏或未解释的方面。程序的I/O行为的例子说明了运行中的法律推理模型,包括在问题环境中应用的步骤。这些例子突出了程序的成功和失败之处,其中成功是指输出符合我们从律师那里期望得到的智能行为,失败是指输出不那么符合上述智能行为。研究者利用一个渐进过程来构思如何提高模型的(法律)性能和扩展成功的范围。通过I/O实例说明推理步骤、假设、成功与失败,为学生提供法律推理过程的窗口。

三、教授法学专业学生“人工智能与法律”

“人工智能与法律”研讨班具有教学价值的关键原因在于,“人工智能与法律”程序把输入的法律问题转化为输出的解释方案的步骤。研讨班向法学院学生提供一些思考机会,让他们思考人类法律推理是否能够、如何以及如何很好地处理同样的问题。

在观察将法律推理过程分解为一组步骤的过程中,学生会意识到,在推理过程中,有些漏洞可能需要通过一些特殊的方法来“填补”,这些漏洞的细节是隐晦的、无法解释的,有时甚至是不合理的。这些漏洞案例包括区分法律的困难问题和简单问题,确定案件之间哪些相似点和不同点在法律上是相关的,分解相互冲突的规则,以及对规则背后的价值进行论证。“人工智能与法律”研究者在某种意义上并没有填补这些漏洞来让一些法律或法学学者满意,但是他们已经在关注填补这些漏洞的问题以及实现工程化的过程,从而为某些目的充分地解决这些问题。法学院学生花时间和精力来观察这些漏洞如何被填补是非常值得的。即使“人工智能与法律”研究涉及计算模型,一般没有计算机编程经验的非技术学生仍然可以通过学习模型和实例来提高他们对法律的理解。这些算法十分抽象地被描述为流程图或文本描述的步骤集。

这些算法的例子在操作中是法律推理的直观实例,法律学生可以从中学习。如前所述,自动法律推理程序的I/O示例说明了程序的成功和失败。失败是更有趣的,因为学生可以观察人类智能如何填补漏洞,思考其对法律和“人工智能与法律”的影响。作为思维实验,学生可以在一个渐进过程中(如扩展示例的解释)参与构建如何提高程序(法律)性能的问题,从而设计出更好的法律推理计算模型。当然,它需要技术专家来详细理解计算模型的知识如何表示(例如用逻辑形式表示)以及搜索、推理控制和学习如何实现。幸运的是,法律专业的学生不需要理解技术细节,就可以从法律推理的范例中学习。

如上所述,“人工智能与法律”研讨班具有教学价值的第二个关键原因在于帮助学生理解现代法律实践技术。由于当前越来越多的律师被要求评估、购买和依赖使用机器学习、⑦机器学习是根据经验自动改进的计算机算法研究。Tom M.Mitchell,MachineLearning 1-2(1997).数据挖掘、⑧见后引[17][“机器学习算法……尤其适用于……可能包含可自动发现有价值的隐式规则的大型数据库的数据挖掘问题(例如,从患者数据库中分析医疗治疗结果或从财务数据库中学习信贷价值的一般规则)”]。自然语言处理和信息检索的产品(例如在电子发掘中),对于非程序设计法律专业的学生来说,了解如何使用这些工具以及这些工具如何工作是非常有价值的。电子发掘工具将不仅很快可以被允许使用,而且需要达到专业的护理标准和大型企业客户的要求。

尽管诸如从大型数据组中进行机器学习、数据挖掘或自然语言处理等技术很复杂,并且其摒弃了法律直觉,律师们仍将越来越多地必须选择这些工具,并用它们或指导其他人使用它们、解释它们的输出,并向其他人(如法官)证明它们的可靠性和有效性。基于这些类型的模型和软件产品,法学院的学生至少可以学习概念词汇、技术如何工作的高级描述、测量性能的方法、度量的意义、模型捕获了什么以及模型遗漏了什么。从以下方面进行思考的经验将使学生了解针对法律职业的数字工具的消费者:① 对算法的高级描述;② 算法在何处工作以及在何处失效的实例;③ 测量性能的方法。

在过去的25年中,“人工智能与法律”研讨班定期在哈佛大学、斯坦福大学、东北大学、芝加哥-肯特大学和匹兹堡大学的法学院开授。⑨见 后 引 [13]、[17] 、[23] 、[24] 。 自 1989年 以 来 ,Kevin Ashley一 直 在 匹 兹 堡 大 学 教 授 人 工 智 能 与 法 律 研 讨 课 。通常,研讨班主要集中让学生学习在该领域主要渠道出版的可用文献,这些渠道有如人工智能与法律(ICAIL)国际大会、⑩International Association for Artificial Intelligence and Law,http://www.iaail.org(last visited Apr.23,2013).法律知识与信息系统年会(JURIX)[11]Jurix,The Foundation for Legal Knowledge Based Systems,http://www.jurix.nl(last visited Apr.20,2013).和《人工智能与法律》杂志。[12]见Artificial Intelligence&L.,available atwww.springer.com/computer/aijournal/10506.这些文献说明了法律推理的I/O实例和中间步骤。他们还指出了一个关于重要法律/教育挑战相关的漏洞,人类推理者很容易跨越、躲避或忽视这个漏洞,而计算推理者需要特殊的技术来解决这个漏洞。有时,“人工智能与法律”研讨班会联合学习人工智能的法律学生和计算机科学研究生。这为法学院的学生提供了一个教学上非常宝贵的机会来练习向非法学院的学生解释法律(以及让研究生向非技术人员解释计算机科学)。学生也获得了与具有技术和技术头脑的人进行互动的经验,许多学生在实践中,可能会在客户或供应商中遇到这些人。

通过让学生参与构建、应用或使用法律推理的计算模型或用于法律推理的某些方面。“人工智能与法律”实践课程可以让他们更进一步。斯坦福大学、东北大学、芝加哥-肯特大学、[13]在芝加哥-肯特大学,理查德·怀特(Richard Wright)教授使用SAGE教授了一门关于“计算机和法律推理”的课程:一个教学专家系统开发工具,一套他自己设计的计算机程序,使得快速、超文本驱动的综合规则库和案例库的构建能够代表法律知识并模拟法律推理,尤其是在法律领域。罗恩·斯塔德(RonStaudt)教授教授“司法和技术实践”,让学生参与构建基于网络的工具(包括专家系统),以支持法律服务倡导者、公益志愿者和公益诉讼人。和匹兹堡大学的法学院已经开展了“人工智能与法律”实践课程,为学生提供了使用适用于非程序员的软件开发工具来开发专家系统的机会。实习活动可以作为“实验室”的一个组成部分与“人工智能与法律”研讨班结合在一起,也可以在下一学期跟进。无论有没有编程技能的学生实际上都可以构建法律专家系统的组件,并且这样做之后,他们将努力弥补差距。即使他们没有跨越这个差距,他们也会了解到这个差距。

由于许多计算机程序都涉及一个不断改进的设计过程,通过确定目标和子目标,并描述实现每一级别目标的一系列步骤,法学院的学生即使在不懂得编程语言的情况下也能够从事高级设计任务,能系统地思考解决法律程序过程的法学院学生可以逐步分解问题,然后集中精力“发明”解决某个子目标的技术(例如一组步骤)。他们不需要通过编写程序来学习描述这些步骤的过程或举例说明这些步骤的过程。

计算机编码中的实际编程只发生在过程的末尾,在任何情况下,它可能不需要特殊的技能。越来越多的工具可以使用,非程序设计专业的法律学生可以利用这些工具为实际的法律问题建立解决方案,从而慢慢落实他们的智能专家系统组件。最近,在乔治城法学院的“技术、创新和法律实践”研讨班上,学生们使用利奥塔逻辑(NeotaLogic)公司开发的工具在各个领域建立了法律专家系统,一些律师事务所也使用NeotaLogic来创建用于专业实践的专家系统。[14]Press Release,Neota Logic,Inc.,Georgetown Law Students Challenge Tradition by Building Online Legal Advisors with Neota Logic (Apr.24,2012)available at,http://www.prweb.com/releases/neotalogic/irontechlawyer/prweb9438690.htm.没有编程技能的学生也可以参与设计和使用注释法律文本的方案(包括使用下文[15]见后引[40]。所述的论证图解工具),然后它们就可以用于法律推理的计算模型,或者应用机器学习根据其法律意义对文本进行分类。例如,霍夫斯特拉大学法学院的“法律、逻辑和技术研究实验室”的学生通过参加有关法律意见中的证据推理注释和有关深入学习的经验研究活动,从而学习法律推理。[16]Law,Logic&Technology Research Laboratory,http://www.lltlab.org(lastvisited Apr.23,2013).

四、“人工智能与法律”研讨班教学大纲

“人工智能与法律”研讨班的教学大纲包括两个关键教学点,即从法律推理的逐步分解中吸取教训和理解法律实践的新技术。

(一)基于法律规范与案例推理的计算模型

教学大纲的第一部分“法律推理计算模型导论”的第一节包含一项丰富的调查和两个与学生特别相关的解决法律问题的计算模型的早期实例,这些学生都上了第一年的侵权和合同课程。

埃德温娜·里斯兰(Edwina Rissland,中文名:李诗兰)的调查向法学院的学生介绍了人工智能、人工智能在法律领域的应用以及法律推理的计算模型。[17]Edwina L.Rissland,Artificial Intelligence and Law:Stepping Stones to a Model of Legal Reasoning,99 Yale L.J.1957,1957-1958(1990).作者系马萨诸塞大学计算机科学名誉教授,定期在哈佛法学院教授人工智能与法律研讨课。除分配阅读材料外,她还强烈建议法学院学生以及她的研究生(我是其中之一,我永远感激这一机会)准备一份一页的阅读材料摘要,包括以下主要条目:① 对工作内容的简要描述(即不超过两到三句话);②STRE方法的长度;③ 方法的弱点;④ 与学生的某些项目、任务、任务或观点相关的方法。我发现准备这些阅读摘要总是很有帮助的,我请我的学生也做同样的事情。这种模型的第一个例子是唐纳德·沃特曼(Donald Waterman)的专家系统,该系统使用启发式规则(基于专家经验的拇指法则)来给出解决产品责任索赔问题的建议。[18]Waterman&Peterson,见前引④。唐纳德·沃特曼是人工智能的先驱,他的论文项目模拟了扑克赌博。第二个样本模型由安妮·加德纳(Anne Gardner)所提出,它分析了学生在第一年的侵权和合同课程中遇到的考试问题。[19]Anne von der Lieth Gardner,An Artificial Intelligence Approach to Legal Reasoning.4(1987).安妮·加德纳毕业于斯坦福大学,获计算机科学博士学位。每一个例子都说明了用于得出法律结论的计算机制。Rissland的调查也关注Waterman和Gardner的例子,并将它们与下面描述的基于案例的法律推理模型的开发相关联。

Waterman的程序包含三种源于法律机构、诉讼律师和保险理赔人的规则:定义法律概念的规则,如产品责任、严格责任和相对过错责任;处理不确定法律术语的解释陪审员对外表和同情的可能反应的非正式规则,以及指导解决计算的规则(例如计算疼痛和痛苦的量)。该系统以自下而上的方式应用规则,它基于这样一种规则:反复询问用户问题,然后给出答案,使用适用的规则得出结论,说明争端对于解决问题有多大价值。通过解释其结论,程序可以输出一棵推理树,一棵被“激发”的规则树(即其条件被满足的规则树),从而得出结论。

Gardner的程序作为四个中间结论或状态之间的有序进程,实现了报价和接受的模型:(0)没有相关性,(1)未决的报价,(2)合同的存在,(1+2)合同的存在加上修改合同的未决提议。圆弧表示从一个状态移动到另一个状态的方式。例如,从(0)移动到(1)需要找到要约,从(1)移动到(2)需要找到对未决要约的接受,从(2)移动到(0)需要撤销要约并拒绝承诺。并且在该模型中存在与每个弧相关的规则,这些规则定义了条件并确定条件是否已经满足(即事实是否披露了要约,接受,撤销等)。

法律推理的逻辑模型部分包括马雷克·斯国特(Marek Sergot)等人的早期程序,其分析了涉及英国公民的法律问题,它是试图“计算”法规的代表之一。这个程序包括150条来自《英国国籍法》的规定(人工表示),可以分析涉及国籍的问题,并使用它所得出的逻辑推理来解释其答案。[20]Marek J.Sergot,Fariba Sadri,Robert A.Kowalski,Frank Kriwaczek,P.Hammond&H.T.Cory,The British Nationality Actasa Logic Program,29Comm.of the ACM 370(1986).Marek Sergot是伦敦帝国理工学院的计算逻辑教授。

在计算大型法规时,出现了一个实际问题:法令规则的形式表示有脱离法定文本的趋势。这个问题使系统结果的解释变得复杂,也使维护规则随法定文本的修改而更新的大型系统变得复杂。特雷弗·本奇-卡波(Trevor Bench-Capon)和弗兰兹·科内(Franz Coenen)开发了一种协调法定规则表示的方法,以便它们与法定代码的结构同构。[21]Trevor Bench-Capon&Franz Coenen,Exploiting Isomorphism:Development of a KBS to Support British Coal Insurance Claims,1991Proc.of the Third Int'l Conf.of Artificial Intelligence &L.62.

本节中的其他著作对在将法定文本解释为逻辑规则时出现的问题提出警示。其中一个问题是需要处理由于自然语言文本中逻辑连接器的范围不确定而引起的逻辑歧义。[22]见Layman E.Allen&C.Rudy Engholm,Normalized Legal Drafting and the Query Method,29 J.Legal Educ.380(1977—1978).另一个问题源自这样一个事实,即古典逻辑是单调的,一旦得出结论,即使根据新的信息,也不能“收回”。因此,它不太适合法律推理,这是由于在法律推理中,法律结论通常可以被某种方式加以辩驳。[23]Donald Berman&Carole Hafner,Obstacles to the Development of Logic-Based Models of Legal Reasoning,in Computer Power And Legal Language 183- 214(Charles Walter ed.,1986).唐纳德·伯曼,前法律和计算机科学中心教授和副主任,定期在马萨诸塞州波士顿东北大学教授人工智能与法律研讨课。

基于案例的法律推理模型和预测法律结果的模型部分包括了对纯粹基于规则的、演绎性的法律推理模型的替代方案进行建模的技术。通过可定义的原型机和论点驱动的形态分析机制,[24]见L.Thorne McCarty,An Implementation of Eisnerv.Macomber,1995Proc.of the Fifth Int'l Conf.OnA rtificial Intelligence&L.276.索恩·麦卡蒂是罗格斯大学的计算机科学和法律教授,他在那里教授关于人工智能与法律的研讨课,并作为斯坦福法学院的访问学者。再加上若干可以通过表示和调节事实因素的原型来增强或削弱特定的主张的维度,[25]Ashley,见前引⑤,at763-764.这些模型就能够更灵活地表示法律概念。第三个模型GREBE使用语义网络来表示法官在解释其所有权认为很重要(或判别性的)的事实。[26]L.Karl Branting,Building Explanations from Rules and Structured Cases,34 Int'l J.of Man-Mach.Stud.797(1991).这些程序使用案例来产生支持和反对提出的结论(如HYPO的三层论证[27]Ashley,见前引⑤,at764.)的论据,这明显偏离了逻辑演绎模型的推理。

基于实例的模型也集中在开发新的技术来经验地评估计算模型的领域,例如GREBE的图灵测试。卡尔·布兰廷(L.Karl Branting)聘请一位人类专家对法学院学生或程序产生的论据进行评分。评分员没有被告知论据的来源(也就是说,没有人提示他有任何论据是由计算机生成的),而程序的论据看起来像法学院学生的论文。[28]Branting,见前引[26]。

基于案例的模型启发了基于要素的方法,CATO[29]见Vincent Aleven,Using Background Knowledge in Case-Based Legal Reasoning:A Computational Model and an Intelligent Learning Environment,150Artificial Intelligence183(2003).和IBP,[30]见Kevin D.Ashley&Stefanie Brüninghaus,Computer Models forLegal Prediction,46 Jurimetrics 309(2006).它们基于正反两面论据来预测法律案例的结果。这使人们重新对评估模型和预测准确性的客观标准产生了兴趣,自从早期的研究者应用了最近邻方法预测涉及资本收益问题的加拿大税务案件的结果,这就是“人工智能与法律”中一个反复出现的线索。[31]见Ejan Mackaay&Pierre Robillard,Predicting Judicial Decisions:The Nearest Neighbour Rule and Visual Representation of Case Patterns,3Datenverarbeitungim Recht302(1974).除了预测,CATO和IBP还增加了根据论点解释预测结果的能力。

题为“模型结合案例、法令、法规、概念和价值”的部分着重于对基于案例的计算模型的其他改进。GREBE程序集成了基于案例和基于规则的推理,使用在《工人赔偿法》[32]Branting,见前引[26]。中具有经常被诉讼的法律概念,索引了过去案例中标准事实的语义网络。

另一种结合案例和规则的方法,CABARET联合了国税局规定内政部扣除量的逻辑表示和条款的开放式结构法定术语。这种方法索引了术语的正面和负面的案例实例。[33]Edwina L.Rissland&David B.Skalak,CABARET:Statutory Interpretation in a Hybrid Architecture,34 Int'l J.of Man-Mach.Stud.839(1991).值得注意的是,CABARET采用议程机制在基于规则的分析和基于案例的分析之间切换,生成了支持和反对纳税人立场的论据。

1993年,一个有影响的评论改变了“人工智能与法律”对基于案例的计算模型的研究进程。[34]Donald H.Berman&Carol Hafner,Representing Teleological Structure in Case-Based Legal Reasoning:The Missing Link,1993Proc.of the Fourth Int'l Conf.on Artificial Intelligence &L.50.唐纳德·H.伯曼(Donald H.Berman)和卡罗尔·哈芬(Carol Hafner)指出,这些模型缺乏目的论成分,即法律法规所服务的隐藏目的或价值——这些目的和价值原本是人类法律解释活动的焦点——在这些模型中却被遗漏了。这种批评引导了未来10年的工作的转向,继而导致了Bench-Capon和萨特(Sartor)的具有里程碑意义的法律推理模式,其使用的案例吸收了从先例中引出的价值偏好理论中的价值因素。[35]Trevor Bench-Capon&Giovanni Sartor,A Model of Legal Reasoning with Cases Incorporating Theories and Values,150Artificial Intelligence97(2003).另一种方法集中于案例决策如何延伸地定义职业道德中的原则。它以“法官”(实际上是工程伦理学专家)作出的伦理决策中标准事实语义网络的广义版本来表示案例。[36]见Bruce M.McLaren,Extensionally Defining Principles and Cases in Ethics:An AI Model,150Artificial Intelligence 145(2003).在一次实验中,布鲁斯·M.麦克拉伦(Bruce M.McLaren)通过实验证明了作为填充抽象伦理规则意义的案例,他对SIROCCO程序检索效率贡献颇大。

(二)具有论证方案的可废除法律推理

这一节介绍当前“人工智能与法律”研究的重点,使用吸收和重述上述逻辑演绎、基于案例和基于价值的方法来评估法律权利索赔的论证模式,开发非单调、可废除的法律推理的统一计算框架。非单调或可废除的推理模型能够根据新的信息(法律推理的一个重要特征)恢复先前的推理结果。

关于用参数模式评估法律主张的章节概述了由凯蒂·阿特金森(Katie Atkinson)和 Bench-Capon[37]Katie Atkinson&Trevor Bench-Capon,Argumentation and Standards of Proof,2007Proc.of the Eleventh Int'l Conf.on Artificial Intelligence &L.107.以及托马斯·F.戈登(Thomas F.Gordon)和道格拉斯·沃尔顿(Douglas Walton)[38]Thomas F.Gordon&Douglas Walton,Legal Reasoning with Argumentation Schemes,2009 Proc.of the Twelfth Int'l Conf.on Artificial Intelligence &L.137.提出的统一框架。该工作还包括对关于法律主张的证据论证和证明标准的建模。

马提亚·格拉巴(Matthias Grabmair)和笔者开发了用于美国最高法院口头辩论中使用的价值判断、中间法律概念和虚拟案例进行案例比较的参数模型。[39]Matthias Grabmair&Kevin D.Ashley,Facilitating Case Comparison Using Value Judgments and Intermediate Legal Concepts,2011Proc.of the Thirteenth Int'l Conf.on Artificial Intelligence&L.161;Matthias Grabmair&KevinD.Ashley,Argumentation with Value Judgments-An Example of Hypothetical Reasoning,2010 Proc.of the 23rd Ann.Conf.on Legal Knowledge&Info.Sys.67.韦恩·R.沃克(Vern R.Walker)的模型将案例中的证据推理的例子与模型法定要求的决策树连接。[40]Vern R.Walker,Nathaniel Carie,Courtney C.De Witt&Eric Lesh,A Framework for the Extraction and Modeling of Fact-Finding Reasoning from Legal Decisions:Lessons from the Vaccine/Injury Project Corpus,19 Artificial Intelligence&L.291,296-298(2011).

随着参数模式对程序建模法律论据种类的改进和扩展,它们增加了对更好地表示法律事实情况和概念的方法的需求。索恩·麦卡蒂(L.Thorne McCarty)[41]McCarty,见前引[24]。和Rissland[42]Rissland,见 前 引 [17];Rissland&Skalak,见 前 引[33],at 839-840.提出的对灵活概念模式的需求变得更加迫切。作者通过实证分析证明,[43]Kevin D.Ashley&Stefanie Brüninghaus,A Predictive Role for Intermediate Legal Concepts,2003 Proc.of the Sixteenth Ann.Conf.on Legal Knowledge&Info.Sys.153,155.中间法律概念对预测法律结果起着重要作用。随着时间的流逝,其含义变化可以被监控,[44]Edwina L.Rissland&M.Timur Friedman,Detecting Change in Legal Concepts,1995 Proc.of the Fifth Int'l Conf.on Artificial Intelligence &L.127.并且参数模式导致了对关于特定中间法律的含义进行更加详细的参数建模。[45]Grabmair&Ashley,前引[39],at 164-166.

所谓法律本体,是指用于法律规范和事实情景的领域概念的系统的、明确的规范,它可以帮助计算模型灵活地用法律概念进行推理。某些时候,法律本体是从以形式表示的案例进行推理的计算模型转变为以文本表示的案例的关键。在法律本体中表示法律概念和案例知识的部分介绍了法律本体的基础工作;[46]Trevor J.M.Bench-Capon&Peppin R.S.Visser,Ontologies in Legal Information Systems;The Need for Explicit Specifications of Domain Conceptualisations,1997 Proc.of the Sixth Int'l Conf.on Artificial Intelligence&L.132;Joost Breuker,Andre Valente&Radboud Winkels,Legal Ontologies in Knowledge Engineering and Information Management,12Artificial Intelligence&L.241(2004).一些本体需要被用于支持使用参数模式的类推、目的论和假设法律推理;[47]见KevinD.Ashley,Ontological Requirements for Analogical,Teleological,and Hypothetical Legal Reasoning,2009 Proc.of the Twelfth Int'l Conf.on Artificial Intelligence &L.1.用于从法律文本构建法律本体论的最新的半自动化手段。[48]Enrico Francesconi、Simonetta Montemagni、Wim Peters和Daniela Tisconia,在法律文本的语义处理中,整合了自下而上和自上而下的方法,为多语言法律领域构建语义资源:法律语言符合语言法95(Enrico Francesconi、Simonetta Montemagni、Wim Peters和Daniel A Tisconiaeds.,2010)。

(三)法律信息检索、信息提取和文本处理

第三部分解释了全文法律信息检索系统如何工作,从而向学生介绍法律信息检索(“IR”)的实用性(第五部分进行更详细的解释),[49]Howard Turtle,Text Retrieval in theLegal World,3Artificial Intelligence&L.5,5-6(1995).包括倒排索引的使用、术语频率在评估相关性中的作用、使用贝叶斯网络的检索概率模型,[50]见Eugene Charniak,Bayesian Networks Without Tears,12 AI Magazine,Winter 1991,at 50.评估法律IR的方法及适用措施,精确度和召回,[51]DavidC.Blair&M.E.Maron,An Evaluation of Retrieval Effectiveness for a Full-Text Document-Retrieval System,28 Comm.of the ACM289(1985).以及从法律文本中提取信息的 方 法 。[52]Peter Jackson,Khalid Al-Kofahi,Alex Tyrrell&Arun Vacher,Information Extraction from Case Law and Retrieval of Prior Cases,150Artificial Intelligence239(2003).

结合法律IR和人工智能来分析法律权利要求这一部分探讨了全文法律信息检索和“人工智能与法律”模型可能互补的优缺点。这部分还探讨了结合它们的方法,包括使用基于案例的模型在SPIRE程序中自动发现案例意见中的法律相关段落,[53]Jody J.Daniels&Edwina L.Rissland,Finding Legally Relevant Passages in Case Opinions,1997 Proc.of the Sixth Int'l Conf.on Artificial Intelligence &L.39.使用法律本体来提高检索效率,[54]M.Saravanan,B.Ravindran&S.Raman,Improving Legal Information Retrieval Using an Ontological Framework,17Artificial Intelligence&L.101,103(2009).从案例法中自动提取信息,[55]Jackson等,见 前 引 [52]。支持其他法律研究范式,诸如通过法律信息网络进行启发式搜索。在SCALIR中,由法律案例组成的网络通过共享术语或引文连接。[56]Daniel E.Rose&Richard K.Belew,A Connectionist and Symbolic Hybrid for Improving Legal Research,35 Int'l J.of Man-Mach.Stud.1(1991).在Bank XX中,法律知识网络连接有注释的节点,这些节点将案例表示为因素集合和引文束,并将原型故事和法律理论的示例表示为因素束。[57]Edwina Rissland,David Skalak&Timur Friedman,Bank XX:Supporting Legal Arguments through Heuristic Retrieval,4 Artificial Intelligence&L.1,5-8(1996).

法律信息提取和文本处理部分的工作将法律推理的计算模型和法律文本联系起来。SMILE+IBP程序根据适用因素对文本描述的案例进行分类,然后使用IBP预测和解释它们的结果。[58]Kevin D.Ashley&Stefanie Brüninghaus,Automatically Classifying Case Texts and Predicting Outcomes,17Artificial Intelligence&L.125,139-140(2009).其他程序根据主要类型、抽象类别和主题(如“行政法”或“知识产权法”)或规范类型(例如定义、许可或义务)自动对法律文本进行分类,然后提取诸如规范特征(例如义务、责任承担者、行动或行动对象)和监管功能(即关于法规管辖哪些实体和事件以及法规的目的及其约束的功能)的信息。[59]Enrico Francesconi&Andrea Passerini,Automatic Classification of Provisions in Legislative Texts,15Artificial Intelligence&L.1,2-3(2007);Emile de Maat,KaiKrabben&Radboud Winkels,Machine Learning Versus Knowledge Based Classification of Legal Texts,2010Proc.of the Twenty-third Ann.Conf.Legal Knowledge&Info.Sys.87.

在以往的“人工智能与法律”关于法律信息提取和文本处理的工作中,研究者可以假设法律文本具有相当同质的结构,并且符合关于内容的某些约束。然而,这些假设不适用于电子发掘,在电子发掘中,诉讼各方必须分析和产生大量与投诉和答复的指控有关的文件。“针对电子发掘的人工智能与法律工具”这部分内容的工作是,通过获取与律师关于索赔和文件的假设有关的证据来应对这些挑战。[60]见Kevin Ashley&Will Bridewell,Emerging AI&Law Approaches to Automating Analysis and Retrieval of Electronically Stored Information in Discovery Proceedings,18 Artificial Intelligence&L.311(2010).鉴于天量文档的存在,这是一个信息检索工具必然占主导地位的领域,[61]Douglas W.Oard,Jason R.Baron,Bruce Hedin,David D.Lewis&Stephen Tomlinson,Evaluation of Information Retrieval for E-discovery,18Artificial Intelligence&L.347(2010).但其中统计技术与基于法律主张和假设的模型的知识可以相互补充。[62]David D.Lewis,After word:Data,Knowledge,and E-discovery,18Artificial Intelligence&L.481(2010).人工智能工具可以发挥有价值的作用,例如在使用社交网络技术过滤文档,[63]Hans Henseler,Network-based Filtering for Large Email Collections in E-Discovery,18Artificial Intelligence&L.413(2010).创建用于预测编码的相关文档的最佳种子集(即基于机器学习的不可视的文档分类[64]Christopher Hogan,Robert S.Bauer&Daniel Brassil,Automation of Legal Sensemaking in E-discovery,18Artificial Intelligence&L.431(2010).),以及支持律师用创新界面探索文档。[65]Caroline Privault,Jacki O'Neill,Victor Ciriza&Jean-Michel Renders,A New Tangible User Interface for Machine Learning Document Review,18Artificial Intelligence&L.459(2010).

(四)人工智能与法律的未来:连接计算模型和法律文本的桥梁

教学大纲的第四部分转向一些未来的“人工智能与法律”工作,弥补法律推理计算模型与法律文本之间的差距。“人工智能与法律的近期发展”这一节呈现了一些可以合理预期的发展。JeopardyTM-winning IBM Watson程序[66]David Ferrucci,Eric Brown,Jennifer Chu-Carroll,James Fan,David Gondek,Aditya A.Kalyanpur,Adam Lally,J.William Murdock,Eric Nyberg,John Prager,Nico Schlaefer&Chris Welty,Building Watson:An Overview of the Deep QA Project,31AI Magazine,Fall 2010,at 59.的 Deep QA方法可能对如何从法律决策文本中自动提取相关信息产生深远的影响。使用Deep QA自然语言处理工具对法律决策文本中的论点图式信息进行注释,程序可以较为理想地筛选提供法律遵从性证据的新文本。[67]Kevin D.Ashley&Vern R.Walker,Automated Monitoring of Legal-Rule Compliance Using Deep QA:Screening Legal Documents for Argumentation Evidence (unpublished manuscript)(on file with authors).贝叶斯网络将与论证模式相结合,[68]Matthias Grabmair&Kevin D.Ashley,A Survey of Uncertainties and their Consequences,in Probabilistic Legal Argumentation,in Bayesian Argumentation61,61-62(FrankZenker ed.,2012).以便法律论证的计算模型能够比Waterman的定居指导计划更系统地解释事实、规范、道德和经验的不确定性。[69]Waterman &Peterson,见前引④。监管要求的可废除的逻辑模型将有助于确保业务流程的设计符合法律,[70]Guido Governatori&Sidney Shek,Rule Based Business Process Compliance,874 Proc.of the Rule ML2012@ECAI Challenge,at the Sixth Int'l Symp.on Rules Paper No.5(2012),available at http://ceur-ws.org/Vol-874/paper17.pdf.并在录入电子合同时实现基于网络代理的自动化。[71]Benjamin N.Grosof,Yannis Labrou&Hoi Y.Chan,A Declarative Approach to Business Rules in Contracts:Courteous Logic Programs in XML,1999 Proc.of the First ACM Conf.on Electronic Com.业务流程方法将继续扩展到管理机构。在荷兰移民归化服务的Indigo项目中,法律和法规在规则引擎服务中实施,移民代理和其他用户调用该服务来支持案例管理。规则引擎为特定情况提供任务列表,但最终由用户决定对任务进行排序。专用工具使最终用户能够向规则建模者和监管者提供反馈,以持续改进法规和规则。[72]Audrey Theunisz,INDiGO:Rules-driven Business Services;Flexibility Within the Boundaries of the Law,Presentation of the Dutch Immigration and Naturalisation Service(Oct.5,2010),available at http://www.servicetechsymposium.com/soa_archive/pdf_berlin/Audrey_Theunisz_Rules_Driven.pdf.In the absence of apublished paper in English on INDiGO,this seems to be the most informative document publicly available.

(五)增编:智能教学系统和法律伦理

最后,教学大纲包括两个主题,可以在研讨班结束时讨论或在早期阶段时综合讨论。“法律与伦理推理的智能教学系统”这一节着重介绍了法律推理的计算模型,这些计算模型已被纳入一些特定系统,这些系统旨在教授学生特定法律概念,[73]Antoinette J.Muntjewerff,ICT in Legal Education,10 Ger.L.J.669(2009).和辩证技能(如区分案件)[74]Aleven,见前引[29]。以及构造、[75]Chad S.Carr,Using Computer Supported Argument Visualization to Teach Legal Argumentation,in Visualizing Argumentation:Software Toolsfor Collaborative and Educational Sense-Making75(PaulA.Kirschner,Simon J.Buckingham Shum&Chad S.Carr eds.,2003).审查[76]KevinAshley&Ilya Goldin,Toward AI-enhanced Computer-supported Peer Review in Legal Education,2011 Proc.of the Twenty-fourth Ann.Conf.on Legal Knowledge&Info.Sys.1.和理解法律理论。[77]Collin Lynch,Kevin D.Ashley&Mohammad H.Falakmasir,Comparing Argument Diagrams,2012 Proc.of the Twenty-fifth Ann.Conf.on Legal Knowledge&Info.Sys.81.这些在线教学技术可以提供给法律学生,甚至那些参与在线法律教育或大规模开放在线课程(MOOC)的学生,那种传统法律教育的学生现在可以在课堂上接受论证实践的教育。

随着人工智能程序的发展,新的法律问题会涌现,“人工智能与法律”程序也不例外。“与人工智能与法律计划有关的法律和伦理问题”部分,着重于智能代理的法律地位、[78]Samir Chopra&Laurence White,A Legal Theory For Autonomous Artificial Agents 119(2011).智能代理的责任、[79]EmadA.R.Dahiyat,Intelligent Agents and Liability:Is It a Doctrinal Problem or Merely A Problem of Explanation?,18 Artificial Intelligence&L.103(2010).使用法律专家系统的未经授权的法律实践[80]Taiwo A.Oriola,The Use of Legal Software by Non-Lawyers and the Perils of Unauthorised Practice of Law Charges in the United States:A Review of Jayson Reynoso Decision,18 Artificial Intelligence&L.285(2010).以及虚拟环境或智能代理环境中的知识产权等法律问题。[81]Woodrow Barfield,Intellectual Property Rights in Virtual Environments:Considering the Rights of Owners,Programmers and Virtual Avatars,39AkronL.Rev.649(2006).法学院的学生使用传统的法律研究工具来研究这些话题,会觉得身处舒服区,但是一个有效的法律分析可以使学生对技术如何工作理解地更深。到课程结束时,学生可能因此而更好地承担法律责任问题。

例如,一份合约与一个法律专家系统都包含法律知识,其中一些知识可能被错误地应用或招致有害结果。然而,这两种技术在它们引起信赖的方式和程度上存在差异,可能对作者或知识工程师的责任有不同的影响。因此,学生可以就他们知道如何去做的事情(如分析法律责任)写论文,但是仍然可以受益于理解法律专家系统如何选择和运用法律知识以及如何解释其结论。此外,通过关注知识的空白,该过程可以帮助学生了解知识工程技术的局限性,也可以设想邀请法学院学生考虑将分析智能代理的法律责任的任务作为使用“人工智能与法律”技术建模的任务。

因此,这份教学大纲传达了一个关于“人工智能与法律”的过去和现在的工作,它的挑战和进展的连贯的叙述。接下来的两节重点介绍学生关于法律推理和理解法律实践新技术的突出课程。为了方便参考,以下列出课程,并用于整理接下来两节中的演示文稿。

“人工智能与法律”研讨班大纲中的材料中学习的课程

A:关于法律规范的课程 A1课:模糊语义对法律规范的影响;A2课:法律规范的逻辑模糊性;A3课:法规结构对法律规范含义的影响;A4课:法律规范受制于未说明的条件

B:关于法律推理的课程 B1课:区分困难和简单案例是一个关键的过程;B2课:类比和区分案例是可指定的过程;B3课:用案例和价值进行推理是一种理论建构;B4课:法律倡导者提出虚拟案例来检验法律规范

C:关于法律论证的课程 C1课:主张者采用于特定法律领域的论证方案;C2课:人们可以通过攻击法律论证假设或识别例外来攻击它;C3课:法律论证涉及逻辑、修辞、不确定性和叙述之间的复杂关系

D:关于法律数字文档技术的课程 D1课:法律数字文档技术是基于运算模型和算法的;D2课:法律数字文档技术的过程以不同类型的文本作为输入;D3课:数字文档技术能够发现与法律问题相关的文本;D4课:数字文档技术及其运算模型需要经验方法来测试;D5课:发现与法律问题相关的文本与应用相关文本解决法律问题不同;D6课:法律推理的计算模型是法律文本和法律问题解决之间的桥梁

五、关于法律规范、法律论证和法津推理的课程

“人工智能与法律”课程以独特而具体的方式讲述了法律学生需要学习的内容,包括有关法律规范、案件推理以及法律论点。课程大纲中有颇多地方值得玩味,学生课后如果细心琢磨,定能会心一笑——适当的润饰能够帮助学生逐步形成思想观念。本部分定义了教学大纲中部分的这种时刻,并给出了相关的背景。

A:关于法律规范的课程

A1课:模糊语义对法律规范的影响

在第一个学期的某个时候,法学院的学生可能已经了解到,法律规范中概念的含义通常没有明确规定。当他们参加“人工智能与法律”研讨班时,这已经不再是新闻了,但是对于学生来说,观察建立根据法律规范进行推理的计算机程序的实际后果可能还是有启发性的。

法规可以被建模为逻辑程序[82]Sergot et al.,见前引[20]。或使用启发式规则建模,但是当规则到期失效时,必须求助于其他东西:专家查询、案例中的论点或法规结构和法规的目的。

Waterman在早期使用规则来定义产品责任、严格责任以及指导解决决策指定的程序中的相对过失时就遇到了这个问题。特别的是,他定义“严格责任”的规则时使用了其他规则中定义的术语和概念,例如“负责产品使用”和“附带销售”,都在其他规则中定义。[83]Waterman&Peterson,见前引④,at 16,38.然而,一些在该产品责任环境中重要的法律判断,如“合理和恰当”或“可预见”在法律规范中没有另外定义。有些法律概念——包括“紧急情况”“不恰当的描述”“财产”“伤害”“瑕疵”和“粗心”——无论是否在规则中定义,都是模糊的,将它们应用于具体的事实情况经常会引起争议,并且经常可以提出合法的论据,即该概念适用或不适用。

Waterman的严格责任界定规则

[规则4:严格责任界定]

如果(原告受到产品伤害

或者(原告确实代表死者

死者被产品杀死)

或者原告的财产被产品损坏)

并且附带销售辩护不适用

并且(产品由被告制造

或者产品由被告销售

或者产品由被告出租)

并且被告对产品的使用负责

并且(加州拥有案件的管辖权

或者产品的用户是受害者

或者产品的购买者是受害者)

并且产品在销售时有缺陷

(产品从制造到销售没有变化

或者(被告的期望是“产品没有变化”

从制造到销售

被告的期望是合理和适当的)

然后主张严格责任理论确实适用于原告的损失。

当遇到一个含义不明确的术语时,人类的法律分析不会停滞不前,系统设计师和知识工程师需要对人类的做法进行建模。尽管法律专业的学生可能理解“语义歧义”的概念,但目前他们对于人类律师处理语义歧义的方法、他们使用的论据类型、这些论据假设什么以及如何攻击这些论据的思考深度还不太清楚。

Waterman列举了四种计算技术,法律专家系统用这四种技术可以处理定义模糊的法律概念,这四种技术如下:① 使用启发式规则(从法律专家或保险精算师那里搜集而来),试图捕捉过去如何使用这个术语;②给出示例,并让用户决定在当前事实情况下术语是否满足;③使系统能够将当前事实情况与实例进行比较,以便确定术语是否满足;④ 在连续的细化过程中修改系统的规则,以便捕获概念的含义。[84]Id.at26.

“人工智能与法律”领域的许多后续工作已经解决了这些计算技术问题。例如,法律专家系统使用第一项和第二项技术来指导用户进行实际决策。研究者特别关注第三种技术,他们使系统根据案例进行类比推理,并论证该概念适用于或不适用于新情况。这是教学大纲第三部分所讨论的工作主题。一些工作已经涉及第四种技术,其中对判决的司法解释的注释正在被持续改进。注释突出了解释中可以被匹配从而分析新的事实情况的部分。[85]例如:Branting,见前引[26];Mc Laren,见前引[36];Ashley&Walker,见前引[67]。

A2课:法律规范的逻辑模糊性

虽然语义歧义只让很少学生感到惊讶,但更少人能够意识到法律规范中的逻辑歧义问题。大多数人似乎惊讶地获悉,因为逻辑连接词的范围在自然语言中的模糊界定和法定结构的复杂性,即使是法律规范的逻辑也可能是模糊的。在形式逻辑或数学逻辑中,括号限定了逻辑或数学运算符的范围,但在法定文本和其他自然语言文本中不是这样。莱曼·艾伦(Layman Allen)提供了许多示例,这些示例表明,即使是简单的法定规则也有多种逻辑解释,立法机关可能基本不知道这些解释。这与为了促进立法妥协而故意包含的语义模糊形成鲜明对比。例如,路易斯安纳的法规规定,“任何人不得拨打或建立本地电话连接……匿名使用淫秽、亵渎、粗俗、下流、淫秽或不当的语言、淫秽性质的建议或提议,以及任何形式的威胁”。[86]Allen&Engholm,见前引[22],at384[quoting Statev.Hill,157So.2d462,462(1963)].但是,如果要违反规定,电话是否必须包括淫秽语言和威胁,还是只要包含其中一项就够了?当然,在刑法环境中,答案可能意味着无罪。同样地,学生也了解到,在解释保险单和合同时,逻辑上的模糊性可能是至关重要的。鉴于我们不能假设今天的学生理解阅读和起草法律规范的必要性,这就是一堂重要的课。

为了逐步规范化法令,Allen提出了一个程序,即系统地列举各种不同的逻辑可能性,以便人们可以从各种不同的逻辑解释中进行选择。然而,他强调说,选择是立法机关的事,最好是在起草过程中完成。当开发包含法定规则的法律专家系统时,知识工程师还需要从备选方案中进行选择。他们试图选择立法机关可能中意的替代方案,但他们的选择并不具有权威性,它只是知识工程师对法规的解释。[87]Id.at396.如果法律已经颁布,除了原始法规之外的任何形式的法规都代表了一种解释。重要的是,任何声称与法规相对应的陈述都不会比法规本身更多或更少。或者,法律专家系统中的规则可以体现专家在法律领域的观点的启发性规则。专家可以以解决其他方式重新概念化或重新特征化法定术语,根据专家的经验解决句法(和语义)模糊问题并且满足系统的目的。

Allen的工作还着重提供一种流程图式的帮助,让学生了解复杂法规的规范化和概述缩进的实用,以理解一项复杂法令。他通过一个复杂的税收条款IRC Sec354来说明这一点。管理某些重组中的股票和证券的交易,就像《美国国内收入法》的其他规定一样,“从句法角度来看简直太糟糕了”。[88]Id.at388.然后他把它与一个标准化版本进行比较,该版本根据该条款的逻辑提供了流程图。[89]Id.at393.它说明了通过法定规则的条件得出结论的替代路径,并使人们更容易看到是否有得出结论的路径。学生们开始意识到,有可能以更加系统的方式起草和提出复杂的法律规范,以帮助他们理解法规,并以此作为起草合同语言的目标。

A3课:法规结构对法律规范含义的影响

Allen的税法示例还引出了这样一个问题:当法定条款通过引用纳入其他条款(可能涉及其他例外情况)或更糟时,当其他条文提供未明确相互参照的例外情况时,绘制逻辑路径的问题。本课程还引导学生思考一项规定在法律解释中相对于其他规定在法律或法规中的地位的重要性。包含信息的法令或法典的层级结构有助于解决其他不明确的术语信息问题,这在民法解释中经常出现。

“人工智能与法律”研究者在对这种现象进行建模方面并没有取得很大进展。[90]But seeBench-Capon&Coenen,见前引[21];Tom Routen,Hierarchically Organised Formalisations,1989 Proc.of the Second Int'l Conf.on Artificial Intelligence &L.242.然而,他们经常遇到这些问题并且常常会感到沮丧。在使用机器学习从法定文本中自动提取信息的工作中,例如,在合理地假设某条规定的部分和子部分的概要结构提供了语义上有价值的信息的情况下,有能力的人类读者甚至可能不需要弄清楚在条款的末尾是否有未标记的段落是前一小节的子部分或独立的子部分。

A4课:法律规范受制于未说明的条件

正如法律规范可能有未引用的例外情况,它也可能有未陈述的条件,例如,它不是违宪的,它不是先发制人的,或者它可以在不违反法律原则的情况下适用。Allen提出了一个问题,即如何知道应该包括哪些未声明的条件、何时应用这些条件以及如何解决是否应用规则的问题。对于学生和知识工程师来说,这些都是棘手的问题。虽然可以认为所谓的解释原则解决了这些问题,Allen指出卢埃林令人信服地将解释原则描述为充数的东西。[91]Layman Allen&Charles Saxon,Some Problems in Designing Expert Systems to Aid Legal Reasoning,1987 Proc.of the First Int'l Conf.on Artificial Intelligence&L.94,105.

在《基于逻辑的法律推理模型的发展障碍》一书中,Berman和Hafner令人信服地指出,即使事实和适用法律达成一致,对手仍然可以产生合理的赞成和反对论点,法庭也会得出不同的结论。这种法律上的不确定性是由以下未陈述的条件中固有的冲突造成的,这些条件包括法律规范是否真的应该被适用;适用时是否违背潜在原则、在特定环境中规则的开放性概念意味着什么以及如何解决不一致的解释原则和不一致的先例。由于这种法律上的不确定性,他们认为,以演绎逻辑为导向的法规模型是不能成功的。[92]Berman&Hafner,见前引[23]。

Berman和Hafner引用了里格斯·帕默尔(Riggs Palmer)[93]等法律不确定性的例子。Riggs对杀害他祖父的孙子是否会继承祖父遗嘱中的遗产提出了困惑。该规则的明确条件“死者财产的任何继承人可以要求得到死者财产”是满足的。但是,应用该规则将违反“任何法律规范均不适用于实施对他人造成严重损害的重罪行为的一方当事人的利益,这带来了该规则适用于他利益的条件”原则。这样的原则是关于规则的规则,并且带来了技术上的要求,逻辑系统将需要支持对所有规则的规则进行量化。

更重要的是,Berman和Hafner总结,法律不确定性现象导致了一个更深刻的问题:基于逻辑的计算模型不适合对法律人的推理进行建模。技术问题在于,在古典逻辑中,不可能有效地证明(或论证)一个命题及其对立面。然而,他们的例子表明,即使倡导者以相同的前提(即公理、规则和公认的事实)开始,他们仍然会产生法律上合理但矛盾的论点。[94]Berman&Hafner,见前引[23],at191.实际上,法学教授经常要求法学院的学生在分析考试问题时提出正反两方的论点,并要求学生提出解决方案。

从Berman和Hafner的描述中可知,法学院的学生很难不去思考他们作为人类推理者是如何处理法律不确定性的。鉴于这些语义和句法模糊、隐含的例外情况和未陈述的条件的问题,律师应当对法律规范本身进行推理,而不是简单地运用法律规范进行推理,这是显而易见的。律师使用论据来说服自己和其他人一个概念意味着什么,例外是否适用,或者未陈述的条件是否满足。对于法学院学生以及“人工智能与法律”研究者来说,这门课是根据支持和反对应用规则的需要,推理(推敲)法律规则。

正如《教学大纲》中阐述的那样,“人工智能与法律”研究者已经试图用带有条件和例外的论点模式来模拟其中一些类型的论点(包括用案例、价值和原则进行推理),从而得到剩余的教学课程。[95]或者,人工智能与法律研究人员试图找到这些应用,其中逻辑上的这些限制不会产生负面的实际后果。

B:关于法律推理的课程

B1课:区分困难问题和简单案例是一个关键的过程

在应用法律规范的过程中,存在如此多的潜在冲突,以至于学生可能想知道人类推理者如何区分简单案件和疑难案件。

如果疑难案件是指那些即使律师虽然同意事实认定,但对其结果或解释存在矛盾的合理观点的案件,那么法律专家在结果和结果的解释方面是否存在容易达成一致的问题?毫无疑问,一些法律决定对于一方来说没有提出任何有争议的法律问题,法律从业者通常能迅速作出几十个法律决定。

在一年级的法律写作或法律程序课程中,法学院的学生可能以哈特与富勒[96]例如:Berman&Hafner,见前引[23],at185-186.之间的法理学辩论的形式遇到过这个问题,但这是一个法学院的学生每学期末都会反复面对的问题。当然,法学院的学生必须根据课程所涵盖的法律规范和决定,决定在考试中详细提出哪些问题,以及忽略哪些问题,这一决定包括评估教师情景中精心设计的优势和劣势所带来的机会。的确,评估学生在压力下、灵活有效地作出这些决定的能力,是法学院教师布置论文型考试问题的原因之一。因此,帮助法学院学生思考如何作出这些决定是一个及时而有用的教训。

在Anne Gardner的合同考试程序中,她第一次提供了一种算法型启发式方法来区分难题和易题。(未命名的)项目的输入是法学院学生处理要约和承诺的合同考试问题的表示,输出是对问题的分析,将事件描述为要约和承诺,并确定所涉及的法律问题。Gardner的立场是,肯定有简单的案例。至少我们一直认为问题很简单。如果没有简单的案例,一切都可以解释,答案将永远无法躲避我们。从系统设计者的角度出发,她指出,确定案件是否容易的方法也必须是容易的。她用于区分困难案例和简单案例的启发式方法如下所示,在Rissland的特征描述中进行了扩充。[97]Rissland,见前引[17],at 1970,n.62;Gardner,见前引[19],at 54-55,160-161.

Gardner用于区分困难案例和简单案例的启发式方法

对于规则中的每个谓词,

如果常识知识规则提供了答案,那么CSK-Answer为真,否则为假。

如果问题与谓词的positive examples匹配,则Pos-Examples为真,否则为假。

如果问题与谓词的negative examples匹配,则Neg-Examples为真,否则为假。

如果,CSK-应答

如果(Pos-Examples 或Neg-Examples)->问题很难

如果(只有Pos-Examples和Neg-Examples其中之一)>问题简单

如果(Pos-Examples和Neg-Examples)>问题很难

如果CSK Answer

如果(Pos-Examples或Neg-Examples)->问题简单

如果(只有Pos-./Neg-Examples中的一个)

如果(只同意-1w/CSK-Answer)->问题很简单,否则问题很难

如果(Pos-Examples和Neg-Examples)>问题很难

对于法律专业的学生来说,当他们在思考律师如何决定对哪些谓词进行辩论,以及他们实际上(学生)如何决定发展哪些考试问题的时候,思考Gardner的方法是很有意义的,Gardner程序中的策略可以以算法形式表示为一组步骤,并提供了一个模型,使学生能够改编成更实际的策略。学生首先可能会需要算法来进行案例比较。

在Gardner的程序中,这些例子不是完全成熟的例子,充其量是捕捉诸如“立即”之类的变量的范例、标准或极值的案例片段。然而,简单的正反实例的直接匹配是不够的,需要一种方法来更稳健地将问题与示例进行比较。如果考虑到将问题情景的事实与法院判定法律适用性的案件进行比较,则该算法将是对学生考试策略的更有用的模型。判断问题是困难还是简单取决于与其他案件的类比。如果正面的例子与事实非常接近,而负面的例子则不是,那么这也许不是一个困难的问题。

B2课:类比和区分案例是可指定的过程

考虑一种区分法律难题和易题的算法,自然会考虑比较案例的算法的设计。简而言之,它引导学生思考法律类比的要点,如何定义“相关相似性”和“相关差异”,以及如何评估类比的强度。Gardner的例子显然没有包含足够的事实信息来比较案例的相似度,评估它们的相似性如何证明以与案例相同的方式处理问题场景是正确的,或者评估它们的差异如何证明不这样做是正当的。

法学院的学生都知道他们需要类比和区分案例。许多苏格拉底式的课堂讨论都涉及学生在课本案例中就某一特定问题进行讨论。课程论文考试要求学生对那些案例和问题情景进行类比或区分。目前尚不清楚学生是否理解类比和区别是什么,以及它们为什么在法律分析中很重要。

如前所示,教学大纲提供了许多“人工智能与法律”研究者试图对法律上相关的相似点和不同点进行建模的方法的实例。它们侧重于确定具有法律意义的事实模式,范围包括:① 专家认为其存在或缺席对一个问题有影响的一般事实描述;② 根据专家所说,并且在案件中证实的典型事实模式,典型地在不同程度上加强一方关于某一问题的主张或论点;③ 法官解释中关键事实的摘录,以证明他或她对某一特定问题的决定是正确的。

研究者通过权利要求、权利要求要素或其他问题以及潜在的价值或原则来对这些模式进行索引,然后将索引与原因相关联。因此,计算机程序可以识别法律上相关的相似点和不同点,使用它们来类比和区分案例,并解释类比和区别对于问题决策的重要性。这些任务集中于基础价值在相关性中发挥作用的方式。

对法学院学生来说,比较在何种程度上捕捉或省略了法律上相关的考虑是有益的。例如,描述符、规模和因素用作重要事实模式的检查表。一方面,这些列表支持根据不存在的事实模式对问题进行推理,并且它们与用于解释它们为什么重要的原因或价值明确关联;另一方面,这些列表是固定的,它们需要随着新模式的出现而更新。标准解释是动态的,因为当一个人将案件及其解释输入数据库时,他可以对法官认为关键的解释片段进行注释。然后,解释性片段可以与它们相关的原因或价值相关联,或者通过它们相关的价值进行索引。在处理新案例时,考虑到这些事实可以用不同的术语表示,解释片段可以与新案例的事实相匹配。

无论如何,法律的重要事实模式可以与潜在的原因、价值观和原则相关联。这种联系是很重要的,因为,正如伯曼和哈夫纳所指出的那样,[98]Berman&Hafner,见前引[34]。事实所产生的有时相互竞争的价值观念是有关如何确定一个问题情景的法律争论的关键焦点,也是法理学努力的一个主要焦点,以证明法律类推作为一种解释现象是正当的。如何在场景分析中表示模式和价值的权重或重要性,以及如何解决竞争价值,已经证明是有争议的。虽然用数字表示权重有助于计算处理,但研究人员往往发现,针对法律从业人员和法官的解释和争论没法用数字处理权重。他们还认为,不能使用固定的层次结构对价值的权重进行建模,在这种情况下,就需要一些对背景敏感的方法来设置权重。最后,随着社会价值观的改变,权重会随着时间的推移而变化。例如,在互联网普及的相对较短的时期内,社会上不同代际群体之间对隐私的价值的评估就在不断变化。

B3课:用案例和价值进行推理是一种理论建构

Bench-Capon和Sartor在用实例和价值进行推理的模型中,将模型描述为“构建和使用理论的过程”。[99]Bench-Capon&Sartor,前引[35],第98页。这一重要见解源于McCarty,前引[24],第285页,“律师或法官在‘困难案件’中的任务是构建有争议的理论、制定所需法律结果的法律规则,然后说服相关受众,这种理论优于对手提供的任何理论”。在这种理论构建中,过去案例的结果揭示了在这些案例中出现的一组因素之间的偏好,而那些结果反过来又揭示了一组价值之间的偏好。这个理论具有解释力。一组价值之间的诱导偏好解释了一组因素之间的偏好,而这些解释了过去情况下的结果。该理论还可用于确定和解释新案例的结果。

这是一个优雅的理论模型,但并非没有问题。第一,人们可以归纳出不止一种理论,这样人们就必须根据其解释能力(即理论解释的案例数量)、一致性和简单性来评估相互竞争的理论。然而,后两个标准并没有被很好地理解。第二,从法理学的角度来看,法官过去在判决新问题时似乎没有或应该使用竞争价值中的偏好。从价值观的角度评估一个问题的建议结果本身就是一个道德决策。考虑到问题的具体事实,法官需要考虑如何应用这些数值。即使法官在以往的案件中使用价值偏好作为指导,人们也期望法官仍然需要将问题与案件进行详细比较,以确保在新情况下应用该偏好是适当的。对于这种比较,必须对事实进行更细致的表示。无论如何,从教学的角度来看,Bench-Capon和Sartor的模型让法学院的学生将重点放在一个具体案件所适用的法律理论上,去考察它是怎样与判例和价值相关的,以及隐含的价值在定义相关相似性方面的作用,如何用之以进行案件的类比和区分。更具普遍性的问题是,法律从业人员在讨论该如何判断问题时,应当怎样将价值和原则的因素纳入考量。

B4课:法律倡导者提出虚拟案例来检验法律规范

法律从业者考虑价值和原则的一个方法是提出假设。假设是一个虚构的场景,以测试用于确定案例的提出的规则的某些属性。读过、听过或看过美国最高法院口头辩论的学生见到过假设。令法律倡导者惊愕的是,法官以提出假设而闻名。当然,在苏格拉底式的课堂讨论中,学生可能会遇到老师提出的假设。然而,学生可能没有充分考虑在法律论证中提出假设的修辞要点:什么构成了有效的假设,假设具有什么力量,以及如何对这种论点作出反应?

“人工智能和法学”研究者在计算模拟假设推理方面取得了进展。[100]例如:Ashley,见前引⑤;Kevin D.Ashley,Teaching a Process Model of Legal Argument with Hypotheticals,17Artificial Intelligence&L.321(2009);Grabmair &Ashley,见前引[39]。对于法律专业的学生来说,这项工作有助于澄清对抗过程的性质,其中辩护律师试图说服法院如何裁决案件。辩护律师确实在试图说服法院,辩护律师提出的在判决正在审理中的案件的规则或测试是一个好的规则,既适用于当前案件,也适用于未来案件。一种观点认为,辩护律师主张,根据拟议规则决定案件对适用价值的影响优于不这样做或适用其他规则的效果。

因此,对抗性过程展开如下:倡导者提出一个规则或测试来决定在审案件,以支持他或她的客户。法官通过提出一个假设情况来挑战拟议的测试,其中测试结果是有争议的。倡导者通过辩称拟议测试下的结果是合理的,通过修改建议的测试以使结果合理或通过区分或类比假设来回应假设。[101]Ashley,Teaching a Process Model,见 前 引 [100],at 326-327;Grabmair&Ashley,见 前引 [39],at 164.

如果法官担心拟议的规则可能过于宽泛,他或她可以构建规则适用的假设,但是将规则应用于假设的效果对规则所依据的价值有害。辩护律师可以通过辩论:

该规则不适用于可区分的假设,或者

该规则适用,但对价值的影响不像法官建议的那么严重,或者

该规则适用并且不利于该价值,但是与该规则相关的另一价值被提升,或者

该规则适用并且不利于价值,并且该规则应当被改变,以便不再适用于假设。如果法官担心提议的规则可能太狭隘,则用补充论证方案。

通过研究假设推理模型及其在最高法院辩论中的应用,学生能够理解这一重要的法律和修辞策略。

C:关于法律论证的课程

C1课:主张者采用特定法律领域的论证方案

正如前面的课程所建议的,表征“人工智能与法律”研究的进展的一个方法是,持续地搜索以识别和模拟特定的法律领域的论证方案,包括从规则、案例和有价值的论证方案等各领域中展开搜索。论证方案对应于论证所认可的领域内进行推理的典型框架;它对应于一种相信论证结论的初步理由。[102]Henry Prakken,Artificial Intelligence and Law,Logic and Argument Schemes,in Arguing on the Toulmin Model 236(David Hitchcock&Bart Verheijeds.,2006).这些论证方案中的一些与这些年来已经开发出来的法律推理计算模型有关,另一些则是全新的;研究者正在开发从证据事实到规则驱动的法律判断的论证方案。[103]例如:Walker et al.,见前引[40]。

在法律写作课程中,学生已经熟悉了用书面摘要证明法律结论的建议格式或方案。例如,① 陈述你的结论;② 陈述支持结论的主要规则;③ 通过引用权威、描述权威如何代表规则、讨论附属规则、分析政策和反分析来证明和解释规则;④ 在辅助规则、支持权威、政策考虑和反分析的帮助下,将规则的要素应用于事实;⑤ 如果步骤①到④很复杂,那么通过重述你的结论来总结。[104]Richard K.Neumann,Legal Reasoning and Legal Writing:Structure,Strategy and Style 9394(6th ed.2009).在上述这些步骤中,至少有一部分可以被分解成附加方案。例如,人们可以想象将步骤④拆装成“人工智能与法律”研究者已经实施的附加论证模式来支持或反驳这样的断言:提出的规则应该通过类比被应用,以支持将规则的元素应用于事实的案例,或通过反对这种类比来应用。[105]例如:Grabmair&Ashley,见前引[39],at164-166.

表1 “家庭法”规则集和作为可废止规则的表示

C2课:人们可以通过攻击法律论证的假设或识别例外来攻击它

举例来说,一个解释法律规范应该如何应用于问题的论证方案,可以让法律专业的学生集中于质疑规则的假设或考虑例外。目前,在“人工智能与法律”研究中,用法律规范进行推理将被视为可废止的,并受制于用可废止的规则进行推理的论证方案。

使用Thomas Gordon的论点图解程序,“Carneades”[106]Gordon&Walton,见前引[38];Thomas F.Gordon,Analyzing Open Source License Compatibility Issues with Carneades,2011 Proc.of the Thirteenth Int'l Conf.on Artificial Intelligence&L.50,51;Thomas F.Gordon,Constructing Legal Arguments with Rules in the Legal Knowledge Interchange Format (LKIF),in Computable Models of the Law 162,168-169(Pompeu Casanovas,Giovanni Sartor,Núria Casellas&Rossella Rubino eds.,2008).可以在一个在由论证方案驱动的法定推理的例子中,说明通过论证的可辩驳的推理。例如,表1的左半部分显示了基于德国民法的、涉及家庭法的四条法律规范。规则s.1601-BGB声明,如果前者与后者“直接血统”,则person1有义务支持person2,这是规则s.1589-BGB中定义的概念。

由于经典逻辑系统无法成功地处理表1左边的规则,因此必须采用一种方案来论证可废止的规则。如果目标是确定哈利(Harry)是否有义务支持莎莉(Sally),并且人们知道Harry是Sally的祖先,那么一个经典的逻辑系统可以没有困难地从规则s.1601-BGB到规则s.1589-BGB反向链接,从Harry是Sally的祖先可以推断出Harry是Sally的“直系血统”,因此有义务去支持Sally。然而,假设一个人后来得知,有义务支持Sally会给Harry带来过度的困难,作为演绎推理,规则s.91-BSHG表示Harry支持Sally的义务被排除在外。这个系统将证明两个不一致的后果:Harry既有义务支持Sally,也没有义务支持Sally。伯曼和哈夫纳发现了这个问题。[107]Berman&Hafner,见前引[23]。经典逻辑演绎是单调的,一旦证明了一个命题,就不能仅仅因为学习新信息就收回它。这种证明一个命题及其反命题的能力意味着这个系统是不一致的并且可以证明任何事。

然而,正如伯曼和哈夫纳所解释的,[108]Id.在法律上,这种事情总是会发生的。如果研究者希望计算机能够以现实的方式从法律规范中得出推断,那么经典的逻辑推理就不能使用,必须使用别的东西。

在“人工智能与法律”领域,目前对“还有什么其他可为的”这个问题的回答是,具有适当论证方案的论证计算模型,用于实现可废止的推理。首先,根据规则s.91-BSHG,person1没有义务支持何时会导致人员“过度困难”;其次,规则s.1602-BGB规定如果person2不是“有需要”,则另有例外。

表1的右半部分显示了可废止的法律规范表示的不同之处。规则s.1601-BGB是可废止的,因为该法令包含支持义务的两个例外。首先,根据规则s.91-BSHG,当会给人带来“不适当的困难”时,person1没有义务提供支持;其次,规则s.1602-BGB规定了另一个例外:person2不需要支持。

因此,规则s.1601-BGB包含前提和结论,但结论只是假设(即可以证实)真实,表明即使前提为真,系统也可能掌握一些事实来推翻结论。这些可废止条件被表示为“关键性问题”,识别影响规则适用性的假设和例外:是否满足指定的基础假设,是否应用指定的例外,这条规则有效吗,适用排除规则吗,是否适用一些优先级较高的冲突规则?

关于如何表达这样的问题或者如何称呼不同类型的可废止性条件,学术界几乎没有一致意见,但是研究者普遍认为,这些可废止性条件需要被指定,因为如由论证方案指导的,程序将测试它们。

图1 具有可废止推理规则的“Carneades”论证图

像Thomas Gordon的“Carneades”这样的系统可以用可废止的推理规则进行推理,并构造论点。图1显示了“Carneades”可以生成的人工准备的论证图版本。[109]Gordon&Walton,见 前 引 [38];Gordon,Analyzing Open Source License Compatibility Issues,见 前 引 [106],at 54-55;Gordon,Constructing Legal Arguments,见前引[106],at179.声明节点是框,论证节点是圆(用“+”表示支持,用虚线表示论证适用性的例外)。如果指定Harry有义务支持Sally的目标,Carneades规则引擎会从该目标向后推理,以找到支持该目标的可废止的推理规则:规则s.1601和s.1589。当论证被构造和编辑时,它们在一个参数图或图表中被可视化。阴影声明节点表示该语句被(相关听众)假定为真。节点旁边的阴影上小圆圈表示该参数是可接受的(根据相关证明标准)。如果下面的圆圈被显示成阴影,则语句的补语可以接受。

图2 通过基于另一个规则的论点来阻止规则的可废止结论

如果指定了击败该论证的目标,则程序搜索与规则相关联的关键问题,以找到可应用的例外、排除或假设的失败,从而阻止该论证的假定结论。因此,当得知有义务支持Sally会给Harry带来不当的困难时,这个程序就会发现这样的排斥。规则s.91-BSHG应用并阻止了论证的结论,如图2所示。

假设有义务支持Sally会导致Harry不当的苦难不是既定的事实。相反,让我们假定,虽然“不当困难”不是由法律规范定义的,法院在涉及某些因素的案件中认定赞成或反对不当困难。

特别地,假设存在三种情况:

Mueller:P在{PF2}中赢得不适当的困难问题;

Schmidt:D赢得了{PF2,DF1}的不当困难问题;

Bauer:P赢得了{PF2,DF1,PF3}的不当困难问题。

最后,让我们假设:Harry和Sally从来没有亲子关系,PF2,并且Sally只需要短时间的支持,DF1。

图3 Schmidt方案的论点胜过Mueller方案,导致规则可废止

在这种情况下,“Carneades”可以根据基于案例的推论构建支持和反对Harry有义务支持的Sally的论点,如图3所示。[110]见前引[38]和前引[109]。与问题共享PF2的Mueller案例支持一个论点,即s.91-BSHG导致根据s.1601-BGB将义务排除在外。然而,Schmidt方案的情况更具有针对性(因为在Mueller和问题之间共享的一组因素是Schmidt和问题之间共享的那些因素的子集,即PF2和DF1),并且结果相反。按照HYPO[111]Ashley,见前引⑤,at 784.的术语,Schmidt方案胜过Mueller方案。

C3课:法律论证涉及逻辑、修辞、不确定性和叙述之间的复杂关系

虽然家庭法的例子很简单,法学院的学生可能仍然对“Carneades”将生成多种类型的法律论点并整合成易于解释的视觉格式的能力印象深刻。法律专业的学生可以看到比简单地演绎性地应用法律规范更复杂的论证结构。

这个论证也回避了一个问题,即律师如何将不确定性和修辞性的考虑因素纳入他们对法律论证的评估中。法律论证是一种处理不确定性的技术(例如在法律规划中),但不确定性也影响法律论证。这种不确定性包括关于以下方面的不确定性:证据和事实断言的合理性,法律对事实的规范性应用,对替代结果的道德评估以及接受论点的可能性。

然后问题出现了:是否以及如何将不确定性因素引入到论证图中。教学大纲中的一些文章处理了类“Carneades”模型中的不确定性。一种方法是在论证图中实现说服负担或证明负担,如“证据的优势”和“超越合理的怀疑”。例如,通过将证据确定性的定量度量同论证与结论联系起来,并强制批准的弧线联系起来,这些证明负担有助于普瑞特定量标准。[112]Gordon&Walton,见前引[38],at 137-138;Atkinson and Bench-Capon,见前引[37]。

此外,“Carneades”的论点模型还可以通过具有不确定性推理的能力(使用贝叶斯信念网络)来扩充;这种改变将允许发起者探索关于证据不确定性[113]Grabmair &Ashley,见前引[68]。的各种假设的后果。例如,他应该为事实或法律辩护吗?为了评估如何最好地改善他作出有利决定的机会,辩护人可以修改代表陪审团对各种证据事实的信仰的假设概率分布,或者修改代表陪审团对各种论据的合理性的信仰的权重。同样的工作探索了叙述在评估律师试图符合证据的故事中的证据不确定性的作用。不同的叙述适用于不同的法律主张。对于一个故事来说似乎可信的证据可能与另一个故事无关,或者与另一个故事相矛盾。虽然用于模拟法律论证的这些方面的计算技术还处于起步阶段,但是学生可以从思考潜在的现象中受益。

这就完成了如何利用“人工智能与法律”研讨班来教授学生一些有关法律的经典课程的讨论。这些材料还可以用于课程指导,以及辅助法律专业的学生准备从事数字时代的法律实践。

六、法律推理的计算模型与法律实践中数字技术的连接

学生需要了解影响法律领域的“信息革命”,以及信息革命如何影响他们法律就业的前景、法律就业的种类,以及他们在数字时代作为法律从业者的责任。一位研究法律实践的发展趋势及其对法学院课程影响的杰出学术观察家最近观察到:法学院课程因一场信息革命而变得更加复杂,这场革命正在改变当前工作和未来工作的组合。由于目前法律行业对过程和技术的重视,目前法学院盛行的实用技术技能教育和领域知识教育可能不足以满足大部分2015[114]William D.Henderson,A Blueprint for Change,40 Pepp.L.Rev.461,501(2013).学年毕业的学生的需要。而学生对于这样的情况毫无准备:法律正变得不那么与陪审团审判和法庭辩护相关,而是更多的与运算工程、预测编码以及这些过程所要求的协作和技术技能相关。[115]Id.at 505-506(emphasis added).

亨德森(Henderson)提到的技术主要是文档审查过程的自动化,以使得它能够使用机器学习技术(也称为预测编码)来处理现代诉讼中的大量电子文档。程序正在学习从现代诉讼中产生的巨大内存文件中选择电子文档,并依靠诉讼者将小组文档标记为与权利主张相关的文档,以及和辩护不相关的文档,根据它们的相关性将它们分组。

“预测编码本质上是机器学习在搜索相关信息时部分取代了人类。”[116]Id.at 487(emphasis added).这一发展是由电子发掘缓存的规模和多样性驱动的。

由于数字数据的大爆炸,我们的日常生活被编码成电子邮件、文本消息以及旨在取代电子邮件的内部知识管理平台和数字化语音邮件,使用传统的审查方法去审查平民或白领诉讼范围变得昂贵得令人望而却步。[117]Id.

强调“过程”对于面对合法就业市场的学生来说尤为重要。Henderson复述理查德·苏斯金德(Richard Susskind)的《律师的终结》时说道。[118]Richard Susskind,The End of Lawyers?6(2010).

通过识别以法律形式的递归模式和司法意见,使得(从定制的法律工作到标准化、系统化、打包,以及最终商品化)这些改变成为可能,使得流程和技术的使用能够实现常规化,并为各种法律需求提供非常便宜和高质量的解决方案。[119]Henderson,见前引[114],at479(emphasis added).

通常由美国法学院初级毕业生从事的劳动密集型工作,……现在由印度法律专业的毕业生[为法律程序外包商(LPOs)工作]来完成,他们正在学习如何设计和操作从大量数字文本中提取有用信息的过程。印度法学院的毕业生不仅得到了就业机会,而且正在学习有价值的技能,而这些技能完全不需要从美国法学院的学习中掌握。[120]Id.at487(emphasis added).

为了更好地提供有关电子发掘和其他法律信息管理过程的产品和服务,律师、律师事务所、法官和监管机构越来越依赖于对机器学习、数据挖掘、自然语言处理和信息检索技术的评估、购买与验证。为了便于参考,这些技术将统称为“数字文献技术”。虽然受到电子发掘的压力的驱动,但数字文档技术并不仅仅用于诉讼,它们在公司业务和法律实践的所有领域都很重要,涉及开发管理公司文件的过程,例如税收、合并和收购以及合规性等等。

如下所述,“人工智能与法律”研讨班通过向法学院学生介绍信息处理、算法和运算工程来帮助他们理解数字文档技术。实际上,在研讨班常常是他们第一次系统地接触这些概念。然而,从一开始就应该明确的是,教学大纲第1部分、第2部分和第3部分所讨论的法律推理计算模型与当前数字文献技术的核心不同。数字文献技术扎根于全文法律信息检索、计算语言学(如浅文本解析和命名实体识别)以及统计自然语言处理、机器学习和数据挖掘。这些技术的起源各不相同,以下将分述之,最后将讨论把它们相互交织在一起的综合运用。

这里相关的一点是,简单地说,大多数课程大纲中的“人工智能与法律”工作,是用来教授学生有关法律规范、案例和论点的课程,却不涉及与数字文档技术相同的任务和过程。的确,数字文档技术与学生处理法律知识的方式之间存在着鲜明的对比,即机器学习、数据挖掘、自然语言处理和信息检索模型的效率与“人工智能与法律”模型表达之间的对比。例如,法律信息检索需要处理大量的文档和自然语言查询,这让Westlaw和Lexis非常有效,然而这些程序并不深入地处理文本;Westlaw和Lexis甚至无法分辨一个案件或议题中谁是获胜方,更不用说如何在一个法律问题的论证中使用文本了。此外,与短语相反,这些程序不能过滤具有/不具有指定特征的文档。

尽管有这些技术差异,“人工智能与法律”研讨班可以通过教授学生以下工具来帮助他们理解数字文献技术:① 在计算模型、算法、相关性度量和实验评估等方面的技术的概念词汇的描述;② 对技术中隐含的任务要求、计算模型和算法的高级描述;③ 这些技术的性能通过实验测量的方式、程度以及这些测量的意义;④技术中隐含的计算模型能够捕获什么和模型会遗漏什么的一些示例;⑤技术嵌入的法律过程,包括硬件、软件、人类技术人员和人类法律从业人员。

总之,参加“人工智能与法律”研讨班为法学院学生提供了“计算”思考法律实践过程和法律信息处理的经验。虽然今天的学生是随着互联网成长起来的,并且非常熟悉万维网的界面,但是他们可能并没有在法律实践中系统地思考信息处理问题。这些学生很可能在编程方面没有什么背景,并且既没有考虑开发算法来实现规范,也没有考虑使用连续的细化来为每个步骤开发子算法。然而,到研讨班结束时,这些学生将完成两项工作,一是使用法律推理算法,二是使用电子发掘的算法。

对于不熟悉全文法律信息检索如何工作的学生来说,这是一个明智的进步。诸如用于全文检索、从大型数据集进行机器学习、数据挖掘或自然语言处理的贝叶斯信念网络之类的技术是复杂的,并且可能抛弃法律直觉。这将有助于学生获得介绍的计算性思维的算法,在法学院的第一年结束时,学生就已经对该算法的模型推理过程很熟悉了。

从另一方面来说,这种进展也是有意义的。如下所述,法律推理的计算模型最终将引导改善数字文档技术的智能行为。至少一些参加“人工智能与法律”研讨班的学生可以很好地自己设计这些技术,或者支持其他人设计它们。

即使法律专业的学生只是数字文档技术的消费者或用户,而不是设计者或改进者,对于非编程专业的法律学生来说,学习这些工具如何工作也是很有价值的。企业和政府客户将很快需要电子发掘工具,这些工具不仅被允许,而且要求专业护理标准。接受这些工具进入职业的过程已经并将继续由律师——以前的法学学生——去选择工具,使用它们,指导其他人如何使用它们,解释它们的输出,并通过解释它们如何工作以及它们如何可靠和有效地来向其他人(如法官)证明它们的使用是正当的。“人工智能与法律”研讨班通过教给未来的律师一些有关法律数字文档技术的宝贵经验来为这些任务做准备。

七、关于法律数字文档技术的课程

本部分重点介绍一些关于数字文档技术的课程,学生可以从“人工智能与法律”研讨班上学到这些课程。

D1课:法律数字文档技术是基于运算模型和算法的

如上所述,从定制化法律服务向商品化法律服务的转变意味着学生可以从理解“涉及法律知识的过程”的概念中受益。

“人工智能与法律”研讨班通过实例向法学院学生介绍这种过程的概念。教学大纲中所讨论的所有计算模型都集中在处理法律知识上。“人工智能与法律”推理模型以及数字文档技术模型也是如此。

许多“人工智能与法律”模型是一些过程的成熟的表示,这些过程涉及法律知识及其算法实现的过程或部分过程。例如,当需要时,CABARET程序应用议程机制在基于规则和实例的推理之间切换控制。[121]Rissland&Skalak,见前引[33],at 853.学生可以检查过程的输出,以将CABARET的控制机制与人类问题解决者的控制机制进行比较,可能人类问题解决者切换得更少,并且更关注于识别问题和解决问题。IBP+SMILE程序利用过去的案例重新实现了预测法律结果的过程。IBP组件将问题分解为若干个小问题,对于每个小问题,基于由与该小问题相关的因素索引的案例,提出关于谁应该获胜的假设。然后,程序测试了反例假设,即不能解释清楚。[122]Ashley&Brüninghaus,Computer Models,见前引[30],at347.SMILE组件使用机器学习来学习如何识别案例的文本描述中的因素。在组合程序中,一个算法使用SMILE将问题输入作为文本处理,并向IBP输出可用因素的列表,然后IBP预测结果。[123]Ashley&Brüninghaus,Automatically Classifying Case Texts,见前引[58],at 139-140.

其他教学大纲研究论文提供了涉及机器学习和自动从文本中提取信息的过程的良好实例,包括法定文本、[124]Francesconi&Passerini,见前引[59];de Maatetal.,见前引[59]。案例文本、[125]Jackson et al.,见前引[52]。文本以及审前发现所涉及的文本。[126]Privaultetal.,见前引[65]。弗朗西斯科利(Francesconi)和同事们的工作说明了自下而上和自上而下的处理的良好结合,让人工的注释器集中在统计有趣的特征上,这些特征可能值得被包含于本体论中。[127]Francesconi et al.,见前引④。

用于审前电子发掘的现有数字文档技术[128]Hoganetal.,见前引[64],at434-435.实现用于识别与诉讼相关的文档的迭代过程。作者集中于高级诉讼人的“感悟”:收集、组织和创建复杂信息集合(即电子文档)表示的过程,所有过程都集中在他们需要理解(即它们如何与诉讼相关)的一些问题上。[129]Robert Bauer,Teresa Jade,Bruce Hedin&Christopher Hogan,Automated Legal Sensemaking:The Centrality of Relevance and Intentionality,2008Proc.of the Second Int'l Workshopon Supporting Search&Sensemaking for Electronically Stored Info.in Discovery Session 2,Paper No.5,2,available athttp://eprints.ucl.ac.uk/9131/1/9131.pdf.目标是梳理诉讼当事人的相关性假设:如果在文件中找到,或多或少抽象的主题描述将使该文件与法律诉讼相关。[130]Hoganetal.,见前引[64],at446-448,455.本文描述了一个迭代的用户建模过程以引出这些相关假设。这是一个以计算机为中介的连续细化过程,其中诉讼人传达所需的信息、检索样本文件,并且诉讼人确认他们是否有回应。如果他们没有回应,诉讼律师会改进这一假设。这个过程产生了诉讼律师的目标模型,与案件相关的法律和其他概念及其特殊程度,以及表达概念的各种方式。实际上,这些信息使诉讼律师的假设可操作,然后用于检索与该假设相关的更多文件。随着机器学习开发出感兴趣概念的概率模型,工具可以帮助诉讼人员可视化新文档与相关文档的概念集群的关系。[131]Privaultetal.,见前引[65]。

多年来,在为匹兹堡大学法学院“人工智能与法律”研讨班撰写论文时,学生已经发展了自己对涉及法律知识的过程的表示。一些代表性的标题包括“人工智能在先锋艺术搜索中的应用:专利文献搜索行业的概述和预测”“基因专利申请过程的人工智能改进”“为了断言的真相:利用人工智能协助陪审团在审判中连贯地重建事实”“通过规范违反无效规则来调整‘人工智能与法律’模型以预测诉讼结果”。

D2课:法律数字文档技术以不同类型的文本作为输入

数字文档技术的基础过程包括文本作为输入。“人工智能与法律”研讨班的学生因此可以了解计算处理文本的挑战。

大纲中所引用的大多数法律推理计算模型都不接受文本作为输入。取而代之的是,人类读取问题场景或要存储在程序知识库中的案例的文本,提取程序所要求的信息,并以适当的格式手动表示问题或案例。因此,在某种意义上,输入是人工处理的文本。主要的例外是上面描述的IBP+SMILE程序。

在数字文献技术的过程和领域中存在太多的文档,无法手工处理每个文档。像Lexis和Westlaw这样的合法IR供应商每天获取数千个案例。案件文本由法院以电子方式提交,并自动在倒排索引中编索引,其中给定文档由每个“主”字编索引(即使用从“索引”项中过滤出来的“the”“a”“an”等字)。因此,合法IR程序根据查询搜索数百万个文档,“人工智能与法律”模型最多搜索数百个(但是一些模型,如SPIRE,[132]Daniels&Rissland,见前引[53]。可以连接到全文合法IR源,从而扩展了它们的搜索)。

这个模型还处理非常不同的文本。一些法律文本处理研究涉及更结构化的文本,这些文本在法律管理过程中的功能是已知的(例如法定文本或法院判决的文本)。相比之下,在电子发掘环境中,文本是在诉讼中产生的极其异构的文档。它们不仅包括公司备忘录和协议,还包括所有基于互联网的通信,也包括电子邮件。电子邮件可以是来自经理和雇员之间的,或者来自雇员到其他雇员、客户和供应商,或者来自雇员的家人和朋友等等。事实上,对于电子邮件,对谁在什么时间段与谁进行通信的社交网络分析可以提供有价值的信息,用于选择相关文本以进一步分析。[133]Henseler,见前引[63]。

D3课:数字文档技术能够发现与法律问题相关的文本

数字文献技术往往侧重于寻找与法律问题相关的信息的过程。这个过程会影响一个系统评估相关性的方式、评估系统的方式以及评估系统性能的措施。法律专业的学生会发现,IR的相关性、评估和措施在电子发掘的教学大纲材料中有简明的定义。

相关性:在IR任务中,一个正确返回的文档(广义上被理解为任何信息容器),如果用户希望看到它就被认为是相关的,否则就不相关了。

评价:相关性是一个观点(而不是一个客观确定的事实)的一个重要结果是检索效率成为评价的主要焦点。绝大多数IR评估主要关注相关性的一个方面:话题性。研究者最广泛使用的话题相关性定义是文献中任何部分对所希望的主题的实质性处理。

度量:通过检索每个主题具有积极评估的文档的能力来度量检索方法的有效性。假设二元评估(即相关与非相关),两种有效性的措施是非常常见的报告。回溯是系统检索到的现有相关文档的比例,而精确度是检索到的实际相关文档的比例。它们一起反映了以用户为中心的观点,即假阳性和假阴性[134]Oard et al.,见前引[61],at 360,362,363.之间的基本折中。

法律语境中的话题是一个动态的目标。尽管Westlaw的密钥编号系统提供了跨越不同法律领域的主题的丰富主题列表,但律师通常寻求更详细的主题。律师试图捕捉与他们正在研究的问题情形(即源案件)相关的目标案件中的事实模式。在电子发掘中,不存在这样的列表。相关主题主要是为诉讼人所知的抽象描述;实际上,如上所述,数字文档技术的提供者需要基于诉讼人对文档相关性的确定,开发特殊的过程以来归纳主题。

教学大纲为法学院学生提供了一个可读的说明,说明像Westlaw和Lexis这样的全文法律信息检索系统如何根据文档和语料库中术语的使用频率来建模用户认为重要的主题(即用户的信息需求)。此外,这些资料还解释了信息检索系统如何评估文档与用户信息需求的相关性,在召回通常是次要重要的环境中实现高精度。[135]Turtle,见前引[49],at7-9.该系统在法律研究中工作良好,很少需要对每个相关案例进行详尽搜索,许多好的案例足以发展对这个问题的理解,并形成关于如何决定的论点。[136]Oardetal.,见前引[61],at353.

然而,在电子发掘中,检索“任何和所有”与主题相关的文档是典型的目标。[137]Id.at351.也就是说,召回是有额外费用的。这个事实之所以不幸,有两个原因。首先,研究表明,律师往往高估了他们的召回率。[138]Blair&Maron,见前引[51],at 293-294.这项(开创性)研究确定了律师的看法之间存在差距,即使用他们的具体询问,他们会检索到大约75%的相关证据,这些证据是在收集40000份诉讼用途的文件中找到的,研究人员能够证明,事实上只发现了约20%的相关文件。[139]Oardetal.,见前引[61],at348-349.其次,“现在很清楚,随着数据集越来越大,高精度搜索通常变得稍微容易一些了,但是不确定性倍增使得越来越难以成功进行特定或详尽的搜索”。[140]Id.at349(citationomitted).

上述因素给法律从业者带来的后果是,法律从业者需要负责理解、选择、解释和证明电子发掘过程和工具,鉴于供应商的替代产品和相互冲突的主张以及缺乏客观评价,这是一项艰巨的任务。

D4课:数字文档技术及其运算模型需要经验方法来测试

对于那些日益面临处理法律信息过程模型的需求的学生,无论是作为消费者还是设计师,“人工智能与法律”研讨班教导一种检验过程模型的经验方法。“人工智能与法律”的发展历史已经通过经验或思想实验来检验模型,重点放在模型崩溃的例子上,然后对其进行调整。这段历史包括发明用于评估模型的实验技术。[141]例如:Branting,见前引[26];Ashley&Brüninghaus,Computer Models,见前引[30];Mc Laren,见前引[36]。从Berman和Hafner第一次呼吁表示基于案例推理的目的论基础,[142]Berman &Hafner,见前引[34]。到CATO的因子层次,[143]Aleven,见前引[29],at 191-193.到IBP中的假设检验,[144]Ashley&Brüninghaus,Computer Models,见前引[30]。到理论归纳,[145]Bench-Capon &Sartor,见前引[35]。到论证方案,[146]Gordon&Walton,见前引[38];Atkinson&Bench-Capon,见前引[37]。到论证方案的工作进展价值判断模型,[147]Grabmair &Ashley,见前引[39]。是示例驱动的法律信息处理模型的增量式持续改进的实例。另一个例子是假设推理模型中的迭代细化。[148]见前引[100]。

教学大纲提供了客观评价电子发掘IR工具的挑战和方法的处理。[149]Oardetal.,见前引[61]。它向学生介绍了TREC法律轨道,来自学术界和工业界的团队每年与其竞争并评估应用于公开数据集的最有效的电子发掘IR工具。公开的数据集包括Tobacco诉讼和Enron丑闻中的电子邮件和其他文件的集合。TREC竞赛的要求,即电子文档数量的增加和系统有效性的三个方面对现实发现进行比较的需求,使得TREC组织者将布莱尔(Blair)和马龙(Maron)研究[150]Blair&Maron,见前引[51]。的实验技术扩展为使用许多法律的大规模评估。学生、律师助理和律师作为志愿相关性评估员。[151]Oardetal.,见前引[61],at367.

作为这项技术的潜在消费者,法律专业的学生应该了解到,电子发掘任务并非一成不变的。虽然TREC的竞争有三个方面,但都集中在“响应性审查:一方……被服务……要求出示文件和……必须找到并生产……对请求作出响应的任何和所有文件”。[152]Id.at 370.重点关注的三个具体方面是:① 交互式任务,即检索所有且仅与主体机构对相关内容的定义一致的文档;[153]Id.② 特设任务,即单遍、首遍自动搜索;[154]Id.at373.③ 相关反馈任务,即基于对第一遍结果的人类反馈的第二遍搜索。[155]Id.at375.

正如奥德(Oard)的文章所阐明的,用于评估这三个任务的技术不同,并且还有其他任务尚未发明评估技术。[156]Id.at370.“在诉讼初期,律师可以对文件集进行探索性检索,以检验假设并建立案件理论。此外,律师可以搜索与特定个人活动有关的文件,以便为证人的证言做准备;作为审判方法,律师可以搜索一组通常相关的文件,以便找到他或她想作为审判中的展品进入的小子集;等等。”

有了对IR相关性、评估和措施的概念性理解,并将其应用于电子发掘,以及用于测试关于过程模型的声明的实证和基于实例的方法,学生可以做好充足地准备,有能力以批判性地质疑供应商关于电子发掘工具的声明,以便在他们自己的电子发掘过程中有效地使用工具,并向客户和法官证明这些工具的效果。

D5课:发现与法律问题相关的文本与应用相关文本解决法律问题不同

在学习了一些数字文献技术,以及一些法律推理的计算模型之后,学生将能够很好地考虑如何将这两种方法结合起来。

为什么这种整合是值得的?如果法律服务市场的历史确实已经从定制、标准化、系统化和包装发展到商品化,那么接下来人们会有什么新需求?尽管生产效率很高,但商品化的法律工作不再是解决客户特定问题的定制工作。虽然雇用人事律师来调整商品化产品以解决客户的问题可能太昂贵,但是计算技术仍然可以有效地执行这种“后商品化”定制。

如上所述,数字文献技术往往侧重于寻找与法律问题有关的信息的过程。相比之下,法律推理的计算模型往往侧重于应用相关信息解决法律问题的过程。因此,这两种方法具有互补的优点和缺点。

信息检索中的相关性度量(即文档实质上处理所需主题的统计概率)非常有效,不需要特殊的文档表示,文档是倒排索引中的文本。一方面,只有人可以使用这样检索到的文档来解决法律问题,例如通过将文档中包含的信息合并到法律论证中;另一方面,法律推理的计算模型采用相关度量,并且可以使用检索到的信息来通过生成论点以解决法律问题。然而,一个缺点是,这些相关性度量只有在案例的维度、因素、关键事实等方面被特别表示时才能起作用。而且,除了像SPIRE[157]Daniels &Rissland,见前引[53]。或SMILE+IBP[158]Ashley&Brüninghaus,Automatically Classifying CaseTexts,见前引[58]。这样的工作之外,程序不能自动填充特殊表示。

然而,人们开始看到正在弥合数字文档技术和法律推理计算模型之间的鸿沟的程序。

D6课:法律推理的计算模型是法律文本和法律问题解决之间的桥梁

人工智能与法律中的一些现有和当前的工作使用法律推理的计算模型和论证作为法律文本与人类寻求的答案和论证之间的桥梁。

例如,SPIRE计划演示了如何使用破产法问题的基于因子的计算模型(如破产计划是否真诚地提交)将查询引入全文法律信息检索系统。该程序使用Hypo风格的计算模型来寻找解决法律问题的最相关案例,并使用这些案例来查询。实际上,指示全文IR系统检索更相似的文本。[159]Id.at131132.160de Maat et al.,见前引[59]。在实验中,SPIRE发现新的相关案例与输入的问题非常相似(例如涉及相同法律故事)。SPIRE用户还可以指示感兴趣的特定特征,并且程序将自动突出显示检索到的案例中与该特征对应的文本部分。

其他示例包括应用模式匹配[160]de Maat et al.,前引[59]。和机器学习技术广泛监管(例如,作为定义、责任、禁止、义务、许可或处罚)功能来分类法定条文。这些技术然后可用于提取与每个功能相关联的典型特征。[161]Francesconi et al.,见前引[48]。例如,规定“打算处理属于本法适用范围的个人数据的控制器必须通知担保人”被归类为“义务”,其相关特征为:(责任的)负担者=“控制器”,动作=“通知”,对方=“担保人”,客体=“处理个人数据”。这项工作旨在从立法文本中直接提取法律规范,以学习法律规范的分类和特征。最终,程序可以用如此提取的形式化规则进行推理。迄今为止,尚未有报道的工作成功地从法律文本中为此目的提取法律规范。然而,在此期间,提取的信息可以被映射到全面的概念索引(例如法律词典、字典或本体)中,并用于支持针对与特定业务遵从性问题相关的所有法律规范的更加集中的概念查询。

其他工作包括注释法律决策文本,使其与基于规则的推理树相连,这样程序就能够学习对以前看不见的文本进行推理。例如,努力将IBM Watson问题回答项目[162]Ferrucci et al.,见前引[66],at67.中使用的NLP技术与可废止的逻辑模型集成,该逻辑模型将法定和规章要求表示为与法律决策中的推理链相关联的规则条件树,这些规则条件将证据输入与事实的结论联系起来。[163]Ashley&Walker,见前引[67]。因此,一个感兴趣的命题(例如,一个法定条款已经得到满足)被分解成一个推理树,该推理树由法律命题和相关的事实断言组成,这些事实断言的表达可以在法律决定的自然语言文本中注释。这种使用增加了法律概念的力度,使它们可以与关于事实的常识推理紧密联系起来,并用于促进更有效的搜索、提取和报告。例如,尽管高层次的法律概念(如“有权获得补偿”)会带来模糊的检索任务,但是分解这些概念的低层概念(如“医疗条件”或“发病时间”)将更适合于自动搜索和推理新文本。

给定足够数量的带注释的决策,可以应用机器学习和自然语言处理,以便程序可以学习识别尚未看到的新文本中的带注释的模式,就像IBM的Watson程序在问题回答环境中所做的那样。如上所述,在至少一所法学院的实验室里,法学院的学生都参与在法律判决中注释法定论证和证据论证的过程。[164]Law,Logic&Technology Research Laboratory,见前引[16]。通过这样做,这些学生正在学习一种全面的法律推理模式,并遇到上面所列举的所有课程——关于法律规范、案例、论证、数字文档技术,以及连接它们的运算工程。

除了数字文档技术之外,“人工智能与法律”过程模型也在各个领域得到发展。INDiGO项目和由州长[165]Governatori&Shek,见前引[70];Theunisz,见前引[72]。进行的工作基于对管理、管理和业务流程的细致描述,以及仔细考虑如何将人工智能专家系统集成到这些流程中以帮助人类。例如,在INDiGO项目中,所关注的过程不仅包括应用规则,还包括根据经验改进它们。一个专家系统协助荷兰的移民代理人根据大量的管理规定处理客户。同时,系统收集和反馈根据条例产生的问题的数据,以传递给监管者和规则建模者,使其了解需要改进的规则的方面。以后法律过程的工程化可望进一步发展,如果法学院的学子能对其潜力多加了解,将会为自己带来更多的机会。

八、结 论

本文介绍了一个“人工智能与法律”研讨班的样本教学大纲,该研讨班能够在数字时代讲授法律和法律实践。经过讨论,得出了教材中隐含的四组教学课程。“人工智能与法律”研讨班不仅教学生有关法律规范、案例和论点的宝贵教学课程,而且介绍给他们处理数字时代法律实践的模型和算法。在这方面,研讨班对学生的教育作出了及时的贡献,并解决了当前法学院在法律职业不确定时期面临的紧迫性问题。

法律推理的“人工智能与法律”模型和文本处理为在现实世界的应用增加了价值,包括电子发掘、可视化法律论据、预测结果、作出解决决策和法律专家系统。法律专业的学生可以作为知情的用户以及新模型的注释者、设计师和发明者对这项技术作出贡献。通过研讨班的学习,法学院的学生就能熟练地将这些技术应用到具体的实际环境中。比如,下一学期的“人工智能与法律”实践课程可以作为一种实验室课程。[166]见上文第四部分。学生可以使用上述工具建立自己的法律专家系统,或者探索如何扩展这些工具以适应法律推理的缺失特征。这些缺失特征包括案例推理和处理不确定性;[167]见前引[11]3和随附文本(略)。尝试将预测编码应用于公开可用的电子发掘数据集;[168]见前引[149]和随附文本(略)。作为自愿的相关性评估者参与Trec Legal Track,[169]Id.以及根据法律论证的计算模型,参与绘制论证图和注释法律文件,以便应用机器学习工具。[170]见前引[163]和随附文本(略)。随着“人工智能与法律”研究者开始致力于应对法律规划建模和创造性解决法律问题的挑战,一部分学生甚至可能贡献新的计算模型和新的知识表示方法。

猜你喜欢
文档规则案例
浅谈Matlab与Word文档的应用接口
撑竿跳规则的制定
有人一声不吭向你扔了个文档
数独的规则和演变
案例4 奔跑吧,少年!
随机变量分布及统计案例拔高卷
让规则不规则
发生在你我身边的那些治超案例
TPP反腐败规则对我国的启示
基于RI码计算的Word复制文档鉴别