大数据如何破解腐败密码

2018-01-17 20:57
方圆 2017年24期
关键词:腐败公民政府

美国最高法院大法官刘易斯·布兰迪斯曾写到:“阳光是最好的防腐剂。”在全球共同推动下,大数据所释放出的威力如火如荼。

美国最高法院大法官刘易斯·布兰迪斯曾写到:“阳光是最好的防腐剂。”在全球共同推动下,大数据所释放出的威力如火如荼。通过向公众提供信息和利用大数据分析,国家可更好地监督公職人员和企业。

我们来关注发生在巴西的故事,数据的公开引发了国营石油巨头巴西石油公司逃税和回扣方案的丑闻,并使得迪尔玛·罗塞夫总统下台。在席卷巴西全国的大规模抗议和反诉中,很容易忽略导致罗塞夫总统在 2016 年 8 月 31 日被弹劾所涉及的严格的技术司法案件。

实际上,罗塞夫被指控挪用了政府预算——大多数人认为她通过在会计账目上弄虚作假来掩盖公共财政的真实状态。非营利组织“开立账户”率先发现了这些违规行为,该组织审查了依据巴西信息公开法律公布于两个主要政府透明门户网站联邦预算网和透明门户网上的预算数据和文件。“开立账户”将这些违规行为透露给了巴西联邦审计法院。联邦审计法院展开了调查,政治程序紧随其后。看似矛盾,但恰恰是政府对透明度的强制要求为揭露政府策划的骗局铺平了道路。

罗塞夫弹劾案展现了如何使用开放数据对领导人问责。这个故事展示“大”而“开放”的数据如何通过快节奏、证据驱动和众包的行动来推动反腐斗争。开放数据可将大量的信息提供给无数的监督人和揭发者。大数据可以将这些信息转化为洞察,使腐败更易于识别、追踪和预测。为了兑现这场运动的所有潜能,技术专家、活动家、官员和公民都必须加倍努力,将数据分析融入政策制定和政府机构中。

数据分析的多面性

公开大数据本身并不能推动反腐工作。2014 年白宫发布的大数据和个人隐私报告强调:“我们可以对大数据集全部或有选择性地存储和检索,但是如果不做分析,我们得到的结果和输入的东西是完全一样的。”此背景下,有必要区分数据分析的四个主要阶段来体现其在全球反腐行动中的潜力:在分析复杂的政治问题时,“描述性分析”使用数据来描述已发生的事情;“诊断性分析”更进一步,通过挖掘交叉验证数据来解释某一具体政策问题出现的原因,找到根本原因,并解读潜在的结构化趋势;“预测性分析”通过机器学习,使用数据和算法来预测接下来极有可能发生的事情;“规范性分析”则提出应该采取怎样的行动来促使或阻止某件事的发生。

数据分析在反腐领域内的几项应用都有着不错的前景。众包,特别是通过移动应用程序,可以为公民提供有效的工具去发现各种腐败迹象。移动技术让公民能够更便捷地获取公开信息,为他们提供对公共服务进行投诉或谴责不当行为的渠道。比如,在印度,一项名为“我行贿了”的应用程序让公民举报官员的受贿和欺诈行为来打击腐败。同样,哥伦比亚总统的政务透明度秘书处研发了一款应用程序,可以让公民举报未完成的或花费过高的公共工程。据《时代报》报道,到2015年底,总共发现了83项这样的公共工程,总价值高达5亿美元,并促使执法部门启动了刑事诉讼。然而,这两款应用程序都未实现公民和官员之间的双向互动,也不开放匿名的原始数据供公民自行分析,或许这是出于隐私的考虑。

推动数据驱动型反腐的三种方法

世界各地的新闻证实了数据能为促进反腐行动带来极大的机会。但是,如果没有进一步支持,这一前景将无法完全实现。具体而言,可以通过三种方法来实现数据在全球反腐行动中的最大潜能,即便是在贪腐长期存在且数据搜集和分析能力普遍偏弱的发展中国家。

第一,提高数据的质量和覆盖范围。只有当输入的数据可靠且来源广泛时,先进的分析工具才能提供有用的见解。关于数据方案的公共讨论倾向于强调传播(开放数据)和使用(大数据),却忽略了数据的产生。如在决策时更重视数据,就应该从一开始就在意数据的质量。政府应能够生成、收集和传播高质量的官方统计数据,并维护可及时生成可靠数据的有效管理登记系统。

在覆盖范围方面,数据的可用性和整体经济水平有着密切的关系。大多数发展中国家的整体情况和发达国家形成了鲜明的对比:电子政务不够发达,互联网普及率和数字化能力较低,某些地区的电网不可靠甚至根本就不存在。因此,这些国家产生的数据较少,也未能广泛传播,这有可能导致不平等现象长期存在和造成社会排斥的风险。首先,基于数据的决策可能偏向于有数据可用的区域,而忽略没有数据的区域。其次,基于数据的问责机制可能会缺乏效力。无法上网的公民不能查阅在线发布的采购合同或学校绩效排名,也无法做出决定。以上风险提醒我们,需要继续努力扩大宽带覆盖范围,向公民提供基础的计算机和互联网技能培训,提升他们使用透明度高的门户网站等政府监督工具的能力。

提升数据的覆盖范围和公开性,特别是用于反腐,可能会在发展中国家遇到较大的政治阻力,特别是在那些公共机构能力有限及政府机构自主性受限的国家。在权势阶层眼中,即使是像普查数据这类基础信息的传播都可能会影响到他们的利益。

例如圭亚那禁止在 2015 年的总统大选前公布 2012 年的人口普查数据(显示了重大的人口变化),起因就是担心公布该数据会带来的政治影响。而在反腐行动中更敏感的信息,比如收入和财产申报以及公共部门合同的细节,自然会面临更大的阻力。考虑到权势阶层认为发布数据可能带来的风险,以及支持开放数据的政治势力的相对实力,开放数据和大数据的影响或许在最需要这些数据的地方仍然会非常有限。

第二,培养政府的数据分析能力。为了发挥大数据和开放数据在反腐方面的潜力,政府必须建设自身能力,以产生有用的洞见并将其融入政策制定和实施过程中。政府自身的技术能力对反腐的可持续性非常重要。虽然将某些具体任务外包给企业或许是有效的解决方案,但算法和软件通常具有专有性,这意味着一旦这些企业离开(或将价格提升到无法接受的高度),政府就无法升级、修改或扩展方案。与此同时,政府在吸引和保留数据分析师方面也遇到了困难,因为他们即便是在私营部门也是稀缺资源。考虑到人才的普遍缺乏,拥有专业技术的数据人才通常会同给出最好待遇的雇主签约,而政府很少能提供这样的待遇。在丹麦和英国,它们专注于通过孵化创新方案和利用数据来完善政策。在北美和拉丁美洲,智利、哥伦比亚、墨西哥等国家建立了这样的实验室。对于调查组织和检察机构,它们的数据分析能力还存在重大差距,大数据可在此方面提供很大的帮助,特别是反腐机构应通过建立反腐实验室来提高其分析能力。

第三,使数据分析更加透明,并扩大其作用范围。任何需要高度专业技能的工具都面临只有少数人掌握的风险,大数据也不例外。此外,大数据运动的反腐行动若要有可信度,就必须更积极主动地应对企业部门的风险。数字平台“开放企业”正在通过汇集政府和企业公开的数据,打造一个开放数据库,其内容包括全球所有注册公司的全部实益拥有人(不一定具名出现在公司所有权证上,却分享公司收益的实际所有人)。该数据库涵盖来自 115 个司法管辖区的 1.1 亿多家企业的信息。

虽然大数据运动在反腐方面有着很大的潜力,但仍然存在诸多挑战。开放数据和大数据的灵活使用不仅要侧重于揭露腐败,还应更好地了解其深层次的原因,避免再次发生腐败。反腐分析不能虚幻地存在,必须以高质量信息为基础,通过改革来匹配战略制度框架。即便是最复杂的技术和数据创新都无法阻止法国小说家泰奥菲尔·戈蒂耶所说的“腐败具有让人费解的吸引力,即便是对最诚实的灵魂而言”。除非将数据分析用于改善国家治理和公共制度,否则它就不能产生其应有的影响力,或者长期持续这样的影响力。(本文节选自《斯坦福社会创新评论》中《大数据破解腐败》一文)endprint

猜你喜欢
腐败公民政府
论公民美育
“群体失语”需要警惕——“为官不言”也是腐败
知法犯法的政府副秘书长
隐私保护也是公民一种“获得感”
腐败,往往由细微处开始……
依靠政府,我们才能有所作为
国外警察腐败控制与启示
十二公民
政府手里有三种工具
公民选举权的平等保护