大数据视角下的贫困户精准退出识别机制研究
——来自织金县五星村的案例*

2018-01-30 10:02杨丽莎张佳伊伍国勇

生态经济评论 2018年2期

杨丽莎张佳伊伍国勇

内容提要: 精准扶贫进入关键时期,必须对于贫困户进行精准进入与退出识别。但实践中存在不同层面的进入与退出识别问题,导致“数字脱贫”“假贫困”“假脱贫”“政策偏离”等不同问题。本文引入大数据思维,重点就贫困户精准退出识别有关信息采集要点相结合,根据需求设计了贫困退出的系统化数字化识别机制,以找出农户是否真正贫困、是否真正脱贫,提高精准识别效率。

关键字:大数据; 贫困户; 精准识别

一重要意义:退出识别比进入识别更关键

2013年,习近平总书记首次提出了精准扶贫的概念,把“精准”引入扶贫的工作中。当前,精准扶贫、精准脱贫已进入攻坚关键期,确保我国到2020年实现农村贫困人口脱贫,坚持精准扶贫、精准脱贫,让贫困户全部摘帽,做到脱真贫、真脱贫。但是,精准识别贫困户的进入与退出,一直以来就是精准扶贫工作中的重点难点问题。

从学术界对于“精准识别”的研究来看,大部分学者都将眼光专注于精准识别贫困户进入贫困。汪三贵根据计量经济学模型来识别农户的家庭贫困状况,同时发现要预测极其贫困的农户是很难的①汪三贵、王姮、王萍萍:《中国农村贫困家庭的识别》,《农业技术经济》 2007年第1期。; 汪磊、伍国勇界定了精准识别的概念,分析了现在贫困人口识别的问题,并从多维数据的角度指出了对策②汪磊、伍国勇:《精准扶贫视域下我国农村地区贫困人口识别机制研究》,《农村经济》2016年第7 期。; 何立华指出贫困问题精准识别十分困难是因为信息不对称所导致的③何立华:《精准扶贫背景下的贫困人口识别:理论、实践与政策》,《中南民族大学学报(人文社会科学版)》 2017年第2 期。; 刘艳华、徐勇利用多维度的贫困度量方法和地理识别方法对农村的贫困户进行精准识别,根据扶贫措施将贫困县进行了类型上的重新规划④刘艳华、徐勇:《中国农村多维贫困地理识别及类型划分》,《地理学报》 2015年第6期。; 陈辉、张全红指出贫困的本质需要用多维视角来识别⑤陈辉、张全红:《基于多维贫困测度的贫困精准识别及精准扶贫对策——以粤北山区为例》,《广东财经大学学报》 2016年第3 期。;邹一楠指出退出贫困人口的有效识别是我国现在面临的重点问题,实践中对于贫困人口的扶贫不精准⑥邹一南:《贫困人口的识别困境及对策》,《中国党政干部论坛》 2017年第7 期。; 记者张桂英报道在黑龙江省已经开始引入数据库存储贫困户资料的系统⑦张桂英:《1.98 万贫困户的资料输入数据库》,《黑龙江日报》 2005年12月13日第6版。; 汪磊、许鹿、汪霞提出要利用大数据管理平台以减少贫困工作中的信息不对称问题⑧汪磊、许鹿、汪霞:《大数据驱动下精准扶贫运行机制的耦合性分析及其机制创新——基于贵州、甘肃的案例》,《公共管理学报》 2017年第3 期。。

不难发现,精准识别问题已有很多学者在不同角度做出了不同深度、不同广度、不同学科的研究,但是对于贫困户的精准退出识别问题却少有涉猎。笔者认为现在对于贫困户的精准退出识别问题,是迫在眉睫、亟待解决的问题。本文拟将大数据思维与贫困户的精准识别问题进行有机结合,力求在大数据的作用下尽可能解决精准退出识别中的信息不对称问题。

二问题根源:虚假信息、重复识别与信息鸿沟

关于建档立卡贫困人口精准识别的工作,全省上下严格执行“符合标准的一字不漏,不符合标准的一户不进”准则。贫困户进入识别一是采用“四看法”指标体系评价,从“看房”“看粮”“看劳动能力强不强”“看家中有没有读书郎”四个方面定性识别贫困户; 二是采用贫困户调查登记表,包括“家庭基本情况”“家庭收支情况”“住房情况”“生产条件情况”“生活条件情况”“其他”等; 三是采用填写家庭人均可支配收入核查表,了解贫困户的家庭收入明细; 四是一户一档资料均含有一个二维码,可以扫描出农户的基本贫困状况和脱贫规划措施。但是基于笔者对于贵州省毕节市织金县五星村的调查研究,发现了关于精准贫困户退出识别一系列现象及问题。

(一)识别信息不准确,存在“假贫困”现象

精准识别入户材料均由农户本人自行填写,虽然政府要求如实登记,但是在整理该村贫困户的识别资料时,发现一户一档的纸质资料和二维码的信息出现不匹配的状况,还有纸质资料的各种表格也会出现自相矛盾的状况,这说明农户填写信息时存在“失真”现象,说明贫困户中存在“假贫困”人口。对一户一档资料的研究发现:每一户资料的二维码中包含农户部分信息,比如家庭成员基本信息、年均总收支情况,都是十分简单的、粗略的信息。但是二维码中包含的信息量不足,信息不够全面,各种信息之间无关联,只能够进行最粗略的查询。二维码虽然算是大数据的一种应用,但完全没有发挥出应该具备的作用,利用价值不高。缺乏充分利用数据库资料进行整合,让大数据在贫困户退出识别中发挥作用。

(二)识别过程不规范,导致重复识别

调研发现当前贫困识别机制设计不够规范。比如,年度贫困户识别规则会根据当地政策实施差异而存在不同变化。一项政策下来,实施中又要求按照该文件精神重新填表重新识别。这不仅给当地政府的工作带来了极大的困难,也让贫困户的识别过程更加复杂化。对于农户有效数据的采集使用过程不够规范和创新,应该引入大数据思维,建立标准农户数据库,不管政策发生什么变化或需要填写哪些资料和表格,只需要在网络上修改数据提取数据即可,不需要让贫困户重复填写很多没有实际意义的表格,工作人员也减少审核工作。

(三)轻退出、重视进入识别,导致“重复扶贫”

对于贫困户的识别问题,政府把大多数精力放在了如何识别贫困户是否贫困,是否可以进入贫困户行列的问题上。但是对于经过帮扶以及脱贫、因各种关系得到贫困户资格的农户,针对他们退出识别问题,缺乏精准识别的有效规则和措施,这导致我们往往忽视了在脱贫过程中,最重要的“退出识别”问题,严重阻碍实现农村人口全面脱贫的战略目标。

(四)信息采集的“四不现象”,导致“贫困黏性”

第一,信息采集不全面。入户档案中包含的数据有家庭成员基本信息、家庭收支情况、家庭住房情况、生产生活情况等。但是不包含贫困户家庭总资产的统计明细,比如固定资产、流动资产分布等; 关于家中外出务工人员具体工作形式、工作地点等都没有涵盖在数据信息中。第二,信息收集不对称。从该村的情况来看,由于贫困户较多,信息及时发布很困难。群众在被识别进入贫困户时,他们得到的消息一定有所差别,群众人脉广的会有更多优势优先共享相关信息进而得到贫困资格,或者是与政府人员关系亲近的农户更有可能及时获得贫困信息。第三,信息收集不准确。档案资料中家庭基本信息与实际不匹配,这都是信息收集不准确的问题反映。信息收集不准确就是对于农户的信息了解不足,导致不能精确地进行退出识别。第四,信息收集不及时。政府对于档案资料信息收集时效性不强,往往存在着严重滞后性。比如在A 村的贫困户资料中,他们的收入核查表并没有更新到最新年度; 还有的农户住房信息都存在前后不一致现象。贫困户家庭信息或者住房信息之类发生变化,政府也不能及时了解更新。导致政府在精准识别退出贫困户问题中存在严重的滞后性,已经达到退出标准的农户仍然保留在贫困户序列中,“贫困黏性”现象十分突出。

(五)管理平台信息阻断,“共享”农户信息困难

扶贫是一项综合系统性工程,贫困人口数据存在多部门共有,各部门自行统计,且统计标准不一,民政、公安、农业及地方政策相关管理机构数据平台信息不共享,平台信息阻断成为精准退出识别的根源性障碍之一。对于贫困的精准识别需要从各个部门、各个不同平台获得信息,以此来判断该农户是否贫困。但现存问题是,不同部门之间存在着信息的阻断,为了避免信息被泄露,信息存在保密性,没有良好的信息交流平台和信息共享机制。贫困户识别牵涉到银行账户还有家庭成员的身份证、户口本,另外,工商行政部门、农业部门、人力资源和社会保障局等都记录了农户不同方面的信息。要精准识别贫困,需要各种信息相互结合,以此通过数据挖掘的方式更加了解贫困户信息,需要把贫困户的所有资料全部整合,所有信息相互连接起来,力求精准退出识别贫困。

三系统识别:共享、挖掘、识别与管控

针对上述分析,想要精确识别贫困退出,需要将各部门数据进行整合。为此笔者设计了一种精确识别机制。即将贫困户各部门的所有数据进行共享,整理规范录入大数据库系统中,通过数据挖掘的手段进行分析,最终通过数据结果识别假贫困,达到精准识别贫困户退出的目标。

(一)系统整合机制:数据共享

针对贫困户退出识别需要结合不同部门的各种数据资料进行整合。只有尽可能多地收录贫困户信息资料,使得到的信息更加全面、更加准确、更加及时、更加对称,才能精准地识别需要退出的贫困户。

第一,民政、公安部门数据。需要了解贫困户的家庭基本信息,可以从民政部门和公安部门得到。从家庭基本信息获悉一个家庭的基本结构,其中:一是可了解该农户家庭属于什么类别的贫困,是属于政策兜底,还是产业扶贫,抑或是教育帮扶之类; 二是可以避免某些农户因为想要争得贫困资格而做出与老人分家产,为了多得到一些贫困补助而争抢贫困户资格的不良行为,这在某些程度上遏制了这些不道德行为的发生。

第二,银行、保险等金融部门数据。只有获悉贫困户银行账户、保险账户的资金流动,了解他们的资金往来,才有了最基础的评判指标。根据农户银行、保险账户的流水情况,可以从中得知他们最基本的年度收支情况,进而判断他是否属于贫困户行列中的一员。政府可以将农户家庭所有成员的银行账户关联起来,实行捆绑制度,这样易于政府管理,也易于政府主管部门对农户家庭直接查询账户流水问题。

第三,农业、林业、国土、工商等部门数据。精准退出识别需要了解农户家庭每名成员的工作状况。农户家庭成员的工作一般为在家务农,或者是打工,抑或是个体户经商。如果他们的工作是在家务农,那么他们所拥有土地、种养殖情况、农资等信息在农业部门备案。然后种植、畜牧、土地流转,生产活动带来的经济效益会有记录; 如果他们的工作是外出打工,那么工资会在银行账户上体现出来; 如果农户家庭选择个体经营小企业,那么可以从工商部门的数据库中查到经营许可证及经营情况等信息,也可以从中了解他们的盈利情况,职业培训情况和其他经营相关技能的学习情况。总之,关于农户的基本情况及收支情况,农业或者工商部门都发挥了十分重要的作用。

第四,教育、医疗、卫生等部门数据。一是教育方面。农户受教育情况数据直接反映家中受教育子女数量、教育支出情况,这是教育扶贫最基本的依据。通过教育行政主管部门调取农户及子女受教育程度、上学情况数据,进而可以分析出贫困户的贫困原因。也可分析农户生产技术的掌握情况就会相对薄弱,政府就可以通过组织贫困户参加知识技能的培训来提升他们的生产技能,力求帮助贫困户脱贫。二是医疗卫生方面。因病致贫存在较大的比例,但是相关依据需要调查农户家庭各名成员的身体健康程度、就医情况和医疗保障使用情况。如张某某家中只有一名成员,并且年事已高,身体不健康,会选择去医院看病,这时候医院的数据可以记录张某某的每次就诊记录还有他的病情进展,通过医院的数据记录可以了解到贫困户的身体健康状况,用以区分他们的贫困类别。医院的数据资料也是作为识别贫困户精准退出的重要组成部分。依据农户的身体健康状况可以合理确定产业扶贫、医疗扶贫、社会保障及其他方式的扶贫; 设置更加合理的农村合作医疗保险以保障他们的就医问题; 卫生服务部门数据也可反映农户子女健康情况和生存状态,进而判断脱贫策略和返贫风险。

第五,银联、微信、QQ、支付宝等网上支付平台数据。贫困户精准退出识别不仅需要民政部门、公安部门、银行、医院、农业部门、工商部门等部门的数据共享和应用,而且还需要联合各种网上支付平台,比如微信、支付宝等。在互联网时代,网上支付、移动支付已经成为生活中不可或缺的一部分。农户花销可以通过支付宝、QQ、银联或微信等方式支出,通过网上交易记录结合银行账户数据可以了解到该农户的生活花销、大致消费水平、总体收入水平、收入与消费支出的比重等,大致了解该农户的经济状况,作为精准退出识别的基础评判。更重要的是,利用现在的大数据挖掘技术,通过在网上平台的各种支付行为,可以大体反映出农户的家庭基本状况以及贫困程度。

上述数据经过管理系统进行数据共享、数据录入、数据整合、数据清洗和数据挖掘技术,可以分析农户家庭的真正生产、生活、收支状态,更加准确、真实地了解农户的贫困状态。根据不同情况有针对性地进行精准帮扶,让真正贫困的贫困户早日进入序列早日得到帮扶,也让已经脱贫的贫困户及时退出,精准退出识别贫困户,快速实现脱贫的战略目标。

(二)系统应用机制:数据挖掘

数据库管理系统(Database Management System,DMS)。数据库技术针对的主要研究方向是如何存储数据、如何使用数据、如何归纳管理数据,这是通过对数据库的整体结构、存储内容、设计理念、管理方式以及如何运用基础理论的方式,并且运用这些理论支撑来达到对数据库的数据进行处理、分析的目标。通过数据库管理系统将贫困农户数量多、种类杂、不易于整体把控的零散数据整合管理,准确、及时、全面进行精准识别。

第一,数据整合功能。该系统不但拥有最基础的数据储存能力,还可以将各个不同维度的数据资料进行整理汇总,极大程度上保证了数据完整性和安全性,如果数据出现了故障性问题,还可以及时地进行修复。

第二,数据清洗功能。把民政部门、公安部门、银行部门、农业部门、工商部门、教育部门、医疗部门、支付宝、微信等网上支付平台等的关于每一贫困户的各种家庭、生产、生活数据进行集中收录,整合到数据库管理系统的内部数据库中。贫困数据库中就包含贫困户的所有个人和家庭资料,再进行大数据技术的综合应用,开展数据清洗工作,把离散数据规范化、指标化、模块化。政府可以通过现有资料与识别贫困户应有的基本标准进行比对,也可以让技术人员通过借助现有的各项农户数据运用数据挖掘技术对贫困户的贫困情况进行透彻分析,以便精准地开展贫困户识别及扶贫管理工作。

第三,数据挖掘功能。对数据进行收录、整合、清洗之后,建议使用数据挖掘技术来对各项汇总的数据进行精准分析。可以让技术人员通过对海量的数据资料进行分析,采用大数据挖掘技术,挖掘出一些深层次的有用信息,得到更进一步的了解,以此做出更好地开展贫困户精准退出识别决策。

(三)系统识别机制:智能识别

在经历了数据收集、数据分析之后,得到了数据结果,可以从“自动识别、高级检索、二维码”等几个角度观察贫困户的贫困状况,从而判断贫困户是否应该退出贫困的行列。

第一,自动识别。通过数据库管理系统中,一是政府人员可以直观地观测到贫困户的家庭情况、种植养殖性经营活动、务工活动、健康情况、教育情况和子女情况,更重要的是全方面反映家庭整体收支情况,在与政府制定的贫困户贫困标准对比之后,可以判断该农户是否贫困或贫困的程度; 二是关于各项贫困测量指标及标准,在数据库系统中进行录入管理,作为参考值,与农户的各项指标进行比对,自动识别出应该退出贫困户行列的农户。

第二,高级检索。政府人员也可以通过高级检索的方式,选择某一类自己想要查看的农户家庭状况,比如单独查看所有农户的受教育情况或者某个农户的家庭整体情况等。政府人员在数据管理平台上输入检索查询条件时,接口一直连接着数据库,结果会直接显示出来,更可以按照指标数值高低、关键字拼音、人口性别、民族等指标排序。通过高级检索可以排除出哪些农户已经成功脱贫、哪些农户尚未脱贫,然后可以更加有针对性地重点帮扶尚未脱贫的农户脱贫。

第三,二维码应用。调查发现,当前扶贫工作中应用到二维码技术,样本村贫困农户有一小部分信息已经存在于现有二维码中。结合数据库管理系统,把包括了农户家庭、生产、生活各个方面的数据自动智能地共享至二维码中,使二维码信息更加全面、更加智能、更加有效,让需要了解农户信息的工作人员轻松地扫一扫就可以了解该农户主要信息,这样使政府人员的工作相对轻松,可以更快捷地识别贫困户退出问题。

(四)系统管理机制:数据管控

应用大数据识别机制可得到了一系列的数据分析结果,极大程度反映贫困户的真实情况,为贫困户的退出识别提供客观依据。但是由于是利用大数据管理技术,涉及农户个人及家庭信息,如果泄露可能会受到不法分子的利用。因此,运用该管理技术还得注意管控数据风险。

第一,数据信息加快流动。在大数据背景下数据库中囊括了关于贫困户各个方面不同来源的数据信息。汇总之后政府将得到更加全面的数据,而且农户数据信息流动加快。当政府在实际开展贫困户的精准退出识别时,不再是从单一的角度对贫困户进行测评,也不需要费很大的力气从不同的维度寻找数据资料。合理地运用数据库这一技术,可以使信息资源流动更快更智能,各个部门相互协调配合,优势互补,数据共享,才能更好地对贫困户精准识别。第二,综合贫困数据,精准定位贫困根源,管控数据应用效率。综合各项数据,对比得出农户在就业、医疗、教育、卫生、产业、保障、人情、生活等不同方面的收支。提取重要的影响因素,比较得出导致该农户真正贫困的根源性因素,从而有针对性从根本上解决问题,精准定位精准帮扶,促进贫困户脱离贫困的行列。

四精准退出:大数据系统应用保障

本文论述了基于大数据背景下的贫困户精准退出识别这一问题。以丰富当前学术界和实践中重“贫困进入识别”、轻“贫困退出识别”这一问题,促进政府对于贫困户的精准识别问题更加客观、理性和重视,早日实现贫困户的脱贫问题,达成乡村振兴的总体目标。但是,要有效应用贫困户精准退出识别机制(大数据管理系统),应该强化数据真实性、安全性两个保障。

第一,数据质量保障。有效识别的前提是数据真实性、全面性。特别是数据必须要保证的就是它的真实性。一是建议数据来源渠道直接是各个相关的政府、机关部门,减少农户自己填写信息的步骤,降低信息作假的概率; 二是基层工作人员也可以走访当地村民核实信息,从村民的口中进一步了解贫困户的真实生活状况,以减少贫困户信息不真实的可能性,提高数据规范性、有效性。

第二,操作技术保障。对于技术应用及风险,关系到技术人员的职业操守很重要,不能透露贫困户的各项信息。可以与技术人员签订一些保密协议,约定工作中可以获得的各种福利。提高技术操作安全效率,制定并严格执行标准化操作程序; 只有挑选素质过硬、品行端正的技术人员,运用标准化大数据管理系统,才能够保证贫困户精准退出识别工作的顺利展开。

第三,数据安全保障。风险控制也是贫困户精准识别退出贫困的一项重要问题。在贫困户的信息识别中,必须重视风险管控。大数据管理系统建立的基础是要从各个部门、各个方面收集农户的全部信息,通过不同方面的农户信息进行汇总、分析,精准识别贫困户是否要退出贫困。在进行这一系列工作的过程中,农户在提供自己的个人信息、家庭信息、收支情况、生产生活情况时,一定会关注到自己提供信息的保密性、安全性。政府在完成识别贫困的过程中必须要注重风险控制的问题,不能让农户的信息被泄露。否则可能导致信息泄露而被不法分子利用,引起个人及家庭安全问题。

大数据视角下的贫困户精准退出识别机制研究——来自织金县五星村的案例*

一 重要意义:退出识别比进入识别更关键

二 问题根源:虚假信息、重复识别与信息鸿沟