基于大数据技术的精准扶贫信息化平台的研究与应用

2017-06-10 04:49章娟娟舒大鑫曹雅琴
赤峰学院学报·自然科学版 2017年9期
关键词:贫困户个性化精准

陈 琳,章娟娟,舒大鑫,曹雅琴,张 庆

(池州学院 数学与计算机学院,安徽 池州 247000)

基于大数据技术的精准扶贫信息化平台的研究与应用

陈 琳,章娟娟,舒大鑫,曹雅琴,张 庆

(池州学院 数学与计算机学院,安徽 池州 247000)

基于大数据技术、预测建模分析技术搭建了精准扶贫信息化平台,平台通过建模工具,能够对贫困户进行行为预测,实现精准识别,防止脱贫户返贫,同时为贫困户和帮扶单位提供扶贫个性化推送和双向选择,实现与社会各种帮扶企业进行信息的共享,以及“脱贫攻坚”第三方检测评估模块,从而深入地推进大数据技术在精准扶贫过程中的应用.

精准识别;精准扶贫;大数据;扶贫信息化平台;脱贫评估

1 大数据精准扶贫的研究动态

1.1 大数据精准扶贫的现实背景

贫困问题是我国“十三五”时期全面建成小康社会进程中需要解决的重大现实问题.习近平总书记在青海代表团表示“齐心协力打赢脱贫攻坚战,确保到2020年现行标准下农村牧区贫困人口全部脱贫”.为了有效缓解并解决在扶贫工作中遇到的问题,以大数据为工具对贫困户的信息、数据进行处理便显得尤为重要.同时这也是推动扶贫工作治理规范化、科学化发展的重要方向.

1.2 大数据技术在精准扶贫中的使用概述

目前我国已经进入扶贫开发最关键的攻坚拔寨的冲刺期,大数据成为实施精准扶贫、精准脱贫的利器.根据安徽省政府的安排,本文研究团队全程参与安徽省黄山市黟县2016年年末脱贫攻坚第三方检测评估,对贫困户的相关信息、各级政府部门的扶贫政策有深刻的了解和认识,在此基础上,研究基于大数据的精准扶贫信息化平台,通过整合财政、教育、水利、就业、社保、林业、卫生、民政、残联、人行等相关数据,利用大数据技术提高数据处理能力和效率,深度挖掘数据的价值,为扶贫工作提供真实可靠、及时全面的决策数据,为最终实现精准扶贫和精准脱贫提供有力支撑.

2 精准扶贫信息化平台的技术基础

2.1 大数据技术

2.1.1 大数据技术优势

大数据技术能够快捷获取数据隐藏信息,并进行分析处理,从而能够有效节省成本.在精准扶贫工作中,通过大数据技术对庞大的贫困户原始信息进行分析、可视化处理,挖掘出有价值信息为精准帮扶工作提供参考.

2.1.2 大数据技术简介

大数据技术是针对数据采集,处理,可视化等方面的技术,在技术处理上主要采用Hadoop.Hadoop是使用海量数据存储和计算的软件框架,该框架采用分布式存储和分布式计算技术,具有可靠、高效、可伸缩性特点.Hadoop框架包括数据存储(HDFS)和数据计算(MapReduce).Hadoop表现在采用并行执行机制,具有高效性,并通过添加Zookeeper分布式锁服务器,进行横向的扩容,因此大大提高数据处理效率.

2.2 Hadoop框架的设计思想

Hadoop框架分为分布式文件系统HDFS、MapReduce处理过程[1].HDFS基于底层,上层为MapReduce引擎.HDFS对数据提供存储,MapReduce对数据提供计算.框架最核心部分为HDFS和MapReduce的主从组件,其中名称节点和数据节点来自HDFS,MapReduce引擎由JobTrackers和Task-Trackers组成.Hadoop包括数据仓库工具和分布式数据库Hbase,设计程序可访问Hbase数据库[2].

3 大数据精准扶贫信息化平台的设计

本文将大数据技术应用于精准扶贫信息化平台,该平台采用MapReduce并行数据处理模型实现并行计算,同时利用建模工具对贫困户相关数据进行可视化分析,预测其下一年度将会发生的行为,从而及时采取帮扶措施.平台主要功能模块为精准识别、精准帮扶、“脱贫攻坚”第三方检测评估,平台整体架构如图1所示:

图1 大数据精准扶贫信息化平台

3.1 精准识别贫困户

平台将财政、教育、就业等方面的信息进行存储,通过大数据技术并行计算,按照每户年人均可支配年收入是否达到脱贫标准,家庭是否有因贫辍学学生,住房是否为危房等条件精准识别贫困户.平台识别的数据来源可以从两个方面入手:一方面是由每个村对每个贫困户的信息进行采集、甄别和录入,最后进行层层核验,同时要求各级对自己录入核验的数据负责.另一方面,则是要多维度对贫困户信息进行准确跟踪,综合致贫原因、劳动力状况、住房状况、子女就学就业状况、政府补贴状况等指标,进一步做到大数据分析、精准识别.

3.2 精准帮扶

3.2.1 行为预测

将被动帮扶转变为主动预测.为了提高帮扶效率,精准帮扶,将“处理问题”的思维方式转向“预测问题”的前瞻性思维方式,利用大数据技术进行行为预测.

3.2.1.1 扶贫需求预测

通过大数据精准扶贫信息化平台,着重理解贫困户与帮扶人之间的交互行为[3],预测扶贫需求.以安徽省黄山市黟县部分贫困户为例,分析贫困户脱贫的行为.

在扶贫的过程中,了解到贫困户脱贫对于所需的资源都不尽相同.图2反映的是贫苦户的行为相关信息统计,针对行为特点可以进行行为的推测,其中工资收入(X1)、家庭经营收入(X2)、财产收入(X3)、转移收入(X4)、生产经营支出(X5)、子女教育支出(X6)、医疗费用支出(X7).

图2 贫苦户的行为相关信息统计图

软件分析的结果是,在这些贫困户的行为中,以X4为经常性动作,X1为偶尔性动作,表明大多数的贫困户最需要政府的社会补贴,部分贫困户脱贫原因是由于自身劳动(导致行为的发生),根据预测,也可以得图3,其为Y值与X1-X7回归趋势,表明X1集中趋势最为明显,故为了要达到脱贫的标准,需增加X1.平台通过预测贫困户的行为,关注其经常性动作,了解其扶贫需求.以此达到整体预测,精准扶贫的效果.

图3 行为信息分析

3.2.1.2 脱贫返贫预测

平台数据库存储海量的扶贫信息,通过关联规律进行预测,防止脱贫户再次返贫从而加重扶贫任务量.以安徽省为例,安徽省贫困户人均纯收入超过3100元的为脱贫户.本文利用 Eviews7.0软件对黟县某一贫困户脱贫期间(2013-2016年)的行为进行分析预测.输出结果如图4所示,R2统计量显示值为0.975801,其拟合程度很高,且在显著性水平0.5区间下,T统计量、F统计量的P值都极小,说明方程为显著的,各项检验符合,可以进行预测,进而得出该户2017年人均纯收入5450元.同样的对下一年2018年人均纯收入进行推测为3950元,明显在贫困户标准线附近,此时平台将处理此类信息,为帮扶人提供预先的帮扶措施,加大帮扶力度,针对拉低其Y值的方面进行有效的预防,防止该户脱贫户返贫.当预先采取精准帮扶措施时,能够推测出2019年、2020年该户人均纯收入分别为5950元、6020元,已不再徘徊在贫困线附近,认为该脱贫户已稳定脱贫.

据平台行为预测,较好地解决了以往静态、滞后的目标瞄准问题,同时对贫困户的动态变化能够准确掌握.

图4 拟合值输出

3.2.2 脱贫导向

在大数据精准扶贫信息化平台中,系统分析模型板块,利用预测处理,进行脱贫导向从而实现扶贫既“精”又“准”.根据扶贫需求搭建资源配置导向,让每一份资源得到充分的利用,为贫困户脱贫带来指导.以黟县某一贫困户为例,根据其行为导向,在其医疗费用支出明显又上升趋势时,可以为其导向医疗资源,帮助其在费用上或报销上的花费,保证其稳定的脱贫.又或是一贫困户的工资性收入明显有增高的趋势,但金额涨幅不大,通过平台,为其推送企业相关招工信息,达到贫困户就业脱贫的目的.同样的,根据返贫预测,平台将及时采取处理方式,基于其已有的脱贫行为,对其进行个性化推荐帮扶措施,以此达到防止已经脱贫人员再次贫困、拉低脱贫效率、加重脱贫任务的目标.

大数据精准扶贫信息化平台的搭建,通过对于贫困户行为的动态分析[4],预测需求,精准定位资源配置方向,并有效的防止脱贫户返贫,释放大数据预测的真正潜能.

3.3“脱贫攻坚”第三方监测评估

为推进脱贫攻坚政策措施落实到位,确保脱贫成效真实可靠,以安徽省为例,根据《中共安徽省委安徽人民政府关于坚决打赢脱贫攻坚战的决定》(皖发[2015]26号)精神,按照实现“四个全覆盖”的要求,建立独立、公正、规范的脱贫攻坚第三方监测评估机制,年中监测评估以脱贫攻坚政策措施落实情况为重点,年末监测评估以脱贫成效真实性为重点.

大数据精准扶贫信息化平台对脱贫户信息进行处理后,通过第三方监测评估模块,由第三方监测评估人员将扶贫项目的流程完全透明于全体部门,对各地开展精准识别、精准施策、精准帮扶、精准脱贫情况进行调查核实、监测评估和分析研判.同时,也有利于查缺补漏、改进工作,便于客观了解扶贫工作全局,更有助于总结经验教训.

4 大数据精准扶贫信息化平台的创新应用策略

4.1 扶贫信息共享

国家层面也一直尝试鼓励民营企业和社会资本参与精准扶贫,通过大数据精准扶贫信息化平台,不仅可以动态管理贫困户的相关扶贫信息,而且与各民营企业进行数据实时共享.通过一定的分类,匹配出社会各组织帮扶有效资源,进行按近帮扶、按需帮扶.在缓解企业短时用工压力的同时,还可以整合所在地区贫困户的可利用劳动力.此外,电商企业可以上架并促销贫困地区的农特产品,以达到消费扶贫的目的.同时通过大数据精准扶贫信息化平台,可以将优秀的扶贫经验分享至其他地区,促进精准扶贫工作的协同发展.

4.2 帮扶的双向选择

因病致贫,因病返贫是贫困群众最主要的致贫原因之一,健康扶贫对于整个脱贫攻坚战有着重要的作用.大数据精准扶贫信息化平台能为贫困户提供准确的医疗信息.将各类医院分别录入平台,贫困户可以根据自己的病情选择合适的医院,寻求帮助.医院也可以通过平台,根据自己的医疗优势选择贫困户进行帮扶.

教育在促进扶贫、防止返贫方面的作用,可说是根本性的、可持续的[5].可将学校分为幼儿园、小学、中学、大学、特教学校等录入大数据精准扶贫信息化平台.贫困户按照自己所需要的学校进行选择,找到离家最近的学校.学校也可在平台找到自己适合帮扶的贫困地区,进行对口教学.

中小型企业所需的劳动力按照年龄、性别、文化程度、健康状况、所在地、专业等录入大数据精准扶贫信息化平台.贫困户可以通过平台筛选适合自己的工作,企业也可根据自己的需要选择相应的劳动力,达到双向选择的目的.

4.3 帮扶信息个性化推送

4.3.1 个性化推送模块的构建

大数据精准扶贫信息平台将通过个性化推荐来实现精准化扶贫.对平台上采集来的数据信息进行分析之后,基于对贫困户行为的分析,再设计个性化的推送服务,向贫困户推送所需的就业、医疗、教育等信息.个性化推荐模块的总体目标,根据贫困户最新的行为信息,提供对贫困户信息的分析和处理服务,包括词频统计分析、信息调用、地域要求等,最后为贫困户推荐他们极其需要的信息.

4.3.2 学习与跟踪贫困户各方面信息

个性化推送模块中的功能,如果要达到个性化服务的要求,首要的问题就是对贫困户信息的了解与获取.一方面要加强与贫困户的交互,另一方面是构造贫困户兴趣模型和个性化推荐算法.

大数据精准扶贫信息平台个性化推送模块主要包括以下三个层次:

4.3.2.1 数据层

通过平台将贫困户与数据相关联,根据他们的致贫原因再将贫困户之间相互区分开来.通过建立贫困户的数据中心,将每个贫困户的日常生活习惯,身体特征,性别年龄,知识能力,爱好性情等进行记录.也就是将除了思维外的一切信息都储存下来,并将这些数据带入分析层进行分析处理. 4.3.2.2 分析层

通过平台将贫困户的特征匹配等相关的逻辑运算,将贫困户和信息做关联,筛选更适合的数据.将信息资源集中整合起来,把无序的数据变为有序的数据,即把离散的数据整理成可以为贫困户服务的数据,使之方便贫困户查找信息,同时提高所提供信息的准确性,节省时间,提高效率.

4.3.2.3 推送层

构建个性化推送与贫困户交互的通道.将能够帮助贫困户的企业名称、帮扶机构、等方面进行推送,该方面将直接影响到个性化推送的利用率,影响着推送的效果.本层是基于与用户的优良互动性,通过主动分析贫困户行为信息来推送信息.同时,也需要对社会各层构建个性化模块,分析出企业、机构和个人所需的劳动力类型,需要的贫困户年龄,帮扶条件是否满足,进而为他们个性化推送满足条件的贫困户.

这样的个性化推送模块通常可以在比较恰当的时机捕获到贫困户最需要的信息,能够让贫困户切身体会到个性化推送模块的优点.同时也大力度的提高扶贫的精准度,真正的让用户集成的大数据知识为精准扶贫做出最大的贡献.

5 结束语

精准扶贫的工作,关系到中国成千上万贫困户的生活和福利,影响着社会主义建设进程.正如习总书记强调的一样:扶贫开发工作已进入“啃硬骨头、攻坚拔寨”的冲刺时期.在这不到3年的时间,要确保所有贫困户全部如期脱贫,可以在精准扶贫上进一步利用大数据技术,完善整个扶贫体系,促进精准扶贫工作的协同发展,实现伟大中国梦!

〔1〕廖峰.大数据环境下Hadoop分布式系统研究与设计.

〔2〕VigneshPrajapati著,李明等译.R与Hadoop大数据分析实战.

〔3〕蒋卓轩.基于MOOC数据的学习行为分析与预测.计算机研究与发展,2015(3).

〔4〕莫光辉.大数据在精准扶贫过程中的应用及实践创新.求实,2016(10).

〔5〕刘传铁.教育是最根本的精准扶贫.人民日报,2016-01-27(05).

TP391

A

1673-260X(2017)05-0018-03

2017-01-04

猜你喜欢
贫困户个性化精准
精准防返贫,才能稳脱贫
坚持个性化的写作
致富闯路人带领贫困户“熬”出幸福
『贫困户』过年
贫困户 脱贫靠产业
新闻的个性化写作
精准的打铁
精准扶贫 齐奔小康
精准扶贫二首
上汽大通:C2B个性化定制未来