利用四经普数据更新名录库工作的反思

2020-11-03 08:11杨正辉
经济视野 2020年13期
关键词:法人名录普查

文| 杨正辉

引言

名录库不仅为各项统计调查提供样本框,其法人单位、产业活动单位的增减变动、运营状态、规模变化、分布趋势、经济结构等数据指标也是反映地方经济社会发展变化的“晴雨表”和“信息库”。

按照四经普方案的要求,2019年11月底国家统计局完成了四经普数据对名录库数据的覆盖更新。从各地反映的情况来看,这一次数据覆盖更新出现了大量的审核错误,此项工作有诸多值得反思、改进之处。

审核错误情况概述

从12月4日截取的数据来看,审核错误呈现出数量大、范围广的特点。从审核错误种类来看,强制性错误主要集中在:法人单位所属产业活动单位数量错误;产业活动单位归属法人匹配指标错误;法人单位表内各类编码缺失。核实性错误主要集中在:法人单位表内经济指标取值错误;法人单位表内期末从业人员数取值错误;法人单位表内机构类型与其他属性指标不匹配。

这些审核错误的具体表现可归纳为四种情况

1.法人单位、产业活动单位表内数据指标取值出错。这个问题导致的各类审核错误数量最多,涉及的单位范围最广。除了单位代码名称、法定代表人(负责人)、区划代码、登记注册类型、运营状态等指标之外的其他指标几乎都有不同程度的取值出错的情况。其中,与收入支出相关的数据类指标、会计标准类别等属性指标是取值出错最为严重的。例如:机构类型为企业的,“营业收入”项被注入来历不明的数据;机构类型为机关、事业单位的,“主营业务收入”项注入来历不明数据;机构类型为农民专业合作社和村(居)民委员会的“执行会计标准类别”被普遍替换成“企业会计制度”或“民间非营利性会计制度”;未独立核算的事业单位、社团“从业人员期末人数”和“非企业单位支出”被全部置换为“0”。

2.法人单位、产业活动单位表内部分指标被清空。法人单位基本情况表内被清空的指标主要有“单位注册地及区划代码”、“产业活动单位数”、“期末从业人数”、“单位规模”、“填表人信息”等。产业活动单位表内被清空的指标主要有归属法人单位组织机构代码和归属法人单位区划代码。其中,不能独立核算的事业单位从业人数、经济指标被清空的情况最为严重,其次,由部门负责普查的金融保险业产业活动单位表内主要业务活动和所有数量类指标均被清空。

3.部分法人单位、产业活动单位表被误剔除。从收集的情况来看,存在部分正常单位被剔除的情况,普遍反映产业活动单位被剔除的较多。

4.2019年已经维护、更新的数据被还原。四经普入户登记结束后,名录库的维护、更新工作陆续恢复正常。乡镇、县区统计机构结合直报单位管理、劳动力调查、文化产业法人单位统计等工作,对名录库很多单位的信息进行了核实修改。但通过这一次覆盖和更新,已经核实的信息被还原成了普查结果。被还原的指标主要有:单位详细名称、单位负责人、联系电话及经济指标等,还有少量被剔除单位也被还原为正常状态。

审核错误对名录库工作的主要影响

大量审核错误的出现,给各级名录库管理机构都带来一定程度的影响。尤其是对县区、乡镇、社区等基层统计机构工作的影响非常大,这些影响主要表现在以下两个方面:

1.大幅增加了基层统计人员的工作量。利用四经普数据覆盖更新名录库后形成的大量审核错误,必然需要投入大量的时间和经历来进行核实、修改和完善。需要社区、乡镇、县区名录库工作人员查询经普登记数据,调阅原始资料,有的还要通过电话核实。错误数量特别大的县区相当于在重新进行清查摸底。再加上名录库更新维护平台缺乏批量替换功能,制约了审核改错效率,也在一定程度上影响基层工作人员的积极性。

2.名录库数据质量受到影响。从实际工作情况来看,很多社区、乡镇和县区的名录库工作人员为了按期完成改错任务,未严格按照规范进行相关指标的核实,凭经验、凭想象进行改错,很多数据都是为了满足审核公式。如此维护的名录库,数据质量必然下降。

产生审核错误的主要原因

通过对大量审核错误和经济普查原始数据的比对、分析,笔者认为导致大量审核错误的原因,可以归纳为以下几个方面。

1.名录库和经济普查报表制度不一致。名录库和四经普两种统计报表制度的指标设置、取值范围、审核关系存在一定差异。例如:未独立核算的事业单位和社会团体,在名录库维护中需要按照实际情况填写“期末从业人员数”,分摊“非企业单位支出”,但在经济普查中只需填报上级法人单位;名录库的企业法人单位经济指标有“营业收入”和“主营业务收入”两项,而四经普非一套表单位调查表则只有“营业收入”;名录库报表制度要求农民专业合作社、村(居)民委员会“执行会计标准类别”为“其他”,而四经普数据采集程序为满足布表要求,则需要选择“企业会计制度”或“行政单位会计制度”等。正是这些差异导致利用经普数据覆盖、更新名录库时取值出错或无值可取,最终产生大面积审核错误。

2.数据覆盖的规则设计不合理。用经普数据覆盖、更新名录库的规则设计涉及的指标多、逻辑关系十分复杂。需要提前对不同单位类型、不同机构类型的各项指标建立对应关系;确定各项指标的取值、转换、计算规则;设计指标有效性校验条件;编制数据冲突处理优先级别等。任何一项设计出现差错都会导致大面积错误的产生,例如:用应缴增值税倒推计算“主营业收入”时,未考虑实际工作中的合理避税和抵扣,而导致取值出错。

3.覆盖更新名录库的工作模式不妥当。一次性大批量导入数据的工作模式极易因计算机指令意外和硬件设备意外产生批量错误。

4.覆盖更新名录库的时机选择不合适。四经普登记的时期数为2018年年度数据,而利用普查数据覆盖名录库数据的时间选择在2019年底,时间相差接近一年。在这一年时间里,单位的结构关系、营业状态、经营地址、财务收支等情况发生了很大变化。同时,在这一年时间里,为满足其他专业调查,已经对部分单位的指标、信息进行了更新。所以在这个时间节点用2018年的数据覆盖2019年的名录库,必然会增加表间关系审核错误,并导致部分数据被回滚。

减少和避免数据覆盖出现错误的建议

很显然,单位被误删除、数据被清空、指标替换错误,大量审核错误的出现和名录库数据质量的降低并不是我们想要的结果。利用普查数据维护名录库,使单位更齐全,属性指标更准确,数量指标更真实的目标并没有实现。

通过对现实情况的分析,着眼今后名录库建设的发展、应用,在不远的下一次和更远的将来切实让这项工作变得更有效,更有价值,则需要对此项工作做必要的改革和完善。

1.建立统一的指标体系。名录库的指标体系应当顺应经济社会发展和普查工作的需要,与经济普查的指标设置、取值范围、审核关系统一起来,只有这样,才能有效避免因制度、方案差异而产生的审核错误。

2.选择合适的数据覆盖时机。利用普查结果覆盖更新名录库,应当选择在普查入户登记开始到数据审核改错结束这一时间段。只有在这个时间段内,用普查数据更新的名录库才能避免数据回滚,数据指标的准确性才能得到保障。

3.科学设计数据更新规则。数据更新的规则是十分复杂的,应当按照单位类型、机构类型结合实际情况分别建立数据更新规则模型,并进行必要的专家论证和实操验证。确保计算机指令、程序语句没有漏洞,数据值的读取、校验、写入准确无误。

4.优化数据覆盖工作模式。在信息技术飞速发展的今天,用普查结果更新名录库数据具备“同步更新”的条件。所谓同步更新,即通过技术手段,在普查登记、集中改错阶段,使名录库与普查库数据实现适时同步更新。实现“同步更新”后,可以免去经普后期再次进行审核改错,大幅减轻基层统计工作人员工作量,并从根本上避免数据回滚等情况的出现,数据时效性更高,数据质量更有保障。

5.完善名录库管理平台功能。当前名录库管理平台没有为基层管理用户提供经普数据导入、批量替换和单位规模自动判断功能。基层名录库维护人员对于同类型、大批量的逻辑错误只能手工逐条核实、修改,效率低、质量差。如果名录库管理平台能够完善这些功能,审核改错工作效率会成倍提升,数据质量也会得到保障。

猜你喜欢
法人名录普查
立即全面普查 警惕二代粘虫发生
2022.3上榜派出所名录
胡春华强调:确保脱贫攻坚普查取得圆满成功
太极拳列入联合国非遗名录
陶行知教育名录
非营利法人破产特殊制度安排研究
对《民法总则》法人的分类方式的思考
陕西省法人及其他组织违法失信“黑名单”
同贺名录
试论英美法系法人犯罪的归责路径及其对我国的启示