外包数据质量控制初探——以中国科学引文数据库为例

2013-04-12 19:06
河南图书馆学刊 2013年4期
关键词:加工数据库人员

陆 耘

(中国科学院国家科学图书馆,北京 100190)

中国科学引文数据库(Chinese Science Citation Database,以下简称CSCD)创建于1989年,由中国科学院国家科学图书馆建设,并获得国家自然科学基金委员会的支持。目前,该数据库共收录了我国自然科学、医学、农业、工程技术学等领域中英文核心期刊和优秀期刊千余种,截至2012年12月,已积累论文记录350余万条,引文记录3,500余万条。历经20多年的建设和发展,中国科学引文数据库已成为具备专业性强、数据质量优良、数据体系完整、检索方式多样、简单易用等特点的大型数据库,深受用户好评,对科技人员和科研评价等工作具有重要影响。

近年来,随着数据采集量的逐年递增,现有的数据加工人员越来越难以负荷海量基础数据的加工工作,为顺应数据库建设的发展,改变基础数据加工方式势在必行。目前,基础数据外包已经成为各类大型数据库建设的一种主流方式,CSCD数据库亦于2003年实行了基础数据外包,这一改变是数据库建设发展中的一次重要跨越,CSCD数据库建设小组的工作模式亦由具体操作的作坊型向主要负责规划设计、组织协调的统筹型转变,原数据加工人员的工作分别转向用户需求分析、数据质量监控以及与数据供应商的协调等方面。其中,外包数据的质量控制更是新工作方式的重中之重。基础数据质量的高低不仅影响数据后期规范化处理、统计产品的可靠性,还直接影响到数据库对外服务水平,比如:与各类资源的融合度、开放链接服务水平等,直接关系到数据库的生存和发展。笔者将结合CSCD建设的工作实践,对如何做好外包数据质量控制进行初步的探讨。

1 选择适合的外包服务公司,签订职责明确的合同与协议

数据外包公司的服务质量直接决定数据质量。在对数据外包公司的选择上,着重考虑了以下几个方面:首先,要求外包公司具备相应资质和信誉,重点考察其相关工作的经历和业绩;其次,考虑外包服务的成本是否合理;第三,考虑到外包服务是初步阶段,只将非核心业务外包,积累对数据外包工作的管理经验。

综合以上几点,我们拟定了业务外包实施方案,经主管部门批准后,遵循公开、公平、公正的原则,采取对外公开招投标,由专家组成的评标委员会评标,择优选择了适合CSCD建设要求的外包数据服务公司。

在选定了外包公司之后,与中标公司签订详细、明确的委托外包合同,包括合同期限、工作目标、合作范畴、运作方式、责任划分、赔偿问题等。在与外包公司签订详尽的工作协议时,围绕数据特点,尽可能考虑周全,将数据提交格式、质量标准、数量标准、任务完成期限、人员流动控制及违约的惩罚措施、解决突发问题的应急对策等可能出现的问题逐一进行约定,尽最大可能保障外包数据质量。

2 外包实施过程中数据质量控制对策

数据质量体现在对数据加工的全过程的把控,因此,数据加工各环节质量控制对策尤为重要。在外包数据的质量控制中,我们主要根据美国质量管理专家戴明的PDCA全程循环质量控制理论,制定了数据质量的全程控制模式。PDCA是一套广泛用于质量管理的标准化、科学化循环系统,它将工作流程具体分为四个阶段:计划(plan)、实施(do)、检查(check)、处理(action),流程执行实施一遍后,要对出现的问题和不足进行完善和改进,并在此基础上,再一次进行PDCA的循环,从而提升质量控制水平。在实践中,我们没有机械地把四个内容从时间上划分前后阶段,而是把质量控制PDCA四项内容贯穿到数据加工的各个环节和时段,围绕这四项内容,展开相互交融的全面的数据质量控制管理(见图1)。

2.1 计划阶段(Plan)

CSCD字段繁多、著录内容多样、逻辑关系复杂,加工难度大,其数据分为3个级别:①Ⅰ级数据,也称原始数据。数据加工要求按照《中国科学引文数据库著录与录入规范》,保证数据内容完整无遗漏,数据对应关系准确,字段分解正确。②Ⅱ级数据。根据《数据审核标准和规范手册》对Ⅰ级数据进行质量检查与修正,完成标准化、规范化处理。③Ⅲ级数据。在Ⅱ级数据的基础上,根据统计产品需要,进一步深加工所形成的统计数据。外包工作主要是完成Ⅰ级数据加工。

2.1.1 做好数据加工人员岗前业务培训,强化质量意识

为了使外包公司的数据质量尽早达到CSCD建设要求,我们根据著录标准编制培训讲义,配备经验丰富的审校人员对外包公司数据加工人员进行严格的岗前培训和考核,培养他们保证质量的意识和能力。我们特别采取了请外包公司人员到项目组边工作边培训的方式,尽快提升数据加工人员的加工水平,并及时发现问题和解决问题,从工作流程的源头保证外包数据质量,实现数据加工工作方式的平稳转变。

2.1.2 确定影响质量的主要因素,制定并完善工作标准和细则

在外包初期,我们对试验数据采取一对一逐册期刊审校的方式,严格按照著录标准和质量要求进行仔细认真校对,将发现的质量问题进行归纳,形成数据错误表单,汇总统计表单中的内容,进行分析和归纳,找出影响质量的各种因素。这些因素可以分为人为因素、技术因素、客观因素三类,就不同因素制定了相关细则和改进方案。比如:为帮助加工人员对某些著录标准、字段含义准确理解,对西文文献类型著录内容的正确识别,我们编制了更为细化、直观的培训讲义,提供了丰富直观的样例。另外,我们进一步整理和编制了各种详尽、明了的工作手册,如《各专业技术职称分类》、《国外主要出版社一览表》、《重点实验室英文缩写表》等,可有效指导数据加工人员甄别和解决工作中遇到的实际问题。

2.2 执行阶段(Do)

在人员培训工作的基础上,由项目组和外包公司双方抽调责任心强、加工经验丰富的人员建立质量管理小组,负责双方的数据质量控制工作。

针对外包公司正式加工提交的数据,我方数据接收人员首先进行数据导入、查重、数量核对,并通过系统报错追踪等技术手段进行数据前期清理工作。之后由数据审校人员严格对照各项细则和审核标准进行逐个字段的审查,归纳整理所发现的新问题,及时反馈到外包公司质量管理人员,这样使外包公司质控人员可以有重点地自查。另外,我们要求外包公司能够对每条加工数据追溯到具体加工人员,通过“数据认责”方式强化加工人员质量意识,减少错误的重复出现。

2.3 检查阶段(Check)

本阶段工作包括针对数据加工整体质量检查和加工人员个体问题分析两项内容:①经过计划和执行阶段后,我方根据合同规定,将对外包基础数据质量进行全面检查。主要采取定期检查与随机抽查相结合的方式,项目方的质量控制小组每两个月对数据大检查一次,并在每个月中不定时随机抽查,由审校人员提交抽查报告,定期向外包公司提供质检报告,包括以往问题的改进情况和近期发现的新问题,提出整改要求,督促外包公司不断改进数据质量,完善数据检验流程,提高数据加工效率。②根据对错误数据的追溯,发现具体加工人员产生错误的原因,对加工人员提出改进建议,从源头控制数据质量。

2.4 处理阶段(Action)

根据检查结果,双方的质量控制小组总结经验教训,对出现的问题加以分析,及时交流质量信息,并把这一循环周期未解决的遗留问题,转到下一次PDCA循环中去,提出整改措施,防止类似情况的再次发生。

九年来,我们借鉴PDCA质量管理模式,对外包数据质量进行了全面、系统的综合管理,使基础数据加工达到了质量标准,数据合格率达95%以上,大大提高了工作效率,保证了数据库检索服务的及时和准确,为CSCD各类统计产品的按时出版发布打下了良好的数据基础。

3 外包工作面临的问题及解决方案

我们经过近几年的数据外包实践,在解决内部人力资源不足和缩小时差等方面取得一定成效,质量管控基本达到了预期目标,数据更新频率实现了每周更新。但是,数据外包工作仍然面临着一些问题,需要不断地探索新方法,使外包工作不断规范、更加完善。

3.1 引入新的数据外包公司,规避数据风险

目前的数据外包公司只有一家,这对于数据的安全存在一定的风险,如果这家公司出现问题,则外包数据必然出现问题。因此,如果有可能的话,外包公司应选择两家或以上,能够在一定程度上规避数据风险,并可形成竞争,提高效率,更有效地保证数据质量。当然,管理两家公司也会对我们的管理能力提出更高的要求,并增加管理成本。

3.2 对数据加工人员开展持续培训,应对各类影响质量的问题进行动态控制

CSCD的数据内容和数据结构都比较复杂,数据人员需要一定的时间才能熟练掌握数据加工要领,因此要求数据加工人员队伍相对稳定。但是,当前由于外包公司内部管理等方面的问题,导致公司人员变动比较频繁,给数据质量管控带来了一定的困难。另外,CSCD收录的千余种期刊,各类期刊的著录内容和形式也不断出现新变化,需要根据实际变化对数据加工人员进行及时的业务培训指导。就以上问题,必须有持续的培训机制,方能在各类新变化中有效实施数据动态质量控制。

3.3 进一步完善检查制度,督促数据公司进行有效的质量控制

相继制定的工作细则、审核制度、定期检查制度已经收到了一定的效果,但检查制度的完善和执行力度上还存在着一些不足。我们还需不断地完善对数据公司工作流程和各项质量管理制度的检查和指导,通过有效配合,针对出现的问题能尽快产生解决方案。另外,要建立完善的质量评估系统,敦促数据公司做好针对人员及工作质量的考核,对工作中发生的质量问题严加控制。

以上是CSCD在建设模式实现转变后,我们在数据外包加工中如何保证数据质量所做的一些实际工作和对现有问题的思考,希望通过本文与同行进行交流,向同行学习更多的经验和方法。在今后的工作中,我们还将借鉴PDCA等各种有效的质量管理模式,结合现实情况的变化,不断提高数据质量控制水平。

[1] 牛书东.图书馆业务外包的实践与思考[J].河南图书馆学刊,2007(3):117-119.

[2] 马桂艳.高校图书馆编目业务外包的全程规范管理[J].唐山师范学院学报,2008(1):155-156.

[3] 郑有才.档案工作全面质量管理[M].北京:科学普及出版社,1991.

[4] (意)帕累托等.你不可不知的30种管理方法[M].北京:当代中国出版社,2003.

猜你喜欢
加工数据库人员
认识“超加工食品”
后期加工
让刑满释放人员找到家的感觉
不得与工会组织任职期内人员解除劳动合同
数据库
菱的简易加工几法
数据库
数据库
数据库
看,塑料制品是这么加工来的