不同类型公文来文的数字化统一处理方法刍议

2016-11-30 17:31江苏省无锡市人民检察院江苏无锡214002
中国新技术新产品 2016年11期

刘 康(江苏省无锡市人民检察院,江苏 无锡 214002)



不同类型公文来文的数字化统一处理方法刍议

刘 康
(江苏省无锡市人民检察院,江苏 无锡 214002)

摘 要:随着社会科技的不断进步以及政府办公信息化的推进,政府机关相继建立了公文处理系统,对数字化文档应用也逐渐增多,如何将公文来文中传统的信函、传真等纸质介质以及不同格式的数字文档统一处理成一种数字文档就显得尤为重要。本文结合笔者实际工作中尝试,为不同类型公文来文的数字化统一处理提供了一种行之有效的解决方法。

关键词:政务管理;公文来文;数字化处理

在全国加快信息化建设速度和办公自动化迅速发展的形势下,电子政务、网上办公快速普及,基于C/S、B/S等架构的政府机关内部公文处理系统(以下简称“OA系统”)已成为政府机关政务管理的标配,OA系统的运用彻底改变了长期以来形成的纸质文件手工收发、报送、流转、签发、归档等习惯,走上了一条政府机关内部公文普遍数字化、信息充分共享、工作高度协作之路。通过OA系统处理的数字化公文,公文格式高度统一、公文处理过程责任明晰、公文处理时间下降到分秒、公文流转的安全性、可靠性及准确性也得到了有效保障,使得政府机关工作效率进一步提高,办公资源进一步优化。然而作为OA系统重要数据信息来源之一的公文来文(非涉密性来文,以下相同),由于来源渠道不一、来文形式不一、来文格式不一、来文数量较多,使得公文来文的数字化统一处理变得比较棘手。如何把不同类型公文来文统一成一种数字文档格式,已成为当前政府机关办公室政务管理工作的重要课题。

1 公文来文的几种类型

政府机关的工作离不开公文,它是信息传递的主要渠道。例如2015年,笔者所在机关收到的来文就有2500件,来文类型比较多,主要有以下几种:

1.1 信函。这是比较传统的来文方式,其介质为纸质文件,能较好地体现公文红头红章的严肃性。由于近年来各级政府机关公文处理机要通道的相继运用,此类来文逐年减少,目前只占来文总数的10%左右。

1.2 传真。这也是相对传统的来文方式。传真(fax, 是facsimile的简写形式,有时也叫telecopying)是指用电话传输经扫描的印刷材料(文本或图像)。原始文件被传真机扫描并转换为位图文件,并作为电信号通过电话系统传输,接受传真的传真机或打印机重新恢复那个电码图像并打印出公文的复印件。由于传真的特殊性,其介质一般为黑白纸质文件。目前此类来文占到来文总数的5%左右。

1.3 党政机关机要通道。这是一种采用方正CEB格式的数字化来文方式。CEB格式是由北大方正公司独立开发的电子书格式,由于在文档转换过程中采用了“高保真”技术,可以最大限度地保持原来的样式。正是基于这种特点,目前在我国政府机关公文处理中应用广泛。方正Apabi Reader(阿帕比)是CEB格式的指定阅读软件,Apabi Reader还具有字体缩放、书签、做笔记、书籍管理、翻译和文字部分拷贝功能,能尽量符合传统的阅读习惯。在配合专用电子印章(以下简称“KEY”)的情况下可以实现带红头红章的文件阅读,亦可打印带有红头红章的纸质公文。目前,此类来文逐年增多,约占来文总数的55%。

1.4 条线机要通道。这是一种采用书生SEP格式的数字化来文方式。SEP是中文平台上通用的、优秀的、安全可靠的文档分发和交换格式,基于书生公司达到国际先进水平的技术构建。SEP符合传统纸张特性,可以完整地原版原貌地转换各种来源的应用程序所生成的电子文档,为政府与企事业单位的文档一体化工作和电子政务建设提供了值得信赖的文档解决方案。书生阅读器(Sure Sense SEP Reader)在配合KEY的情况下可以实现带红头红章的文件阅读,亦可打印带有红头红章的纸质公文。目前,此类来文约占来文总数的30%。

2 数字文档一体化处理的几种尝试

为了更好地把纸质介质及数字文档统一处理成一种数字文档,并融入基于B/S结构的OA系统中,笔者进行了几种不同方式的尝试,并最终选择出最优最便捷的方法。

2.1 把纸质介质扫描后OCR识别转换成WORD格式文件。这种方式的优点是:纸制介质转化成WORD文档后,对于进一步编辑、采集利用相对比较便捷。缺点是:转换步骤比较烦琐,OCR识别时间较长,往往一份文件扫描识别转换需要的时间在20分钟左右(以10页 A4纸公文为例),OCR识别率不高,最多在90%左右,如果原文件是传真件,在传真过程中产生的图像污渍会使得识别率大大下降。同时转换成WORD格式文件后,原文件的红头红章无法体现。

2.2 把纸质介质扫描成JPG格式,然后再通过CEB或SEP编辑器转换成CEB或SEP格式文件。这种方式的优点是:能较好地体现原纸质介质的文头及印章。缺点是:通过CEB或SEP编辑器编辑的过程比较烦琐,扫描并制作1份CEB或SEP格式文件需时20分钟左右(以10页A4纸公文为例)。同时,由于CEB和SEP格式的通用性不佳,需在OA系统的每个客户端上都安装相应的阅读软件才能阅读,加重了OA系统技术人员对客户端的维护工作量。

2.3 CEB和SEP格式文件直接导入OA系统中。这种方式的优点:最快捷。缺点:由于CEB和SEP格式文件只有采用了相应的硬件KEY后才能显示和打印原文件的红头红章,所以必须在OA系统的每个客户端电脑上配备相应的KEY,在KEY设备采购添加上成本比较高,在后继维护上也比较烦琐。

2.4 把CEB和SEP格式文件打印成纸质介质,连同信函、传真等纸质介质一起扫描成PDF格式。PDF(Portable Document Format的简称,意为“便携式文档格式”),是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。这一特点使它成为进行电子文档发行和数字化信息传播的理想文档格式。PDF具有许多其他电子文档格式无法相比的优点,它可以将文字、字形、格式、颜色等封装在一个文件中打包存储,还可以包含超文本链接、声音等电子信息,支持特长文件,集成度和安全可靠性都较高。同时,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原文件的每一个字符、颜色以及图像。这种转换方式是笔者选择的最优最便捷方式,从使用的情况来看,如采用每分钟60页、双面120页的黑白彩色高速送纸型扫描仪,扫描精度(dpi)为200,10页A4纸公文只需几秒钟就可转化成带头红头红章的PDF文档,同时CEB和SEP格式文件打印的纸质介质以及信函、传真等纸质介质可作为纸质档案进行归档,减少了不必要的浪费。这种方式唯一的缺点就是OA系统的每个客户端电脑上必须有PDF阅读软件,但考虑到目前几乎所有电脑上都会安装不同类型的PDF阅读软件,即使没有安装,有些浏览器及文档软件也能支持打开并阅读,因此这一缺点也就显得微不足道了。

3 纸质文件扫描成PDF格式数字文件需要注意的几点

在实际应用中,笔者觉得以下几点对于高效、整洁地制作一份PDF格式数字文件至关重要。

3.1 尽量采用带双面输稿器的高速送纸型扫描仪。实践证明,一台带双面输稿器的高速送纸型扫描仪,能大大节约工作时间,减少工作强度,提高工作效率。

3.2 纸质文档放入扫描仪输稿器中尽量要放正。由于高速扫描仪送纸速度较快,稍有不慎,不正的文件就会扫描成倾斜。因此纸质文件放入输稿器时尽量要放正放整齐,原稿若有倾斜或者在扫描中文稿放置不正而出现的偏差要及时调整,这样扫描后的文件就比较美观,所见即所得。

3.3 扫描时扫描精度适中即可。扫描精度越高,扫描文件就大。在实际操作中,扫描精度在200Dpi,几乎就可以非常真实地再现文件的原貌,又节省存储空间。

综上所述,处理不同类型的公文来文是政府机关的重要内容之一,采用统一、高效的数字化处理方式能使公文来文进一步匹配OA系统,使公文传输更加快捷、格式标准也统一化,极大地提高工作效率。随着社会不断发展、科学技术日新月异,数字文档一体化处理工作也将面临更多新挑战,要不断根据实际情况做出相应调整以配合时代发展的需要。

参考文献

[1]楼建晴,沙红.高校收文数字化管理及安全性之实现[J].兰台世界,2006(9):34.

[2]陶岩.文件扫描—纸质文件数字化的重要途径[J].办公室业务,2003(12):40-41.

[3]徐志刚,缪梓伦.纸质公文一体化处理方法刍议[J].信息化建设,2011(8):23-25.

[4]赵丁丁.机关文印部门对公文处理过程的变化[J].计算机光盘软件与应用,2013 (8):122-123.

中图分类号:TP391

文献标识码:A