基于Visual C++的Excel工作簿数据处理

2017-03-06 00:27张志恒张显库杨光平马超冯永孝
软件导刊 2017年1期
关键词:数据处理

张志恒+张显库+杨光平马超+冯永孝

摘要摘要:利用Excel手动处理大量数据时工作量大、繁琐,难以及时、准确筛选数据。用VC++(Visual C++)编程实现工作簿数据处理,能够快速、准确地筛选出所需要的信息。以每年公布的1 1000余种SCI(Science Citation Index)期刊数据为例,编程实现对所需领域SCI期刊数据的快速筛选,便于科研工作者获得领域具有高影响因子的SCI期刊数据信息,方便科研工作开展。

关键词关键词:VC++;数据处理;Excel工作簿;SCI期刊

DOIDOI:10.11907/rjdk.162170

中图分类号:TP319文献标识码:A文章编号文章编号:16727800(2017)001013502

引言

美国科学情报研究所出版的《科学引文索引》(Science Citation Index,简称SCI)是世界核心期刊文献检索的主要工具,其收录了全世界最重要和最具影响力的研究成果。具有高影响因子的SCI论文对于科研具有极高的参考价值。SCI数据库内容繁多,快速、准确地筛选所需要的SCI期刊相关信息,对于科研人员具有重要意义。Excel是Office家族中功能强大的办公软件,使用广泛。SCI数据可以通过Excel直接导出,大多数科研人员采用Excel手动筛选,以获得所需的内容。人工处理SCI数据库工作量大、易发生误删,影响最终结果的准确性。用VC++编程对Excel工作簿进行数据处理可以较好地解决这一问题。

VC++是Microsoft开发环境Visual Studio Professional 的一部分[1],VC++是常用的可视化界面开发工具,具有界面设计灵活多样、代码执行效率高、数据处理速度快等优点。利用VC++操作Excel,将两者结合起来使用,对于快速处理数据具有重要意义[2]。

使用本文程序在Window10系统中利用VC++2013对Excel 2013的处理、编译,达到了预期效果。

1Excel接口与对象模型

COM(Component Object Model)是一种面向对象的编程模式,它定义了对象在单个应用程序内部或多个应用程序之间的行为方式。VC++编译的外部程序通过接口与Excel对象模型进行交互,从而实现对Excel的操作,相比早期2003版本,该程序接口和对象模型发生了一定变化,程序中用到的对象主要有Application、Workbook、Worksheet等[3]。

首先插入一个类:按2013版的Excel安装位置对应地选择为Excel.exe。选中常用的类对象:Application、Workbook、Workbooks、Worksheet、Worksheets、Range、Font,注释类的头文件#import。

3软件介绍

3.1软件设计原理

首先根据相关领域业关键词进行初步筛选,筛选出含有此关键词的所有SCI论文;然后在此基础上,利用程序收集的关键词库作进一步筛选,删除含有这个词汇同时含有其它专业核心词汇的一行数据;最后较为准确地筛选出所需要的论文数据。程序流程如图1所示。

自定义筛选原理:通过学科关键字删除不含有该学科的无关数据,通过自定义筛选之后还有一部分含有学科关键字词根,同时明显属于其它学科的数据、例如“disease”中含有“sea”关键字,但明显与航海交通无关,需要通过关键词库进一步删除。

关键词库中含有10个学科的主要专业词汇。部分关键词如下[78]:

图1程序流程 交控类:traffic;ocean;isa;ship;navig;Transport;model;automat

医学类:Medic;diabet;psycho;toxicolog;dermatolog;cardiolog;nurs

生物类:Bio;parasitolog;nutrit;entomolog;metabolism;Anthropo

人文类:Cultur;publi;manage;

market;famil;child;Sociolog

环境类:Water;geographclimat;environ;ecolog;earth;geolog

物理类:material;nano;molecular;physic;nuclear

化学类:Combustion;carbon;oil;chem; tobacco;plastic;algebra;steel;

经济类:Business;econom;financ;invest

农林类:Forest;fish;agr;struct;sphere;geomet

天文类:astronomy;osmos ;solar;Venus;lunar;meteor。3.2软件界面介绍

系统界面如图2所示。点击“选择”按钮调取需要处理的Excel文件,可自定义关键字(系统有默认关键字,同时支持自定义填写),勾选需查询的领域,系统会在自定义筛选的基础上重新删除明显与该领域无关的论文,界面中設有进度条,可以显示数据处理情况,方便使用者获得数据处理进度。点击开始按钮,进行筛选。

猜你喜欢
数据处理
验证动量守恒定律实验数据处理初探
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
ADS-B数据处理中心的设计与实现
MATLAB在化学工程与工艺实验数据处理中的应用
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
大数据处理中基于热感知的能源冷却技术
Matlab在密立根油滴实验数据处理中的应用
我国首个“突发事件基础数据处理标准”发布