UML 在取用水数据稽核中的应用

2018-01-02 08:30宋佳星
水利信息化 2017年6期
关键词:取水量字段用水

宋佳星 ,张 华 ,万 毅

(1. 华北电力大学可再生能源学院,北京 102206;2. 水利部水资源管理中心,北京 100053)

UML 在取用水数据稽核中的应用

宋佳星1,张 华1,万 毅2

(1. 华北电力大学可再生能源学院,北京 102206;2. 水利部水资源管理中心,北京 100053)

由于国家水资源监控平台可能存在取用水数据不一致和不可靠的问题,为提高数据质量,实现取用水数据的完整性和一致性,运用 UML 建立取用水数据稽核系统,挖掘取用水数据库表中隐含的阈值和字段关系,为取用水的异常数据提供数据稽核的方法;通过静态和动态建模支持稽核系统的数据分析,实现逐步提升取用水数据的数据质量;通过建立用例图、类图和活动图,确定用户和数据库之间的交互关系,展示取用水数据的内容属性,并实现系统中取用水数据的可视化和一致性检测。

UML;国家水资源监控平台;取用水;数据稽核

0 引言

国家水资源监控平台作为全新的信息化成果,由于数据采集源头的差异,导致数据集成效果不佳,可能出现大量的错漏数据,使统计分析结果不一致。为探索解决这些问题的方法,采用数据稽核模型进行数据的检验和处理。通过数据稽核建模可大大提高数据的准确性,使高质量的数据更全面、更合理、更及时地为水资源管理乃至整个水利行业提供有效支撑,为抗洪减灾、水资源管理、水生态保护和水土保持等提供重要手段和技术保障。

Unified Modeling Language(UML)又称统一或标准建模语言,它是一个支持模型化和软件系统开发的图形化语言,为软件开发的所有阶段提供模型化和可视化支持,表达软件设计中的静态和动态信息[1]。国家水资源监控平台作为对水资源开发利用、用水效率和水功能区限制纳污等控制管理的监控体系,拥有多个数据库,其中包含基础、业务和监测等数据库。以 UML 用例图、类图和活动图,以业务数据库的“年度取水计划基本信息表”“年度取水计划农业取水申请信息表”和“年度取水计划生活取水申请信息表”为例,建立取用水数据稽核系统,实现取用水数据的可视化,为实现数据的完整性和一致性检验功能提供方法,提高了数据质量和安全,为国家水资源监控平台的高效运行和管理提供技术支撑。

1 取用水数据稽核系统的需求分析

国家水资源监控平台数据稽核系统包含取用水类、水质类等子系统。取用水数据稽核系统作为稽核系统的子系统,为国家水资源监控平台数据的奇异性检测和数据质量的优化提供了重要方法。系统需要对录入的取用水数据进行分析,找出错误和异常数据,实现对错误和异常数据的反馈,从而提高数据的质量和正确性。

在用 UML 进行需求分析时,建立数据稽核系统的用例图,描述系统对取用水数据内容、规格、阈值、字段关系的功能,实现对取用水的数据输入、查询、校核和可视化的系统行为[2],确定国家水资源监控平台的使用人员和数据稽核系统的交互作用。

利用 UML 的表示方法将系统描述成一系列的参与者和用例[3],从而为取用水数据系统分析阶段的分析模型建立奠定基础,如图 1 所示。

图 1 数据稽核系统用例图

1)参与者。在国家水资源监控平台数据稽核系统中,参与者包括水资源管理的使用人员、应用系统、数据库系统等。

2)用例。用例是描述所开发数据稽核系统的功能需求。包括取用水数据的录入、查询、阈值,以及表内和表间字段关系、表间字段关系数据的一致性检查和可视化。

2 取用水数据稽核的静态建模

取用水数据稽核系统的需求提出阶段产生了系统规格和功能的说明,在分析阶段需要对取用水数据库表进行构建,形成一个准确、完整、一致、可检验的系统。以业务数据库的“年度取水计划基本信息表”“年度取水计划农业取水申请信息表”和“年度取水计划生活取水申请信息表”为例,在已有数据内容和库表的关联关系基础上,运用类图描述库表的阈值、属性和字段间隐含的关系。

对象类静态结构模型描述了系统的静态结构,包括构成系统的类和对象、属性、操作及这些对象类之间的关系。类图的基本结构为类图名、属性区、操作区 3 个部分,如图 2 所示[4]。通过类图反映水利数据稽核系统数据库表中的信息及其相互关系。现以“年度取水计划基本信息表”为例,如图 3所示。

图 2 类图基本结构

“年度取水计划基本信息表”作为一个基类,实现了其与“年度取水计划生活取水申请信息表”和“年度取水计划农业取水申请信息表”之间的联系[5]。其中“年度取水计划农业取水申请信息表”和“年度取水计划生活取水申请信息表”为“年度取水计划基本信息表”的子表。在 UML 类图中 “年度取水计划基本信息表”和“年度取水计划农业取水申请信息表”与“年度取水计划生活取水申请信息表”之间的关联关系通过用带菱形的实线表示,其中头部指向整体。

在“年度取水计划基本信息表”中,属性区描述了表内的基本信息和数据类型。其中主要包括“申请年取水量”“其中批复地下水取水量”“其中地下水取水量”和“批复年取水量”等,并对数值型字段的数据格式做了定义,为提高数据质量提供了基本规则。

“年度取水计划基本信息表”中,操作区分别描述了表内数据的阈值、表内字段关系和表间字段关系。具体如下:

1)对表内数值型字段的阈值做了规定,并用“-”代表字段是表的私有属性。例如:“-申请年取水量”阈值范围为 0~1 140 000 万m3,表示“申请年取水量”作为表内字段,其最小值为 0 m3,最大值为 1 140 000 万m3,通过对“申请年取水量”“其中批复地下水取水量”“其中地下水取水量”和“批复年取水量”阈值进行设定,可以初步筛选出错误数据。

2)描述表内字段关系,即表内数值型字段之间所隐含的关系,并用“-”代表字段关系是表内私有属性。例如:“-申请年取水量 ≥ 年批复取水量”。表内字段关系继续细化数据的基本规则。通过表内字段关系,可以筛选出冲突数据。

3)确定表间字段关系,即表间数值型字段之间所隐含的关系,并用“+”代表字段关系是表间共有属性。“批复年取水量”不仅和“其中批复地下水取水量”之间存在表内字段关系,而且和“年度取水计划生活取水申请信息表”之间的字段存在表间字段关系。其表间字段关系表示为:“+ 批复年取水量 ≥ 年取水量”。通过表间字段关系的建立,旨在进行表间字段数据的一致性检验,以进一步提高数据的质量。

图 3 年度取水计划基本信息表类图示意图

结合国家水资源监控平台中库表数据的录入和输出类型,分别对操作区数据阈值和字段关系的返回值进行定义。例如:“年度取水计划生活取水申请信息表”中“设计灌溉面积”为双精度数据;“年度取水计划基本信息表”中的表内和表间字段关系为布尔型数据。

“年度取水计划基本信息表”中表间字段关系的字段索引,通过端口的索引字段查询字段所在表。同时也可以直接展示“年度取水计划基本信息表”中存在表间字段关系的字段。

3 取用水数据稽核的动态建模

对象动态结构模型描述了系统的动态行为,它们指明了系统如何响应外部的事件,涉及系统中对象的执行顺序和状态变化,侧重于系统控制逻辑的描述[6]。以数据稽核系统中“年度取水计划基本信息表”为例,建立 UML 活动图,如图 4 所示。

以“年度取水计划基本信息表”中“批复年取水量”字段为例,“批复年取水量”数据在输入后首先进行数据格式验证;在数据满足要求的情况下才能进行字段阈值验证,当“批复年取水量”字段阈值在[0,1 140 000] 之间时,说明数据正常,否则数据报错。

图 4 取用水数据稽核系统活动图

字段阈值验证完成之后需要进行表内字段关系验证,即验证字段“批复年取水量”是否满足“批复年取水量 ≥ 其中批复地下水取水量”;在验证表间字段关系“批复年取水量 ≥ 年取水量”时需要对字段分别进行索引,找到“年取水量”所在表:“年度取水计划生活取水申请信息表”。“年取水量”字段经过验证数据格式、阈值、表间字段关系后,可以保证跨表字段“年取水量”的数据正确性。通过表间数据关系的一致性检验,最后将较高质量的数据归入数据库。

由于基础、业务和监测等数据库中表内容的差异,部分表不存在表内和表间字段关系,故经过字段阈值验证完成后可以直接归入数据库。

4 结语

本文以国家水资源监控平台“年度取水计划基本信息表”为例,运用 UML 进行数据稽核系统的建模。可得出以下结论:

1)运用 UML 对国家水资源监控平台的系统需求和数据稽核工作进行需求分析,可以明确系统数据的需求。实现参与者与数据库之间进行数据录入、查询和可视化的交互功能及通过数据阈值、表内字段关系、表间字段关系、表间字段关系的数据一致性检验完成高质量数据入库。

2)UML 的类图表达形式,可以全面的表达各个数据库表的数据内容,其中包括隐含在字段之间的关系和阈值。通过建立表字段的阈值和字段间的运算与逻辑关系,实现对数据精度和质量的控制,确保数据的完整性和一致性,提高数据的安全性和可靠性。

3)UML 的动态建模描述了取用水数据稽核系统如何逐步提高数据质量和精度的过程,通过对数据格式、数据阈值、表内字段关系和表间字段关系验证。最终,将具有高精度和准确度的数据归入到数据库,为国家水资源监控平台的高效运行和管理提供技术支撑。

[1] 翟亚红,杨艳霞. UML 建模技术的研究与应用[J]. 科技创业,2010 (4): 156-158.

[2] 杨扬. 基于 UML 的水利数据服务平台建模研究[D]. 南京:河海大学计算机及信息工程学院,2003: 30-46.

[3] 赵艳平. 基于 UML 的水利数据服务平台建模[J]. 安徽水利水电职业技术学院学报,2006,6 (4): 61-64.

[4] THOMAS R, GENEST D, LOISEAU S. A useful logical semantics of UML for querying and checking UML class diagram[EB/OL].[2017-04-10].https://www.researchgate.net/publication/221539758.

[5] 王建军,王先甲,郑振浩. 基于 UML 的水电勘测设计院的设计过程管理系统[J]. 人民长江,2006,37 (11): 112-114.

[6] EFIIZONJ L, INFDRMATIKA T, WAN W K, et al. Formalization of UML class diagram using description logics[R]. Informalion Techndogy, 2010,3: 1168-1173.

Application of UML in water fetching data audits

SONG Jiaxing1, ZHANG Hua1, WAN Yi2
(1. School of Renewable Energy, North China Electric Power University, Beijing 102206, China;2. Water Resource Management Center, Ministry of Water Resources, Beijing 100053, China)

National water resources monitoring platform has inconsistent and unreliable water fetching data. In

order to solve the problem, UML is used to improve the quality of data and came true integrity and consistency of water fetching data have come true. It helps to establish the water data fetching audit system, excavate the hidden threshold and fi eld relationships in the water database table. UML provides a method for data audit of the abnormal water fetching data, supports the analysis of audit system through static modeling and dynamic modeling of the data and improves data quality of water data gradually. By the establishment of using case diagram, class diagram and activity diagram, the interaction between the user and the database can be determined. It also shows the water content attribute data which realizes the visualization of water data in the system and consistency test.

UML; national water resources monitoring platform; water fetching; data audit

TP312;TV213

A

1674-9405(2017)06-0033-04

10.19364/j.1674-9405.2017.06.006

2017-05-19

国家自然科学基金项目(50579083);国家重点研发计划(2016YFC0401704)

宋佳星(1991-),男,河北承德人,硕士研究生,研究方向为水资源系统分析、水工水力学。

猜你喜欢
取水量字段用水
哪些火灾不能用水扑灭?
图书馆中文图书编目外包数据质量控制分析
节约洗碗用水
单位耗电量取水量法估算地下水取水量方法初探
2020年氮肥、甲醇行业水效“领跑者”名单发布
南通通州查处暗管偷排企业 正面调查受阻挠 调取水量来突破
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
一次性用水
关于CNMARC的3--字段改革的必要性与可行性研究