分布式数据库在金融应用场景中的探索与实践分析

2019-10-21 11:17高清阔孙勇
科学与财富 2019年31期
关键词:应用场景分布式数据库

高清阔 孙勇

摘 要:网络金融持续发展,对金融业数据库方面要求日益提升,迫切需要具备高可用性、可扩展性、高性能的数据库系统。鉴于此,本文主要围绕着在金融行业应用场景当中分布式的数据库应用探索及实践,望能够为相关专家及学者对这一课题的深入研究提供有价值的参考或者依据。

关键词:分布式;数据库;金融;应用场景;

1、系统整体框架

1.1 框架

分布式的数据库(CBASE),整个系统框架以四个系统功能模块为主,即为集群管理、事务处理、数据存储、SQL处理。集群管理,管理集群全部服务器、副本与数据分布;事务处理,相应各种更新操作、更新存储系统内部增量数据;数据存储,储集群基准的数据;SQL处理,接受、解析用户端SQL的请求,经语法、词法分析、查询优化各项操作,发送至数据存储或者事务处理的节点来执行。

1.2 关键性的技术模块

①写性能方面的优化

CBASE的设计,可实现读写相互分离的一种系统框架,对读或者写负载有所不同,予以分别优化处理。针对未修改数据,通过普通的PC服务装置,实现存储操作,处理大量数据扩展管理方面的问题。更新的热点数据被存储至内存较大的事务处理节点,事务处理的节点内存达相应大小后,能手动或自动冻结数据,并将其存储至固态的硬盘内部,以定期合并形式把数据分散地存储至静态的数据节点内部。通过这一设计,可维持系统的可扩展性,且对事务处理的请求有着高吞吐量。多数事务处理均无需跨越相应事务处理的节点,可借助事务处理增加节点这一手段将系统整体处理能力提升。针对少量分布形式的事务,仅经优化两个阶段,便可将降低事务的延迟提交。事务处理的节点,通过大容量的内存数据,规避掉传统的数据库内集中式锁管理装置,改用轻量级别多版本、行锁并发的控制协议、混合存储的介质存储相应日志等各项科学技术,系统整体能力得以有效提升。

②高可用性能

CBASE当中实现分布式的选举协议状态转换,属于不确定性的有限自动装置。阶段角色会伴随选举实随时变换。某个节点在刚刚启动或者从故障当中恢复,角色处于备节点状态,会设定时装置。若此节点已接收主节点所发送更新的日志,定时装置会重置,角色处于恒定不变状态。反之,则定时器在超时之后,认为集群未存在有效主节点,此节点便会转变成候选者,并准备竞争成全新主节点。候选者会向其余节点传输投票的请求,有三种情况,即为获取到多数节点的投票节点属于主节点;受到更新的日志信息,证明集群当中主节点已存现,候选者们可转变其备节点;若选举已超时,则需重新发起新一轮的选举。节点逐渐成为了主节点过后,会向其备节点来发送相应更新日志,将其余节点定时器予以重组处理。

③分布式的事务

事务处理,属于支撑着金融业应用一项关键的科学技术,可保证业务数据一致与完整。大型的银行应用不但要满足数据库方面系统完整度要求,还应具备着网络级并的事务方面处理能力。金融业务内部系统的事务处理实际应用特点是,通过CBASE来实现支撑着高通量的事务处理分布式的一种数据库综合系统,相比原有集中式的数据库,CBASE并不需要用户设计及维护分库的分表规则,该系统能自动化结合主键,把数据合理划分成不同事务的处理节点,业务逻辑及数据存储的解耦合即可实现,开发及维护方面的难度系数得以有效降低,资源线得以扩展,且集群解决了I/O上限方面现实问题。CBASE分布式的事务引擎具体实现期间,通过两阶段的提交优化处理,事务可保证有着一致性方面特征。无故障期间,可轻松实现此协议。若有故障问题出现,比如网络故障、信息丢失等等,通过超时动作便可避免进程无限性的阻塞,协议实现后,进程会阻塞每步骤,且均会加入相应超时动作。处于最坏情况之下,执行两个阶段的提交协议,期间可能会有多次的服务器或者通信故障问题出现,导致参与者无法较长时间的停留至不确定的状态中,即为未解决事务。而同分布式的数据库,便能够恢复持久存储的信息内容对象值,若参与者为不可用状态,则可等待着数据库的管理技术员加以干预或处理.

2、实践应用

2.1 查询历史数据

伴随着时间逐步推移及业务持续发展,各企业内部历史数据的查询系统均面临着历史数据信息量持续增长、系统框架当中传统的数据库已无法满足于快速增加的数据量现实需求。金融业历史数据有着较广的涵盖范围,如交行历史数据的查询系统,内含主机、账务、贷记卡等业务系统所有历史数据,对数据库自身扩展性方面有著极高的要求,以能够充分满足于业务量现实需求。除了历史数据方面存储,查询历史数据系统还应当向外部提供着联机事务检索与各种新增业务服务等,缓解其余在线业务历史数据的管理压力,以至于对数据库快速响应着联机检索服务方面有着极高的要求与标准。历史数据的查询系统,要求该数据库应当具备着较高的可扩展性、可靠性、高性能等,且该分布式的数据库还应当充分满足于各方面现实标准与要求。经大量测试与评估分析后,交行历史数据库的综合系统内采用了CBASE,现阶段系统整体的数据量可达上百个TB,每日均超1个TB,且有持续增长这一变化趋势。大并发检索条件下,检索相应的时间可维持毫秒级别范围。经多年稳定运行可充分表明自主研发分布式的数据库在金融领域中应用切实可行。

2.2 贷记卡专项授权系统的并发处理

信用卡相关业务不断纵深向的发展及客户量持续增长,以至于交易量极具攀升,对于贷记卡的授权系统在线升级更新、持续高效、7*24h的稳定化交易服务方面更为迫切。伴随网络金融出现与广泛应用,支付宝相关电商双11的网购促销均引起交易呈爆发式的增长,系统负担逐渐加重,传统的数据库迎来了空前绝后的、史无前例的发展挑战,原有系统资源已无法满足现实需求,数据库整个系统自身潜在各项性能发展瓶颈。那么,为确保贷记卡的授权系统稳定,将系统总体处理能力提升,基于原有系统框架,借助CBASE分流处理高并发的业务所形成系统压力。以CBASE为基础新一代的贷记卡专项授权系统基本特征如下:高并发的处理能力,可高峰每秒处理事务量达上万;弹性的扩展能力,整个系统处理的能力能实现快速弹性的扩容处理;高可用性,能够确保业务系统维持7*24h以内在线服务,分流高并发时主机的压力。在银行各个关键系统的试点期间,CBASE框架已逐步成型,各项功能得以逐步完善化,可靠性与各项性能均得以增强,已向着产品化的方向发展着,所取得经济与社会方面的效益较为显著。以某商业银行为例,通过采用了以CBASE为基础新一代的贷记卡专项授权系统后,构建起了数据库在授权系统,通过采集海量信息,存储主数据库内,依据不同信息安全等级,对不同用户进行分级别授权,以更好地保护用户信息,增强以CBASE为基础新一代的贷记卡专项授权系统整体安全系数。

3、结语

通过以上分析论述之后我们对于金融行业应用场景当中分布式的数据库应用情况,均能够有了更加深入地认识及了解。从总体上来分析,分布式的数据库具备着强大的应用优势,今后为能够更好地将其应用至金融行业的应用场景当中,便还需相关技术员结合实际情况,加以分析与研究,持续优化与完善该分布式的数据库,以便于其充分发挥效用科学应用至金融行业各种应用场景中,为金融行业发展注入力量。

参考文献:

[1]张文升.分布式数据库Greenplum研究与应用[J].金融科技时代,2017,19(06):444-446.

猜你喜欢
应用场景分布式数据库
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
数据库
室内外布线用新型光缆技术规范应用研究
数据库
数据库
数据库
物联网关键技术与应用
基于DDS的分布式三维协同仿真研究
西门子 分布式I/O Simatic ET 200AL