基于Spark的脑卒中医疗大数据服务平台构建研究

2022-03-04 00:18张志洁
科技创新与应用 2022年4期
关键词:服务平台病情医疗

张志洁

(岭南师范学院 计算机与智能教育学院,广东 湛江 524048)

随着人们对健康和生存质量需求的日益提高,脑卒中防治工作逐渐成为全社会关注的焦点。脑卒中是由脑血管病变发展到一定程度导致的,具有较高发病率、致残率和死亡率,已成为当今世界严重危害人类健康和生命安全的重大疾病。在中国卒中协会首次发布的中国卒中报告显示,目前我国脑卒中发生率正以每年8.7%的速度上升,每年死于脑卒中的患者达到130万,脑卒中在我国已成为第一位死亡原因。

近年来,国家相继出台了《“健康中国2030”规划纲要》《国家大数据战略》《“互联网+”行动计划》等相关文件,致力于利用互联网和信息化的优势,解决脑卒中防治热点问题,信息化已成为脑卒中防治工作的重要手段。因此,若能及时采用有效的风险评估工具进行早期脑卒中病情预警,识别高复发风险患者,提高高危患者的风险意识并积极控制危险因素,对降低脑卒中复发率、致残率和死亡率有重大意义。

大数据技术作为一种有效的信息化技术手段,在多源异构医疗大数据的存储和处理分析中能够发挥重要的效用,已成为国内外研究者们关注的重点方向之一。目前,已构建了基于Hadoop的医疗辅助诊断系统、医疗康复推荐系统,基于Spark的高血压药物推荐平台、卫生统计系统、医疗实时数据分析平台,基于大数据的医院临床知识系统等,在如何对多源异构医疗大数据进行存储、处理方面进行了广泛探讨。

本课题结合Spark技术,构建新型的脑卒中医疗大数据服务平台,并以此为基础建立脑卒中预防模型,结合机器学习算法对脑卒中高风险患者进行早期、准确、快速识别,旨为脑卒中疾病的早期预警、复发防控、风险评估提供技术和方法学支撑,拟从以下3个方面开展研究:基于数据驱动的脑卒中特征选择;脑卒中服务平台的系统功能设计;构建脑卒中服务平台的关键技术。以上各部分内容在逻辑上依次联系,从而构成一个有机整体,如图1所示。

图1 脑卒中服务平台架构图

1 基于数据驱动的脑卒中特征选择

近年来随着大数据时代的到来,医疗领域中的大数据源出现了指数级别的增长,可以看作是医疗数据的爆炸式增长模式,在各种医疗服务平台中使用大数据进行分析有助于对用户的病情进行准确决策,有助于辅助医生进行诊断和资料方案的制定。

医疗大数据的来源丰富,数据格式多元化,常见的数据来源有居民健康档案及基本公共卫生、健康体检、临床诊疗、健康/疾病检测、健康保险和可穿戴设备等。这些数据内容多样化,包含有姓名、年龄、住址、电话等隐私信息,面诊过程中病患的身体状况、医疗检测、影像等信息和个体健康信息等。仅一个社区医院累积的数据量就可达数万亿字节甚至数千万亿字节(PB)之多。因此,如何在合理的时间内达到撷取、管理并整合这些数据,使之能快速成为能够帮助医生或者用户进行更积极治疗或决策是亟待解决的问题。

本课题依据数据挖掘技术的知识体系,针对脑卒中医疗大数据的多层次、多粒度、参数关联复杂等特点,采用合适的数据挖掘方法对大规模数据进行深入分析和挖掘,将用户的医疗数据进行分步式处理。首先,采用随机森林算法对采集到的数据进行缺失值填充,随机森林算法收敛速度快、精度高,能有效对大规模原始数据集进行高效处理;其次,采用高斯函数对异构的数据进行数据融合,使得原始数据集中的异构数据能有效进行整合;最后,采用熵值法从原始数据集中筛选出高价值数据属性,使得后期的数据分析和挖掘更精准、快捷。通过对大规模多源异构数据的有效预处理和特征选择,可获得核心脑卒中医疗数据集,为服务平台的后续数据挖掘提供支撑,有助于为用户提供精准的医疗服务和决策。

2 脑卒中服务平台的系统功能设计

现有的多数医疗服务平台的功能都存在需要改进的地方,比如:如何让用户方便快捷地了解自身健康情况,如何让用户在平台中获得精准的医学治疗方案建议,如何为用户推荐适合其需求的服务等。

为解决目前医疗服务平台存在的难点问题,满足脑卒中患者的需求,节约患者就医时间,解决脑卒中患者“看病难”的问题,需设计新型的脑卒中服务平台,其具有特色鲜明的各种功能。首先,依托互联网,使得用户可以随时随地了解自身健康状况,快速锁定具体病情发展趋势,清晰知晓自身病情状况。其次,医生也可通过此平台及时获知用户病情发展特点,对治疗方案进行应对调整;最后,通过对用户病情风险的预测结果和对用户偏好的分析,并结合用户当前地理位置信息,为用户提供合理的个性化推荐,推荐适合该用户病情特点的医院及医生,缩短就医时间和流程,在一定程度上为他们的就医提供适当的导向,提升患者的就医效率。同时,根据用户疾病特点和用户喜好,为用户推荐个性化的健康生活常识和医学知识,以帮助用户提升自我意识,主动积极地缓解病情,促进生活质量的提高。

3 脑卒中服务平台的关键技术研究

在脑卒中医疗大数据服务平台的构建中,设计基于Hadoop技术的分布式并行处理架构,它由实现数据分析的MapReduce计算框架和实现数据存储的分布式文件系统(HDFS)有机结合组成,此平台可对海量医疗数据进行高效存储、处理,并将区块链技术应用于存储层中,既能保证数据的安全性和一致性,也能保证计算效率,提高数据质量,以形成数据格式统一的分布式数据存储仓库,并为后续数据挖掘和分析提供支撑。

基于前期的数据存储、预处理后,采用机器学习算法对医疗大规模数据进行深入分析和挖掘,发现数据内在机理、剖析数据蕴含趋势。首先,采用神经网络算法对核心高维数据集进行分析和挖掘,对用户患病风险进行预测,以对脑卒中患者进行早期、准确、快速地识别,神经网络算法运行速度快、精度高,已广泛成功运用于多领域,能高效地为脑卒中疾病的早期预警、复发防控、风险评估提供强有力的技术支撑;其次,基于神经网络算法的预测结果和数据属性的各自权值,深入分析引发病情风险的重要因素,为疾病的有效预防和治疗提供指引和参照;第三,采用协同过滤方法,结合用户病情风险预测结果、用户偏好、用户当前地理位置等信息,为用户推荐合适的就医医院医生,为用户及时就医提供支撑。同时,结合用户病情分类结果和就医情况信息等,采用决策树算法为用户进行个性化健康生活方案和康复、预防方案的推荐,作为用户生活中的健康助手以提升用户的医学防护意识,将患病风险转化成积极有效的二级预防干预,有效提升患者生存质量。

4 结束语

结合前人的研究,为补全医疗信息化行业的缺口,满足脑卒中患者的需求,在现今的医疗服务平台已有的功能的基础上,结合大数据技术及机器学习算法,构建脑卒中服务平台,为脑卒中的患者提供诊前风险预测和个性化医疗信息推荐功能。通过采用缺血性脑卒中最新诊断标准,对用户脑卒中进行准确地诊前风险预测,帮助用户快速锁定具体患病风险,提前了解自身健康状况,便于用户及时就医。并且,根据脑卒中风险预测结果、用户需求等,为用户就医流程进行合理推荐,为用户进行个性化健康生活方案和康复、预防方案进行科学推荐,有利于用户有效就医引导,提高就医效率,帮助患者在日常生活中快速便捷地获取健康生活知识,缓解病情。有效推动医疗信息服务的理念从“面向集体”向“面向个体”转变,打造个性化和私人化贴身服务,帮助患者提高生活质量,提升智慧生活品质,推进医疗信息领域的创新发展。

猜你喜欢
服务平台病情医疗
打造一体化汽车服务平台
不戒烟糖友病情更难控制
低GI饮食模式或能显著改善糖尿病病情
江苏省一体化在线交通运输政务服务平台构建
论基于云的电子政务服务平台构建
基于云计算的民航公共信息服务平台
血清TSH对乳头状甲状腺微小癌患者病情的影响
京张医疗联合的成功之路
我们怎样理解医疗创新
医疗扶贫至关重要