大数据人工智能时代中国变应性鼻炎真实世界的研究与思考

2021-08-09 05:38杨钦泰
关键词:变应性搜索引擎鼻炎

杨钦泰

1 中山大学附属第三医院耳鼻咽喉头颈外科、变态反应(过敏)科(广州,510000)

变应性鼻炎发病率快速增加是全球的共同趋势,目前认为城市化和现代化生活方式是导致其快速增加的重要原因。张罗教授研究团队发现,中国最近六年变应性鼻炎患者增加了1 个亿,目前我国至少有3 亿变应性鼻炎患者[1]。科学家们指出,城市化和现代化生活方式让我们人类与大自然在一定程度上实现“自我隔离”,使得感染性疾病减少,但我们的免疫系统因缺乏“锻炼”而失调,导致免疫性疾病(主要是过敏性疾病)快速增加。他们发出警告:这种发展趋势如果得不到有效抑制,再过20年,我们每个人都将不能逃脱过敏性疾病的魔爪。因此,面向“人民生命健康”全民共同防治过敏是对接“国家重大的需求”。

面对日益增多的变应性鼻炎患者,作为医生,你真的了解他们的真实需求吗?大数据显示:“非常不了解”,至少医生和患者双方对变应性鼻炎治疗的认知存在严重偏差。我们医生都非常清楚变应性鼻炎是全身过敏性疾病在上气道的表现,影响患者生活质量,并可能进一步发展成为多系统的过敏性疾病。目前虽然局部糖皮质激素等对症药物治疗或者对因的脱敏治疗对变应性鼻炎有一定疗效,但容易反复发作,根治非常困难,患者需要定期随访并纳入慢病管理。程雷教授团队利用人工智能技术对近年我国互联网用户变应性鼻炎的相关检索信息进行大数据分析,发现我国患者普遍认为变应性鼻炎是小病,到医院看病希望医生用最佳方案或者采用偏方能够一次性根治[2]。其中“变应性鼻炎的最佳治疗方法、变应性鼻炎的治疗偏方、变应性鼻炎怎么样处理好”[2]是互联网上关于变应性鼻炎提问最多的三个问题,这就是真实世界患者的真实需求。然而,当就诊患者得到医生的回应“变应性鼻炎容易反复发作,需要长期规范治疗,目前难于根治等”后,很多患者会根据网络竞价排名等问题而传入不良医疗机构所谓的“根治”,造成了后续诸多不良影响,甚至导致鼻腔不可逆的破坏后果。要提升变应性鼻炎的诊疗质量和水平,是最关键和必要的条件,通过大数据获悉患者的真实需求。

我们正快速步入互联网大数据和人工智能时代,在大数据和人工智能等技术开始全面落地应用之后,这些新技术不仅会对个人信息进行收集、分析和应用,同时对于整个产业领域和社会资源都会进行管理,这是一个明确的发展趋势,简单的说就是“资源数字化”,资源数字化也是智能化的重要基础。

研究发现,日常生活中人们不管是出于善意或是恶意经常会说谎,所以传统的统计调研方法得出的结论一部分可能是错误和偏倚的,有时会误导我们的认知[3]。然而,人们在一种情况下会放下戒备、吐露心声、暴露自己的真实想法,那就是面对互联网[3]。人们面对搜索引擎的时候一定不会说谎,因此,搜索引擎也被称为“数据吐真剂”。在大数据时代进行“小样本”抽样分析已不合时宜,我们需要的是尽可能的全部数据,称为“全样本”。互联网大数据可以达到近乎全样本的功能,由海量的数据形成的真实而庞大的数据可以分析和总结出意想不到的结论和趋势,这些又“大”和又“真”的数据最能接近人们的真实状态。

由中国互联网络信息中心发布的《第47 次中国互联网络发展状况统计报告》显示,截止2020 年12 月,我国网民规模达9.89 亿,其中使用手机上网的比例高达99.7%,即9.86 亿[4]。而我国搜索引擎用户规模达7.70 亿,占网民整体77.8%[4]。同一部门数据显示,百度搜索引擎的用户渗透率排名第一,达90.9%[5],网民在利用互联网寻求医疗信息等场景其使用率为70.5%[5]。可见,在中国,有问题问“度娘”(百度)已经形成一种习惯,“没看病,先上网”已经形成一种趋势,我们应该通过对这种“习惯”和“趋势”的资源数字化来掌握民众的真实需求,而“百度指数”则是一个有力的工具。

目前百度搜索引擎已开放大数据展示平台,百度指数可提供基于百度海量网民检索行为的数据统计和分享,其每天发布特定检索词在全国各省市的搜索量。据此,我们可以获悉关键词的检索趋势、需求图谱、人群画像以及时空分布等。在新冠肺炎疫情期间,我们利用人工智能技术挖掘疾病症状检索关键词的百度指数及中国疾病预防控制中心发布的疫情实时大数据探索了新冠肺炎的症状特征[6]。结果显示疫情期间湖北省民众对下呼吸道症状的检索量较上呼吸道症状明显增多,而且腹泻症状的检索量亦显著升高,与此后多项研究结果相符[6]。此外,百度指数增量与新增确诊数、新增疑似数呈显著正相关[6],提示大数据对于传染性疾病具有一定的趋势性判断和预警的作用。由此可见,网络搜索引擎大数据具有海量性、高速性、多样性、真实性等特征,且成本低、易获取,可有效助力医疗快速发展。

我们最近在“百度指数”平台以“变应性鼻炎”作为检索词,对检索人群属性进行了机器快速聚类分析,获得了百度搜索引擎用户变应性鼻炎的地域分布、时间分布等时空分布特征。首先,我们知道在百度搜索“变应性鼻炎”的人群一般有两种,一种是自己得了变应性鼻炎的人群,另外一种是家人有变应性鼻炎的人群,他们搜索的主要目的是获取疾病知识和寻求解决方案,因此检索人群的所属区域及排名可在一定程度上反映变应性鼻炎在中国各地的分布趋势,即主要分布在东部沿海地区和中部地区(图1)。另外,由于搜索者的普遍特征是有问题即刻搜索,也就是变应性鼻炎发作时才搜索,搜索量和发病情况存在密切相关性,因此,百度指数还能反映变应性鼻炎在不同地区的发病时间分布差异。我们对广东省和全国的百度检索特征进行了比较研究,分析结果显示全国变应性鼻炎的日均百度指数具有明显的季节差异,主要表现为3~5 月及7~9月的两个搜索高峰(图2),这与中国两个花粉季节和季节性变应性鼻炎发病时段重合。然而,广东省的日均百度指数则没有明显的季节差异,只有1~2月的一个相对低谷(图3)。广东省属于南方地区,90%变应性鼻炎患者都是尘螨过敏,花粉过敏相对较少,而1~2 月是该省全年气温最低的季节(平均10℃左右),不具备尘螨生长的适宜气温(25°C 左右),所以尘螨过敏原相对减少,患者病情也相对平稳或者发作减少,自然而然导致搜索量的下降。百度指数的这一搜索趋势提示变应性鼻炎的发病在全国范围与广东省范围存在明显差异,全国范围综合来看变应性鼻炎因花粉季节影响存在季节性的发病高峰,而广东省地区以尘螨为主的常年性发病则相对比较平稳。由此可见,网络搜索引擎大数据可在一定程度上反映真实世界变应性鼻炎的流行趋势,可作为传统流行病学调查手段的一种有力补充。搜索引擎大数据与人工智能技术相辅相成,二者有机结合,能够实现机器快速分析患者需求、热搜指数提前预警及系统支持实时分析等功能,有助于满足新时代疾病精准防控的需求。

图1 全国“变应性鼻炎”百度指数地域分布(省份,2013.7-2020.12)

图2 “变应性鼻炎”全国百度指数走势(2013.7-2020.12)

图3 “变应性鼻炎”广东百度指数走势(2013.7-2020.12)

推特(Twitter)是国外最受欢迎的网络社交平台,澳大利亚学者通过对推特的大数据分析进行花粉监测,并指导季节性变应性鼻炎的预防和用药[7]。一项来自意大利学者的研究报道,利用人工智能进行变应性鼻炎患者鼻分泌物的细胞学检测,灵敏度达97%,准确度达94%,可明显减少显微镜下人工识别的时间和工作强度[8]。国外多国过敏领域专家最近合作建立的变应性鼻炎临床决策支持系统(clinical decision support system, CDSS) 应用程序(app)[9],可协助诊断变应性鼻炎,生成治疗管理方案,指导患者进行自我管理,并协助医生管理患者,为利用大数据和人工智能提高健康管理提供了一个很好的范例[10]。

然而,我们必须清楚大数据和人工智能在实际应用中存在的局限性及其注意事项。

事实上,当前的大数据仍然以“信息孤岛”的形式存在,电商掌握着用户的消费习惯,导航掌握着用户的移动轨迹,各医院的患者诊疗信息互不联通,没有任何一个组织机构能够获取在广度和深度上都足够充分的、完全的数据。此外,目前来自于现实或网络的大数据并不能完全覆盖整个人类社会、达到全样本。例如,我国60 岁及以上人口的比例为18.7%[11],而我国60 岁及以上网络用户的比例仅为6.9%[4],提示网络数据不可避免地会产生一定程度的偏倚。

大数据,顾名思义,其数据体量巨大。此外,其增长速度极其迅猛。然而,大数据研究的权威学者维克托·迈尔·舍恩伯格指出,只有5%的数据是结构化且能适用于传统数据库的。因此,我们必须接受大数据的混杂性,否则剩下95%的非结构化数据都无法得到有效利用。对于我们的临床和科研需求而言,针对一个问题,往往大多数时候并非所有的数据都是适合的,有用的数据仅占其中很小一部分。这就要求我们必须在海量数据中,排除冗余的、无意义的数据,在庞大的噪声中挖掘、采集有用的数据。

由于大数据的客观特性,天然地需要与人工智能结合并进行数据处理。蓬勃发展的人工智能似乎能够满足我们的众多需求,但仍存在着许多障碍和陷阱。曾备受瞩目的IBM Watson Health(沃森健康)人工智能,后来证实它所提出的许多治疗建议实际上是错误的,例如建议在有严重出血的患者中使用贝伐珠单抗[12]。这说明有缺陷的算法可能对患者造成重大伤害,从而导致医疗事故。人工智能运用算法解析大量数据,不断学习,找到输入和输出之间的“关系”,然后对新的输入进行判断和预测。然而,数字人工智能的算法就像一个“黑匣子”,可能输出让人无法理解的结果。因此,当人工智能被运用到临床前,需要不断地调试、审核、模拟、验证以及进行前瞻性研究。

总而言之,大数据为人工智能提供了源源不断的燃料,而人工智能则持续推进大数据应用深化,让原本海量数据实现价值。二者紧密联合、相辅相成,从而获取对疾病更精确、更深层的认识,也是变应性鼻炎真实世界研究的重要武器。医务工作者在临床诊疗过程中必须更加重视患者的真实需求,利用大数据及人工智能对变应性鼻炎患者进行针对性的科普宣教,协助诊断及治疗决策,加强指导患者的管理,使变应性鼻炎患者获得科学的诊断和防治。然而,在实践过程中,我们必须清楚大数据、人工智能的局限性以及数据隐私等注意事项。

猜你喜欢
变应性搜索引擎鼻炎
自拟苍玉君子汤结合针刺治疗肺脾气虚兼风寒型变应性鼻炎的经验分享
生物制剂治疗变应性支气管肺曲霉菌病的研究进展
脑梗死合并变应性支气管肺曲霉病行呼吸康复的探讨
Chrome 99 Canary恢复可移除预置搜索引擎选项
万物复苏话过敏性鼻炎
过敏性鼻炎的治疗方法
自发性脑脊液鼻漏误诊变应性鼻炎一例
世界表情符号日
滴香油治过敏性鼻炎
基于Lucene搜索引擎的研究