仅次于癌症将成人类第二大杀手,面对抑郁症AI能做些什么?

2020-11-04 17:10:00
刘大牛
转自文章
232

近几年,关于抑郁症自杀的社会新闻层出不穷,让这个在过去一直被大众忽视的疾病逐渐浮出水面。上个月,话题#抑郁症成仅次于癌症的人类第二大杀手#登上微博热搜,大众终于对患抑郁症群体有了较直观的认识:抑郁症属于情感性精神障碍疾病,常伴随焦虑发生。临床体现为“三低”——情绪低落,兴趣减退,动力不足,且持续至少2周以上。抑郁还可能增加某些健康问题的风险,如心脏病。据世卫组织预测,到2020年,抑郁症将代替癌症成为世界第二大疾病,大约有8%的男性和15%的女性在他们的一生中会患上抑郁障碍, 严重影响生活质量, 并且其中有近 15%的人选择了自杀。此外,还有相当多的患者根本没有意识到自己患有抑郁症,更没有进行过诊治。因此, 对抑郁症患者进行早期识别诊断, 并及时给予治疗十分重要。 近几年,人工智能 变得越来越“聪明”,并开始在医疗领域取得一些成果。那么,人工智能 技术能够在治疗抑郁症方面发挥什么作用吗?

一、发病预测

人工智能 技术针对抑郁症的发病预测,目前主要是使用不同的 机器学习 方法,对可以反映抑郁症倾向的因子及各种疾病标志物来做出判断。目前, 应用于抑郁症的 机器学习 算法主要为传统 机器学习 , 如 支持向量机 随机森林 、K-近邻算法、浅层人工 神经网络 等。但近年来随着 深度学习 的发展, 卷积 神经网络 自动编码器 、深度置信网络等开始逐渐被应用于抑郁症研究中。利用 机器学习 建立抑郁症预测模型的基本原理为采集抑郁症风险因素、生物标记物等数据, 然后对这些数据进行预处理得到归一化的数据集, 按一定比例分为训练集和测试集, 利用训练集对 机器学习 算法进行训练, 最后用测试集对模型进行性能评估, 并在验证评估过程中对模型进行不断优化。

机器学习 的优势在于对数据中潜在规律的挖掘。因此, 建立预测模型的第一步是收集数据。目前,研究的数据主要有年龄、性别、药物滥用等社会人口学资料, 临床收集的躯体症状、心理状态资料,医学仪器采集的脑电信号(Electroencephalography, EEG)、脑部核磁共振成像(Magnetic Resonance Imaging, MRI)、眼动数据、心率变异性 参数 等生理信号数据。其中基于脑电信号和脑部核磁共振成像的应用最为广泛, 但是由于MRI等生理信号的采集成本较高, 故研究者们逐渐探索采集成本低却能很好预测抑郁症的数据,比如语音、表情等。

另外,随着科技的进步,采集数据的方式也变得越来越多元化。除了MRI等生理信号的采集,还有包括基于问卷收集调查资料, 通过各类传感器采集健康数据, 从网络平台上获得公开数据等。随着近年来 物联网技术 的发展,使得各种可穿戴设备承载大量的健康信息, 很多研究者将这些数据通过 机器学习 应用于抑郁症领域,包括应用智能手机传感器APP来获取日活动度、睡眠情况、社会交流情况等数据来预测个体的抑郁情况。另外,移动互联网的普及让大量用户通过 Facebook、Twitter 等社交网络平台进行情感表达、日常沟通, 这些数据同样为研究者通过将 自然语言处理 技术、情感分析与 机器学习 结合来对用户的心理健康、情感障碍进行研究提供了机会。

例如2014年,中国科学院心理所计算网络心理实验室负责人朱廷劭发起了心理地图PsyMap项目。PsyMap通过网络爬虫整合微博树洞留言信息后,再通过AI对留言进行分析筛查,最后,再由志愿者对有自杀意向的人进行心理危机干预,试图在他们走向终结之前挽救生命。从2017年正式上线至2019年10月,心理地图PsyMap共计给4222人发送了干预私信;2018年,由荷兰阿姆斯特丹自由大学 人工智能 系教授黄智生开启了“树洞计划”。树洞计划寻找濒临危险的抑郁症患者的 逻辑 跟心理地图相差不大,都是利用AI进行筛查、分级,而后介入。但树洞计划的自杀危险程度分级更为明确,十级为最高级,即自杀正在开始;九级则是有明确的自杀计划。随后几级以悲观厌世的程度依次递减,在6级以下,志愿者一般不会直接介入。黄智生表示,运用 知识图谱 技术,AI机器人可通过监控留言分析一个人的情绪。几乎每个月,救援团都能救回50条生命,一年时间里,救援团阻止了约800次自杀。

不需要挖掘社交平台上的数据,而是借助了 计算机视觉 机器学习 的方法也能用来预测抑郁症指标。2017年,由哈佛大学和佛蒙特大学共同主导的一个项目以166位 Instagram 用户为研究样本,共分析了他们分享在平台上的43,950张照片,其中71张涉及患有抑郁症病史。据研究人员发表在EPJ Data Science上的论文显示,他们使用了 机器学习 工具成功识别出抑郁症的标志,并使用颜色分析、元数据组件和面部检测算法,从43,950张Instagram 照片中计算提取统计特征,而每张照片的色调、亮度以及使用的滤镜都是其重要的分析维度。研究结果表明,患有抑郁倾向的用户更倾向于发布更多照片,且颜色多为蓝色、灰色和深色;其次,他们使用的滤镜也更少;另外,患有抑郁倾向的用户也更喜欢发布人脸特写照片,但与健康的用户相比,其分享的每张照片出现的人脸数量更少。这可能表明,抑郁症患者更喜欢在小范围的社交环境中和人交往。同时,研究结果还表明, 在利用机器学习 分析了这些照片得到的模型之后,所得模型的表现优于普通医师诊断抑郁症的平均成功率。

除了采集语音、文字、图像等数据进行研究, 机器学习 与神经影像结合也取得了一定进展。一项研究将ML与MRI相结合预测抑郁症的发作,通过采集33名10~15岁少女各脑区的灰质、皮质厚度数据,采用 支持向量机 技术预测5年内抑郁症发作概率,总体 准确率 达到70%(敏感性69%,特异性70%。而韩国有研究者使用 随机森林 模型发现,家庭关系、社会关系和家庭收入的满意度对于构建抑郁症发病风险的预测模型很重要,说明使用调查数据预测抑郁症的未来发作有潜力。

总之,针对抑郁症的发病预测,目前主要是使用不同的ML方法对生理、行为数据进行分析。当前,此类研究还处于尝试阶段,未正式投入临床应用,但已显示出巨大潜力,未来可为抑郁症的一级预防提供支持。

二、早期识别

早期的抑郁症状很容易与单纯的情绪低落相混淆,不易被察觉,导致患者错失治疗的最佳时机。现阶段研究主要方向是将ML方法与脑电、语音信息、手机使用行为、可穿戴设备采集的信息以及文本自动分析技术相结合,对抑郁症人群进行早期识别。

例如2016年,南加州大学的研究人员开发了一款 机器学习 工具,它能够检测出某些语言相关的诊断标准,来评估患者的抑郁症情况。这款工具名为SimSensei,它在医生问诊过程中监听患者语言表达过程中的心理和神经性紊乱异常状况,这些异常很难被问诊者所察觉。研究者表示:“我们评估了253位实验对象的自动评估元音空间,证明了新的检测手段检测到抑郁症和创伤后应激障碍患者的元音空间有显著减小。我们证明了在测试部分交互或数量有限的语音数据时,新技术是健壮的,印证了该方法的实用性。最后,我们成功地显示了该测试结果在不同个体和不同发音速率上的统计鲁棒性。”

2017年,来自 IBM 的计算精神病学和神经成像研究小组团队开始尝试利用 机器学习 预测人患精神疾病的风险。该项目以 2015 年发表的研究作为基础,通过对 59 名普通人的语言方式追踪、分析,并对语言连贯性进行评分,确定潜在患病风险。59 位参与者在随后两年中,有 19 名出现了精神障碍,而 AI 预测的精确度达到 83%,这背后的判断依据,是 AI 技术发现处于精神疾病风险的人在说话时使用了较少的所有格代词,并且连贯句子较少,这可能是精神疾病的一部分前兆。不过,关于对于语言的分析是否能够适用于所有语种,以及不同病症是否会有不同的语言倾向,有待进一步研究。

2018年,斯坦福大学 人工智能 实验室与视觉实验室负责人 李飞飞 带领团队公布一种基于 机器学习 的抑郁症症状严重程度测量方法,该方法使用了视频、音频和文本数据集,以及因果 卷积 神经网络 模型,通过表情和语音诊断一个人是否患了抑郁症, 准确率 超过80%。不仅如此,该模型还能部署到手机上,从而让更多的人能够进行诊断。值得一提的是,这项研究成果还入选了NIPS NeurIPS 2018医疗健康 机器学习 (ML4H)Workshop。

在抑郁症群体中,儿童是一个比较特殊的存在。据统计,大多数自闭症儿童的父母都是在孩子出生后1到3年才发现孩子的变化,在美国,这个年龄中位数为4.3岁。但是,大量研究表明,在综合征完全显现之前,进行早期干预可以降低ASD的严重程度,并改善儿童的大脑和行为发育。有没有一种方法可以缩短儿童出现症状到确诊中间的时间差呢?

2020年,一家位于加利福尼亚的公司推出一种新的自闭症谱系障碍(ASD)诊断工具Cognoa,它能在出现相关迹象的几周内做出ASD诊断,远快于当前的标准。Cognoa的技术来自斯坦福大学医学院儿科学副教授Dennis Wall实验室,依据于父母调查,家庭录像和临床医生问卷等数据。研究者表示,该工具的算法是根据来自数百个不同性别、种族和种族背景的实际案例的数据进行训练的,它不仅可以加快诊断时间,而且可以消除当前系统固有的许多偏差。

最近,该公司在美国各地的14个地点完成了一项关键的双盲临床试验。目前, 关键试验的结果尚未公布, 但该公司表示,此试验“已超过了FDA同意的目标 基准 ”,在性别和种族上都是准确的。另外,这项研究于2019年7月至2020年5月进行,在今年春季新换大流行期间通过远程医疗对部分儿童进行了远程评估。在远程管理上,该工具的性能也一样好。 公司计划在未来几个月内提交完整的研究报告以供发表,不久将正式提交FDA。如果获批成功,Cognoa将成为首个自闭症谱系障碍诊断工具。

目前,AI在抑郁症的早期识别方面取得了可观进展,可以降低人群中抑郁症早期筛查的 假阴性 率,为疾病早期诊断治疗提供更多可能。但同时也存在一定的误诊率,需要临床医师进一步诊断,因此不可完全依赖于AI的分析结果,需视应用场景而定。

三、辅助诊断

目前抑郁症的诊断是以精神科医师的精神检查为主,这虽然无法用技术替代,但为了实现更加客观、高效的诊断,AI技术逐步应用于对抑郁症患者的辅助诊断。其中,ML与MRI技术的结合,可以辅助诊断抑郁症,同时也可以反映抑郁症的严重程度。基于体素- 相关向量机 模型的诊断 准确率 为85%,敏感性为84%,特异性为85%,基于体素-特征形态- 相关向量机 模型的诊断 准确率 为90%,敏感性为93%,特异性为87%,后者虽提高了总体预测准确性,但提升幅度未超过5%。

国内也有研究者利用不同的ML方法,对脑电图、眼动追踪信息、皮肤电数据进行分析,准确度均在65%以上。将这3种模式组合用作分类器的输入,发现通过logistic算法获得的准确度最高为79.6%,在整体上提高了诊断准确性。例如, 望里科技 的AI抑郁评测系统利用脑电、眼动、皮电等信息采集的生理数据,对抑郁症进行客观的评估。通过复杂的数据运算,该系统可以寻找将抑郁症患者与健康人群进行有效区分的计算机模型。通过与 北京大学 第六医院的科研合作,目前 望里科技 的抑郁辅助诊断评估分类 准确率 已达到81%。据悉,未来该系统将拓展到自闭症、精神分裂、老年痴呆、暴力倾向等问题的研究和产品开发。并且, 望里科技 还在上述系统的基础上开发了自杀风险评估系统,这一产品被运用于服刑人员的心理管理,帮助狱警了解并管理服刑人员心理健康状况,达到预防服刑人员自杀的目的。该产品在教育、医疗领域也有应用的潜力。

AI技术也可以用于量表开发,促进情感障碍的高效鉴别诊断。通常,双相情感障碍与抑郁症难以鉴别,有研究者利用 机器学习 的RF模型来优化情感障碍评估量表,进而开发出更为简洁的中文双相情感障碍诊断清单,并将其应用于临床实践,便于对双相情感障碍和抑郁症进行快速有效的鉴别诊断。

四、治疗

1、疗效预测

事实上, 机器学习 在抑郁症诊疗中最突出、普遍的应用之一,就是其在药物治疗结果上的使用。因为抑郁症的发病机制目前仍不清楚,在过去50年抑郁症的药物治疗中,大约有 70%的病人是症状改善,还有30%的抑郁症病人是药物不起作用。如果检索在抑郁症诊疗中应用 机器学习 的期刊就会发现,大部分的论文都将重点放在了精神药物治疗上。 

其中一项著名的研究利用 机器学习 对相关症状进行 聚类 ,随后建立了一个 机器学习 模型来评估几种主要抗抑郁药物的疗效。结果发现了三组症状,并发现研究涉及的几种抗抑郁药的疗效存在统计学上的显著差异。这表明医生在给抑郁症患者开药时,应该根据患者所表现的具体症状对症下药。 

除了对药物疗效进行预测,也可以通过ML方法对物理治疗的疗效进行有效预测。 

2、心理治疗

当前,对于抑郁症的常规治疗方式是以心理治疗为主,药物治疗为辅。而利用 人工智能 技术对患者进行心理治疗,则是通过构建虚拟场景、虚拟人物,结合心理治疗师对抑郁症患者进行认知行为治疗、人际心理治

接受治疗的患者和VR环境的影像

2016年,英国伦敦大学学院等机构研究人员与西班牙同行开展一项研究,让15名年龄在23岁至61岁间的抑郁症患者配戴 虚拟现实 头盔,并通过与 虚拟现实 场景中的虚拟人物互动开展相关治疗。研究人员表示, 虚拟现实 头盔能让患者“代入”一个虚拟化身,在虚拟环境中与其中人物进行互动。试验中,研究人员让患者化身与一个情绪低落的虚拟小孩交流,学会如何向小孩表达同情心。在程序设定下,这个小孩会对患者化身的讲话产生积极反应,逐渐停止哭泣。然后研究人员让患者反过来“代入”到小孩身上,从小孩的视角来观察整个交流过程。每名患者接受3次这样的 虚拟现实 治疗。结果显示,完成疗程的一个月后,有9名患者的症状出现缓解迹象,其中4人的抑郁症严重程度下降十分明显。

借助 虚拟现实 技术开展心理治疗时,还可利用ML算法开发心理智能 聊天机器人 。例如2019年,Flow宣布推出其 聊天机器人 治疗师来治疗抑郁症。该款名为Flow的 聊天机器人 治疗师,每天与用户进行对话,并提供自助技术、情绪跟踪、精选视频、冥想和心理锻炼。它帮助用户了解为什么睡眠、锻炼、营养和冥想是抑郁症康复的主要支柱,并收集情绪数据以行为疗法为模型,提供个性化的反应。

随着 5G 的普及,相信 虚拟现实 技术能够突破硬件条件的限制,在治疗抑郁症方面有更多应用能够落地。尽管这种方式不能取代心理治疗师的角色,但仍提供了一种经济高效的治疗方案,同时也可以作为心理治疗的辅助工具在临床应用。

五、人工智能 技术在抑郁症应用中存在的问题

目前,以抑郁症为代表的精神类疾病大多病因未明,遗传因素、社会心理因素、素质因素都可能与发病有关。业内有一句经典的比喻:现在人类对大脑的认知水平就好比在黑夜的足球场角落点了一支蜡烛。这形象地说明了当下人类认知的困境,而依赖人类输入知识进行判断的 人工智能 自然也受此影响。除此之外,在研究过程中还面临以下问题:

1、样本代表性较差

目前大部分基于 人工智能 对抑郁症诊疗的研究普遍样本量较小,不能很好地反映总体抑郁症人群的特征。如何实现智能手段对疾病的预测、鉴别、诊断、治疗,需要足够的样本数据充分覆盖每个群体的特征进行计算,避免出现由于抽样误差导致的数据偏倚。

2、智能设备相关的伦理问题

智能手机为代表的移动设备虽然为患者带来了诸多好处,但对加强隐私保密措施的研究仍然有限。尽管患者的信息通常是匿名的,但数据重新识别技术仍然对个人信息构成潜在威胁。由于抑郁症患者的特殊性,临床信息的泄漏可能会导致情绪创伤、恶化病情。因此,未来的政策应着重于隐私问题的解决,在数据的有益利用与个人隐私之间取得平衡。 

3、临床应用面临的困难

因临床数据越来越复杂,研究人员必须处理不同类型、不同来源的大数据,如人口数据、图像数据、遗传信息数据、社交网络数据等。临床数据的多样性增加了设计算法和建立推理模型时的复杂程度和困难程度,因此大多数研究仅停留在模型建立等理论基础上,还未将大 数据分析 的成果转化为临床应用。 

而至于AI+精神健康商业化发展,更是有很长的路要走,尤其是目前企业探索的部分诊疗方式正饱受质疑。其中,通过情绪识别来监控情绪并判别心理状态这一做法所受到的质疑最大。因为在高速运转的社会中,饱经规训的人们并不会把情绪明晃晃地写在脸上。为探讨情绪识别算法与真实情感的相关度,美国心理科学协会曾委托五位来自该领域的杰出科学家进行了数据收集和科学证明。最终,五位科学家给出的论文显示,情绪的表达方式多种多样,很难从一组简单的面部运动中可靠地推断出一个人的感受,表情与心情之间没有坚实的科学依据证明有直接关联。这也是为什么微软、谷歌、 IBM 、亚马逊等公司尚未将情绪识别算法投入诊疗市场的原因之一。 

另外,患者的接受度也对 人工智能 的应用提出了考验。无论是心理咨询还是精神科问诊,都要求患者主观上对咨询师/医生充分信任,积极配合治疗。但目前,人类对AI的心理检测接受度普遍不高,这是由于心理检测中涉及很多主观判断,如焦虑、心境低落等等。人类医师具备共情能力,更易被患者认为“听懂了我的话”,而 人工智能 则易被视为“冷冰冰的机器”,难以获得信任。 

所以,很多从业者认为,尽管AI对于抑郁症的诊疗研究,已在影像、智能穿戴、文本识别等方面有了突破,但它应该是最后的防线,而不应该是前线。真正能让抑郁症患者从阴霾中走出来的不是科技,而是有触感的关怀。而对于患者而言,自己的努力也非常重要,毕竟就像鲁迅所说,“人类的悲欢很多并不相通”,再专业的救助也很难做到完全将心比心,最终还是需要靠自己走出来。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业 抑郁症
发表评论
评论通过审核后显示。
文章分类
联系我们
联系人: 透明七彩巨人
Email: weok168@gmail.com