谷歌在医疗健康领域的宏伟野心并不是什么秘密。2014 年,Google X 实验室就联合杜克大学、斯坦福大学宣布启动基线研究(Baseline Study)。
在今年 3 月份人机围棋大战爆发前夕,谷歌 DeepMind 人工智能部门也爆出将推出面向医疗行业的 DeepMind Health 人工智能应用。他们表示 DeepMind 已经和 NHS(英国国家医疗服务体系)合作,开发一款名为 Streams 的应用以帮助医院员工监测肾脏疾病患者。
至此,以 DeepMind 为代表的谷歌与 NHS 的合作才走进公共视野。但 New Scientist 获得的一份文档揭示该科技巨头与 NHS 的合作比起所宣称的走得更远。
这份签约于 2015 年 9 月份的文档—— DeepMind 和皇家慈济 NHS 信托(Royal Free NHS Trust)数据共享协议——对该公司目前的工作和其有权获取的敏感数据类型给出了最清晰的描述。
通过皇家慈济 NHS 信托运营的三家伦敦医院(Barnet、Chase Farm 和 the Royal Free),该协议授予了 DeepMind 每年对 160 万患者医疗数据的广泛使用权。 比如,其中包括感染 HIV 病毒(阳性)的人的信息,以及过量吸毒和堕胎的细节信息。这项协议还赋予 DeepMind 对过去五年患者数据的使用权。
DeepMind 虽然在二月份就了宣布了前文提到的与 NHS 的合作。但该协议表明其还有更大的计划。
这是我们第一次听说 DeepMind 获得医院医疗记录的使用权,健康数据隐私组织 MedConfidential 管理者 Sam Smith 说,「这不只是关于肾脏疾病。他们将得到所有数据。」
个人认证信息 /数据, 指确认个人、客户身份的信息。包括:姓名、地址、NHS 证号、图片或视频。其他有助于确认个人身份的信息,比如完整邮编、生日、电话号码、电子邮箱。
此外,该协议明确指出,谷歌不能在其业务的其它部分使用这些数据。这些数据本身将由与谷歌达成协议的第三方存储在英国,而非存储在 DeepMind。DeepMind 也必须在 2017 年 9 月协议到期时删除其所有的数据副本。
需要所有数据
谷歌表示,因为没有肾脏疾病患者的单独数据库,它需要获取所有数据以让 Streams 有效地运行。在一份声明中,皇家慈济 NHS 信托表示其「将按照严格的信息管理规则且仅以直接临床护理为目的向 DeepMind 提供 NHS 的病人的数据。」
尽管如此,一些人仍可能会担忧谷歌所能使用的信息的量。其中包括每天的医院活动日志,例如病人的位置和状态记录——以及谁于何时探望了他们。这些医院也将共享一定的病理学和放射学检查结果数据。
除了接收这种持续的新数据流,DeepMind 还有权获取皇家慈济 NHS 信托托付给二级用户服务(SUS)数据库的历史数据——集中了 NHS 在英国所有医院的治疗记录。其中包括重症监护、事故和急诊部门的数据。
皇家慈济并未回应 New Scientist 关于病人是否可选择退出机制的问题。对于想要退出 SUS 数据收集的病人而言已经有一种方法了,但那并不是一种直接的方式,而且还涉及到向你的全科医生(GP)填写申请。而且退出机制也覆盖不了病人入院、出院和转院的实时数据。
此外,该文件还揭示了 DeepMind 正在开发一个名为 Patient Rescue 的平台,其将为 NHS 信托医院提供数据分析服务。文件显示 Patient Rescue 将使用医院的数据流来开发除了 Streams 之外的其它工具,这些工具可以执行临床数据的实时分析和支持诊断决策。该协议称,这些工具还有一个目标是帮助医务人员遵守英国国家卫生与临床优化研究所(NICE)的准则。
DeepMind 的计划中没有自动化临床决策——例如给予病人何种治疗——但其表示希望通过对医生难以处理的巨量数据做出预测以支持医生的诊断、治疗。
比如,Patient Rescue 通过将新病人的信息与数百万其它病例的数据进行比对,可能预测出他们正处于某种还未表现出症状的疾病的早期阶段。然后医生可以进行测试看预测是否正确。
谷歌拒绝谈论其可能将在 Patient Rescue 平台上开发其它什么工具,比如通过设置人工智能,处理来自数百万病人的巨量数据。但谷歌之前曾表示败血症(英国每年有 31,000 人死于这种疾病)的早期检测可能是未来的一项应用。
DeepMind 正在收集的数据将使其可以预测任何其想要预测的疾病,Smith 说,「DeepMind 想要做的是开发一个能够做预测任何事的通用算法——任何你可以进行测试的事。」
我们已经知道当机器学习与大量高质量的医疗数据结合时,这种事情是可能的。牛津大学计算健康信息学实验室负责人 David Clifton 说他的研究团队已经在牛津大学医院 NHS 信托基金会旗下的四家医院中部署了机器学习工具。他说:「如果你在这些医院中的一家,你就处在我们的东西的监控中。」
预测
这些系统除了检测病人个体的健康,还能关注传染病的爆发。Clifton 及其同事也在使用机器学习处理来自牛津大学医院 NHS 信托基金会的数据。Clifton 说他们可以使用这些数据预测可能发展成双相型精神障碍(bipolar disorder)的人。
开发这些系统不是要取代医生或护士,Clifton 说,「而是关于我们可以如何将医务人员的注意力放到正确的位置上,」他说,「我们一开始在喷气式发动机中做过这样的事。现在的目标是一样的——让人类的专长负责系统中正确的部分。」
我们不必担忧谷歌侵犯病人隐私或滥用这些数据,DeepMind 联合创始人 Demis Hassabis 就读本科时剑桥大学的老师 Ross Anderson 说,事实上,谷歌在保护数据安全和隐私方面上没有不良记录。他说:「如果学习不良健康数据可以帮助他们预测处在风险中的病人,那这就是一个完全合理的赚钱方式。」
对 Anderson 而言,更重要的问题是已经成为世界上最强大公司之一的谷歌,是否应该对健康分析有如此多的控制。Anderson 说:「如果谷歌在为 NHS 提供的一些服务上是垄断的,它就会毁灭 NHS。」
Smith 对 DeepMind 通过这一协议获取的内容有同样的担忧。「这是隐私内容,」他说,「想要获取这些内容只能通过谷歌或皇家慈济。」
「21 世纪,医疗健康将数字化,同时给病人带来巨大的益处。」英国生命科学大臣 George Freeman 说,「但 NHS 的病人需要知道他们的数据会是安全的,而不会被不当地出售或使用,这就是我们已经引入了严格的新措施以保护病人秘密的原因。」
谷歌表示其对 DeepMind 与皇家慈济的合作没有任何商业计划,目前的试验都是免费进行的。但皇家慈济授权给 DeepMind 的数据具有很大的价值。它可能会在明年协议到期之后销毁数据的副本,但这已经给了其足够的时间用于挖掘关于健康的知识。
数据挖掘是机器学习和人工智能的新兴领域内的一项决定性技术,而世界上没有任何其它公司比谷歌做得更好。
互联网霸主:
谷歌向医疗健康领域的进军可能会让其成为反竞争行为指控的目标。而且这不是第一次。
2002 年,一家名为 SearchKing 的公司起诉谷歌,称其在搜索领域的霸主地位给了其超过其它互联网企业的不正当影响。谷歌承认了故意破坏 SearchKing 在搜索引擎中的排名,但仍然赢得了那场官司。
2005 年,谷歌因制作 1000 万本数字图书而被指责。批评者抱怨说谷歌的体量和影响力才促成了与版权持有者的交易,即使有能与之比拟的公司,也少的可怜。
自 2010 年开始,欧盟委员会一直在调查对谷歌反竞争行为的指控。该巨头公司被指控滥用其网络搜索中的主导地位以将用户引导到它的其它产品中,如地图、航班搜索和购物。