两年前,将
人工智能
(AI)用于药物研发的初创公司只有
30家左右,而现在这个数目已经飙升到了
148家。这一统计虽然还不完全,但是它反映了AI在药物研发中的迅猛发展。今年,美国著名的硅谷银行(Silicon Vally Bank, SVB)第一次推出了对
数字健康领域的投资统计,在今年上半年,对这一领域的投资已达到52.6亿美元,超过了2017年全年的投资总数,2019年全年投资总数有望超过100亿美元!
可以说,
AI技术的成熟出现在医药产业发展的关键节点上,由于新药物靶点和作用机制越来越少,医药公司需要更多的投入和精力才能产出和以前相当的“first-in-class”药物。克服这一障碍的方法包括提升研发效率,和深耕已有数据来发现新的洞见。AI在这两个方面都可以大展身手。
然而,业界资深人士也表示,在AI迅猛发展的同时,我们需要警醒AI的研究方向是否走偏了。
对AI能力的过度炒作可能会为这一领域带来“AI的冬天”。今天药明康德内容团队将结合公开资料,探讨AI在药物研发中的潜力和局限。
图片来源:Pixabay
理解复杂的规则
给予足够多的数据,
机器学习
算法能够从中发现规律,然后利用这些规律来作出预测或者对新的数据进行分类。它们在这方面的表现远远快于任何人类。当代的药物研发团队面对的挑战是需要系统性地对海量数据进行分析,这些挑战已经不是可以单靠人脑来完成的工作。
AI尤其擅长处理应用复杂的规则对大量数据进行分析。麻省理工学院(MIT)计算机科学家,杨森(Janssen)公司的科学顾问Regina Barzilay博士表示:“例如,当我们在学习化学的时候,我们学习了很多规则并且理解了化学反应的机制,然而有些时候,这些规则非常非常的复杂。
如果我们能够为计算机算法提供很多数据,并且将需要解决的问题正确地呈现出来,它们有可能捕捉到人类无法捕捉到的规律。“
以药物毒性为例,在过去50年里,世界范围内有超过
450款药物在获批上市之后因为毒副作用撤市,其中肝脏毒性是最常见的原因。例如在1993年上市的治疗皮肤真菌感染的特比萘芬(terbinafine)在上市之后被发现可能导致肝脏毒性。截至2008年,已经有3例因为肝功能衰竭而死亡的病例和70例其它肝脏毒性被证明是由于特比萘芬造成的。然而,药物在肝脏中的代谢过程非常复杂,也非常难于预测。
这是
机器学习
可能帮助解决的典型问题,而且我们已经拥有了训练AI的数据。美国联邦政府的Tox21项目,通过美国环保局(EPA)、国家卫生研究院(NIH)和FDA的合作,构建了一个包含大量分子和它们对人类关键性蛋白毒性的
数据库
。这一
数据库
可以被用来训练AI,发现化合物结构、特征和功能与可能出现的毒副作用之间的关系。
名为Cloud Pharmaceuticals的生物技术公司已经将这些数据整合到该公司的化合物筛选过程中。这家公司去年与大型药企葛兰素史克(GSK)达成一项研发合作协议。“使用这一数据集训练
机器学习
算法之后,
当新分子出现时,AI能够预测它是不是会具有毒性。”Cloud公司联合创始人兼首席科学官Shahar Keinan博士说。
除了发现潜在毒性以外,
机器学习
算法还可以预测候选化合物在不同物理和化学环境下的反应,从而帮助药物研发人员理解它们在人体不同组织中的行为。滑铁卢大学(University of Waterloo)的物理化学家Scott Hopkins博士正在与辉瑞(Pfizer)公司合作,训练算法来评估候选分子吸收或者丢失水份的能力。
“如果一个药物分子非常迅速地吸收水份并且不会让水份流失,这意味着这种药物在水中很容易溶解,”Hopkins博士说:“它在胃中会很快溶解并且进入血液循环。”这一算法通过分析89种小分子候选药物结构与可溶性的关系,能够准确预测出类似分子的关键性特征。这项研究已经在
Nature Communications上发表。
对药物潜在毒性和生化特征的筛查虽然是药物开发中不可缺少的步骤,但是
对于AI研究人员来说,在药物研发中的“圣杯”是从头生成一个新治疗性分子的结构。
药明康德的合作伙伴Insilico Medicine公司,正在
使用称为“生成对抗网络
“(generative adversarial network, GAN)来开发全新的小分子化合物,治疗癌症、代谢性疾病和神经退行性疾病等严重疾病。这一算法由两个互相对抗的
深度
神经网络
构成。
第一个
深度
神经网络
的任务是根据一系列化合物应该具有的功能和生化特征标准(例如溶解性、靶点,或者生物利用度),生成分子结构。而另一个
深度
神经网络
的作用是对第一个
神经网络
输出的结构进行“批评“。
“它们之间在相互竞争,“Insilico公司首席执行官Alexander Zhavoronkov博士说:”经过无数次的迭代,它们能够学会生成一些全新的结构。“
Insilico公司计划针对多个孤儿药靶点开发候选药物分子。
人工智能
的局限性
虽然
人工智能
在药物开发领域取得了很大的进步,但是它们还无法取代人类的作用。AI在药物开发中的作用就像一个智能厨房。“你可以有智能微波炉、咖啡机和其它智能工具,但是它们都没法为你做出一道晚餐,“Barzilay博士说:”你需要将这些工具整合在一起来做出一道晚餐,它们只能够帮助你做的更快更好。“
AI的表现受到输入数据质量的限制。在今年的药明康德全球论坛上,业界的专家也表示,
很多时候,用于训练机器学习
算法的高质量数据并不存在。而低质量的数据可能导致算法从数据中获取虚假的信号,导致了“垃圾进,垃圾出“的扩大化。 现今存在的公开数据往往由于格式、代表性等多种原因,无法成为高质量的数据。对于有的AI药物研发公司来说,解决这一难题的办法是自己生成高质量的数据。例如,insitro和Recursion公司都在根据解决特定问题的需求,生成自己的数据。
而对于Gary Marcus博士来说,他的担忧是对
AI能力的过度炒作可能带来与实际不符的期望值。而看看AI开发的历史就可以看到,AI领域的开发已经在1974-1980年,和1987-1994年,经历过了两个发展的“冬天“。由于期望不能够得到实现,AI研究的政府和私人投资都大幅度减少。
▲Gary Marcus博士(图片来源:
Gary Marcus博士个人网站)Gary Marcus博士是纽约大学心理学和
神经科学
教授,也是
机器学习
初创公司Geometric Intelligence的创始人和首席执行官。在他看来,
深度学习
(deep learning)是非常出色的算法工具,然而它相当于一种超级记忆。能够把所有想知道的东西都记下来当然不是件坏事,但是当遇到不常见的情况时,它缺乏灵活性,表现并不算好。
他担心的是,我们过于依赖
深度学习
这一种
人工智能
的构架。
即便深度学习
是一个完美的“锤子”,但是在医药领域需要解决的问题却不全是“钉子”。试图使用一种工具来解决所有问题是不恰当的,面对需要解决的问题的多样性,我们也需要有更为灵活和细致入微的思考方式。基因泰克研发掌门人Michael Varney博士也在日前的
访谈中表现出对
人工智能
过度炒作的忧虑。
虽然业界人士表示,使用
人工智能
在药物研发方面的应用存在着过度的炒作,但是他们仍然对
人工智能
可能带来的可能性非常兴奋。无论是Marcus博士还是Varney博士,都在积极开发和使用
人工智能
工具,协助新药研发的过程。
“
如果能够将药物发现的效率提高5倍到10倍,从经济学角度上讲,研究人员可以探索更具风险的研发项目,因为失败的成本大大降低了。“华盛顿大学(Washington University)的S. Joshua Swamidass博士说。他带领的团队使用
机器学习
,最终在2018年解开了特比萘芬导致肝脏毒性之谜。”想像一下,那样我们可以有能力探索多少种难治疾病的创新疗法!
参考资料
[1] Artificial Intelligence Shakes Up
Drug Discovery
. Retrieved August 24, 2019, from https://www.the-scientist.com/bio-business/artificial-intelligence-shakes-up-drug-discovery-65787
[2] AI startups are racing into drug development. Here’s 5 burning questions about which will survive. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/22/artificial-intelligence-drug-development-startups-growth/
[3] Machine learning brings cell imaging promises into focus. Retrieved August 24, 2019, from https://www.nature.com/articles/d41573-019-00144-2
[4] Bera et al., (2019). Artificial intelligence in digital pathology — new tools for diagnosis and precision oncology. Nature Reviews Clinical Oncology, https://doi.org/10.1038/s41571-019-0252-y
[5] Warning of an AI winter, a skeptic argues deep learning in medicine needs a reboot. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/21/ai-winter-deep-learning-oversold-in-medicine/