联邦学习最新医疗场景发布,同济大学刘琦教授团队与微众银行杨强教授AI团队合作打破药物数据共享壁垒
- 2020-12-17 15:18:00
- 刘大牛 转自文章
- 231
近日,国内AI场景应用再次取得重要成果。来自 同济大学 生物信息系的刘琦教授课题组与微众银行 杨强 教授AI团队合作,通过 联邦学习 来进行本地药物隐私数据的保障,以及模拟多个制药机构(用户)之间的药物协同开发,助力制药机构在保障自身药物数据隐私安全的前提下进行协同药物发现。
该成果已发表在生物信息学领域著名期刊《Bioinformatics》上,题为《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》,首次探索了应用 联邦学习 进行协同药物开发的可行性,并提出了一种基于 联邦学习 的协同药物定量构效原型系统FL-QSAR。
定量构效模型是药物设计领域的经典模型,可用于对于药物分子结构和分子活性之间关系的建模和预测。生命科学领域尝试通过经典的加密计算手段来进行生物和药物数据的共享和建模,然而随着世界各国提出了一系列法律法规(如欧盟的GDPR,美国的CCPA)来保护数据的私密性和安全性,要求数据不能出本地或跨域,传统数据共享方法将面临新的法律法规的挑战。
联邦学习 是近年提出的一种新的合法链接数据孤岛进行数据共享计算的协作范式,由谷歌和 杨强 教授团队分别在to C和to B场景率先提出。相比于传统数据加密共享方法, 联邦学习 基于数据可用不可见的理念,通过聚合所有用户的加密模型参数,在数据不出本地的情况下进行模型协同训练,能够更好的面对数据共享领域出现的新的问题和法律法规约束。
联邦学习 在金融等领域已获得广泛关注,但是在药物研发及生物计算领域尚未有所应用。制药领域普遍对于数据不出本地进行共享有着强烈需求,迫切需要探索 联邦学习 在该领域的应用。本次微众银行AI团队和 同济大学 的合作项目,是 联邦学习 在药物研发领域首次应用探索。
项目首次在药物小分子领域探索使用 联邦学习 范式进行药物协同开发的可行性,结合微众银行的 联邦学习 开源平台 FATE,开发了基于 联邦学习 的协作药物发现平台FL-QSAR。研究团队通过对于包含了15个药靶的QSAR 基准数据来构建深度学习模型,进行QSAR建模以及多制药机构(多用户)环境下的协同药物开发模拟,模拟结果证明:(1)多用户通过FL-QSAR进行协同QSAR建模,将显著优于单用户仅使用其私有数据进行QSAR建模,(2)通过特定的模型优化,FL-QSAR可以在保护药物小分子结构隐私的前提条件下,获得与直接整合多用户小分子数据进行QSAR建模相同或者类似的模型预测效果。
同济大学 与微众银行AI团队在这项产学研协同中,尝试去解决传统药物领域的上述“顽疾”——即不同的制药机构之间可以通过数据共享来提高QSAR建模预测的准确率,然而该领域的知识产权和相关的经济利益不利于制药机构之间进行数据的直接共享和合作。通过在药物小分子领域探索使用 联邦学习 范式进行药物协同开发的可行性,结合微众银行的 联邦学习 开源平台FATE, FL-QSAR可以在保护药物小分子结构隐私的前提条件下,获得与直接整合多用户小分子数据进行QSAR建模相同或者类似的模型预测效果。
这是一种有效的药物协同发现的解决方案,打破了传统QSAR建模时不同制药机构之间的数据无法直接共享的壁垒,有助于在隐私保护的前提条件下进行协同药物发现,并适合于推广和应用到生物医学隐私计算的其他相关领域。该研究成果得到国家重大研究与发展计划、国家自然科学基金项目、上海市自然科学基金项目、上海市人工智能标准专项项目等基金的资助。
从全球来看,AI产业化进入深水区,近日谷歌AI团队DeepMind所研究的AlphaFold 算法在生物学领域也取得了重要突破,在此算法下,可通过蛋白质的氨基酸序列高精度地确定其3D结构。AI与生物医学的密切结合将推进人类健康事业的发展与探索进入新的阶段,多位业界专家纷纷表态,称“AI将改变生物学”,而 联邦学习 等新技术的加入将从隐私保护等伦理道德层面为探索之路保驾护航。
论文详情:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |