Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

联邦学习最新医疗场景发布,同济大学刘琦教授团队与微众银行杨强教授AI团队合作打破药物数据共享壁垒

近日,国内AI场景应用再次取得重要成果。来自同济大学生物信息系的刘琦教授课题组与微众银行杨强教授AI团队合作,通过联邦学习来进行本地药物隐私数据的保障,以及模拟多个制药机构(用户)之间的药物协同开发,助力制药机构在保障自身药物数据隐私安全的前提下进行协同药物发现。

该成果已发表在生物信息学领域著名期刊《Bioinformatics》上,题为《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》,首次探索了应用联邦学习进行协同药物开发的可行性,并提出了一种基于联邦学习的协同药物定量构效原型系统FL-QSAR。

图:联邦学习流程图定量构效模型是药物设计领域的经典模型,可用于对于药物分子结构和分子活性之间关系的建模和预测。生命科学领域尝试通过经典的加密计算手段来进行生物和药物数据的共享和建模,然而随着世界各国提出了一系列法律法规(如欧盟的GDPR,美国的CCPA)来保护数据的私密性和安全性,要求数据不能出本地或跨域,传统数据共享方法将面临新的法律法规的挑战。

联邦学习是近年提出的一种新的合法链接数据孤岛进行数据共享计算的协作范式,由谷歌和杨强教授团队分别在to C和to B场景率先提出。相比于传统数据加密共享方法,联邦学习基于数据可用不可见的理念,通过聚合所有用户的加密模型参数,在数据不出本地的情况下进行模型协同训练,能够更好的面对数据共享领域出现的新的问题和法律法规约束。

联邦学习在金融等领域已获得广泛关注,但是在药物研发及生物计算领域尚未有所应用。制药领域普遍对于数据不出本地进行共享有着强烈需求,迫切需要探索联邦学习在该领域的应用。本次微众银行AI团队和同济大学的合作项目,是联邦学习在药物研发领域首次应用探索。

项目首次在药物小分子领域探索使用联邦学习范式进行药物协同开发的可行性,结合微众银行的联邦学习开源平台FATE,开发了基于联邦学习的协作药物发现平台FL-QSAR。研究团队通过对于包含了15个药靶的QSAR 基准数据来构建深度学习模型,进行QSAR建模以及多制药机构(多用户)环境下的协同药物开发模拟,模拟结果证明:(1)多用户通过FL-QSAR进行协同QSAR建模,将显著优于单用户仅使用其私有数据进行QSAR建模,(2)通过特定的模型优化,FL-QSAR可以在保护药物小分子结构隐私的前提条件下,获得与直接整合多用户小分子数据进行QSAR建模相同或者类似的模型预测效果。

同济大学与微众银行AI团队在这项产学研协同中,尝试去解决传统药物领域的上述“顽疾”——即不同的制药机构之间可以通过数据共享来提高QSAR建模预测的准确率,然而该领域的知识产权和相关的经济利益不利于制药机构之间进行数据的直接共享和合作。通过在药物小分子领域探索使用联邦学习范式进行药物协同开发的可行性,结合微众银行的联邦学习开源平台FATE, FL-QSAR可以在保护药物小分子结构隐私的前提条件下,获得与直接整合多用户小分子数据进行QSAR建模相同或者类似的模型预测效果。

这是一种有效的药物协同发现的解决方案,打破了传统QSAR建模时不同制药机构之间的数据无法直接共享的壁垒,有助于在隐私保护的前提条件下进行协同药物发现,并适合于推广和应用到生物医学隐私计算的其他相关领域。该研究成果得到国家重大研究与发展计划、国家自然科学基金项目、上海市自然科学基金项目、上海市人工智能标准专项项目等基金的资助。

从全球来看,AI产业化进入深水区,近日谷歌AI团队DeepMind所研究的AlphaFold 算法在生物学领域也取得了重要突破,在此算法下,可通过蛋白质的氨基酸序列高精度地确定其3D结构。AI与生物医学的密切结合将推进人类健康事业的发展与探索进入新的阶段,多位业界专家纷纷表态,称“AI将改变生物学”,而联邦学习等新技术的加入将从隐私保护等伦理道德层面为探索之路保驾护航。


论文详情:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958

产业联邦学习
相关数据
杨强人物

杨强现任香港科技大学新明工程学讲席教授、计算机科学和工程学系主任,大数据研究所所长 。他是人工智能研究的国际专家和领军人物,在学术界和工业界做出了杰出的服务和贡献,尤其近些年为中国人工智能(AI)和数据挖掘(KDD)的发展起了重要引导和推动作用。

联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

同济大学机构
推荐文章
暂无评论
暂无评论~