在生物技术和制药行业,微生物被用于各种治疗药物,如抗生素和疫苗的生产。微生物在工业制造中用于生产丙酮、酒精、甘油、二氧化碳、丁醇、乳酸、味精、乙酸、柠檬酸、葡萄糖酸和生物燃料等产品。当前,微生物生理学的一项主要挑战是:确定「细胞生长与细胞分裂」调控和协调的基本原理。东京大学的研究团队利用机器学习来预测生长和分裂过程中的单细胞大小;这一进展可能改善用于制药和发酵产品工业制造的微生物的预测和控制手段。该研究以「Representation and inference of size control laws by neural-network-aided point processes」为题,发布于2021年7月8日出版的《PHYSICAL REVIEW RESEARCH》杂志。过去,人们利用物理学和数学已经建立了许多细胞生长和分裂的模型。常见模型,往往使用连续时间随机过程,其中单个细胞以可变速率生长和分裂。然而,这些模型对于高维数据通常不太有效,因为它们往往受到公式中固有的过度简化假设的限制。
高维数据在生命科学基础研究、制药和生物工程行业中是固有的存在,并且非常常见。产生高维数据的过程实例包括预测药物反应性、癌症分类、基因表达微阵列、细胞信号、结构预测、质谱、高通量筛选(HTS)分析、DNA微阵列和生物标记物选择等。
除了高维数据之外,使用现有模型进行细胞生长和分裂预测的另一个挑战是,生物数据可能表现出超出简单模型解释能力的高度变异。一种常见的解决方法是将其捕获为概率分布(例如高斯分布,也称为正态分布)中的「噪声」。但是,这些模型可能无法产生最准确的结果。为了解决这些挑战,科学家们通过调整神经网络 (NN) 来应用人工智能深度学习,该神经网络最初用于依赖历史的时间点过程来确定细胞大小的调节。微流体装置、参数定义以及大肠杆菌细胞的生长情况示意图。(来源:论文)AI 模型设计可以扩展为额外的变量,例如基因表达、细胞大小和分裂间隔,以获得高维历史信息(各代细胞的生长分裂信息等),从而能够对细胞分裂有更多的了解。研究人员表示:与其他基于 RNN 的模型相比,Fully NN 模型具有更好的性能;该模型可以在有史以来最小密集尺度上预测「细胞分裂前」和「细胞分裂后」细胞的大小;细胞分裂后的分布形状因之前的细胞生长情况而异;神经网络通过数据去噪,可以使加法器原理更加突出。同时研究人员发现,潜在关系可能无法通过简单的描述性方法恰当地表示。即便如此,NN仍然适用于具有不同大小控制机制的各类微生物。大肠杆菌在37℃下的条件概率密度函数(PDFs)的实际观察轨迹和介质,以及细胞大小。(来源:论文)通过「灵活地表示确定性关系」和「噪声分布的函数形式」,神经网络可以有效地将历史相关的确定性因素和无法解释的噪声从给定数据中分离出来。科学家们指出,「通过使用该方法,我们表示并推断细菌与裂变酵母的——出生细胞和分裂细胞的大小分布。」研究人员报告说:「这些结果表明,NN方法是一种极其强大的工具;可以将决定因素和随机因素与测量数据进行半自动分离;它可以作为传统建模方法的补充方法进一步发展。」通过将人工智能深神经网络的创新信息技术应用于复杂的生物功能,科学家开发出这种强大的工具,从而将信号与噪声分离;这可能有助于加速未来的新发现。论文链接:https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.3.033032相关报道:https://www.psychologytoday.com/ca/blog/the-future-brain/202107/ai-predicts-cell-growth-may-accelerate-life-sciences