自动化加快了对稳定蛋白质的搜索
利用机器人技术和机器智能的力量,普林斯顿工程学院和罗格斯大学的研究人员已经找到了一种在目前最先进技术的一小部分时间内设计稳定蛋白质的方法。该团队的机器人平台将速度提高了十倍以上,他们的计算方法可以比仅靠人类智能更快地找到数周到数年的解决方案。
稳定蛋白质是药物研发、生物燃料生产和塑料回收研究的核心挑战。目前,科学家们利用他们的化学知识来估计哪些化合物将在不同条件下与蛋白质很好地配对。传统方法使用试错法来改进结果。随着科学家们创建和测试分子样本,这种艰苦的方法可能需要几个月的时间,而且通常无济于事。
在新系统中,工程师使用机器学习模型来识别最有可能稳定所需蛋白质的化合物。该模型有助于将数十万种可能性缩小到少数可能的候选人。机器人组装平台产生分子样本以供评估。将机器人平台与机器学习模型相结合只需几天即可获得结果。
这种双涡轮方法提供了一个额外的优势:由于它能够处理大量数据,机器学习模型通常会推荐科学家不会想到的候选分子。
普林斯顿大学化学和生物工程助理教授、该研究的两位资深作者之一迈克尔韦伯说:“就我们可以寻找的增加而言,它几乎是无限的。” “利用机器学习来指导我们的搜索加速了发现,这一速度很难量化,但非常重要。如果你继续依赖系统搜索或试验,你可能会在很长一段时间内旋转你的轮子——和错误。”
在韦伯和罗格斯大学生物医学工程助理教授亚当·戈姆利的带领下,研究人员在《先进材料》杂志上发表了他们的发现。
在开发他们的系统时,该团队转向了三种具有独特特性的蛋白质,其中包括一种在医院和水处理厂广泛使用的辣根中发现的蛋白质。
“如果我们能够解决这三个问题,那么理论上我们可以将相同的程序扩展到各种酶,”韦伯实验室的研究生、新论文的第一作者之一 Roshan Patel 说。
虽然蛋白质在自然界中表现出各种惊人的壮举,但它们往往对自己的工作条件很挑剔。温度变化或暴露于溶剂中可能会阻止它们前进。为了使蛋白质硬化以在其原生环境之外使用,科学家们经常使用专门的支撑材料(例如混凝土中的钢筋)来加固它们,从而使这些脆弱的结构更加坚固。这是实现大量生物医学、环境和其他工业技术的关键一步。
但是找到蛋白质与其支持分子之间的完美匹配意味着优化天文数字的选择。传统的方法很慢,而且在很大程度上是不系统的——想想试错法——这意味着大多数可能的解决方案都未经探索。
对于辣根蛋白,研究人员首先根据传统、直观的方法制造了 500 种不同的支持分子。每个支持物都有一定的潜力使蛋白质抵御恶劣的工业条件,但研究人员并不知道更多。然后,他们测试了 500 个分子中的每一个作为支持,收集有关其性能的真实数据,同时让计算机模型预测他们会发现什么。将预测与调查结果进行比较,使他们能够通过称为强化学习的正强化过程改进计算机模型。
借助新训练的计算机模型,研究人员将搜索范围扩大到超过 50 万个可能的支持分子。每个分子代表一个不同的配方,由数千种不同配置的成分拼凑而成。他们在模型中运行了四次数据,每次都在寻找两件事:表现优于其他领域的分子,或者具有某些有趣品质的分子,可能会使算法更加复杂。
“在第五轮中,”韦伯说,“我们解开了袖口。我们说,好吧,给我们你能找到的最好的 24 个 [分子]。”
与他们使用基于直觉的方法确定的分子相比,新的机器辅助方法发现支持分子对辣根蛋白的作用要好五倍以上。当使用脂肪酶(一种分解体内脂肪的蛋白质)时,结果更加显着。新系统发现了一种支持分子,与最初的选择相比,它的性能提高了大约 50 倍,甚至推动蛋白质在其天然环境之外比在其自然状态下更好地工作。
“你可以对[这些分子]进行很多操作,包括它们底层单元的化学性质、它们的大小、它们的结构、它们的序列,”韦伯说。对于有用的应用程序,“所有这些事情都可能以您可能利用的方式影响属性”。
韦伯说,他们可以通过将机器学习模型与现场物理机器人系统集成来简化流程并进一步加快速度。最初的大部分工作是通过在两个实验室之间来回发送数据来完成的。
他还指出了该团队开始研究的特定应用,在这些应用中寻找稳定蛋白质的分子可能会带来变革性的解决方案:一种回收难以破碎的塑料的新方法和一种非侵入性治疗脊髓损伤的方法。
韦伯说:“有机会进行跟进,更准确地弄清楚这些事情为什么起作用以及它们起作用的条件。”
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。