用人工智能设计的深假蛋白质将针对水污染物
如果您曾经使用过像Craiyon或DALL-E这样的基于文本的人工智能图像生成器,那么您只需几个单词提示就知道AI工具可以创建既逼真又完全合成的图像。
为此类网站提供支持的机器学习将扫描互联网上的数百万张图像,分析它们并将它们的各个方面组装成新鲜但虚假的图像。
现在,堪萨斯大学的研究人员正在努力使用类似的机器学习过程来构建用于检测水污染物的新蛋白质。一位KU研究人员计划使用机器学习来创建“深假”膜β-桶蛋白——一类自然成功的生物传感器——旨在检测水中的污染金属离子。
“这些β桶非常有用,因为它们可以将东西穿过膜,”首席研究员、KU分子生物科学副教授JoannaSlusky说。“桶可以制造很好的酶——桶可以做很多不同的事情。”
以前对管状β桶的研究已经改变了它们在各种任务中的结合特性。然而,这项工作大部分是艰巨的,并且是手工完成的,通常会导致有限数量的支架或桶结构的微小变化。
“在这种情况下,我们正在使用机器学习来生成大量的桶,”Slusky说。“但是,如果我们既能生产桶又能让它们有用呢?我们问自己,‘桶的生物技术应用是什么?嗯,一种可能是金属传感器,它或许可以检测金属污染物。”
Slusky和她的联合首席研究员、以色列海法大学的RachelKolodny教授和MargaritaOsadchy教授(以及KU博士后研究员DanielMontezano)将开发一种新的机器学习过程,该过程可以生成带有类似于自然界中的支架的beta桶,但序列不同。
“有一个网站叫‘这个X不存在’,”Slusky说。“如果你去那个网站,你会看到所有这些人工智能生成的东西,而人并不真正存在。但是一台计算机制作了一张图像,例如,一只猫。但这并不是一只真正的猫——一台计算机拍摄了一堆猫的照片,然后说,“好吧,我们现在可以生成你想要的尽可能多的猫照片,因为我们知道什么是猫。”我们需要做一些真实的事情,这样我们才能看到它更像是生成一个食谱。”
“问题是,如何让计算机生成蛋白质配方。”
Beta桶非常适合通过机器学习进行改进,因为“天然蛋白质在可能的序列数量上只是一个小插曲”。
Slusky说,如果计算机算法能够了解使蛋白质成为蛋白质的本质,它将避免生成无用的序列。
“大多数序列实际上永远不会是蛋白质——它们不会有特定的折叠,”她说。“他们会一次又一次地以一种奇怪的、不可预测的方式与自己结合。要成为一种蛋白质,你需要一个能形成一个形状的序列。当人们试图制造随机序列,甚至是某种定向序列时,他们发现它们中只有非常非常小的一部分可能实际上是蛋白质。”
随着机器学习创造新的和可行的序列导致这种常见的折叠,Slusky和她的同事希望生成一个特别适合在水中寻找金属离子的β桶。这项工作的成果将是基于Beta桶的生物传感器,可以识别水道中的铅等污染物。
“如果我们将它们制成合适的尺寸,这种分子将是放入某些特定金属的理想选择,并且您可以拥有正确的取代基,以便它与该金属结合,”Slusky说。“因为它在膜中,它可以给你某种电导差异——它被结合的时间和不被结合的时间之间存在差异。如果你能做到这一点,你就可以感知不同的金属和不同浓度的“这些金属。我们想要完成很多重大步骤,但我充满希望和兴奋。”
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。