研究人员利用人工智能语言工具实现解码分子运动

2020-10-13 14:54   来源: 互联网

通过将自然语言处理工具应用于蛋白质分子的运动,马里兰大学的科学家们发明了一种抽象语言,描述蛋白质分子如何和何时可以具有多种形状,以及它们如何和何时从一种形状过渡到另一种形状。

研究人员使用人工智能语言工具来解码分子运动

蛋白质分子的功能通常取决于它们的形状和结构,因此了解形状和结构的动态可以为从蛋白质如何工作到疾病起因以及设计靶向药物疗法的所有事物打开大门。这是机器学习算法首次以这种方式应用于生物分子动力学,这一方法的成功也为如何促进人工智能提供了一个洞察力。关于这一工作的一篇研究论文发表于 2020 年 10 月 9 日的 "自然通讯" 上。


在这里,我们展示了在写电子邮件时用来完成句子的人工智能架构,它可以用来揭示活分子的语言,"这篇论文的高级作者、物理科学与技术研究所(UMD) 化学和生物化学副教授 PratyushTiWARY 说。" 我们已经证明,这些分子的运动可以映射到一种抽象语言,人工智能技术可以用来从由此产生的抽象词中产生生物学上真实的故事。


生物分子在周围环境中不断移动,在周围环境中摇摆。它们的形状取决于它们如何折叠和扭曲。它们可能保持在给定的形状上几秒钟或几天,然后突然打开,重新变成其他形状或结构。从一种形状向另一种形状的转变非常类似于逐渐膨胀的缠绕线圈的拉伸。当线圈的不同部分被释放和膨胀时,分子呈现出不同的中间构象。



但从一种形式到另一种形式的转变发生在皮秒(1/1000000000000 秒)或更短的时间内,这使得高功率显微镜和光谱学等实验方法很难准确捕捉膨胀过程,哪些参数影响膨胀,哪些形状是可能的。这些问题的答案构成了一个生物学故事,蒂瓦里的新方法可以揭示这一点。


Tiwari 和他的团队利用牛顿的运动定律(可以预测分子内原子的运动),通过强大的超级计算机(包括 UMD 的 DeepThinght2) 开发统计物理模型来模拟单个分子的形状、运动和轨迹。


然后,他们将这些模型输入机器学习算法,就像 Gmail 在你键入时自动完成句子一样。在这个算法中,模拟被处理成一种语言,在这种语言中,每个分子运动都形成一个字母,它可以与其他动作串在一起,形成单词和句子。通过学习判断哪些形状和运动彼此跟随,哪些不遵循语法和语法规则,该算法可以预测在改变形状时蛋白质的纠缠程度以及沿途采取的各种形式。


为了证明他们的方法的有效性,研究小组将其应用于一种叫做核糖开关的小生物分子中,这是以前用光谱学分析过的。结果表明,核糖开关在拉伸过程中可能采取各种形式,这与光谱学研究的结果非常吻合。

我希望这项技术最重要的用途之一是开发靶向药物,"蒂瓦里说," 你想要的药物效果很好,但你只能把你想要的药物结合起来。" 如果我们能够理解某一特定生物分子的不同形式,我们就能做到这一点,因为我们可以在正确的时间制造只与一种特定形式结合的药物,这种结合只要我们愿意就能持续多久。


这项研究的一个同样重要的部分是理解蒂瓦里和他的团队使用的语言处理系统(通常称为递归神经网络),在这种特殊情况下,理解语言处理系统是一种长期和短期的记忆网络。" 研究人员分析了支持在互联网上学习分子运动语言的数学原理。他们发现,网络使用的逻辑类似于统计物理学中的一个重要概念,即路径熵。考虑到这一点,将来有机会改进递归神经网络。


人们自然会问,人工智能工具的成功背后是否有重要的物理原理。我们在这里发现,这确实是因为人工智能是学习路径熵。现在我们知道了这一点,它打开了更多的杆和齿轮,我们可以调整来做更好的生物人工智能,甚至改进人工智能本身。在任何时候,只要你了解一个复杂的系统,比如人工智能,它就不再是一个黑匣子,而是为你提供了更有效和可靠地使用它的新工具。"。





责任编辑:萤莹香草钟
分享到:
0
【慎重声明】凡本站未注明来源为"5G科技网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!