基于深度学习的蛋白质设计新方法

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

Deep learning for new protein design

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。但这里有个问题。

“蛋白质的搜索空间是巨大的,”华盛顿大学蛋白质设计研究所和霍华德休斯医学研究所的研究科学家布莱恩考文垂说。

他的实验室研究的蛋白质通常由65种氨基酸组成,每个位置有20种不同的氨基酸选择,就有65的20次方次方的结合组合,这个数字比宇宙中原子的估计数量还要大。

考文垂是2023年5月发表在《自然通讯》杂志上的一项研究的合著者。

在这项研究中,他的团队使用深度学习方法在“从头开始”(从头开始)计算蛋白质设计中增强现有的基于能量的物理模型,结果在实验室中验证了将设计的蛋白质与其目标蛋白质结合的成功率提高了10倍。

“我们表明,通过结合深度学习方法来评估氢键形成或疏水相互作用的界面质量,你可以显著改善管道,”研究合著者纳撒尼尔·贝内特(Nathaniel Bennett)说,他是华盛顿大学蛋白质设计研究所的博士后学者。

“这与试图一一列举所有这些能量是相反的,”他补充说。

读者可能熟悉深度学习应用程序的流行示例,例如语言模型ChatGPT或图像生成器DALL-E。

深度学习使用计算机算法从数据模式中分析和推断,对算法进行分层,逐步从原始输入中提取更高级别的特征。在这项研究中,使用深度学习方法来学习蛋白质序列和可能结构的表示的迭代变换,这些变换非常迅速地收敛于非常准确的模型上。

作者开发的深度学习增强的从头蛋白质粘合剂设计协议包括机器学习软件工具AlphaFold 2和由蛋白质设计研究所开发的RoseTTA折叠。

该研究问题非常适合在Frontera上并行化,因为蛋白质设计轨迹彼此独立,这意味着当计算作业运行时,信息不需要在设计轨迹之间传递。

“我们只是拆分了这个问题,其中有200万到600万个设计,并在Frontera的庞大计算资源上并行运行所有这些设计。它上面有大量的CPU节点。我们给每个cpu分配一个设计轨迹,这样我们就可以在可行的时间内完成大量的设计轨迹。”

作者使用RifDock对接程序生成了600万个蛋白质“对接”,或潜在结合的蛋白质结构之间的相互作用,将它们分成大约10万个块,并使用Linux实用程序将每个块分配给Frontera的8000多个计算节点之一。

这10万个码头中的每一个都将被分成100个工作,每个工作有1000个蛋白质。一千个蛋白质进入计算设计软件Rosetta,在那里,这一千个蛋白质首先以十分之一秒的尺度进行筛选,而那些存活下来的蛋白质则以几分钟的尺度进行筛选。

此外,作者使用蛋白质设计研究所开发的软件工具ProteinMPNN,进一步提高了生成蛋白质序列神经网络的计算效率,比以前最好的软件快200倍以上。

他们在建模中使用的数据是酵母表面显示结合数据,所有这些数据都是由蛋白质设计研究所公开收集的。在这个实验中,数万条不同的DNA链被命令编码一种不同的蛋白质,这是科学家们设计的。

然后将DNA与酵母结合,使每个酵母细胞在其表面表达一种设计好的蛋白质。然后将酵母细胞分为结合细胞和不结合细胞。反过来,他们使用人类基因组测序计划的工具来找出哪些DNA有效,哪些DNA无效。

考文垂表示,尽管研究结果表明,设计结构与目标蛋白质结合的成功率提高了10倍,但仍有很长的路要走。

“我们已经上升了一个数量级,但我们还有三个数量级要做。研究的未来是进一步提高成功率,并转向更困难的新目标,”他说。病毒和癌症的t细胞受体就是最好的例子。

改进计算设计的蛋白质的方法是使软件工具更加优化,或者取样更多。

考文垂说:“我们能找到的电脑越大,我们就能制造出越好的蛋白质。我们正在研发未来抗癌药物的工具。我们制造的许多单独的粘合剂可能会成为拯救人们生命的药物。我们正在努力使这些药物变得更好。”

本文来自作者[盼香]投稿,不代表思达普立场,如若转载,请注明出处:https://www.cdstartup.cn/wiki/202505-525.html

(7)

文章推荐

  • 疫情工作怎么开展(谈谈疫情期间如何开展工作)

    防疫工作的手段防疫工作的手段主要包括隔离、检测、疫苗接种和宣传教育。隔离是防疫工作中的重要手段之一。它的核心思想是将感染者或疑似感染者与健康人群分开,以减少病毒的传播机会。隔离措施可以分为居家隔离和集中隔离两种形式。居家隔离适用于轻症患者或疑似患者,要求他们

    2025年05月06日
    0
  • 印度首都婴儿护理中心火灾致7名婴儿遇难

    一名消防官员表示,周六晚上,印度首都新德里一家婴儿护理中心发生火灾,造成7名婴儿死亡。消防官员AtulGarg说,救援人员将12名新生儿从中心运送到附近的医院,但有7人因吸入烟雾而死亡。他补充说,另外五人因吸入烟雾正在接受治疗。

    2025年05月06日
    0
  • 疫情期间怎么扫墓(疫情期间怎么扫墓呢)

    疫情期间清明能不能扫墓清明节是传统的祭祖节日,通常我们会回老家为祖先扫墓,但由于疫情的原因,今年我不能回去给爷爷奶奶扫墓。作为孙女,我可以在自己家里进行象征性的祭奠。不需要到户外烧纸,因为那可能是别有用心的人花钱策动的无理行为。在家里设置灵位牌是一个简单

    2025年05月06日
    0
  • 印度百强上市公司需在24小时内澄清市场传言

    剧情简介从6月1日开始,前100家上市公司必须退出24小时内确认或否认主流媒体的市场谣言。该规定旨在防止信息泄露影响股票估值,增强市场公平。Sebi的新f该框架排除了公司行为的价格波动,确保了所有投资者的公平竞争环境。这一举措加强了市场的诚信,使其对全球投资者更具吸引

    2025年05月06日
    0
  • 疫情期间云什么(疫情期间做什么挣钱?)

    什么是云游玩_云徒步是啥意思云徒步是一个网络流行语,指的是疫情期间由于被封控而无法出门,但又想在家体验徒步的乐趣,于是通过直播等方式远程云体验徒步旅行。在疫情期间,许多人被封控在家,无法进行户外活动和旅行。为了满足人们对户外活动的需求,一些人开始通过直播等方

    2025年05月06日
    0
  • 哈立德·本·穆罕默德·本·扎耶德参加2024年全球公用事业峰会

    阿布扎比,9月17日(ANI/WAM):阿布扎比王储、阿布扎比执行委员会主席SheikhKhaledbinMohamedbinZayedAlNahyan出席了将于9月18日在阿布扎比ADNEC中心举行的2024年世界公用事业大会。他参观了展览,回顾了推

    2025年05月06日
    0
  • 疫情还能爆发吗(疫情还能爆发吗现在)

    新冠又爆发了吗2024是的,2024年新冠病毒仍然存在,但并未形成大规模的爆发。在国内,虽然多省份不再报告新冠病毒感染情况或不再报告具体数字,但部分地区如上海、广东等还在监测和报告新冠感染的具体数字。这些数据表明,新冠病毒并未完全消失。综上所述,虽然2024

    2025年05月06日
    0
  • 竞争监管机构对Alphabet与人工智能公司Anthropic的关系展开调查

      英国竞争与市场管理局(CompetitionandMarketsAuthority)已要求在正式调查之前对这两家人工智能公司之间的合作发表意见。该监管机构确认正在调查谷歌母公司与人工智能公司Anthropic的合作,原因是担心这可能会影响人工智能市场

    2025年05月06日
    0
  • 疫情是什么搞的(疫情是什么来着)

    怎么还搞几年疫情还搞几年疫情的原因是:国际环境的因素,给我们的疫情防控,带来压力,面对疫情,我们一直坚持动态清零,但是国际上很多国家已经选择躺平放弃与疫情做抗争。病毒不断地在变化,应对难度增加。这两个原因导致疫情一直在反反复复,不能完全被消灭,疫情的时间也越

    2025年05月06日
    0
  • 乌克兰借助美制武器攻破俄罗斯关键桥梁,库尔斯克战事加剧

    乌克兰军队使用Himars大炮袭击了俄罗斯库尔斯克地区的一座重要桥梁,切断了俄罗斯军队的一条重要补给线。被攻击的桥梁位于格卢什科沃附近,距离乌克兰边境以北约15英里,距离苏扎以西40英里。乌克兰上周在苏扎发起了首次越境行动。俄罗斯外交部表示,乌克兰使用西

    2025年05月06日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 盼香
    盼香 2025年05月05日

    我是思达普的签约作者“盼香”!

  • 盼香
    盼香 2025年05月05日

    希望本篇文章《基于深度学习的蛋白质设计新方法》能对你有所帮助!

  • 盼香
    盼香 2025年05月05日

    本站[思达普]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 盼香
    盼香 2025年05月05日

    本文概览:理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

    联系我们

    邮件:思达普@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们