从旧年到本年,清华大学汲引张数一和团队连着两个冬天作念出两个“AI+卵白质”效果,它们诀别是极速压缩与智能重建卵白质序列空间的 EvoAI,以及大要 24 小时日夜按捺、全自动进化卵白质的 iAutoEvoLab 工场。有关论文诀别发表于 Nature Methods 和 Nature Chemical Engineering。
EvoAI 和 iAutoEvoLab 的聚拢,酿成了一个闭环:
iAutoEvoLab 不错产生普遍的进化数据,反过来这些数据又能喂养和检会 EvoAI,让其展望能力和遐想能力越来越强。
而更强劲的 EvoAI 又不错结合 iAutoEvoLab 遐想更明智的进化路子和基因回路,已毕卵白质的可编程进化。
以前,这个自动化实验-AI 的闭环,有望买通卵白质序列到复杂功能的黑箱。其中,马梓源和沈达诀别是有关论文的第一作家。

图 | 从左到右:张数一、沈达、马梓源(起头:贵府图)
EvoAI:将海量卵白质压缩进一个锚点百宝箱
当把统共可能的卵白质序列视为一派正式广宽的星空,那么找到那些功能优秀的卵白质,就像是在星河系中寻找合乎人命存在的星球。传统门径要么像使用千里镜同样一个一个地吃力不雅察及实验筛选,要么即是试图使用并不好意思满的星图去作念推算即狡计机展望,这两种门径不仅幽静而且存在谬误。
张数一团队给出的处置决策是:抛开一一扫描的作念法,只需找到那些最亮堂、最具代表性的锚点卵白质就行了。这些锚点即是那些包含了关节功能信息的卵白质变体。惟有锚点富裕有代表性,就能描摹出统共这个词高功能卵白质的路子图。
张数一告诉 DeepTech:“咱们的处置想路访佛于图片压缩,即是将关节信息索取并浓缩在更小的尺寸里,无需传递沿路弘远数据,也能保留中枢特征。通过这种极致的压缩,不错高效拿获那些界说卵白质功能景不雅的关节数据点也即是锚点。”

为了高效地找到这些锚点,他们发明了一套名为 EvoScan 的进化扫描门径。这套门径的中枢在于应用了一种会感染细菌的病毒也即是噬菌体行为进化平台,其上承载着那些需要采纳立异的卵白质基因。他们还给这套系统配备了一个基于 CRISPR 的定向突变系统,这么一来就不错对准卵白质基因的特定段落进行突变。
同期,他们还遐想了不同卵白所需要的基因回路(genetic circuit)来行为筛选门径,借此将卵白质功能的蛮横与噬菌体的活命能力平直挂钩。那些功能好的卵白质能让噬菌体已毕普遍繁衍,那些功能差的卵白质则会平直被淘汰。
这让 EvoScan 能像使用探照灯进行分区扫描同样,快速、系统地探索卵白质的各个区域,从而大要找出那些让卵白质功能变强的关节突变点也即是锚点。

为了考证 EvoScan 门径的效果,张数一等东说念主进行了卵白-卵白互相作用、卵白-小分子互相作用、卵白-核酸互相作用等不同场景下的三个实验。
在第一个实验中,他们到手进行了回应突变实验,使得绿色荧光卵白的纳米抗体归附功能,讲明了 EvoScan 的精确定位能力。
在第二个实验中,针对新冠病毒的主卵白酶也即是病毒复制必需的关节卵白质,他们使用两种不同的药物,以耐药性行为筛选压力,借此进行全基因扫描。收尾不仅找到了已知的耐药性突变,还发现了一批从未被报说念过的新耐药位点,况兼这些位点遍布于统共这个词卵白质之中。这进一步讲明了 EvoScan 的全局扫描能力。
在第三个实验中,他们遴荐了一个同源性较低的转录因子卵白质 AmeR。通过遐想多轮的多维扫描路子,从可能的序列空间之中,拿获了 82 个关节的锚点变体。这些变体大多包含了多个突变,功能齐比原始卵白质更强劲。其中,弘扬最佳的一个单突变体 S57R,在细菌和东说念主类细胞中齐变成了愈加高效的基因开关,大要为合成生物学提供优质的零件。
找到 82 个锚点只是第一步。关节在于下一步:何如用这戋戋 82 个点,去代表和重建表面上高达 10^50 的可能性的统共这个词高功能序列空间?
为此,他们聚拢了预检会的卵白质结构模子 GeoFitness 和卵白质谈话模子 ESM-2,使用这 82 个锚点的数据进行检会,教养 AI 解析这些突变之间的复杂的互相作用,即解析一种名为上位性的风景。
收尾骄贵:这个名为 EvoAI 的混杂智能模子,只是凭借 82 个锚点,就关于 AmeR 的序列空间进行了愈加准确的描摹。基于展望模子策画的序列空间,当张数一团队使用 AI 遐想包含 6 个突变的全新卵白质时,统共 10 个由 AI 遐想的卵白质变体功能齐得到了大幅普及,活性提高了 10-38 倍。比较之下,使用传统低维突变数据检会出来的模子,遐想出来的沿路是相较于运转卵白功能更差的卵白质。
经过狡计,AmeR 这个无比弘远的高功能卵白质遐想空间被压缩了 10^48 倍,况兼只用 82 个锚点就大大普及了遐想空间的可读性/可展望性。因此,EvoAI 讲明了卵白质功能景不雅具有极点的可压缩性,为卵白质工程遐想盛开了新纪元的大门。

iAutoEvoLab:24 小时按捺歇的全自动卵白质进化工场
找到了遐想卵白质的智能门径 EvoAI 之后,另一个巨大的挑战摆在眼前:何如将意见快速、大范畴地变为践诺?很多裕如后劲的卵白质,尤其是触及到功能复杂或多结构域交融的卵白质,在待立异的规划功能方面,它们的肇端活性可能极低致使为零,使用传统门径立异它们堪比大海捞针。
于是,张数一团队联袂互助者打造出一个工业级全自动实验室 iAutoEvoLab,它的规划是将卵白质定向进化这个过程,变得像当代化工场活水线同样的高通量、高服从和高可靠性,况兼险些无需东说念主工扰乱。

iAutoEvoLab 交融了硬件、软件与无菌环境:
在它的硬件部分里,触及到一个液体处理职责站,该职责站就像智谋的机械手同样,大要精确地进行样品传代和溶液建设。机械臂在导轨上来往穿梭,将培养板在不同招引之间进走运转。恒温培养箱、助长检测仪和雪柜等各司其职。其还打造一个定制化的歪斜模块,大要让液体革新变得愈加精确。
在它的软件部分里,触及到一个名为 MegaFluent 的软件为止系统,它不仅大要编排复杂的操作经由,还能分析助长检测仪传来的细菌助长数据,把柄设定好的阈值能作念出如下决策:哪个孔该进行赓续培养?哪个孔达到了传代圭臬?该使用多大的稀释比例和药物浓度?通过这些决策其能针对每个实验孔已毕孤苦响应为止。
在它所附带的无菌环境里,头顶的层流罩大要提供洁净的空气,确保在长达数周致使数月的衔接进化过程中,样品不会被耻辱。

光有自动化平台还不够,还需要有一个进化引擎。为此,张数一团队遴荐了基于 OrthoRep 的酵母体内助长偶联衔接定向进化系统。他们评估了多种与酵母助长有关的遴荐鲜艳基因,并遐想了一系列基因回路,将规划卵白质的功能蛮横,平直退换为这些遴荐鲜艳基因的抒发强弱,从而能与酵母细胞的助长景象进行紧紧绑定。
这就像给每一个恭候进化的卵白质设定了一个游戏律例:功能得到立异的,酵母就能活得好和活得长;功能变差或者功能不变的,酵母就会被淘汰。在这种合手续不竭的活命压力之下,进化以自动的容貌开展着。
为了探明它的着实身手,他们挑战了一项高难度任务:立异一个交融卵白 CapT7。如能到手进化则可一次性完成基因转录和 mRNA 加帽,那么将在 mRNA 疫苗坐褥和药物开发中产生巨大应用后劲。但问题在于,领先的交融卵白在酵母里险些检测不到活性,因此这是一个近乎于从零动手的进化清贫。
关联词,iAutoEvoLab 在向上 25 天的时刻里,24 小时不隔断地运行着,并治理着上百个孤苦的进化骄贵。把柄及时助长数据,软件会以动态容貌颐养每个孔中的抗生素浓度和菌液稀释比例,幽静地加猛进化压力。

经过多轮的自动化筛选,他们得到了功能得到权臣提高的变体。通事后续接入自动化衔接流培养安装,进一方式施加极限遴荐压力,他们得到了 CapT7-V14,其在酵母中驱动基因抒发的能力比领先版块提高了 30 倍以上。
iAutoEvoLab 的到手讲明了,即使是从功能险些为零的源流开赴,通过全自动、高通量、可编程的进化,也不错铸造出具有实用价值的卵白质器具,并能将卵白质工程这么一门高度依赖东说念主工教育的期间,升级为圭臬化和范畴化的先进制造。期刊裁剪评价称:“不难联想,这么的平台将在扩大卵白质工程产业范畴方面找到一系列内容应用。”
张数一也示意:“论文发表后,咱们收到了来自多方的轻柔与相干。咱们搭建这一平台的初志,恰是但愿以前它能成为一个通用型器具,使产出的数据缔造在和洽、圭臬化的基础之上。”
参考贵府:
https://www.nature.com/articles/s41592-024-02504-2?sessionid=
运营/排版:何晨龙