人工智能遇上生物设计巴塞罗那科学家破解细胞身份的奥秘

2025-06-16 03:06

  

人工智能遇上生物设计巴塞罗那科学家破解细胞身份的奥秘

  在未来,你的身体将拥有像“金刚狼”罗根那样的自愈因子——伤口以肉眼可见的速度愈合,断裂的组织瞬间重生。

  这种近乎神迹的能力背后,隐藏着一个生物学的基本核心问题:身体如何精准地指挥新生细胞,让它们知道自己应该变成什么?是皮肤细胞覆盖创口,是血管细胞重建通道,还是那些氧气运输者、免疫卫士和凝血专家的血液细胞来恢复至关重要的内部平衡?

  来自巴塞罗那基因组调控中心的科学家们,在拉尔斯·韦尔滕教授的带领下,就如同破解了金刚狼体内那套指令系统的简化版。他们成功揭示了血液细胞——我们体内不断更新、种类繁多的居民——是如何精准选择自己命运的终极身份:是成为红血细胞、白血细胞,还是血小板?

  这项研究就像是为细胞世界绘制了一张详细的“职业指南地图,不仅解释了血液细胞如何选择自己的命运,更重要的是,研究团队还学会了如何人工设计这样的指导手册,让细胞按照我们的意愿发育成特定的类型。这个发现对于治疗血液疾病、癌症,甚至是再生医学都具有革命性的意义。

  要理解细胞如何选择自己的命运,我们首先需要认识一群特殊的指挥官——转录因子。如果把细胞比作一个复杂的工厂,那么转录因子就像是工厂里的管理层,它们决定着哪些生产线应该开工,哪些应该停工。

  但是这里有一个令人困惑的现象:在血液干细胞分化的过程中,这些指挥官们似乎并不遵循我们预期的规律。按理说,如果一个细胞要变成红血细胞,那么负责红血细胞生产的指挥官应该大量出现,而负责其他细胞类型的指挥官应该消失。但实际情况却完全不同。

  研究团队通过先进的单细胞测序技术发现了一个令人惊讶的事实:在血液干细胞分化的整个过程中,几乎所有的转录因子都在同时存在,它们的表达水平只是呈现出渐变的分布,就像是一幅彩色渐变图。这就好比一个工厂里,所有部门的经理都在同时上班,只是有些人声音大一点,有些人声音小一点。

  这个发现让科学家们陷入了深思:如果所有的指挥官都在场,那么细胞是如何做出精确的命运选择的呢?为什么在这种混乱的会议中,细胞还能准确地知道自己应该成为什么?

  为了解答这个谜题,研究团队将目光投向了基因调控的另一个关键角色——增强子序列。如果说转录因子是指挥官,那么增强子序列就像是会议室,转录因子需要在这些特殊的DNA片段上结合,才能发挥调控基因表达的作用。

  传统的研究方法就像是通过观察已建成的建筑来推测建筑师的设计原理,虽然能获得一些信息,但很难理解其中的根本规律。研究团队采用了一种全新的策略:他们决定从零开始,像乐高积木一样,人工拼装不同的增强子序列,然后观察这些人造“会议室如何影响细胞的行为。

  这种方法的巧妙之处在于,研究人员可以精确控制每一个组件。他们就像是在进行一场大规模的烹饪实验,每次只改变一种配料的种类或分量,然后品尝最终的味道。通过这种方式,他们可以准确地知道每种配料(转录因子结合位点)对最终“菜品(基因表达)的具体影响。

  研究团队总共设计了64,400个不同的人工增强子序列,这个数字听起来可能很抽象,但如果把它比作食谱的话,相当于创造了六万多种不同的料理配方。每个配方都仔细记录了使用的“调料种类、分量、搭配方式,甚至是“调料之间的摆放距离。

  当研究团队开始测试这些人工制造的增强子序列时,他们发现了一个完全出乎意料的现象。在传统的认知中,转录因子通常被简单地分为两类:激活因子(促进基因表达)和抑制因子(抑制基因表达),就像是好人和坏人一样界限分明。

  但实验结果显示,现实远比这种简单的二分法复杂得多。研究团队发现,同一个转录因子在不同的情况下可能表现出完全相反的行为。就像是一个平时乐于助人的好邻居,在某些特定情况下可能会变得不那么友善。

  更加令人惊讶的是,两个单独时都表现良好的激活因子,当它们聚在一起时,竟然会变成抑制因子。这就好比两个单独时都很和善的朋友,一旦碰面却会产生化学反应,变得暴躁起来。具体来说,研究团队发现了Fli1-Spi1和Cebpa-Gata2这两对组合,它们单独存在时都能促进基因表达,但一旦结合在一起,却会强烈抑制基因的活动。

  这种现象被研究团队称为组合对偶性。它揭示了一个重要的生物学原理:细胞并不是简单地通过增加或减少某个转录因子的数量来调控基因,而是通过精妙的搭配组合来实现精准控制。

  研究团队的进一步实验揭示了另一个令人着迷的现象:转录因子之间的相互作用不仅取决于它们的身份,还与它们在DNA上的相对位置密切相关。这就像是跳交际舞一样,舞伴之间的距离会直接影响舞蹈的效果。

  以Fli1和Spi1这对舞伴为例,当它们在DNA上靠得很近时(间隔只有几个碱基对),它们会产生强烈的抑制效果,就像两个人贴得太近反而互相妨碍。但当它们保持适当距离时,这种抑制效果就会减弱或消失,各自都能正常发挥作用。

  为了理解这种现象的分子机制,研究团队使用了最先进的蛋白质结构预测技术。他们发现,当Fli1和Spi1距离很近时,Fli1蛋白会与Spi1蛋白的一个特殊区域(转录激活域)发生物理接触,就像一个人的手臂意外地挡住了另一个人的嘴巴,阻止了正常的说话(转录激活)功能。

  这个发现让研究团队意识到,细胞基因调控的精妙程度远超想象。每个转录因子结合位点的位置都经过了精确的设计,就像一个精密的机械表,每个齿轮的位置都不能有丝毫偏差。

  通过大量的实验和数据分析,研究团队逐渐理解了细胞如何利用这些复杂的相互作用来做出精确的命运选择。关键在于一个看似简单但实际上极其精妙的机制:浓度比例感应。

  想象一下你在调制鸡尾酒,最终的味道不仅取决于每种酒的质量,更取决于它们之间的比例关系。细胞也是如此,它们会品尝不同转录因子的浓度比例,然后据此决定激活哪些基因。

  研究团队设计了一系列特殊的实验来验证这个假设。他们制造了含有不同数量Fli1和Spi1结合位点的人工增强子,就像调制不同配比的鸡尾酒一样。结果发现,只有当两种转录因子的结合位点数量大致相等时,增强子才会表现出抑制活性。如果其中一种占据明显优势,增强子就会恢复激活功能。

  这个机制的生物学意义非常深远。在血液干细胞分化的过程中,不同细胞类型会表达不同水平的Fli1和Spi1。当细胞发育成某个特定类型时,这两个转录因子的表达比例会发生变化,从而导致相关增强子从抑制状态转换为激活状态,或者相反。

  通过这种方式,细胞就能够感知自己当前的发育状态,并相应地调整基因表达程序。这就像是一个智能的导航系统,能够根据当前位置自动选择最合适的路线。

  掌握了这些基本规律后,研究团队开始尝试一个更加雄心勃勃的目标:能否像工程师设计电路一样,人工设计具有特定功能的基因调控元件?

  为了实现这个目标,他们引入了深度学习技术。研究团队训练了一个人工智能模型,就像教一个学生学习烹饪一样。他们把所有的实验数据——包括增强子序列的配方和对应的味道(基因表达活性)——都输入给这个AI学生。

  经过大量的学习和训练,这个AI模型逐渐掌握了基因调控的烹饪技巧。它能够根据输入的增强子序列,准确预测这个序列在不同细胞类型中的表达活性。更令人兴奋的是,这个模型还能够反向工作:给定一个期望的表达模式,它能够设计出相应的增强子序列。

  研究团队用这个AI模型进行了一次雄心勃勃的测试。他们设计了64个不同的订单,每个订单都要求在特定的细胞类型中激活基因,而在其他细胞类型中保持沉默。这就像是要求一个厨师制作64道不同的菜,每道菜都只能让特定的食客喜欢,而让其他食客无感。

  令人惊喜的是,AI模型成功完成了大部分订单。在实际的细胞实验中,75%的设计序列能够在预期的细胞类型中激活基因表达,64%的序列能够在不需要的细胞类型中保持沉默。这个成功率虽然还不是100%,但已经远远超出了随机设计的效果。

  在研究过程中,团队还发现了一个令人深思的现象。当他们在白血病细胞系K562中测试这些人工增强子时,发现了与正常血液干细胞完全不同的行为模式。

  在正常的血液干细胞中,转录因子之间存在大量的相互制约和平衡,就像一个井然有序的社会,每个人都需要遵守某些规则和约束。但在K562癌细胞中,这些制约机制大部分都失效了,就像一个失去秩序的社会,几乎所有的转录因子都变成了激活因子,很少有抑制性的相互作用。

  这个发现为理解癌症的发生机制提供了新的视角。癌细胞之所以能够同时表达本应互相排斥的基因程序,可能正是因为它们失去了这些精妙的调控平衡。正常细胞需要在干细胞程序和分化程序之间做出选择,而癌细胞却能够贪心地同时保持两者,这也许正是它们获得异常增殖能力的原因之一。

  这项研究的意义远远超出了基础科学的范畴。掌握了细胞命运调控的基本规律后,科学家们就能够开发出全新的治疗策略。

  在再生医学领域,研究人员可以利用这些知识来精确地引导干细胞分化成特定的细胞类型。比如,如果需要治疗某种血液疾病,医生可以设计特定的基因调控元件,让患者的血液干细胞优先分化成缺失的细胞类型。

  在癌症治疗方面,这项研究揭示的调控机制缺陷可能成为新的治疗靶点。如果能够恢复癌细胞中失去的调控平衡,或许就能够阻止癌细胞的异常行为。

  更令人兴奋的是,这种基于人工智能的设计方法具有很强的通用性。虽然这项研究聚焦于血液系统,但同样的原理和方法很可能适用于其他器官系统。未来,我们或许能够为心脏、大脑、肝脏等各种器官设计专门的基因调控元件。

  这项研究在方法学上的创新也值得特别关注。传统的生物学研究往往依赖于观察自然界中已经存在的现象,就像考古学家通过挖掘古迹来推测古代文明一样。而这项研究采用了一种合成生物学的思路,通过人工构建来验证和理解生物学原理。

  这种方法的优势在于能够获得更加清晰和确定的因果关系。当研究人员观察自然界中的基因调控现象时,往往很难确定哪些因素是关键的,哪些只是偶然的伴随现象。但通过人工设计和构建,研究人员可以精确地控制每一个变量,从而得出更加可靠的结论。

  研究团队设计的64,400个人工增强子序列,每一个都是一次精心设计的实验。这就像是进行64,400次独立的科学实验,每次只改变一个或几个参数,然后观察结果的变化。通过这种大规模的系统性研究,研究人员能够绘制出基因调控的详细地图。

  值得一提的是,这项研究体现了现代科学研究的国际化特色。研究团队来自巴塞罗那基因组调控中心、庞培法布拉大学等多个机构,团队成员包括来自不同国家和文化背景的科学家。这种国际合作不仅汇集了不同的专业技能,也带来了多元化的思维方式。

  研究团队还体现了开放科学的精神。他们不仅发表了详细的研究论文,还建立了一个开放的网络平台(),让全世界的研究人员都能够访问和使用他们的数据。这种开放性将大大加速相关领域的研究进展。

  此外,研究团队还详细记录了实验方法和数据处理过程,并将所有的计算代码公开发布。这种透明度不仅有助于其他研究人员重现和验证结果,也为后续研究提供了宝贵的技术基础。

  随着这类研究的不断深入,我们正在见证精准医学的一个重要转折点。过去,医学治疗往往采用一刀切的方式,所有患有同一疾病的病人都接受类似的治疗。但基因调控机制的深入理解让我们看到了一种全新的可能性:根据每个患者的具体情况,设计个性化的基因调控方案。

  想象一下,未来的医生可能会像现在的建筑师一样工作。当面对一个血液疾病患者时,医生首先会详细分析患者血液干细胞的基因表达谱,然后设计专门的基因调控元件,精确地引导干细胞分化成患者最需要的细胞类型。这种治疗方式不仅更加精准,也可能大大减少副作用。

  当然,从实验室发现到临床应用还有很长的路要走。研究人员需要进一步验证这些机制在人类细胞中的适用性,还需要开发安全有效的基因传递技术。但这项研究为我们描绘了一个充满希望的未来图景。

  这项研究还带来了一些意想不到的启发。研究团队发现的负协同作用机制——即两个激活因子结合后变成抑制因子——挑战了我们对生物系统的传统认知。这提醒我们,生物系统的复杂性往往超出我们的想象,简单的线性思维可能会误导我们对生命现象的理解。

  这种非线性的相互作用在其他生物系统中可能也广泛存在。比如,在神经系统中,不同神经递质之间可能也存在类似的复杂相互作用。在免疫系统中,不同免疫因子的组合可能也会产生意想不到的效果。这为未来的生物学研究开辟了新的方向。

  这项由巴塞罗那基因组调控中心完成的研究,就像是为细胞世界写了一本详细的“人生指南。它不仅解释了血液细胞如何选择自己的命运,更重要的是,它让我们学会了如何编写这样的“指南。

  虽然这项研究从实验室到临床应用还需要很长的时间,已经为我们打开了一扇通向精准医学未来的大门。

  对于普通人来说,这项研究的意义在于它让我们对自己身体的构造有了更深的认识。每时每刻,我们身体里都在发生着无数精妙的分子对话,无数的细胞在做着复杂的命运选择。而科学家们正在逐渐学会这种分子语言,并尝试用它来帮助我们战胜疾病,延长寿命,提高生活质量。

  本文来自至顶AI实验室,一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破,挖掘其潜在的应用场景,为企业和个人提供切实可行的解决方案。

  A: 转录因子就像细胞工厂里的管理层或指挥官,它们决定着哪些基因应该开工生产蛋白质,哪些应该停工。简单来说,转录因子是一类特殊的蛋白质分子,能够结合到DNA上的特定位置,控制基因的表达。

  A:很有可能会带来新的癌症治疗思路。研究发现,癌细胞(如白血病细胞K562)与正常细胞在基因调控方面存在显著差异。正常细胞中存在精妙的制衡机制,不同转录因子会相互制约,确保细胞按规则发育。但在癌细胞中,这些制衡机制大多失效了,导致细胞能够贪心地同时激活本应互斥的基因程序。

  基于这个发现,科学家们可能开发出新的治疗策略:一是尝试恢复癌细胞中失去的调控平衡机制;二是利用人工设计的基因调控元件,精确引导患者的正常干细胞分化成缺失的细胞类型,从而修复癌症造成的损伤。不过从实验室到临床应用还需要更多研究验证。

  A: 科学家采用了类似乐高积木的方法来人工设计基因调控元件。他们首先制造了64,400个不同的人工DNA序列(增强子),就像设计64,400种不同的食谱,每个都仔细记录了调料(转录因子结合位点)的种类、分量和搭配方式。然后,他们用人工智能技术训练了一个厨师模型,让它学习这些食谱与最终味道(基因表达效果)之间的关系。经过大量学习后,这个AI模型不仅能预测给定序列的效果,还能反向设计出符合特定要求的序列。

  在实际测试中,75%的设计序列能够在预期的细胞类型中激活基因,64%能够在不需要的细胞类型中保持沉默。虽然还不是100%完美,但这个成功率已经远超随机设计。

  原标题:《人工智能遇上生物设计,巴塞罗那科学家破解细胞身份的奥秘,像“金刚狼”一样拥有不死之身》

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。