5y视图|预测生物学:AI将生物学从“还原理论”推
栏目:专题报道 发布时间:2025-04-13 17:41
5y视图|预测生物学:AI将生物学从“还原理论”推向“紧急”的新范式 Shi Yunfeng Wuyuan执行董事“预测系统本身的未来状态是了解系统本身”的建议。这篇文章今天分享的文章来自Jacob Kimmel Creode,联合创始人兼Newlimit Scientist,这是一家生物技术公司Newlimit Scientist,致力于开发用于衰老的表观遗传重编程治疗疗法。他还是Calico科学家的前任主任,该公司由抗衰老Google提供支持。他的研究背景始终集中在分子生物学和计算机科学的交集上。在本文中,他提出了一个概念,可以指定“人工智能驱动的生命科学研究”的当前范式是什么:不可预测的生物学。有很多评论的观点是:1。新生物学研究是由机械和人工智能的研究驱动的,2。预测系统意味着了解系统,而不是观察图形原因的创建。 3。发生的“认识论”而不是减少。 4。目前,生物学研究的新范式将从工业/营利性公司而不是非收入机构和学者开始。 NVIDIA的收缩是符合生物学或“ Techbio”的不可预测天堂的创业技术公司的代表之一。计算中心,模型堆栈和自动化实验室专注于开发大量的生物学和化学数据,这些数据超过50 pb,包括各种多组分分子,影响和作用于单细胞表型等,以进行推论和预测,而人类科学家在机器上帮助了较差的工作。其他两个“可预测的生物学”范式的代表是Arc Institute and Future House,它们都是过去两年中新近建立的机构,与这一新的生物学P一致阿拉迪斯。我们可以想象,生物学是一个很大的迷宫,大多数黑色地区。传统上,科学家拿着蜡烛和手电筒,步骤步骤探索墙壁符号(分子功能和生命的生命系统的一部分)。合适的生物学家具有一个动态图(AI模型),可以预测下一个角落的位置基于现有路径,并减去隐藏在整个迷宫中的快捷方式和机制的位置 - 即使它们尚未走到那里,迷宫是动态的-No(但是我们之前看不到),而这个新的地图是Maze -upda -upda -upda -upda -update -update -update -update -update the Briage。这个未来应该很轻。它是明亮的,但是您需要实现真理的曙光。生命科学需要新的工具来释放生物技术的真正无限潜力,而不是卡在各种“本地谷”中。但是在这张模因图片中,前线的专业人员应该理解这种疾病。如果新技术可以轻松地产生令人愉悦的结果并轻松“推动”,则意味着它仍在旧的系统中旋转Em。因此,也许“减少生物学”比到目前为止的预测生物学更准确(因为我认为两个单词“减少”和“推理”之间的区别)。如今,人工智能的能力根本无法实现“可预测的”生物学。在 - 深度研究中,还必须与身体物理学的真实模拟和更好的建筑实验相结合,并且需要虚拟与现实之间的合作。可预测的生物学具有认识论:雅各布·金梅尔(Jacob Kimmel)编辑:范扬出版日期:2024年8月30日,长篇文章早期预警:可预测的生物学是生命中新兴的科学天堂,在分子生物学和研究机械生物学的相交中发现(分子生物学的相互作用)。生物学预测的重点是衡量有关生物实体的共同信息,并认为预测未知实验的结果等同于理解系统。该领域的新工具解决了问题过去很难解决,并且是天生的新研究机构。与以前的生活科学研究游行不同,营利性公司会导致这个新领域的边界。将某人称为生物学家并没有真正告诉您他们的技能,日至日工作或认知原则。他们研究了一个干旱季节的生物学家,该生物学家的模式是转移大陆大象的模式,或者研究了在黑暗晶体学室中调节TGF-beta配体活动的结构基础的生物学家?在上个世纪,生物学逐渐与解决各种问题的许多分支区域逐渐不同,例如物理和化学经验。这些分支机构中的许多人都足够独立,可以发展其知识系统。他们不仅专注于不同的问题,而且还使用各种提供的工具来解决问题(他们使用提供的不同工具来解决问题)。叫一个分子生物学家的人,而不是Nly确实意味着他们具有操纵核酸的技术技能,但也表明它们倾向于底部,从而降低了认识论的方法。分子生物学的历史学家霍勒斯·弗里兰德·贾德森(Horace Freeland Judson)在这种文化和智力上准确地获得了分裂:“分子生物学不是由自然界定义的单个领域……这是一种分析水平的工具,一种工具,也就是说,这是许多内容的风格。重点是使用在此框架的先前数据中训练的模型来破坏未来实验的结果。h作为细胞的细胞表达谱)。如果经常降低分子生物学,那么不可预测的生物学就会出现,并且许多复杂的生物学现象不能与许多物质的关系分开解释。如果生物学系统认为系统内的接触范围的完整地图可以带来真正的理解,那么生物学的预言认为,预测系统的未来状态是理解的。 The breakthrough in molecular biology depends on nucleic acid biochemistry, increasing biology system has benefited from early advancement in computer technology, while unpredictable biology is built on artificial intelligence tools that can be noted from data and explain biology (where molecular biology is enabled by nuclear acid biochemistry and system -enabled Biology of early computers, unpredictable biology is built on intelligence tools that learn to explain biology from 数据)。可预测的生物学不优于或不优于其上述我的纪律,但它是唯一的(不同)。这些差异使科学家提出了新的问题,建立新的机构并找到新公司。这可能是生物学史上第一次切割场可能由营利性冒险而不是传统的学术机构主导。我认为这些方法将塑造生物学的未来,因此值得探讨生物学的起源,研究方向以及未解决的问题。认知谱系的认知谱系以分子生物学和现代性的左右顺序有助于生物学的预后。现代的生物医学根可以追溯到化学与生理学的交集,从而诞生了生物化学。生物化学可能是第一个专门从事生活系统的学科,它认为生命是复杂但入门物理生物,而不是具有不同政府原则集的“基本”元素。自从1930年代,分子生物学已成为来自生物化学的独立领域。如今,几乎所有现代生物技术公司的发展都可以被某些尺寸的分子生物学监测。分子生物学的含义始终难以捉摸。 DNA结构的共同发现者弗朗西斯·克里克(Francis Crick)曾经去除该分子生物学,可以定义为对分子生物学家感兴趣的任何东西。但是他还提出了更清晰的理由:[分子生物学]研究大量,长链生物分子 - 核酸和蛋白质及其合成。从生物学的角度来看,这意味着基因的纪律及其复制和表达,基因本身和kansome产品。分子生物学的核心是使用降低起始策略来解释生命系统。研究人员提出的问题通常围绕单个分子的功能,哪些分子决定了特定的生物学过程。这种探究方法表明主要a大多数分子都有少量操作,并且大多数操作都由少数分子控制。为了使减少策略取得成功,至少在某些情况下应该是正确的。尽管这种方法似乎太简单了,但减少策略带来的突破令人赞叹!它成功解释了遗传学分子机制和信息传播,尤其是gatnthe教条:DNA复制,转录和翻译。同样,我们对细胞交流,本体论和病理生物学的广泛理解是通过选择分子,破坏分子并根据发生的事情来解释其作用来实现的。分子生物学有利于从对认知parsimimony的渴望中需要减少更多的方法。毕竟,在开发的早期阶段,技术工具受到很高的限制。例外,即使是生命的“细胞汤”中的蛋白质也是一项非常具有挑战性的任务!遵循基因或蛋白质是持续了多年的行为足以成为医生论文的研究主题。研究多个Gens或其产品的关系更加困难(查询多代或其产品的接触是不可避免的)。尽管可以衡量这些关系,但如何解释其意义仍然是一个主要挑战。生物学家通常依靠“眼球测试”来观察二进制表型,或使用纸和笔来执行手机估计。测量和计算的进步都导致新一代生物学家开始研究小分子对解释的抗性现象。系统生物学减少减少的局限性取决于技术,发现和思想的相互作用,也许取决于减少重要性的衰落。系统生物学可能比分子生物学更难定义。从历史上看,这两个领域之间是一个巨大的收紧,悉尼·布伦纳本人是对第一个生物学家系统的一些研究批评。与前身相比,系统生物学的最大差异是,它专注于无法通过实验还原方法获得的复杂生物系统的新兴特性。人类生物学提供了一个很好的例子,说明了为什么采用了这种方法。我们的身体非常复杂,但是人类的数量仅为20,000。当您意识到下垂的数量超过基因数量时,与功能相对应的基因的基本概念似乎无效(远比具有离散gen的基因的功能更大)!显然,这些分子之间存在关系。效果大于他们自己的效果。直到1990年代中期,生物学家才无法验证这些联系。即使您想探索基因X,Y和Z的非线性逻辑,它们的交互方式,以前的工具也可能无法提供好方法。自动DNA和合成技术促进了系统的生物学,PR排卵与许多分子同时测量的第一个工具。在此期间,基因组学,转录组学和蛋白质组学工具使研究人员能够同时测量生物体中所有基因的逆性和丰度。系统生物学家试图通过获得无偏的数据并开发感兴趣行为的最小模型来理解系统。如果我们假设正在研究细胞周期,则系统生物学家可能会尝试创建肌符合方程,其中包含许多细胞周期的基因丰度以照亮细胞行为。对于这些模型,简单性和简单性通常比无法预测的性能更重要。系统生物学家希望从可以写在餐巾纸上的简单规则方面知道复杂过程的机制。有一种方法可以构建田地的长期方向是图形原因。如果我们假设图中的所有节点都是生物分子,则是测量和标记系统系统的生物学家我们可以想象出图中所有节点的节点作为生物分子,生物学家期望生物学家测量和鼻子之间的各个方面。通过测量所有这些连接,生物学依赖系统,有一天我们可以设计系统从一开始到一个被称为合成生物学的野外兄弟。不幸的是,可预测的生物学包含出现,生物学系统的工具无法超越许多分子之间的简单关系。在实践中,很难通过微分方程来预测复杂的细胞行为,例如发育,免疫力或药物反应,其准确性很难达到显着水平。尽管理论上的贵族,但生物学家确实很难制定足够大的简单微观政策来解释戏剧性的宏观生物学。可预测的生物学是将预言作为生物学研究的主要任务,而不是培养功能和相关性分子的占主导地位,分子生物学和系统生物学都在试图基于这些目录原理的预测朝着预测迈进。如果我们意识到一个基因的功能及其与其他基因的相关性,那么如果该基因被激活或约束,我们将会降低会发生什么。预言生物学家愿意屈服于中间编目工作,并继续从可预测的力量中理解(避开中间目录以追求从不可预测的力量中获得的理解)。换句话说,预言生物学家更专注于测量二十个时间分子生物学从古典物理学的认识论中获得灵感,而难以预测的生物学获得了从科学科学和信息理论中获得的工具。粉丝注意:相互(MI)信息是用于测量两个随机变量之间连贯性的信息理论中的概念。它测量可以获得ABO的“信息”的数量通过观察变量,UT另一个变量。简而言之,彼此之间的信息是一种用于衡量两个对象之间关系的牢固关系的工具。如果两者之间的关系牢固,那么彼此之间的信息量是压倒性的。如果两者彼此无关,那么彼此之间的信息量很小。它比简单的关系更强,因为它获得了更复杂的关系,这是另一个与猜测事物间接相关的现象。该方法的实现是由于现代机器学习程序(ML)的出现。直到1990年代,大型数据集的研究模型仍然面临实际挑战。由于提高了摩尔定律驱动的计算和改进算法的力量,在此期间,具有良好性能的模型变得越来越有用。该模型的第一代允许研究人员从新兴的高通pu中获取更多见解T实验,但在大多数情况下,依赖输入数据本身将无法预测实验的结果。 DNA采用的早期模型已帮助研究人员搜索和对齐相似的依从性,但无法预测先前未注意的突变的影响。基因表达的简单基因模型可能会降低细胞类型或癌症的结果,NGUIT无法预测避免特定细胞基因的影响。如果自1990年代以来对机器的研究(ML)已经存在,为什么不可预测的生物学直到最后十年才增加?早期的计算限制使该模型没有捕获足够的生物背景信息,如果它具有长的DNA序列或高分辨率显微镜图像。没有这些背景信息,该模型只能做出相对局部的预测,从而将其应用限制在最复杂的生物学问题上。古典生物化学提供了类比。 Linus Pauling和Max Perutz使用AC解决了生化结构策略,基础原子的物理模型。这些工具可以揭示第二个结构,例如蛋白质α-螺旋和DNA双螺旋,但是需要模拟物理性质的蛋白质的更复杂的第三级结构是不可预测的,这需要模拟较大尺寸的物理特性。在2010年左右,GPU计算促进代表研究的深层工具破坏了第二个障碍。现在,研究人员可以找到可以捕获丰富的输入上下文的模型,例如长期生命代码,成千上万的表达曲线和配对的药物处理的协变,以及在六个不同的六个不同的表型维度中吸收数百个细胞的图像。通过对生物系统的更详细的描述,第二代不可预测的生物学模型使计算假设检验成为可能。除了从原子世界实验更多的见解外,这些模型还允许研究人员进行M碎片世界中的任何实验。这些功能改变了不可预测的生物学家探索的问题,以及它们用来从一系列潜在可能性中获取新事实的实验方法。通过获得生物系统的更详细的特征,第二代不可预测的生物学模型可以实现计算机假设测试。除了从原子世界的实验中获得更多见解外,这些模型还使研究人员能够在相对世界中完成大量实验。这些能力不仅改变了不可预测的生物学家所探索的问题,而且还改变了他们的实验,从一系列可能的可能性中揭示了新事实。释放更大的问题生物学充满了假设空间,这些空间很大程度上可以彻底寻找。例如,所有可能的100bps DNA的增强剂活性(即促进基因表达的能力)的测试需要4^100≈10^60实验。只是测试所有组合简单细胞系中基因中2个中断的s也需要(20,000 c 2)≈10^8实验。分子生物学和细胞生物学的传统工具不足以探索所有这些可能性,并具有数量级的差距。例如“最强的Geneenhancer(最强的增强剂)是什么?”或“哪些基因对于细胞分裂至关重要?简单问题,例如“意外的Mavoid求解。分子生物学及其直接后继者通过局部搜索前进了可怕的数字。由于假设空间太大而无法彻底看,因此研究人员使用直观和先验的知识来思考哪些假设是最富有成果的。接下来是DNA的DNA增强剂活性,但是如果我们知道有关这一长度的许多强大增强子,那么智能分子生物学家可以尝试从有希望的起点尝试突变体,并以相对较高的成功机会。评估的假设。但是,如果众所周知的po的空间实际上,增强剂实际上远非全球最佳距离,良好的分子生物学家仍然不太可能找到结论 - 接近真正强大的Oneenhancer。可预测的生物模型使研究人员可以做不同的事情。研究人员可以专注于收集数据模型和培训(而不是使用Intuiti)来导航本地假设领域,而是专注于收集数据模型,而不是依靠Intuiti来浏览本地假设领域,而是可以专注于将数据集中在练习模型上。为此进行的实验可能与传统的分子生物学家或系统生物学家不同。通常,不可预测的生物学家可以使用更多的实验预算来收集涵盖假设空间内可能性范围的不同数据,而分子生物学家则将采用“贪婪的算法方法”,以专注于测试当前知识知识附近的假设。风扇杨注意:“贪婪算法”是一种使得S在每个步骤中的最佳选择。它不会考虑未来的情况,而只会在当前情况下选择最好的情况,希望最终获得全球最佳解决方案。如果您想攀登最高点以看到最美丽的风景,但是您总是沿着陡峭的方向爬上,您会在自己面前看到,但是您只能爬上一座小山,而不是通往最高山的道路,因为您不认为它可能会有更高的峰值。以子聚物为例,以100bp增强子为例,预言生物学家可以进行一项实验,该实验对数千个随机随机遵循的基因表达的表达促进活性侵占,然后练习一个模型,以直接从对手那里预测活性。然后,他们可以使用此计算机模型来搜索最佳结论 - 遵循各种可能性并预测全球最佳解决方案。使用这些工具,不可预测的生物学家可能会发现新的强大的拥塞 - 临时范围。尽管此示例是理想的,但设计新蛋白质的现实世界实验已达到相似的结果。创建新的机构创建了新的机构将以自己的形式诞生相应的机构(学科成为其形象的机构)。 MRC分子生物学实验室,冷泉港实验室和四家原始生物技术公司 - 创世记,生物基因,Genzyme和Amgen中的分子生物学生物。系统的生物学源自广泛的研究所,大学基因组科学,Illumina,Millennium Pharmaceutical和Myriad Genetics。不可预测的生物学的代表机构的类型仍在增长(渲染)。过去的学科通常在诞生商业企业之前就发展成为学术中心。不可预测的生物学可以颠倒。目前,很少有学术机构专门探索这一横截面,但是新的弧线研究所和施密特中心等机构正在显示未来的方向。相比之下,Techbio领域的公司出现在许多方向上,包括诊断领域(Freenome,Grail)和Therapeutic领域(Bighat,Dyno,Dyno,Enveda,Extctia,Extcia,build,build,return,return,Xaira)。私营部门的增长超出了传统的学术环境,可能反映了不可预测的生物学的独特资源。与分子生物学问题不同(通常是由单个研究者在预算有限的情况下解决的),当数据按比例足够充分地形成数据时,生物学预测最有效。这些条件通常更容易在营利性企业中实现。预测生物学有可能成为该行业科学家真正受到学术界驱动的第一个生物学学科。 CODA结论我很幸运能在我的领域有一个阶段变更阶段。从早期生物技术的曙光开始,科学家梦见了造物素g一个更好的世界通过生物学操纵。我们已经扩大了生活,创造了过去无法想象的奇迹,但是我们从未完全征服疾病或设计我们的环境。即使是最简单的单元格也比我们最复杂的计算机更复杂。抽象的层次多于一个人的思想。希望不可预测的生物学可能不需要限于人类思维将节点与图形原因联系起来的能力,而要依靠我们观察模式并以足够的意愿和活力来指导探索方向的能力。 PS,帖子末尾的读者的重要评论:杰里米·扎克(Jeremy Zucker):有趣而周到。我同意5月的想法 - 区分不可预测的生物学的关键问题是:可以根据明显的特征x预测实验结果吗?但是,如果这是驾驶预言生物学家的主要问题,那么以下句子是不可能处理的:“可预测的生物学家是更关注的重点d在两个生物学现象之间测试彼此的信息而不是衡量直接原因。因此,足以预测未知的实验的结果。
服务热线
400-123-4567