生物学是有助于塑造人工超级智能(ASI)的终极大数据科学项目。 高质量数据的重要性怎么强调都不为过。在庞大的生物数据集上训练人工智能模型,可能是建立生命基础模型的关键所在--它能让人工智能系统以类似人类的水平进行推理和理解,并设计生物进化。 You 等人最近的一项研究以 AlphaFold 等突破为基础,解码了蛋白质序列和结构信息。 生物信息的编码跨越三个基本层次:序列、结构和系统。准确地建立生物学模型涉及所有三个层次和多个反馈回路。 本文的重点是系统级生物信息建模,将人工智能驱动的虚拟细胞概念推进到多细胞相互作用和组织级系统建模,最终实现虚拟组织模型。从单个细胞的人工智能模型到人工智能驱动的组织建模,或 “人工智能虚拟组织”,是开发整个人类有机体人工智能模型道路上的一个重要里程碑。 这项研究利用在2,300万个细胞上训练的1亿参数模型,应用几何图神经网络(GeoGNNs)提取细胞相互作用的潜在空间信息。尽管如此,对细胞微环境和肿瘤生物学的重要见解仅仅是个开始,因为它有助于绘制和可视化潜在空间,但并不能使人工智能利用生物工程原理进行推理。 真正由人工智能驱动的生物学推理需要更多的数据,而10x Genomics和Illumina的Fluent等公司通过其单细胞和空间基因组学平台完全有能力提供这些数据。 在生物技术和医疗保健领域,能够收集大规模生物数据的公司,如 10x Genomics、Illumina 和 Guardant Health,是这场革命的关键推动者。它们的工具和技术将有助于构建生命的终极人工智能基础模型,因为生物推理开始使人工智能驱动的生物工程成为可能。 该文章为编译,标题为: Biology Could Be The Blueprint For Life’s Foundation Model And Superintelligence 作者:Nemo Mar