NVIDIA 的 BioNeMo Recipes 使数十亿参数的生物模型能够在具有 LoRA 的单个 GPU 上适应,从而改变了计算生物学工作流程。
NVIDIA 推出了 BioNeMo Recipes,这是一套工具,旨在使用低阶适应 (LoRA) 微调数十亿参数的生物基础模型。通过利用 LoRA,研究人员可以以最小的计算开销调整 ESM2(蛋白质)和 Evo2(DNA)等大规模预训练模型来执行特定任务。这项创新可以通过在单个工作站 GPU 上访问高性能 AI 模型来显着加速计算生物学的进步。
生物基础模型相当于生命科学领域瑞士军刀的人工智能。它们经过对 DNA、RNA 或蛋白质序列的大量数据集的预先训练,捕获了生物学的统计“语言”。这些模型已用于蛋白质结构预测、变异效应分析和功能注释等任务。然而,微调这些通常具有数十亿个参数的模型传统上需要昂贵的硬件和大量的计算资源。 LoRA 改变了这种动态。
LoRA 的工作原理
LoRA 通过保持原始模型的参数冻结并引入小型、可训练的适配器矩阵,避开了传统微调的资源强度。这种方法将可训练参数的数量减少到整个模型的 1%,从而能够在单个 GPU 上进行高效微调,同时保持与完全微调相当的性能。 NVIDIA 将 LoRA 集成到其 BioNeMo Recipes 中,通过提供基于 PyTorch 和 Hugging Face 等熟悉工具构建的即用型工作流程,使该过程变得更加平易近人。
例如,NVIDIA 针对二级结构预测任务对 ESM2-3B 蛋白质模型进行了微调,即为蛋白质序列中的氨基酸分配结构标签。使用 LoRA,该团队在 NVIDIA RTX 6000 GPU 上在一小时内训练模型时实现了最先进的准确率(Q3 任务为 84.8%,Q8 任务为 74.3%)。
案例研究:使用 Evo2 进行 DNA 剪接位点分类
在另一个示例中,NVIDIA 将 LoRA 应用于 Evo2-1B 模型以进行 DNA 剪接位点分类,这是理解 RNA 剪接机制的关键任务。使用 LoRA 微调模型将分类准确率提高到 96.6%,而仅训练分类头的基线仅为 52.3%。同样,这是在单个 GPU 上实现的,突出了这些工作流程的可访问性。
对计算生物学的影响
在普通硬件上微调十亿参数模型的能力使计算生物学中尖端工具的使用变得大众化。除了蛋白质结构预测和 DNA 分析之外,这些技术还可以加速药物发现、基因编辑和合成生物学等应用。例如,OpenFold 联盟最近的扩张和 Zuckerberg Biohub 的人工智能驱动的蛋白质模型突显了生物技术领域对适应性强、高性能人工智能系统不断增长的需求。
但是,挑战依然存在。正如最近的分析所指出的,将这些模型推广到分布外的生物场景(例如预测病毒突变)需要在数据收集和验证方面进一步创新。 NVIDIA 的 BioNeMo Recipes 是向前迈出的重要一步,但更广泛的生态系统必须继续解决可扩展性和准确性问题,以释放生物基础模型的全部潜力。
让生物学变得更加可编程
NVIDIA 的 BioNeMo Recipes 标志着生物学朝着更加可编程和可预测的方向转变,与 OpenAI 的 GPT-Rosalind 和 IBM 的多模式生物医学模型等更广泛的行业趋势保持一致。通过集成 LoRA、Transformer Engine 优化和序列打包技术,NVIDIA 使得在单个 GPU 上微调大量生物模型变得可行,而无需牺牲性能。对于计算生物学家来说,这是一个游戏规则改变者。
研究人员可以通过访问 NVIDIA 的官方 GitHub 存储库来访问全套 BioNeMo 配方,并立即开始进行微调。
