基于AlphaFold 3的超高通量推理工具。使用MMseqs2-GPU替代Jackhmmer,在单张H200 GPU上实现同源搜索速度提升超68倍,端到端推理速度提升超22倍。
AlphaFast具备多GPU能力,在4张H200 GPU上可达到每输入8秒的吞吐量,8张H200 GPU上为每输入4.5秒,在更大系统上吞吐量更高,且随设备数量近似线性扩展。
对于最小化设置或无大量计算资源的用户,请参见我们的Modal设置部分,可实现无服务器推理,成本为$0.035/输入,时间为28秒/输入。
查看我们的bioRxiv预印本!
也查看MMSeqs2-GPU论文!
免责声明:AlphaFast需要AlphaFold 3模型权重,其受Google DeepMind使用条款约束。您必须直接向Google申请并获取权重。本产品非Google官方支持产品。注意:蛋白质MSA使用MMseqs2-GPU。RNA MSA默认在MMseqs-CPU可用时使用,也可通过RNA FASTA数据库选择回退到nhmmer。DNA链使用空MSA,与AlphaFold 3的原生行为一致。
免责声明:AlphaFast需要AlphaFold 3模型权重,其受Google DeepMind使用条款约束。您必须直接向Google申请并获取权重。本产品非Google官方支持产品。
[!NOTE] 蛋白质MSA使用MMseqs2-GPU。RNA MSA默认在MMseqs-CPU可用时使用,也可通过RNA FASTA数据库选择回退到nhmmer。DNA链使用空MSA,与AlphaFold 3的原生行为一致。
通过Google的此表单申请AlphaFold 3模型参数访问权限。审批通常需要2-5个工作日。您将收到名为af3.bin.zst的压缩权重文件。
af3.bin.zst
环境要求 跳转到 本地服务器 Docker、Sudo权限 Docker设置 HPC集群 Singularity、SLURM HPC设置 无服务器 Modal 计费账户 Modal设置
下载AlphaFast数据库。默认情况下,这会从HuggingFace安装预构建的蛋白质MMseqs2、RNA MMseqs2和mmCIF数据。
[!IMPORTANT] 将path/to/databases指向快速数据驱动器(推荐NVMe)。默认预构建安装包括蛋白质MMseqs2、RNA MMseqs2和mmCIF数据。仅当需要用于强制--use_nhmmer运行的RNA FASTA后备文件时,才添加--include-nhmmer。仅在高级重建工作流中使用--from-source。
前提条件:预构建模式需要hf、zstd和tar。--from-source还需要wget和mmseqs。有关MMseqs2安装说明,请参见docs/building.md。
path/to/databases --include-nhmmer --use_nhmmer --from-source
hf zstd tar --from-source wget mmseqs
# 默认:蛋白质 + RNA MMseqs + mmCIF(来自HuggingFace)
./scripts/setup_databases.sh /path/to/databases
# 添加用于强制nhmmer运行的RNA FASTA后备文件
./scripts/setup_databases.sh /path/to/databases --include-nhmmer
# 仅蛋白质预构建安装
./scripts/setup_databases.sh /path/to/databases --protein-only
# 仅RNA预构建安装
./scripts/setup_databases.sh /path/to/databases --rna-only
# 从Google托管的源数据构建,而非使用预构建工件
./scripts/setup_databases.sh /path/to/databases --from-source
或者,从HuggingFace下载预构建数据库(无需填充转换):
# 安装HF CLI
curl -LsSf https://hf.co/cli/install.sh | bash
# 运行脚本
./scripts/setup_databases.sh /path/to/databases --from-prebuilt
[!NOTE] 或者,如需从源代码构建容器,请参见docs/building.md。
docker pull romerolabduke/alphafast:latest
[!IMPORTANT] 请将path/to/databases指向具有快速网络传输的高速卷。默认的setup_databases.sh模式会从HuggingFace下载预构建的蛋白质MMseqs2、RNA MMseqs2和mmCIF数据。仅当您还需要RNA FASTA备用文件时才添加--include-nhmmer。AlphaFast将花费大约1小时将数据库复制到本地NVMe卷(在HPC系统上通常称为/scratch)。如果没有此卷,请确保数据库位于尽可能快的I/O分区上。 [!NOTE] 您可能需要编辑SLURM指令以匹配您大学特定的HPC格式。
# 作为SLURM作业提交(CPU节点,无需GPU)
sbatch scripts/setup_databases.sbatch /path/to/databases
# 或在交互式会话中直接运行:
./scripts/setup_databases.sh /path/to/databases
# 可选:包含RNA FASTA备用文件以支持强制nhmmer运行
sbatch scripts/setup_databases.sbatch /path/to/databases --include-nhmmer
或者,从HuggingFace下载预构建的数据库(无需填充转换):
# 安装HF CLI
curl -LsSf https://hf.co/cli/install.sh | bash
# 运行脚本
./scripts/setup_databases.sh /path/to/databases --from-prebuilt
[!IMPORTANT] 大多数大学的HPC系统使用apptainer或singularity而非Docker进行权限管理。根据您的HPC设置,您的主目录可能非常小;因此,您应确保apptainer或singularity的缓存目录设置在大小和速度合适的卷上。有关更多信息,请参阅docs/hpc.md获取具体指导。
singularity pull alphafast.sif docker://romerolabduke/alphafast:latest
[!NOTE] 有多种方法可将权重移至您大学的HPC系统,例如从DeepMind团队提供的链接直接下载、通过rsync或scp等工具进行SSH传输。大多数大学系统会有数据传输节点,提供Globus等服务,可能会很有用。
rsync -avP /local/path/af3.bin.zst user@hpc:/path/to/weights/
创建一个包含输入.json文件的目录。有关完整格式参考,请参阅docs/input_format.md。最小示例:
{
"name": "2PV7",
"sequences": [
{
"protein": {
"id": ["A", "B"],
"sequence": "GMRESYANENQFGFKTINSDIHKIVIVGGYGKLGG..."
}
}
],
"modelSeeds": [1,2,3],
"dialect": "alphafold3",
"version": 1
}
[!NOTE] AlphaFast的性能提升取决于:输入批大小、GPU计算能力/显存以及GPU数量。特别是在HPC系统上,AlphaFast会尝试将几乎所有代码、容器、数据库传输到计算节点的本地/scratch目录。根据网络速度,此传输可能需要1-2小时;因此,AlphaFast最适合用于非常大的输入批大小。此外,如果您注意到显著的减速,应确保uv等包管理器的缓存目录以及其他系统包未设置在集群中的慢速文件系统上。如果所有其他方法都失败,应使用我们的Modal设置部分来满足您的需求。
./scripts/run_alphafast.sh \
--input_dir /path/to/inputs \
--output_dir /path/to/outputs \
--db_dir /path/to/databases \
--weights_dir /path/to/weights \
--temp_dir /scratch/$USER/alphafast_tmp \
--container /path/to/alphafast.sif \
--jax_compilation_cache_dir /scratch/$USER/alphafast_jax_cache \
--gpu_devices 0,1,2,3
为获得重复多GPU运行的最佳结果,请将JAX缓存放置在快速的节点本地或高性能共享存储上。完全冷启动的缓存仍可能导致第一个并行波在每个工作进程上编译一次,后续运行将受益于持久化的工件。
modal run modal/af3_predict.py --input protein.json
modal/prepare_databases.py 需要一个名为 huggingface 的 Modal 密钥,其中包含 HF_TOKEN,并将其传递给 Hugging Face 以进行经过身份验证的下载,从而获得更高的速率限制。
有关完整的 CLI 参考、批处理、多 GPU 模式和成本估算,请参见 docs/modal.md。
| Flag | Default | Description |
|---|---|---|
| --input_dir | (必填) | 包含输入 JSON 文件的目录 |
| --output_dir | (必填) | 结果输出目录 |
| --db_dir | (必填) | 数据库目录(来自 setup_databases.sh) |
| --weights_dir | (必填) | 包含 af3.bin.zst 的目录 |
| --gpu_devices | 0 | 逗号分隔的 GPU 设备 ID。单设备 = 单 GPU 模式,多设备 = 多 GPU 模式。示例:--gpu_devices 0,1,2,3 |
| --container | romerolabduke/alphafast:latest | Docker 镜像或 .sif 路径 |
| --batch_size | auto(输入数量) | MSA 批大小 |
| --backend | auto-detect | 强制使用 docker 或 singularity |
--input_dir、--output_dir、--db_dir(来自 setup_databases.sh)、--weights_dir(包含 af3.bin.zst)、--gpu_devices(例如 --gpu_devices 0,1,2,3)、--container(默认 romerolabduke/alphafast:latest 或 .sif 路径)、--batch_size 和 --backend(可指定 docker 或 singularity)为关键配置项。
有关高级标志,请参见 docs/advanced.md。
如果您在研究中使用 AlphaFast,请引用我们的工作、AlphaFold 3 和 MMSeqs2-GPU:
@article{Perry2026.02.17.706409,
author = {Perry, Benjamin C and Kim, Jeonghyeon and Romero, Philip A},
title = {AlphaFast: High-throughput AlphaFold 3 via GPU-accelerated MSA construction},
year = {2026},
doi = {10.64898/2026.02.17.706409},
publisher = {Cold Spring Harbor Laboratory},
abstract = {AlphaFold 3 (AF3) enables accurate biomolecular modeling but is limited by slow, CPU-bound multiple sequence alignment (MSA) generation. We introduce AlphaFast, a drop-in framework that integrates GPU-accelerated MMseqs2 sequence search to remove this bottleneck. AlphaFast achieves a 68.5x speedup in MSA construction and a 22.8x reduction in end-to-end runtime on a single GPU, and delivers predictions in 8 seconds per input on four GPUs while maintaining indistinguishable structural accuracy. A serverless deployment enables structure prediction for as little as $0.035 per input. Code is available at https://github.com/RomeroLab/alphafast.},
URL = {https://www.biorxiv.org/content/early/2026/02/18/2026.02.17.706409},
journal = {bioRxiv}
}
@article{Abramson2024,
author = {Abramson, Josh and Adler, Jonas and Dunger, Jack and Evans, Richard and Green, Tim and Pritzel, Alexander and Ronneberger, Olaf and Willmore, Lindsay and Ballard, Andrew J. and Bambrick, Joshua and Bodenstein, Sebastian W. and Evans, David A. and Hung, Chia-Chun and O’Neill, Michael and Reiman, David and Tunyasuvunakool, Kathryn and Wu, Zachary and Žemgulytė, Akvilė and Arvaniti, Eirini and Beattie, Charles and Bertolli, Ottavia and Bridgland, Alex and Cherepanov, Alexey and Congreve, Miles and Cowen-Rivers, Alexander I. and Cowie, Andrew and Figurnov, Michael and Fuchs, Fabian B. and Gladman, Hannah and Jain, Rishub and Khan, Yousuf A. and Low, Caroline M. R. and Perlin, Kuba and Potapenko, Anna and Savy, Pascal and Singh, Sukhdeep and Stecula, Adrian and Thillaisundaram, Ashok and Tong, Catherine and Yakneen, Sergei and Zhong, Ellen D. and Zielinski, Michal and Žídek, Augustin and Bapst, Victor and Kohli, Pushmeet and Jaderberg, Max and Hassabis, Demis and Jumper, John M.},
journal = {Nature},
title = {Accurate structure prediction of biomolecular interactions with AlphaFold 3},
year = {2024},
volume = {630},
number = {8016},
pages = {493--500},
doi = {10.1038/s41586-024-07487-w}
}
@article{Kallenborn2025-fd,
title = "{GPU}-accelerated homology search with {MMseqs2}",
author = "Kallenborn, Felix and Chacon, Alejandro and Hundt, Christian and
Sirelkhatim, Hassan and Didi, Kieran and Cha, Sooyoung and
Dallago, Christian and Mirdita, Milot and Schmidt, Bertil and
Steinegger, Martin",
journal = "Nat. Methods",
volume = 22,
number = 10,
pages = "2024--2027",
year = 2025,
doi = "10.1038/s41592-025-02819-8",
}
源代码采用 CC-BY-NC-SA 4.0 许可证。模型参数受 AlphaFold 3 模型参数使用条款约束。输出受输出使用条款约束。
这不是 Google 官方支持的产品。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务