
archivebox/archiveboxArchiveBox 是一款功能强大的开源自托管网页归档解决方案,帮助个人和组织收集、保存网页内容并离线查看。互联网上的内容随时可能消失或变更,虽然 Archive.org 等中心化服务做得很好,但无法保存私有内容,也不能覆盖所有类型的资源。ArchiveBox 则让你能自主掌控数据,既可以归档公开网页,也能保存私有内容(如需要登录的页面),适用于书签备份、***证据留存、社交媒体内容存档、研究资料保存等场景。
Docker Compose 是最简单的安装方式,自动包含所有依赖,适合大多数用户:
安装 Docker
先在系统上安装 Docker(如已安装可跳过)。
创建目录并下载配置文件
新建一个存放归档数据的目录,下载 docker-compose.yml 配置文件:
bashmkdir -p ~/archivebox/data && cd ~/archivebox # 下载配置文件,可根据需要编辑其中的参数(如端口、存储路径) curl -fsSL '[***]' > docker-compose.yml
初始化并创建管理员用户
运行初始化命令,按提示设置管理员账号(用于网页界面登录):
bashdocker compose run archivebox init --setup
启动服务并访问网页界面
启动服务后,访问 `[***] 即可打开网页管理界面:
bashdocker compose up
适合熟悉命令行的用户,需手动处理依赖:
bash# 安装 Python 包 pip3 install --upgrade archivebox *** playwright playwright install --with-deps chromium # 安装 Chromium 及依赖 # 创建数据目录并初始化 mkdir -p ~/archivebox/data && cd ~/archivebox/data archivebox init --setup # 初始化归档库,自动安装剩余依赖
bashsudo add-apt-repository ppa:archivebox/archivebox sudo apt update && sudo apt install archivebox
bashbrew tap archivebox/archivebox && brew install archivebox
bash# Docker 环境(需在 docker-compose.yml 所在目录执行) docker compose run archivebox add '[***]' # 本地 pip 安装环境 archivebox add '[***]'
打开 `[***] URL】,输入网址并可选添加标签、备注。
~/archivebox/data/archive 目录,每个 URL 对应一个子文件夹,内含 HTML、PDF、截图等文件,可直接打开。basharchivebox list # 列出所有归档 archivebox show '[***]' # 查看指定 URL 的归档详情
ArchiveBox 会根据网页类型自动提取多种格式,确保内容可长期保存:
ArchiveBox 使用标准文件格式(HTML、PDF、WARC 等)存储数据,不依赖专有格式,即使未来工具停止维护,也能通过普通软件访问归档内容。建议定期备份 ~/archivebox/data 目录,确保数据长期安全。
通过 ArchiveBox,你可以安心保存互联网上有价值的内容,确保即使原页面消失,这些数据也能长期留存并随时访问。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务