专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

热门搜索:openclaw🔥nginx🔥redis🔥mysqlopenjdkcursorweb2apimemgraphzabbixetcdubuntucorednsjdk
crawl4ai

unclecode/crawl4ai

unclecode

Crawl4AI是开源的对大语言模型友好的网络爬虫与抓取工具。

31 次收藏下载次数: 0状态:社区镜像维护者:unclecode仓库类型:镜像最近更新:8 天前
轩辕镜像,快一点,稳很多。点击查看
版本下载
轩辕镜像,快一点,稳很多。点击查看

Crawl4AI: 开源LLM友好型网络爬虫与抓取工具

!GitHub Stars !Downloads !Join *** !*** Follow

1. 镜像概述和主要用途

Crawl4AI是GitHub上排名第一的趋势性开源项目,由活跃的社区积极维护。它提供针对LLM、AI代理和数据管道优化的高速、AI就绪型网络爬取能力。作为开源工具,Crawl4AI兼具灵活性和实时性能,为开发者提供无与伦比的速度、精度和部署便捷性。

2. 核心功能和特性

  • LLM友好设计:专为大型语言模型和AI应用优化的数据输出格式
  • 高性能爬取:提供极速的网页内容获取能力
  • 开源灵活:完全开源,可根据需求定制和扩展
  • 实时处理:支持实时数据爬取和处理
  • 多架构支持:兼容amd64和arm64架构
  • AI服务集成:通过.llm.env文件支持OpenAI、Claude、Groq等AI服务
  • Web界面:内置Playground界面,便于测试和配置
  • API支持:提供标准API和流式API两种调用方式

3. 使用场景和适用范围

  • LLM应用开发:为大型语言模型提供高质量训练或推理数据
  • AI代理构建:作为AI代理的信息获取模块
  • 数据管道建设:构建网页数据采集的数据管道
  • 智能内容提取:从网页中提取结构化信息
  • 研究数据收集:为各类研究项目收集网络数据
  • 市场情报分析:监控和分析市场相关网页信息

4. 详细的使用方法和配置说明

4.1 快速启动

使用Docker快速启动Crawl4AI服务:

bash
docker run -d \
  -p 11235:11235 \
  --name crawl4ai \
  --shm-size=3g \
  unclecode/crawl4ai:latest

服务启动后,访问以下地址打开Web控制台: http://localhost:***/playground

Web控制台提供了测试爬取、调整配置和为AI代理生成JSON的界面。

4.2 从Docker Hub拉取镜像

bash
# 拉取最新版本
docker pull unclecode/crawl4ai:latest

# 拉取特定版本
docker pull unclecode/crawl4ai:0.6.0rc1-r1

4.3 API调用示例

4.3.1 标准API调用

bash
curl -X POST http://localhost:11235/crawl \
  -H "Content-Type: application/json" \
  -d '{"urls": ["https://example.com"]}'

4.3.2 流式API调用

bash
curl -N -X POST http://localhost:11235/crawl/stream \
  -H "Content-Type: application/json" \
  -d '{"urls": ["https://example.com"], "crawler_config": {"type": "CrawlerRunConfig", "params": {"stream": true}}}'

4.4 Docker Compose配置示例

yaml
version: '3.8'

services:
  crawl4ai:
    image: unclecode/crawl4ai:latest
    container_name: crawl4ai
    ports:
      - "11235:11235"
    shm_size: "3g"
    restart: unless-stopped
    environment:
      - TZ=Asia/Shanghai
    volumes:
      - ./llm.env:/app/.llm.env
      - crawl4ai_data:/app/data

volumes:
  crawl4ai_data:

4.5 环境变量配置

创建.llm.env文件配置AI服务:

OPENAI_API_KEY=your_openai_api_key
CLAUDE_API_KEY=your_claude_api_key
GROQ_API_KEY=your_groq_api_key

4.6 高级配置

通过API调用时可以传递配置参数:

json
{
  "urls": ["https://example.com"],
  "crawler_config": {
    "type": "CrawlerRunConfig",
    "params": {
      "stream": true,
      "depth": 2,
      "max_pages": 10,
      "timeout": 30
    }
  }
}

5. 完整文档和支持

5.1 官方文档

完整文档请访问:docs.crawl4ai.com

文档包含以下内容:

  • 配置参数调整
  • 浏览器配置文件使用
  • 自定义过滤器编写
  • 大规模部署指南

5.2 获取支持

  • GitHub仓库:https://github.com/unclecode/crawl4ai
  • 社区:[]
  • X(*)**:@unclecode

6. 版本信息

版本标签说明
latest最新稳定版
0.6.0rc1-r1特定版本示例

7. 系统要求

  • Docker Engine: 20.10.0+
  • 内存: 至少4GB
  • 磁盘空间: 至少1GB
  • 网络: 能够访问互联网以拉取镜像和爬取网页

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。

国内拉取方式

docker pull docker.xuanyuan.run/unclecode/crawl4ai:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

官方拉取方式

docker pull unclecode/crawl4ai:<标签>

更多 crawl4ai 镜像推荐

chendefine/crawl4ai logo

chendefine/crawl4ai

chendefine
crawl4ai
325 次下载
5 个月前更新
protemplate/crawl4ai logo

protemplate/crawl4ai

protemplate
Crawl4AI:开源的LLM友好型网络爬虫与抓取工具,包含最新及未发布版本。
614 次下载
7 个月前更新
eunginx/crawl4ai logo

eunginx/crawl4ai

eunginx
该镜像集成@unclecode的Legendary CRAWL4AI与OLLMA CLOUD,用于结合爬取与AI处理任务,设置需参考示例env.txt文件。
328 次下载
2 个月前更新
asrguru/crawl4ai logo

asrguru/crawl4ai

asrguru
暂无描述
738 次下载
1 年前更新
kmistele/crawl4ai logo

kmistele/crawl4ai

kmistele
Public builds of the new crawl4ai containers
121 次下载
1 年前更新
materialbank/crawl4ai logo

materialbank/crawl4ai

materialbank
极速、AI就绪的网络爬虫,专为大型语言模型(LLMs)、AI代理和数据管道量身定制。
453 次下载
7 个月前更新

查看更多 crawl4ai 相关镜像

部署与使用文档

Crawl4AI Docker 容器化部署指南

Crawl4AI 是一款开源的LLM友好型网络爬虫和抓取工具,专为LLMs(大型语言模型)、AI代理和数据管道设计。

阅读全文

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

Harbor 镜像源配置

Harbor Proxy Repository 对接专属域名

Portainer 镜像源配置

Portainer Registries 加速拉取

Nexus 镜像源配置

Nexus3 Docker Proxy 内网缓存

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

使用与功能问题

配置了专属域名后,docker search 为什么会报错?

docker search 限制

Docker Hub 上有的镜像,为什么在轩辕镜像网站搜不到?

站内搜不到镜像

机器不能直连外网时,怎么用 docker save / load 迁镜像?

离线 save/load

docker pull 拉插件报错(plugin v1+json)怎么办?

插件要用 plugin install

WSL 里 Docker 拉镜像特别慢,怎么排查和优化?

WSL 拉取慢

轩辕镜像安全吗?如何用 digest 校验镜像没被篡改?

安全与 digest

第一次用轩辕镜像拉 Docker 镜像,要怎么登录和配置?

新手拉取配置

错误码与失败问题

docker pull 提示 manifest unknown 怎么办?

manifest unknown

docker pull 提示 no matching manifest 怎么办?

no matching manifest(架构)

镜像已拉取完成,却提示 invalid tar header 或 failed to register layer 怎么办?

invalid tar header(解压)

Docker pull 时 HTTPS / TLS 证书验证失败怎么办?

TLS 证书失败

Docker pull 时 DNS 解析超时或连不上仓库怎么办?

DNS 超时

Docker 拉取出现 410 Gone 怎么办?

410 Gone 排查

出现 402 或「流量用尽」提示怎么办?

402 与流量用尽

Docker 拉取提示 UNAUTHORIZED(401)怎么办?

401 认证失败

遇到 429 Too Many Requests(请求太频繁)怎么办?

429 限流

docker login 提示 Cannot autolaunch D-Bus,还算登录成功吗?

D-Bus 凭证提示

为什么会出现「单层超过 20GB」或 413,无法加速拉取?

413 与超大单层

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别?

免费版与专业版区别

轩辕镜像支持哪些 Docker 镜像仓库?

支持的镜像仓库

镜像拉取失败还会不会扣流量?

失败是否计费

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办?

KYSEC 拦截脚本

如何在轩辕镜像申请开具发票?

申请开票

怎么修改轩辕镜像的网站登录和仓库登录密码?

修改登录密码

如何注销轩辕镜像账户?要注意什么?

注销账户

配置与原理类

写了 registry-mirrors,为什么还是走官方或仍然报错?

mirrors 不生效

怎么用 docker tag 去掉镜像名里的轩辕域名前缀?

去掉域名前缀

如何拉取指定 CPU 架构的镜像(如 ARM64、AMD64)?

指定架构拉取

用轩辕镜像拉镜像时快时慢,常见原因有哪些?

拉取速度原因

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
unclecode/crawl4ai
博客公告Docker 镜像公告与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
镜像拉取问题咨询请 提交工单,官方技术交流群:1072982923。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
镜像拉取问题咨询请提交工单,官方技术交流群:。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.