专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

troynguyen/cypress-included-pdf-package Docker 镜像 - 轩辕镜像 | Docker 镜像高效稳定拉取服务

热门搜索:openclaw🔥nginx🔥redis🔥mysqlopenjdkcursorweb2apimemgraphzabbixetcdubuntucorednsjdk
cypress-included-pdf-package
troynguyen/cypress-included-pdf-package
troynguyen
基于Cypress的集成测试环境,包含pdftk、poppler-utils、ghostscript和tesseract-ocr,支持测试过程中的PDF处理与OCR文字识别任务。
下载次数: 0状态:社区镜像维护者:troynguyen仓库类型:镜像最近更新:1 年前
轩辕镜像,不浪费每一次拉取。点击查看
中文简介版本下载
轩辕镜像,不浪费每一次拉取。点击查看

Docker镜像文档:cypress-ocr-pdf-tools

概述

本镜像基于cypress/included构建,扩展集成了多种PDF处理工具(pdftk、poppler-utils、ghostscript)和OCR识别工具(tesseract-ocr),旨在提供一站式的端到端测试环境,支持在测试流程中直接处理PDF文件或执行OCR文字识别任务。

核心功能与特性

1. Cypress测试环境
  • 内置完整的cypress/included环境,支持直接运行Cypress测试脚本,无需额外安装Cypress依赖。
2. PDF处理工具集
  • pdftk:支持PDF文件合并、拆分、旋转、加密/解密等基础操作。
  • poppler-utils:提供pdftotext(PDF转文本)、pdfinfo(PDF元信息提取)、pdfimages(PDF图像提取)等工具。
  • ghostscript:支持PDF压缩、格式转换(如PDF转PostScript)及高级渲染处理。
3. OCR文字识别
  • tesseract-ocr:开源OCR引擎,支持从图像或PDF中提取文字,默认包含英文语言包,可通过配置扩展其他语言支持。

使用场景

  • 电商/***系统:测试订单、发票等PDF文件的生成正确性(内容验证、格式检查)。
  • 文档管理系统:验证导出PDF的文本内容、图像提取及元数据准确性。
  • 表单系统:对包含扫描件的PDF进行OCR识别,测试文字提取结果与预期值匹配。
  • 自动化测试:在端到端测试流程中,直接调用工具处理PDF/OCR,无需依赖外部服务。

使用方法

1. 拉取镜像
bash
docker pull [镜像名称]  # 请替换为实际镜像地址
2. 基本运行命令
bash
docker run -it --rm \
  -v $(pwd)/cypress:/e2e/cypress \
  -v $(pwd)/cypress.config.js:/e2e/cypress.config.js \
  [镜像名称] \
  npx cypress run
  • -v $(pwd)/cypress:/e2e/cypress:挂载本地Cypress测试用例目录到容器内。
  • -v $(pwd)/cypress.config.js:/e2e/cypress.config.js:挂载Cypress配置文件。
  • 命令末尾可添加Cypress参数(如--spec cypress/e2e/pdf-test.cy.js指定测试文件)。
3. 测试中调用工具示例

在Cypress测试脚本中,可通过cy.exec()调用镜像内置工具:

示例1:提取PDF文本并验证内容
javascript
// cypress/e2e/pdf-validation.cy.js
it('验证PDF导出内容', () => {
  // 假设测试流程中生成了目标PDF并保存到/tmp/test.pdf
  cy.exec('pdftotext /tmp/test.pdf -', { log: true }).then(result => {
    expect(result.stdout).to.include('订单编号: 20240101001');  // 验证文本内容
  });
});
示例2:OCR识别图像中的文字
javascript
// cypress/e2e/ocr-test.cy.js
it('OCR识别验证', () => {
  // 假设测试流程中下载了包含文字的图像/tmp/sample.png
  cy.exec('tesseract /tmp/sample.png stdout', { log: true }).then(result => {
    expect(result.stdout.trim()).to.equal('测试OCR识别内容');  // 验证OCR结果
  });
});
4. Docker Compose配置示例
yaml
# docker-compose.yml
version: '3.8'
services:
  cypress-test:
    image: [镜像名称]
    volumes:
      - ./cypress:/e2e/cypress
      - ./cypress.config.js:/e2e/cypress.config.js
      - ./test-assets:/e2e/test-assets  # 挂载测试所需的PDF/图像资源
    command: npx cypress run --spec cypress/e2e/pdf-ocr-test.cy.js

配置说明

环境变量
  • **CYPRESS_*:支持所有Cypress原生环境变量(如CYPRESS_BASE_URL`指定测试基础URL)。
  • TESSDATA_PREFIX:指定tesseract语言包路径(默认/usr/share/tesseract-ocr/5/tessdata/)。
扩展配置
  • 安装额外tesseract语言包:通过apt-get安装(需以root用户运行),例如安装中文语言包:
    bash
    docker run -it --rm --user root [镜像名称] apt-get update && apt-get install -y tesseract-ocr-chi-sim
    
  • 自定义工具路径:如需修改工具默认配置,可通过挂载配置文件(如/etc/ghostscript/下的配置)实现。

注意事项

  • 容器默认工作目录为/e2e,建议将测试脚本及资源挂载到此目录。
  • 处理大型PDF或高分辨率图像时,建议为容器分配足够内存(通过--memory参数)。
  • OCR识别 accuracy 受图像质量影响,测试中建议使用标准化的图像/PDF样本。
查看更多 cypress-included-pdf-package 相关镜像 →
google/shaka-packager logo
google/shaka-packager
google
用于VOD和直播DASH及HLS应用的媒体打包与开发框架。
20 次收藏100万+ 次下载
11 天前更新
netdata/package-builders logo
netdata/package-builders
netdata
这些基础Docker镜像主要用于构建二进制分发包,为开发者提供标准化的构建环境,确保在不同系统或平台上打包过程的一致性与可靠性,支持高效生成可直接分发的二进制文件,适用于各类软件项目的打包流程,简化从源码到分发包的转化步骤,提升开发与部署效率。
100万+ 次下载
10 天前更新
bitnami/cypress logo
bitnami/cypress
bitnami
Bitnami Cypress安全镜像,现作为商业订阅的OCI制品提供,支持Debian和Photon基础操作系统,提供加固安全特性及合规支持。
1万+ 次下载
6 个月前更新
rancher/wmi_exporter-package logo
rancher/wmi_exporter-package
rancher
暂无描述
10万+ 次下载
5 年前更新
datadog/agent-package-dev logo
datadog/agent-package-dev
datadog
暂无描述
1万+ 次下载
1 年前更新
datadog/agent-package logo
datadog/agent-package
datadog
暂无描述
1万+ 次下载
11 天前更新

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

使用与功能问题

docker search 报错:专属域名下仅支持 Docker Hub 查询

docker search 报错问题

网页搜不到镜像:Docker Hub 有但轩辕镜像搜索无结果

镜像搜索不到

离线传输镜像:无法直连时用 docker save/load 迁移

离线传输镜像

Docker 插件安装错误:application/vnd.docker.plugin.v1+json

Docker 插件安装错误

WSL 下 Docker 拉取慢:网络与挂载目录影响及优化

WSL 拉取镜像慢

轩辕镜像是否安全?镜像完整性校验(digest)说明

镜像安全性

如何用轩辕镜像拉取镜像?登录方式与专属域名配置

如何拉取镜像

错误码与失败问题

manifest unknown 错误:镜像不存在或标签错误

manifest unknown 错误

TLS/SSL 证书验证失败:Docker pull 时 HTTPS 证书错误

TLS 证书验证失败

DNS 解析超时:无法解析镜像仓库地址或连接超时

DNS 解析超时

410 Gone 错误:Docker 版本过低导致协议不兼容

410 错误:版本过低

402 Payment Required 错误:流量耗尽错误提示

402 错误:流量耗尽

401 UNAUTHORIZED 错误:身份认证失败或登录信息错误

身份认证失败错误

429 Too Many Requests 错误:请求频率超出专业版限制

429 限流错误

Docker login 凭证保存错误:Cannot autolaunch D-Bus(不影响登录)

凭证保存错误

账号 / 计费 / 权限

免费版与专业版区别:功能、限额与使用场景对比

免费版与专业版区别

支持的镜像仓库:Docker Hub、GCR、GHCR、K8s 等列表

轩辕镜像支持的镜像仓库

拉取失败是否扣流量?计费规则说明

拉取失败流量计费

KYSEC 权限不够:麒麟 V10/统信 UOS 下脚本执行被拦截

KYSEC 权限错误

如何申请开具发票?(增值税普票/专票)

开具发票

如何修改网站与仓库登录密码?

修改网站和仓库密码

配置与原理类

registry-mirrors 未生效:仍访问官方仓库或报错的原因

registry-mirrors 未生效

如何去掉镜像名称中的轩辕域名前缀?(docker tag)

去掉域名前缀

如何拉取指定架构镜像?(ARM64/AMD64 等多架构)

拉取指定架构镜像

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
troynguyen/cypress-included-pdf-package
博客公告Docker 镜像公告与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
镜像拉取问题咨询请 提交工单,官方技术交流群:1072982923。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
镜像拉取问题咨询请提交工单,官方技术交流群:。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.