
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
DQOps是一款DataOps友好的数据质量监控工具,提供可定制的数据质量检查和数据质量仪表板。DQOps内置约100种预定义的数据质量检查,帮助用户监控数据质量。
!DQOps界面
DQOps设计为数据质量团队的主要平台,也适用于所有希望为其数据平台应用数据质量监控的数据工程或数据科学团队。以下是部分使用场景及最佳实践:
以下示例展示了配置数据质量检查的完整流程,包括使用YAML文件或DQOps用户界面:
要将DQOps作为Docker容器运行,需要:
按照以下步骤以服务器模式启动DQOps:
在终端中运行以下命令从DockerHub下载DQOps镜像:
docker pull dqops/dqo
运行DQOps Docker镜像:
docker run -v [输入本地userhome文件夹路径]:/dqo/userhome -p 8888:8888 dqops/dqo --dqo.cloud.api-key=[输入你的API Key] run
-v标志将本地创建的"userhome"文件夹挂载到容器中,需提供本地userhome文件夹的路径-p标志将主机的8888端口映射到容器的8888端口,没有端口映射将无法访问应用--dqo.cloud.api-key参数指定DQOps Cloud账户的API Key几秒钟后,打开浏览器访问http://localhost:8888,即可看到DQOps的图形界面。
按照以下步骤以Shell模式启动DQOps:
在终端中运行以下命令从DockerHub下载DQOps镜像:
docker pull dqops/dqo
运行DQOps Docker镜像:
docker run -v [输入本地userhome文件夹路径]:/dqo/userhome -it -p 8888:8888 dqops/dqo --dqo.cloud.api-key=[输入你的API Key]
-v标志将本地创建的"userhome"文件夹挂载到容器中,需提供本地userhome文件夹的路径-i标志即使未附加也保持STDIN打开-t标志分配伪终端-p标志将主机的8888端口映射到容器的8888端口,没有端口映射将无法访问应用--dqo.cloud.api-key参数指定DQOps Cloud账户的API Key几秒钟后,可以使用DQOps终端,或在浏览器中访问http://localhost:8888打开图形界面。
可以通过调用DQOps Python客户端将DQOps集成到数据管道和ML管道中。安装Python客户端包:
python -m pip install --user dqops
dqops包包含远程客户端,可连接到DQOps实例并执行用户界面支持的所有操作。DQOps客户端可用于数据管道或数据准备代码中,以验证表的质量。
可以使用未认证客户端从数据管道代码连接到本地DQOps实例。首先创建客户端对象:
pythonfrom dqops import client dqops_client = client.Client(base_url="http://localhost:8888")
或者,如果连接到已启用身份验证的生产DQOps实例,需在DQOps的用户配置文件屏幕中生成DQOps API Key。然后使用该密钥作为令牌创建AuthenticatedClient:
pythonfrom dqops import client dqops_client = client.AuthenticatedClient(base_url="http://localhost:8888", token="你的DQO API Key")
现在可以调用DQOps操作。以下代码展示如何对已在DQOps中注册的数据源执行数据质量检查:
pythonfrom dqops.client.api.jobs import run_checks from dqops.client.models import CheckSearchFilters, \ RunChecksParameters request_body = RunChecksParameters( check_search_filters=CheckSearchFilters( column='sample_column', column_data_type='string', connection='sample_connection', full_table_name='sample_schema.sample_table', enabled=True ) ) check_results = run_checks.sync( client=dqops_client, json_body=request_body )
run_checks操作返回已执行数据质量检查的摘要和最高数据质量问题严重级别。以下示例中,最严重的问题为error级别:
json{ "jobId" : { "jobId" : 123456789, "createdAt" : "2023-10-11T13:42:00Z" }, "result" : { "highest_severity" : "error", "executed_checks" : 10, "valid_results" : 7, "warnings" : 1, "errors" : 2, "fatals" : 0, "execution_errors" : 0 }, "status" : "succeeded" }
在DQOps REST API客户端参考文档中了解更多关于DQOps Python客户端的信息,其中展示了客户端支持的每个操作对应的Python代码示例。
有关完整的指南和使用场景文档,请访问[***]
快速入门指南展示了如何开始使用DQOps。
此外,阅读DQOps概念指南,了解DQOps的工作原理以及如何配置数据质量检查。
如发现工具问题,请在以下地址提交:
https://github.com/dqops/dqo/issues
或通过[***]
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务