
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
CogStack是一个轻量级分布式、容错的数据库处理架构和生态系统,旨在资源受限环境中简化NLP处理和预处理。CogStack Pipeline作为其核心组件,提供可配置的数据处理管道,专门用于处理电子健康记录(EHR)数据。它主要使用数据库和文件作为EHR数据的主要来源(即将支持自定义数据连接器),基于https://spring.io/projects/spring-batch%E6%A1%86%E6%9E%B6%E6%9E%84%E5%BB%BA%EF%BC%8C%E5%8F%AF%E7%94%9F%E6%88%90%E5%8F%AF%E7%9B%B4%E6%8E%A5%E7%B4%A2%E5%BC%95%E5%88%B0https://www.elastic.co/%E7%9A%84%E6%B3%A8%E9%87%8AJSON%E6%96%87%E4%BB%B6%EF%BC%8C%E4%B9%9F%E5%8F%AF%E5%AD%98%E5%82%A8%E4%B8%BA%E6%96%87%E4%BB%B6%E6%88%96%E6%8E%A8%E5%9B%9E%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82
需安装以下工具:
通过GitHub仓库获取CogStack Pipeline:
bash# 克隆仓库 git clone https://github.com/CogStack/CogStack-Pipeline.git # 或从Releases页面下载压缩包并解压 # https://github.com/CogStack/CogStack-Pipeline/releases
本教程使用的示例数据集包含两类EHR数据:
完整数据集描述请参考官方Confluence文档。
1. 下载数据库dump文件
在examples/目录下执行:
bashbash download_db_dumps.sh
2. 运行 setup 脚本
进入examples/example2/目录,执行 setup 脚本准备部署文件:
bashbash setup.sh
执行后会创建__deploy/临时目录,包含所有部署所需文件。
3. Docker Compose部署
进入examples/example2/__deploy/目录,启动CogStack生态系统:
bashdocker-compose up
部署的CogStack生态系统包含以下微服务:
samples-db:PostgreSQL数据库,包含预加载的示例数据集(数据库名db_samples)cogstack-pipeline:CogStack数据处理管道及工作节点cogstack-job-repo:PostgreSQL数据库,存储CogStack作业信息elasticsearch-1:ElasticSearch单节点,存储处理后的EHR数据kibana:Kibana数据可视化工具,用于查询ElasticSearch中的数据Kibana访问
通过浏览器访问Kibana仪表板:
http://localhost:5601/
首次使用需在Kibana管理面板配置索引模式(参考https://www.elastic.co/guide/en/kibana/current/tutorial-define-index.html%EF%BC%89%E3%80%82
ElasticSearch访问
ElasticSearch REST端点:
http://localhost:9200/
示例查询:
bash# 列出所有索引 curl 'http://localhost:9200/_cat/indices' # 查询特定索引 curl 'http://localhost:9200/sample_observations_view'
PostgreSQL数据库访问
示例数据库暴露端口5555,连接信息:
db_samplestesttest连接命令:
bashpsql -U 'test' -W -d 'db_samples' -h localhost -p 5555
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务