mu-migrations-service是一款用于在数据库上运行迁移的服务,目前支持SPARQL查询(.sparql)和Turtle文件(.ttl)格式,未来计划扩展支持更多格式。该服务确保迁移按序执行、状态可追踪,适用于RDF数据库(如Virtuoso)的数据更新、初始化及模式变更场景。
适用于需要对RDF数据库进行结构化数据迁移的项目,包括但不限于:
将迁移服务添加到项目栈
在mu-project的docker-compose.yml中添加以下配置,将迁移服务集成到项目:
yamlmigrations: image: semtech/mu-migrations-service links: - triplestore:database # "triplestore"为数据库服务名称(通常是Virtuoso实例) volumes: - ./config/migrations:/data/migrations # 本地迁移文件目录映射到容器内
使用docker-compose up -d启动服务栈,通过docker-compose logs -ft migrations查看日志,确认服务启动成功(初始无迁移执行)。
编写迁移以更新数据集中的谓词
以下示例将数据集中所有schema:name谓词替换为foaf:name:
./config/migrations/20200329140538-replace-schema-name-with-foaf-name.sparqlsparqlPREFIX schema: <http://schema.org/> PREFIX foaf: <http://xmlns.com/foaf/0.1/> DELETE { GRAPH ?g { ?s schema:name ?o . } } INSERT { GRAPH ?g { ?s foaf:name ?o . } } WHERE { GRAPH ?g { ?s schema:name ?o . } }
执行docker-compose restart migrations重启服务,通过docker-compose logs -ft migrations查看迁移执行状态及结果。
使用SPARQL查询操作数据
创建SPARQL迁移文件(如./config/migrations/20160808225103-statuses.sparql),示例内容:
sparqlPREFIX dct: <http://purl.org/dc/terms/> PREFIX tac: <http://tasks-at-hand.com/vocabularies/core/> PREFIX mu: <http://mu.semte.ch/vocabularies/core/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> INSERT DATA { GRAPH <http://mu.semte.ch/application> { <http://tasks-at-hand.com/resources/statuses/not_started> a tac:Status; mu:uuid "wellknown-status-not_started"; dct:title "not started". <http://tasks-at-hand.com/resources/statuses/ongoing> a tac:Status; mu:uuid "wellknown-status-ongoing"; dct:title "ongoing". <http://tasks-at-hand.com/resources/statuses/done> a tac:Status; mu:uuid "wellknown-status-done"; dct:title "done". } }
使用Turtle文件在默认图中插入数据
创建Turtle迁移文件(如./config/migrations/20160808225103-statuses.ttl),示例内容:
turtle@prefix dct: <http://purl.org/dc/terms/> . @prefix tac: <http://tasks-at-hand.com/vocabularies/core/> . @prefix mu: <http://mu.semte.ch/vocabularies/core/> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . <http://tasks-at-hand.com/resources/statuses/not_started> a tac:Status; mu:uuid "wellknown-status-not_started"; dct:title "not started". <http://tasks-at-hand.com/resources/statuses/ongoing> a tac:Status; mu:uuid "wellknown-status-ongoing"; dct:title "ongoing". <http://tasks-at-hand.com/resources/statuses/done> a tac:Status; mu:uuid "wellknown-status-done"; dct:title "done".
默认情况下,Turtle数据将导入到图<http://mu.semte.ch/application>中。
使用Turtle文件在特定图中插入数据(实验性)
创建与Turtle文件同名的.graph文件(如20160808225103-statuses.graph),文件内容为目标图名称:
http://mu.semte.ch/graphs/custom-graph
迁移的命名和组织
[Unix时间戳]-[描述].sparql或.ttl(如20200329140538-replace-schema-name-with-foaf-name.sparql)/data/migrations目录(可通过卷映射),支持子文件夹,执行状态仅与文件名相关,与路径无关执行保证
数据库中的迁移管理
迁移完成状态存储在MU_APPLICATION_GRAPH(默认:<http://mu.semte.ch/application>)中,每条记录为类型muMigr:Migration的资源,包含:
muMigr:filename:迁移文件名muMigr:executedAt:执行完成时间戳muMigr: <http://mu.semte.ch/vocabularies/migrations/>)配置
支持通过环境变量配置:
BATCH_SIZE:Turtle迁移的单次插入三元组数量(默认:***)MINIMUM_BATCH_SIZE:批处理大小下限,低于此值时报错(默认:100)COUNT_BATCH_SIZE:单次从数据库查询的已执行迁移数量(默认:***)大型数据集和批处理大小
三元组存储通常有单次请求数据量限制,服务通过批处理拆分大型数据集。配置BATCH_SIZE控制单次插入量,失败时自动减半重试,直至达到MINIMUM_BATCH_SIZE。数据先导入临时图,成功后通过SPARQL Graph查询合并到目标图,确保完整性。
与mu-authorization配合使用(实验性)
可与mu-authorization集成,服务会添加mu-auth-sudo头以提升权限执行迁移。此功能为实验性,欢迎反馈以改进。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务