semtech/mu-migrations-service Docker Image Overview

semtech/mu-migrations-service

自动构建

semtech

用于运行数据库迁移的服务，支持SPARQL查询（*.sparql）和Turtle文件（*.ttl），按文件名顺序执行迁移，确保执行顺序和完成状态跟踪，适用于RDF数据库的数据更新与初始化。

1 次收藏下载次数: 0状态：自动构建维护者：semtech仓库类型：镜像最近更新：1 年前

轩辕镜像，加速的不只是镜像。点击查看

中文简介版本下载

轩辕镜像，加速的不只是镜像。点击查看

mu-migrations-service

镜像概述和主要用途

mu-migrations-service是一款用于在数据库上运行迁移的服务，目前支持SPARQL查询（.sparql）和Turtle文件（.ttl）格式，未来计划扩展支持更多格式。该服务确保迁移按序执行、状态可追踪，适用于RDF数据库（如Virtuoso）的数据更新、初始化及模式变更场景。

核心功能和特性

多格式支持：当前支持SPARQL查询文件（.sparql）和Turtle文件（.ttl）
有序执行：按文件名中数字前缀的升序顺序执行迁移
执行保障：前一迁移成功后才执行下一迁移，失败时停止后续操作，已完成迁移不会重复执行
状态跟踪：在数据库中记录迁移完成状态，包含文件名和执行时间
配置灵活：通过环境变量调整批处理大小等参数

使用场景和适用范围

适用于需要对RDF数据库进行结构化数据迁移的项目，包括但不限于：

数据模型变更（如谓词替换、类定义更新）
初始化基础数据（如系统配置、枚举值）
批量数据更新或清洗
版本化数据迁移管理

详细使用方法和配置说明

教程

将迁移服务添加到项目栈

在mu-project的docker-compose.yml中添加以下配置，将迁移服务集成到项目：

yaml
migrations:
  image: semtech/mu-migrations-service
  links:
    - triplestore:database  # "triplestore"为数据库服务名称（通常是Virtuoso实例）
  volumes:
    - ./config/migrations:/data/migrations  # 本地迁移文件目录映射到容器内

使用docker-compose up -d启动服务栈，通过docker-compose logs -ft migrations查看日志，确认服务启动成功（初始无迁移执行）。

编写迁移以更新数据集中的谓词

以下示例将数据集中所有schema:name谓词替换为foaf:name：

创建迁移文件：./config/migrations/20200329140538-replace-schema-name-with-foaf-name.sparql
写入SPARQL查询：

sparql
PREFIX schema: <[***]>
PREFIX foaf: <[***]>

DELETE {
  GRAPH ?g { ?s schema:name ?o . }
} INSERT {
  GRAPH ?g { ?s foaf:name ?o . }
} WHERE {
  GRAPH ?g { ?s schema:name ?o . }
}

执行docker-compose restart migrations重启服务，通过docker-compose logs -ft migrations查看迁移执行状态及结果。

操作指南

使用SPARQL查询操作数据

创建SPARQL迁移文件（如./config/migrations/20160808225103-statuses.sparql），示例内容：

sparql
PREFIX dct: <[***]>
PREFIX tac: <[***]>
PREFIX mu: <[***]>
PREFIX rdf: <[***]>

INSERT DATA {
  GRAPH <[***]> {
    <[***]>
      a tac:Status;
      mu:uuid "wellknown-status-not_started";
      dct:title "not started".
    <[***]>
      a tac:Status;
      mu:uuid "wellknown-status-ongoing";
      dct:title "ongoing".
    <[***]>
      a tac:Status;
      mu:uuid "wellknown-status-done";
      dct:title "done".
  }
}

使用Turtle文件在默认图中插入数据

创建Turtle迁移文件（如./config/migrations/20160808225103-statuses.ttl），示例内容：

turtle
@prefix dct: <[***]> .
@prefix tac: <[***]> .
@prefix mu: <[***]> .
@prefix rdf: <[***]> .

<[***]>
      a tac:Status;
      mu:uuid "wellknown-status-not_started";
      dct:title "not started".
<[***]>
      a tac:Status;
      mu:uuid "wellknown-status-ongoing";
      dct:title "ongoing".
<[***]>
      a tac:Status;
      mu:uuid "wellknown-status-done";
      dct:title "done".

默认情况下，Turtle数据将导入到图<[***]>中。

使用Turtle文件在特定图中插入数据（实验性）

创建与Turtle文件同名的.graph文件（如20160808225103-statuses.graph），文件内容为目标图名称：

[***]

参考

迁移的命名和组织

命名规则：文件名必须以数字开头且全局唯一，建议格式为[Unix时间戳]-[描述].sparql或.ttl（如20200329140538-replace-schema-name-with-foaf-name.sparql）
文件组织：迁移文件需放在/data/migrations目录（可通过卷映射），支持子文件夹，执行状态仅与文件名相关，与路径无关