OpenRefine 是一款免费开源的强大工具,用于处理和改善混乱数据。这些Docker镜像基于官方发布版本(3.5.0、3.4.1、3.4、3.3、3.2、3.1、3.0、2.8、2.7、2.7rc2、2.7rc1、2.6rc2、2.6rc1、2.5、2.1、2.0)以及一个分支版本(2017-10-28-with-pr1294)构建。
- https://github.com/felixlohmeier/openrefine-docker
- https://hub.docker.com/r/felixlohmeier/openrefine/
Docker构建文件的灵感来源于 https://hub.docker.com/r/vimagick/openrefine/ 和 https://hub.docker.com/r/psychemedia/openrefine/%E3%80%82
版本
参见 https://github.com/OpenRefine/OpenRefine/releases
- OpenRefine 4.0-snapshot(2021-07-12),基于 openjdk:11-jre-alpine [4.0-snapshot]
- OpenRefine 3.5.0(2021-11-07),基于 openjdk:8-jre-alpine [3.5.0] & [latest]
- OpenRefine 3.4.1(2020-09-24),基于 openjdk:8-jre-alpine [3.4.1]
- OpenRefine 3.4(2020-09-06),基于 openjdk:8-jre-alpine [3.4]
- OpenRefine 3.3(2020-01-31),基于 openjdk:8-jre-alpine [3.3]
- OpenRefine 3.2(2019-07-16),基于 adoptopenjdk/openjdk12:alpine-jre [3.2-java12]
- OpenRefine 3.2(2019-07-16),基于 adoptopenjdk/openjdk11:alpine-jre [3.2-java11]
- OpenRefine 3.2(2019-07-16),基于 openjdk:10-jre-alpine [3.2-java10]
- OpenRefine 3.2(2019-07-16),基于 adoptopenjdk/openjdk9:alpine-slim [3.2-java9]
- OpenRefine 3.2(2019-07-16),基于 openjdk:8-jre-alpine [3.2]
- OpenRefine 3.1(2018-11-29),基于 adoptopenjdk/openjdk9:alpine-slim [3.1-java9]
- OpenRefine 3.1(2018-11-29),基于 openjdk:8-jre-alpine [3.1]
- OpenRefine 3.0(2018-09-16),基于 adoptopenjdk/openjdk9:alpine-slim [3.0-java9]
- OpenRefine 3.0(2018-09-16),基于 openjdk:8-jre-alpine [3.0]
- OpenRefine 2.8(2017-11-19),基于 adoptopenjdk/openjdk9:alpine-slim [2.8-java9]
- OpenRefine 2.8(2017-11-19),基于 openjdk:8-jre-alpine [2.8]
- OpenRefine 2.8(2017-11-19),基于 openjdk:7-jre [2.8-java7]
- OpenRefine 2.7(2017-06-18),基于 openjdk:8-jre-alpine [2.7]
- OpenRefine 2.7(2017-06-18),基于 openjdk:7-jre [2.7-java7]
- OpenRefine 2.7 发布候选版 2(2017-03-03),基于 openjdk:8-jre-alpine [2.7rc2]
- OpenRefine 2.7 发布候选版 1(2017-02-10),基于 openjdk:8-jre-alpine [2.7rc1]
- OpenRefine 2.6 发布候选版 2(2015-10-14),基于 openjdk:8-jre-alpine [2.6rc2]
- OpenRefine 2.6 发布候选版 1(2015-04-30),基于 openjdk:8-jre-alpine [2.6rc1]
- Google Refine 2.5(2011-12-11),基于 openjdk:7-jre [2.5-java7]
- Google Refine 2.5(2011-12-11),基于 openjdk:6-jre [2.5-java6]
- Google Refine 2.1(2011-07-12),基于 openjdk:6-jre [2.1-java6]
- Google Refine 2.0(2010-11-10),基于 openjdk:6-jre [2.0-java6]
- OpenRefine https://github.com/opencultureconsulting/OpenRefine%EF%BC%882017-10-28 快照,包含拉取请求 #1294),基于 openjdk:8-jre-alpine [2017-10-28-with-pr1294]
使用方法
基础运行命令
bash
docker run -p 3333:3333 felixlohmeier/openrefine
在主机浏览器中访问 http://localhost:3333(或网络内任何机器均可访问)。
自定义运行命令示例
bash
docker run --rm -p 80:3333 -v /home/felix/refine:/data:z felixlohmeier/openrefine:3.5.0 -i 0.0.0.0 -d /data -m 4G
参数说明:
--rm:容器退出时自动删除
-p 80:3333:将容器内部端口 3333 映射到主机端口 80
-v /home/felix/refine:/data:z:将主机目录 /home/felix/refine 挂载到容器内 /data 目录(:z 用于 SELinux 环境)
felixlohmeier/openrefine:3.5.0:指定使用 3.5.0 版本的镜像(即 OpenRefine 3.5.0 版本)
-i 0.0.0.0:设置 OpenRefine 可从容器外部(如主机)访问
-d /data:将 OpenRefine 工作区设置为 /data 目录
-m 4G:将 Java 堆大小增加到 4G
相关资源
- OpenRefine 命令行客户端:https://github.com/opencultureconsulting/openrefine-client/#docker
- 用于批处理模式运行 OpenRefine 的 Linux Bash 脚本(导入、转换、导出):https://github.com/opencultureconsulting/openrefine-batch/#docker