
重要提示:此镜像已弃用,请使用新的 https://hub.docker.com/repository/docker/voltrondata/sqlflite 镜像替代。
https://hub.docker.com/r/voltrondata/flight-sql []([] https://github.com/voltrondata/flight-sql-server-example []([] []([***]
本镜像展示了如何使用DuckDB或SQLite作为后端数据库构建Apache Arrow Flight SQL服务器实现。它通过中间件支持认证,并允许通过TLS建立加密的数据库连接。有关Apache Arrow Flight SQL的更多信息,请参见这篇文章。
打开终端,拉取并运行已配置好的Docker镜像(如需在屏幕上查看标准输出,可将"--detach"改为"--interactive"):
bashdocker run --name flight-sql \ --detach \ --rm \ --tty \ --init \ --publish 31337:31337 \ --env TLS_ENABLED="1" \ --env FLIGHT_PASSWORD="flight_password" \ --env PRINT_QUERIES="1" \ --pull missing \ voltrondata/flight-sql:latest
上述命令会自动挂载一个小型TPC-H DuckDB数据库文件。
注意:可通过将环境变量
TLS_ENABLED设置为"0"禁用容器内的TLS(默认值为"1",即启用)。除非在Kubernetes中使用mTLS sidecar等类似机制,否则不建议禁用TLS,因为这会导致不安全连接。
可选:使用自定义数据库文件
运行Docker镜像时,可以指定自己的DuckDB数据库文件(数据库必须使用DuckDB 1.0.0版本构建)。
前提条件:安装DuckDB CLI
安装https://github.com/duckdb/duckdb/releases/tag/v1.0.0%E7%9A%84DuckDB CLI,并确保可执行文件在PATH中。
平台下载链接:
https://github.com/duckdb/duckdb/releases/download/v1.0.0/duckdb_cli-linux-amd64.zip
https://github.com/duckdb/duckdb/releases/download/v1.0.0/duckdb_cli-linux-aarch64.zip
https://github.com/duckdb/duckdb/releases/download/v1.0.0/duckdb_cli-osx-universal.zip
以下示例生成一个新的TPC-H Scale Factor 1(1GB)数据库文件,并运行docker镜像挂载该文件:
bash# 在主机的/tmp目录生成TPC-H数据库 pushd /tmp duckdb ./tpch_sf1.duckdb << EOF .bail on .echo on SELECT VERSION(); INSTALL tpch; LOAD tpch; CALL dbgen(sf=1); EOF # 运行flight-sql docker容器,并将主机上创建的DuckDB数据库文件挂载到容器内 docker run --name flight-sql \ --detach \ --rm \ --tty \ --init \ --publish 31337:31337 \ --env TLS_ENABLED="1" \ --env FLIGHT_PASSWORD="flight_password" \ --pull missing \ --mount type=bind,source=$(pwd),target=/opt/flight_sql/data \ --env DATABASE_FILENAME="data/tpch_sf1.duckdb" \ voltrondata/flight-sql:latest
运行初始化SQL命令
可通过设置环境变量INIT_SQL_COMMANDS在容器启动时执行初始化命令,值为用分号分隔的SQL命令字符串。例如:SET threads = 1; SET memory_limit = '1GB';。
以下是运行带初始化SQL命令的Docker镜像完整示例:
bashdocker run --name flight-sql \ --detach \ --rm \ --tty \ --init \ --publish 31337:31337 \ --env TLS_ENABLED="1" \ --env FLIGHT_PASSWORD="flight_password" \ --env PRINT_QUERIES="1" \ --env INIT_SQL_COMMANDS="SET threads = 1; SET memory_limit = '1GB';" \ --pull missing \ voltrondata/flight-sql:latest
也可通过设置环境变量INIT_SQL_COMMANDS_FILE指定包含初始化SQL命令的文件路径(例如/tmp/init.sql),该文件必须挂载到容器内。
注意:对于DuckDB后端,会自动运行以下初始化命令:
SET autoinstall_known_extensions = true; SET autoload_known_extensions = true;
注意:返回数据的SELECT初始化命令不会显示结果(不支持)。
注意:失败的初始化SQL命令会导致Flight SQL服务器中止并以非零退出码退出。
下载Apache Arrow Flight SQL JDBC驱动
使用以下JDBC连接字符串从主机连接到本地运行的Docker Flight SQL服务器(如修改了FLIGHT_PASSWORD环境变量的值,请相应更改密码):
bashjdbc:arrow-flight-sql://localhost:31337?useEncryption=true&user=flight_username&password=flight_password&disableCertificateVerification=true
有关在流行数据库IDE工具DBeaver Community Edition中设置JDBC驱动的说明,请参见此https://github.com/voltrondata/setup-arrow-jdbc-driver-in-dbeaver%E3%80%82
注意:如果停止/重启Flight SQL Docker容器,并尝试使用相同密码通过JDBC连接,可能会出现错误:"Invalid bearer token provided. Detail: Unauthenticated"。这是因为客户端JDBC驱动缓存了使用前一实例RSA私钥签名的bearer令牌。只需通过更改"FLIGHT_PASSWORD"环境变量设置新容器的密码,然后使用新密码通过JDBC连接。
可使用新的Apache Arrow Python ADBC Flight SQL驱动查询Flight SQL服务器。ADBC相比JDBC具有性能优势,因为它最大限度地减少了序列化/反序列化,数据在所有阶段都保持列存格式。
有关ADBC和Flight SQL的更多信息,请参见此处。
确保已安装Python 3.9+,然后打开终端运行:
bash# 创建Python虚拟环境 python3 -m venv ./venv # 激活虚拟环境 . ./venv/bin/activate # 安装依赖,包括新的Arrow ADBC Flight SQL驱动 pip install --upgrade pip pip install pandas pyarrow adbc_driver_flightsql # 启动Python交互式shell python
在Python shell中运行:
pythonfrom adbc_driver_flightsql import dbapi as flight_sql, DatabaseOptions flight_password = "flight_password" # 生产环境中建议使用环境变量! with flight_sql.connect(uri="grpc+tls://localhost:31337", db_kwargs={"username": "flight_username", "password": flight_password, DatabaseOptions.TLS_SKIP_VERIFY.value: "true" # 如果使用受信任CA签名的TLS证书,则不需要此选项 } ) as conn: with conn.cursor() as cur: cur.execute("SELECT n_nationkey, n_name FROM nation WHERE n_nationkey = ?", parameters=[24] ) x = cur.fetch_arrow_table() print(x)
应看到以下结果:
textpyarrow.Table n_nationkey: int32 n_name: string ---- n_nationkey: [[24]] n_name: [["UNITED STATES"]]
flight_sql_client CLI工具连接也可使用新的flight_sql_client CLI工具连接Flight SQL服务器并运行命令。该工具内置在Docker镜像中,也可作为独立可执行文件用于Linux和MacOS。
示例(从主机终端运行):
bashflight_sql_client \ --command Execute \ --host "localhost" \ --port 31337 \ --username "flight_username" \ --password "flight_password" \ --query "SELECT version()" \ --use-tls \ --tls-skip-verify
应返回:
textResults from endpoint 1 of 1 Schema: version(): string Results: version(): [ "v1.0.0" ] Total: 1
使用以下命令停止docker镜像:
bashdocker stop flight-sql
从以下支持的平台下载(并解压缩)最新版本的flight_sql_server CLI可执行文件:
https://github.com/voltrondata/flight-sql-server-example/releases/latest/download/flight_sql_cli_linux_amd64.zip
https://github.com/voltrondata/flight-sql-server-example/releases/latest/download/flight_sql_cli_linux_arm64.zip
https://github.com/voltrondata/flight-sql-server-example/releases/latest/download/flight_sql_cli_macos_amd64.zip
https://github.com/voltrondata/flight-sql-server-example/releases/latest/download/flight_sql_cli_macos_arm64.zip
然后在终端中运行:
bashFLIGHT_PASSWORD="flight_password" flight_sql_server --database-filename data/some_db.duckdb --print-queries
查看所有程序选项:
bashflight_sql_server --help
要手动构建解决方案并运行SQLite和DuckDB Flight SQL服务器,需要在机器上设置Python 3.9+虚拟环境。按照以下步骤操作:
bashgit clone https://github.com/voltrondata/flight-sql-server-example --recurse-submodules cd flight-sql-server-example # 构建并安装静态库和可执行文件 cmake -S . -B build -G Ninja -DCMAKE_INSTALL_PREFIX=/usr/local cmake --build build --target install
bashpython3 -m venv ./venv . ./venv/bin/activate pip install --upgrade pip setuptools wheel pip install --requirement ./requirements.txt
bashwget https://github.com/lovasoa/TPCH-sqlite/releases/download/v1.0/TPC-H-small.db -O ./data/TPC-H-small.sqlite
bashpython "scripts/create_duckdb_database_file.py" \ --file-name="TPC-H-small.duckdb" \ --file-path="data" \ --overwrite-file=true \ --scale-factor=0.01
bashpushd tls ./gen-certs.sh popd
bashFLIGHT_PASSWORD="flight_password" flight_sql_server --database-filename data/TPC-H-small.duckdb --print-queries
此选项允许从两个后端中选择:SQLite和DuckDB,默认使用DuckDB。
bash$ FLIGHT_PASSWORD="flight_password" flight_sql_server --database-filename data/TPC-H-small.duckdb Apache Arrow version: 17.0.0 WARNING - TLS is disabled for the Flight SQL server - this is insecure. DuckDB version: v1.0.0 Running Init SQL command: SET autoinstall_known_extensions = true; Running Init SQL command: SET autoload_known_extensions = true; Using database file: "/opt/flight_sql/data/TPC-H-small.duckdb" Print Queries option is set to: false Apache Arrow Flight SQL server - with engine: DuckDB - will listen on grpc+tcp://0.0.0.0:31337 Flight SQL server - started
上述命令等效于运行flight_sql_server -B duckdb或flight_sql --backend duckdb。要选择SQLite,运行:
bashFLIGHT_PASSWORD="flight_password" flight_sql_server -B sqlite -D data/TPC-H-small.sqlite
或
bashFLIGHT_PASSWORD="flight_password" flight_sql_server --backend sqlite --database-filename data/TPC-H-small.sqlite
运行结果如下:
bashApache Arrow version: 17.0.0 WARNING - TLS is disabled for the Flight SQL server - this is insecure. SQLite version: 3.45.0 Using database file: "/opt/flight_sql/data/TPC-H-small.sqlite" Print Queries option is set to: false Apache Arrow Flight SQL server - with engine: SQLite - will listen on grpc+tcp://0.0.0.0:31337 Flight SQL server - started
要查看所有可用选项,运行flight_sql_server --help:
bashflight_sql_server --help Allowed options: --help 显示帮助信息 --version 打印版本信息并退出 -B [ --backend ] arg (=duckdb) 指定数据库后端,允许选项:duckdb、sqlite -H [ --hostname ] arg 指定Flight SQL服务器监听的主机名。未设置时使用环境变量'FLIGHT_HOSTNAME';若也未设置,默认使用'0.0.0.0' -R [ --port ] arg (=31337) 指定Flight SQL服务器监听的端口 -D [ --database-filename ] arg 指定数据库文件名(绝对路径或相对于当前工作目录的路径) -U [ --username ] arg 指定允许客户端连接的用户名。未设置时使用环境变量'FLIGHT_USERNAME';若也未设置,默认使用'flight_username' -P [ --password ] arg 指定客户端连接服务器的密码。未设置时使用环境变量'FLIGHT_PASSWORD';若也未设置,服务器将启动失败 -S [ --secret-key ] arg 指定用于签名服务器颁发的JWT的密钥。未设置时使用环境变量'SECRET_KEY';若也未设置,服务器将生成随机密钥 -T [ --tls ] arg 指定TLS证书和密钥文件路径 -I [ --init-sql-commands ] arg 指定服务器启动时运行的SQL命令。未设置时使用环境变量'INIT_SQL_COMMANDS' -F [ --init-sql-commands-file ] arg 指定包含服务器启动时运行的SQL命令的文件
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。


探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务