
!GitHub !https://github.com/HumanSignal/label-studio/workflows/label-studio:build/badge.svg !GitHub release
官方网站 • 文档 • 加入Slack社区
Label Studio是一个开源数据标注工具。它允许您通过简单直观的UI界面对音频、文本、图像、视频和时间序列等数据类型进行标注,并导出为多种模型格式。可用于准备原始数据或改进现有训练数据,以获得更准确的机器学习模型。
!Label Studio标注不同类型数据的演示GIF
如果您有自定义数据集,可以定制Label Studio以满足您的需求。
Label Studio包含多种标注模板,或可使用专门设计的配置语言创建自定义模板。最常见的标注模板和用例包括文本分类、命名实体识别、图像分割、音频转录等。
官方Label Studio Docker镜像可通过docker pull获取。在Docker容器中运行Label Studio并通过http://localhost:8080访问:
bash# 拉取最新镜像 docker pull heartexlabs/label-studio:latest # 运行容器,映射8080端口并挂载数据卷 docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest
所有生成的资产(包括SQLite3数据库存储label_studio.sqlite3和上传的文件)将保存在./mydata目录中。
覆盖默认Docker启动命令
您可以通过追加新参数来覆盖默认启动命令:
bashdocker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG
Docker Compose脚本提供生产就绪的堆栈,包括以下组件:
通过以下命令从http://localhost开始使用应用:
bashdocker-compose up
您还可以添加MinIO服务器用于本地S3存储。这在本地系统上测试S3存储行为时特别有用。通过以下命令启动:
bash# Linux系统如非docker组用户需添加sudo docker compose -f docker-compose.yml -f docker-compose.minio.yml up -d
如果没有静态IP地址,必须在hosts文件中创建条目,以便Label Studio和浏览器都能访问MinIO服务器。
使用Label Studio机器学习SDK连接您喜爱的机器学习模型。步骤如下:
这使您能够:
您可以将Label Studio用作机器学习工作流的独立部分,或将前端或后端集成到现有工具中。
| 项目 | 描述 |
|---|---|
| label-studio | 服务器,作为pip包分发 |
| 前端库 | Label Studio前端库,使用React构建UI,mobx-state-tree进行状态管理 |
| 数据管理器库 | 数据管理器库,用于数据探索工具 |
| https://github.com/HumanSignal/label-studio-sdk/tree/master/src/label_studio_sdk/converter | 将标签编码为您喜爱的机器学习库格式 |
| https://github.com/HumanSignal/label-studio-transformers | 连接并配置用于Label Studio的Transformers库 |
在文章的参考文献部分包含Label Studio的引用:
tex@misc{Label Studio, title={{Label Studio}: Data labeling software}, url={https://github.com/HumanSignal/label-studio}, note={Open source software available from https://github.com/HumanSignal/label-studio}, author={ Maxim Tkachenko and Mikhail Malyuk and Andrey Holmanyuk and Nikolai Liubimov}, year={2020-2025}, }
本软件根据Apache 2.0 LICENSE许可 © Heartex。 2020-2025
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务