该镜像用于构建LinTO的NLP关键词提取服务,基于linto-platform-nlp-core开发,可作为独立服务通过HTTP API部署,或集成到LinTO平台栈中作为微服务运行。
关键词提取服务需要Docker环境正常运行。
微服务模式下,服务的唯一入口是消息代理上发布的任务。支持的消息代理包括RabbitMQ、Redis、Amazon SQS。此外,为避免大型音频通过消息代理传输,服务需使用共享存储文件夹。
linto-platform-nlp-keyword-extraction支持两种部署方式:
bashgit clone https://github.com/linto-ai/linto-platform-nlp-keyword-extraction.git cd linto-platform-nlp-keyword-extraction docker build . -t linto-platform-nlp-keyword-extraction:latest
bashdocker run --rm \ -p HOST_SERVING_PORT:80 \ --env SERVICE_MODE=http \ --env CONCURRENCY=10 \ linto-platform-nlp-keyword-extraction:latest
上述命令将启动一个容器,在主机的HOST_SERVING_PORT端口提供HTTP API服务。
参数说明:
| 变量 | 描述 | 示例 |
|---|---|---|
| HOST_SERVING_PORT | 主机服务端口 | 80 |
| CONCURRENCY | 工作进程数量 | 4 |
linto-platform-nlp-keyword-extraction可通过linto-platform-services-manager集成到linto-platform-stack中。在此模式下,容器启动celery工作进程,等待消息代理上的关键词提取任务。 任务模式下的LinTO-platform-keyword-extraction不建议手动启动。 如需连接自定义消息代理,需配置以下参数:
需确保消息代理在MY_SERVICE_BROKER地址正常运行。
bashdocker run --rm \ --env SERVICES_BROKER=MY_SERVICE_BROKER \ --env BROKER_PASS=MY_BROKER_PASS \ --env SERVICE_MODE=task \ --env CONCURRENCY=10 \ linto-platform-nlp-keyword-extraction:dev
参数说明:
| 变量 | 描述 | 示例 |
|---|---|---|
| SERVICES_BROKER | 服务代理URI | redis://my_redis_broker:6379 |
| BROKER_PASS | 服务代理密码(无密码时留空) | my_password |
| CONCURRENCY | 工作进程数量(1个工作进程对应1个CPU) | [1 -> CPU核心数] |
/healthcheck
/keyword-extraction
/docs
提供OpenAPI/swagger-ui接口文档。
工作进程接受包含以下参数的请求:
text: str, method: str
返回格式
包含关键词及其分数的JSON对象(关键词为键,分数为值)。
bashcurl -X POST "http://SERVICE:PORT/keyword_extraction" -H "accept: text/plain" -H "Content-Type: application/json" -d "{ \"text\": \"此处为待处理文本。\", \"parameters\": {\"method\": \"spacy\"} }"
本项目基于AGPLv3许可证开发(详见LICENSE)。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务