
andpad/elasticsearch_with_kuromojielasticsearch_with_kuromoji是一个预集成Kuromoji日语分词插件的Elasticsearch Docker镜像,旨在简化日语文本处理的部署流程。该镜像基于官方Elasticsearch镜像构建,内置Kuromoji插件,支持日语词汇的精准分词、形态分析和索引,适用于需要对日语内容进行高效搜索和分析的场景。
使用以下命令启动容器:
bashdocker run -d \ --name es-kuromoji \ -p 9200:9200 \ -p 9300:9300 \ -e "discovery.type=single-node" \ -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \ elasticsearch_with_kuromoji:latest
| 环境变量 | 说明 | 默认值 |
|---|---|---|
ES_JAVA_OPTS | Java运行参数 | -Xms1g -Xmx1g |
discovery.type | 节点发现类型 | single-node(单节点模式) |
cluster.name | 集群名称 | docker-cluster |
node.name | 节点名称 | 容器ID |
容器启动后,通过以下命令验证Kuromoji插件是否安装成功:
bash# 检查已安装插件 curl http://localhost:9200/_cat/plugins # 预期输出包含 "kuromoji"
bashcurl -X PUT "http://localhost:9200/japanese_docs" -H "Content-Type: application/json" -d ' { "settings": { "analysis": { "analyzer": { "japanese_analyzer": { "type": "custom", "tokenizer": "kuromoji_tokenizer", "filter": ["kuromoji_baseform", "kuromoji_part_of_speech", "kuromoji_readingform"] } } } }, "mappings": { "properties": { "content": { "type": "text", "analyzer": "japanese_analyzer" } } } }'
bashcurl -X POST "http://localhost:9200/japanese_docs/_analyze" -H "Content-Type: application/json" -d ' { "analyzer": "japanese_analyzer", "text": "今日はとてもいい天気です" }'
预期返回分词结果,包含"今日"、"とても"、"いい"、"天気"等词汇及相关词性、读音信息。
数据持久化:通过挂载数据卷实现数据持久化
bashdocker run -d \ --name es-kuromoji \ -p 9200:9200 \ -v /host/path/to/data:/usr/share/elasticsearch/data \ elasticsearch_with_kuromoji:latest
自定义配置:挂载自定义elasticsearch.yml配置文件
bashdocker run -d \ --name es-kuromoji \ -p 9200:9200 \ -v /host/path/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \ elasticsearch_with_kuromoji:latest
集群部署:修改discovery.type为multi-node,并配置cluster.initial_master_nodes实现多节点集群
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务