
apachepinot/pinotApache Pinot是一个实时分布式OLAP(在线分析处理)数据存储,专为提供可扩展的实时分析而构建,具有低延迟特性。它能够从批处理数据源(如Hadoop HDFS、Amazon S3、Azure ADLS、Google Cloud Storage)和流数据源(如Apache Kafka)摄入数据。Pinot由LinkedIn和Uber的工程师开发,设计目标是实现无上限的横向和纵向扩展,且性能基于集群规模和预期查询每秒(QPS)阈值保持稳定。
Pinot适用于需要对海量数据和事件执行实时OLAP查询的场景,要求低延迟和高吞吐量。除实时流数据摄入外,它同样支持批处理场景,且保持低延迟特性。特别适合以下场景:
sqlSELECT sum(clicks), sum(impressions) FROM AdAnalyticsTable WHERE ((daysSinceEpoch >= *** AND daysSinceEpoch <= ***)) AND accountId IN (***) GROUP BY daysSinceEpoch TOP 100
详细步骤参见快速演示文档:
bash# 克隆仓库 git clone [***] cd pinot # 构建Pinot(跳过测试,使用二进制分发包配置) mvn clean install -DskipTests -Pbin-dist # 运行快速演示(批处理模式) cd build/ bin/quick-start-batch.sh
Pinot提供Kubernetes集成,支持与交互式查询引擎(Trino、Presto)和数据可视化工具(Apache Superset)集成。部署指南参见Kubernetes快速入门,主要通过Helm Chart实现集群部署。
完整文档参见Pinot官方文档,主要包括:
Apache Pinot基于Apache License, Version 2.0许可发布。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务