专属
文档
插件
助手
邀请
顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像

交易
充值流量我的订单

文档

工具

功能
提交工单页面收录

帮助
轩辕镜像免费版

其他
关于我们网站地图
热门搜索:
架构筛选
ukwa/ukwa-backstage logo

ukwa/ukwa-backstage

ukwa
用于浏览内部数据存储的用户界面,通过整合多个Solr集合,提供对各类内部系统状态的监控与查看功能,基于Apache Solr后端和Blacklight前端构建。
366 次下载6 年前更新
ukwa/ukwa-pywb logo

ukwa/ukwa-pywb

ukwa
UKWA定制版pywb,包含UKWA专用代码和配置的Web归档访问系统,扩展了官方pywb镜像功能。
10万+ 次下载2 年前更新
ukwa/ukwa-ui logo

ukwa/ukwa-ui

ukwa
UK Web Archive的集合前端Docker部署,提供Web存档的用户界面,支持通过Docker Compose集成Solr服务进行本地开发和部署。
10万+ 次下载2 年前更新
ukwa/ukwa-intranet logo

ukwa/ukwa-intranet

ukwa
暂无描述
5万+ 次下载2 年前更新
ukwa/ukwa-manage logo

ukwa/ukwa-manage

ukwa
用于管理英国网络档案馆(UKWA)爬取生命周期的工具集,提供TrackDB管理、HDFS存储操作及CDX/Solr索引管理等核心功能。
2.9千+ 次下载2 年前更新
ukwa/ukwa-access-api logo

ukwa/ukwa-access-api

ukwa
用于发现和交互访问UKWA内容的API服务。
2.5千+ 次下载3 年前更新
ukwa/ukwa-site logo

ukwa/ukwa-site

ukwa
暂无描述
662 次下载10 个月前更新
ukwa/uptimerobot-prometheus-exporter logo

ukwa/uptimerobot-prometheus-exporter

ukwa
一个基于Golang的Prometheus导出器,用于监控UptimeRobot的监控项。
50万+ 次下载7 年前更新
ukwa/ukwa-notebook-apps logo

ukwa/ukwa-notebook-apps

ukwa
基于Jupyter笔记本的内部报告应用程序,通过Voila运行。
1.1千+ 次下载2 年前更新
ukwa/crawl-log-viewer logo

ukwa/crawl-log-viewer

ukwa
一个独立的Web服务,用于检索和过滤存储在Kafka主题中的爬取日志流,支持通过Web界面查看和筛选日志条目。
5万+ 次下载5 年前更新
ukwa/clamd logo

ukwa/clamd

ukwa
ClamD in a docker container.
5万+ 次下载2 年前更新
ukwa/webrender-puppeteer logo

ukwa/webrender-puppeteer

ukwa
基于Google Puppeteer的网页渲染工具,类似于webrender-phantomjs,用于自动化网页内容渲染及相关功能实现。
1万+ 次下载3 年前更新
ukwa/w3act logo

ukwa/w3act

ukwa
用于网络档案的WWW注释和管理工具,支持网络资源的注释、管理及相关元数据处理,适用于网络档案的整理与保存工作。
1万+ 次下载2 年前更新
ukwa/heritrix-worker logo

ukwa/heritrix-worker

ukwa
基于Heritrix3构建的Docker镜像,集成UK网络档案馆(UKWA)特定代码和配置,用于运行可扩展网络爬虫,支持病毒扫描、浏览器渲染、URL去重及Kafka消息队列等功能,适用于大规模网络内容归档。
1 次收藏1万+ 次下载4 年前更新
ukwa/ukwa-ui-collections-solr logo

ukwa/ukwa-ui-collections-solr

ukwa
该镜像为英国网络档案馆(UKWA)的收藏内容提供Solr搜索支持的UI组件,原属ukwa仓库,现已独立以便管理。
820 次下载4 年前更新
ukwa/heritrix logo

ukwa/heritrix

ukwa
当前生产环境使用的Heritrix的Docker化构建
1 次收藏1万+ 次下载1 年前更新
ukwa/monitrix logo

ukwa/monitrix

ukwa
Heritrix 3网络爬虫的监控/分析前端,基于ELK构建,提供两个原型(专用Web应用和Kibana版本),主要用于解析、存储Heritrix日志并实现可视化分析,目前逐步转向Kibana版本。
1万+ 次下载10 年前更新
ukwa/ukwa-reports logo

ukwa/ukwa-reports

ukwa
暂无描述
149 次下载2 年前更新
gmrukwa/deployer logo

gmrukwa/deployer

gmrukwa
暂无描述
5万+ 次下载3 年前更新
ukwa/webarchive-discovery logo

ukwa/webarchive-discovery

ukwa
用于数据挖掘和索引ARC及WARC文件,以实现其内容可探索与发现的组件。
1万+ 次下载10 个月前更新
ukwa/webarchive-discovery-solr logo

ukwa/webarchive-discovery-solr

ukwa
Docker化的Solr版本,包含基于webarchive-discovery模式的核心,用于数据挖掘和索引ARC/WARC文件,实现内容的可探索和可发现。
1万+ 次下载10 个月前更新
ukwa/shine logo

ukwa/shine

ukwa
基于Solr后端的原型Web档案探索UI,使用warc-discovery索引器构建,提供Web档案搜索与探索功能。
3.9千+ 次下载6 年前更新
ukwa/pdf2htmlex logo

ukwa/pdf2htmlex

ukwa
在Docker容器中运行pdf2htmlEX的Python Web服务,用于通过URL将PDF文件转换为HTML格式。
2 次收藏3.5千+ 次下载9 年前更新
ukwa/backstage logo

ukwa/backstage

ukwa
暂无描述
171 次下载4 年前更新
ukwa/crawl-streams logo

ukwa/crawl-streams

ukwa
用于处理爬虫活动相关事件流的工具,可根据爬取规范启动爬取任务,支持调度、种子配置等功能,适用于爬虫事件流的管理与操作。
2.7千+ 次下载2 年前更新
ukwa/webrender-phantomjs logo

ukwa/webrender-phantomjs

ukwa
使用PhantomJS渲染URL的Web服务,用于网络爬虫过程中提取链接,并可配合warcprox将渲染结果存储为WARC记录。
2.5千+ 次下载7 年前更新
ukwa/waybacks logo

ukwa/waybacks

ukwa
构建包含所有OpenWayback版本的容器,通过WAR Overlay方式叠加定制化修改,实现不同用途的Web归档回溯服务,包括UKWA开放服务、QA测试环境及LDL阅览室专用版本。
2.4千+ 次下载7 年前更新
ukwa/webrender-api logo

ukwa/webrender-api

ukwa
一个独立的网页渲染服务,提供RESTful API,用于爬取期间渲染实时网页(需配合warcprox确保资源打包为WARC记录)及爬取后处理存档网页,支持比较前后结果、生成截图和缩略图。
2.2千+ 次下载5 年前更新
ukwa/webrender-har-daemon logo

ukwa/webrender-har-daemon

ukwa
在Heritrix3爬取过程中协调从网页提取嵌入URL的守护进程。
2.2千+ 次下载10 年前更新
ukwa/warcprox logo

ukwa/warcprox

ukwa
一个支持横向扩展的网络归档代理解决方案,通过负载均衡器将请求路由到多个warcprox实例,确保相同URL始终由同一实例处理,实现高效去重,适用于大规模网络爬取和归档。
2千+ 次下载4 年前更新
ukwa/warc-server logo

ukwa/warc-server

ukwa
用于将WARC文件请求路由到正确文件的简单服务
2千+ 次下载3 年前更新
ukwa/airflow logo

ukwa/airflow

ukwa
包含一些额外依赖的Apache Airflow容器,便于快速部署和使用工作流管理与任务调度功能。
1.6千+ 次下载2 年前更新
ukwa/mementoweb-webclient logo

ukwa/mementoweb-webclient

ukwa
用于浏览多个网络档案中Memento的用户界面。
1.5千+ 次下载8 年前更新
ukwa/tinycdxserver logo

ukwa/tinycdxserver

ukwa
该Docker镜像用于运行基于RocksDB引擎的tinycdxserver CDX服务器,支持读写操作,可通过简单部署提供CDX服务状态查看与使用。
1.5千+ 次下载8 年前更新
ukwa/shepherd logo

ukwa/shepherd

ukwa
Shepherd是英国网络档案馆(UK Web Archive)的爬虫编排引擎,用于协调服务、管理爬取工作流、提供命令行工具及监控,支持从爬取启动到数据归档的全流程自动化与模块化架构。
1.3千+ 次下载8 年前更新
ukwa/crawl-test-site logo

ukwa/crawl-test-site

ukwa
一个用于爬虫测试的简单网站,通过Jekyll渲染和提供服务。
1.2千+ 次下载7 年前更新
ukwa/epub-streamer logo

ukwa/epub-streamer

ukwa
暂无描述
1.1千+ 次下载2 年前更新
ukwa/docker-hadoop logo

ukwa/docker-hadoop

ukwa
Docker容器中运行的Hadoop客户端,启用HttpFS,适合从容器环境执行Hadoop任务。
1千+ 次下载4 年前更新
ukwa/archival-acid-test logo

ukwa/archival-acid-test

ukwa
Web档案的酸性测试套件,通过Docker化方式提供测试资源服务器和预期结果,用于验证网络爬虫(如Heritrix3)在各类请求、响应及服务器行为场景下的爬取行为与输出内容。
1.1千+ 次下载4 年前更新
ukwa/python-w3act logo

ukwa/python-w3act

ukwa
用于与w3act服务交互的Python包,封装常见操作,专注于从W3ACT提取数据,提供命令行工具处理PostgreSQL数据库CSV文件并生成衍生数据,支持Docker容器部署。
904 次下载2 年前更新
ukwa/shine-react logo

ukwa/shine-react

ukwa
一个用React JavaScript编写的实验性分面浏览器
810 次下载6 年前更新
ukwa/docker-trifecta logo

ukwa/docker-trifecta

ukwa
Trifecta Docker container build
821 次下载7 年前更新
ukwa/pywb logo

ukwa/pywb

ukwa
pywb是一个Python web归档工具包,用于准确重放各类web档案并创建高保真归档,具备动态多集合配置、录制功能、组件化架构及Memento API支持,是Webrecorder项目基础及通用web归档解决方案。
817 次下载5 年前更新
giantswarm/backstage logo

giantswarm/backstage

giantswarm
暂无描述
10万+ 次下载7 个月前更新
ukwa/heritrix3-exporter logo

ukwa/heritrix3-exporter

ukwa
一个Prometheus指标导出器,用于从Heritrix3服务器暴露关键爬虫指标,支持监控爬虫状态、性能和资源使用情况。
1 次收藏697 次下载7 年前更新
ukwa/robot-framework logo

ukwa/robot-framework

ukwa
用于UKWA的Robot Framework执行环境,提供Docker化的自动化测试和任务执行环境。
653 次下载2 年前更新
ukwa/httpfs logo

ukwa/httpfs

ukwa
略微修改的HttpFS服务Docker容器,提供HDFS的REST HTTP网关,支持完整文件系统读写,可用于跨版本Hadoop集群数据传输、防火墙后HDFS访问及通过HTTP工具/非Java语言访问HDFS。
510 次下载6 年前更新
ukwa/docker-hypercored logo

ukwa/docker-hypercored

ukwa
作为Docker容器的实验性Dat托管服务
541 次下载6 年前更新
ukwa/jupyterhub logo

ukwa/jupyterhub

ukwa
用于compmodels的JupyterHub Docker镜像,提供内部JupyterHub设置的原型。
490 次下载7 年前更新
ukwa/monitor-stat-pusher logo

ukwa/monitor-stat-pusher

ukwa
暂无描述
502 次下载1 年前更新
tavopa7/backstage logo

tavopa7/backstage

tavopa7
暂无描述
5万+ 次下载1 年前更新
ukwa/brozzler logo

ukwa/brozzler

ukwa
将网络爬虫工具Brozzler封装在Docker容器中的镜像,便于快速部署和使用,无需手动配置复杂依赖环境。
1 次收藏426 次下载8 年前更新
ukwa/iipc-workshop-warclight logo

ukwa/iipc-workshop-warclight

ukwa
Docker容器中的Warclight实例,适用于研讨会和演示。
387 次下载7 年前更新
ukwa/hdfs-exporter logo

ukwa/hdfs-exporter

ukwa
抓取DFS健康页面数据并导出至Prometheus,适用于早期Hadoop版本(0.20.x)的HDFS监控。
403 次下载5 年前更新
ukwa/warcprox-squid logo

ukwa/warcprox-squid

ukwa
A squid setup suitable for scaling out warcprox.
351 次下载10 年前更新
duncandoyle/backstage-gloo logo

duncandoyle/backstage-gloo

duncandoyle
暂无描述
5万+ 次下载1 年前更新
ukwa/hapy logo

ukwa/hapy

ukwa
Heritrix3 API操作的Python命令行客户端的Docker化版本,支持通过命令行或脚本自动化管理Heritrix爬虫任务,如创建、构建、启动、暂停和监控作业等操作。
340 次下载2 年前更新
ukwa/openwayback logo

ukwa/openwayback

ukwa
Docker化的OpenWayback,旨在与ukwa/tinycdxserver配合使用。
336 次下载9 年前更新
martinaif/backstage-k8s-demo-backend logo

martinaif/backstage-k8s-demo-backend

martinaif
暂无描述
1 次收藏10万+ 次下载5 年前更新
ukwa/bamboo logo

ukwa/bamboo

ukwa
NLA网络归档集合管理器Docker镜像,用于跟踪网络归档集合、管理索引及计算统计数据,支持基本的集合管理功能。
311 次下载9 年前更新
ukwa/grobid logo

ukwa/grobid

ukwa
GROBID(书目数据生成)工具的Docker容器化版本,用于将(学术)PDF转换为结构化TEI格式,以提升自动提取的文档元数据质量。
1 次收藏289 次下载9 年前更新
ukwa/superset logo

ukwa/superset

ukwa
包含Solr支持的Docker化Apache Superset,用于数据可视化和探索分析的开源BI工具。
283 次下载2 年前更新
ukwa/webarchive-collections-solr logo

ukwa/webarchive-collections-solr

ukwa
这是一个配置用于保存Collections和Targets的Solr实例,是UKWA网站更新的初始原型。
283 次下载9 年前更新
ukwa/solrwayback logo

ukwa/solrwayback

ukwa
暂无描述
284 次下载4 年前更新
ukwa/docker-hbase-standalone logo

ukwa/docker-hbase-standalone

ukwa
容器化的HBase,适用于集成测试等场景
273 次下载8 年前更新
jomeier/backstage-dev logo

jomeier/backstage-dev

jomeier
暂无描述
1万+ 次下载2 年前更新
sourcefuse/backstage logo

sourcefuse/backstage

sourcefuse
SourceFuse Backstage Repository
1万+ 次下载3 个月前更新
polarpoint/backstage-app logo

polarpoint/backstage-app

polarpoint
暂无描述
1万+ 次下载3 年前更新
ukwa/zeppelin logo

ukwa/zeppelin

ukwa
为UKWA研究部署的Apache Zeppelin Docker镜像,支持交互式数据分析和Spark集群模式,可持久化存储笔记本。
223 次下载9 年前更新
polarpoint/backstage logo

polarpoint/backstage

polarpoint
暂无描述
1万+ 次下载3 年前更新
ukwa/docker-warcprox logo

ukwa/docker-warcprox

ukwa
暂无描述
196 次下载3 年前更新
timbyr/backstage logo

timbyr/backstage

timbyr
暂无描述
1万+ 次下载3 年前更新
wpalmeida/backstage logo

wpalmeida/backstage

wpalmeida
暂无描述
1万+ 次下载2 年前更新
ukwa/py-wasapi-client logo

ukwa/py-wasapi-client

ukwa
Docker封装的WASAPI客户端,用于与Archive-It WASAPI数据传输API交互,支持下载WARC文件、生成校验和清单、查询文件信息及多进程下载,简化网络存档数据获取流程。
166 次下载7 年前更新
ukwa/outbackcdx logo

ukwa/outbackcdx

ukwa
基于RocksDB的网络档案捕获索引(CDX)服务器,支持OpenWayback(XML)和PyWb(JSON)协议,提供实时增量更新、压缩索引及主从复制功能,适用于大规模网络档案索引管理,已在澳大利亚国家图书馆和大英图书馆生产环境中处理80-90亿条记录。
1 次收藏171 次下载5 年前更新
tekn0ir/backstage logo

tekn0ir/backstage

tekn0ir
暂无描述
1万+ 次下载4 年前更新
refael058325/backstage-leumi logo

refael058325/backstage-leumi

refael058325
暂无描述
1万+ 次下载2 个月前更新
ukwa/crawl-db logo

ukwa/crawl-db

ukwa
暂无描述
136 次下载2 年前更新
martinaif/backstage-k8s-demo-frontend logo

martinaif/backstage-k8s-demo-frontend

martinaif
暂无描述
5万+ 次下载5 年前更新
第 1 页
轩辕镜像
镜像搜索
...
ukwa-backstage
教程轩辕镜像功能与使用教程
价格查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
官方公众号:源码跳动|官方技术交流群:51517718
官方公众号:源码跳动|官方技术交流群:|问题咨询请:提交工单
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.