专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

mcp/aws-dataprocessing-mcp-server Docker 镜像 - 轩辕镜像 | Docker 镜像高效稳定拉取服务

热门搜索:openclaw🔥nginx🔥redis🔥mysqlopenjdkcursorweb2apimemgraphzabbixetcdubuntucorednsjdk
aws-dataprocessing-mcp-server
mcp/aws-dataprocessing-mcp-server
mcp
AWS Data Processing MCP Server是一个提供数据处理和转换服务的Docker镜像,支持Glue、EMR、Athena等AWS数据处理服务,提供32种工具用于IAM角色管理、S3使用分析、数据目录管理、查询执行等操作,帮助用户高效管理和执行AWS数据处理工作流。
下载次数: 0状态:社区镜像维护者:mcp仓库类型:镜像最近更新:4 个月前
轩辕镜像,让镜像更快,让人生更轻。点击查看
中文简介版本下载
轩辕镜像,让镜像更快,让人生更轻。点击查看

AWS Data Processing MCP Server

数据处理和转换服务。

什么是MCP Server?

MCP信息

属性详情
Docker镜像mcp/aws-dataprocessing-mcp-server
作者awslabs
仓库[***]

镜像构建信息

属性详情
Dockerfile[***]
Docker镜像构建者Docker Inc.
Docker Scout健康评分!Docker Scout Health Score
验证签名COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/aws-dataprocessing-mcp-server --key [***]
许可证Apache License 2.0

可用工具(32种)

服务提供的工具简短描述
add_inline_policy向IAM角色添加新的内联策略。
analyze_s3_usage_for_data_processing分析数据处理服务(Glue、EMR、Athena)的S3存储桶使用模式。
create_data_processing_role为数据处理服务创建新的IAM角色。
get_policies_for_role获取附加到IAM角色的所有策略。
get_roles_for_service获取可由特定AWS服务承担的所有IAM角色。
list_s3_buckets列出名称中包含“glue”且位于指定区域的S3存储桶。
manage_aws_athena_data_catalogs管理AWS Athena数据目录,支持读写操作。
manage_aws_athena_databases_and_tables管理AWS Athena数据库和表,支持只读操作。
manage_aws_athena_named_queries管理AWS Athena中的已保存SQL查询。
manage_aws_athena_query_executions执行和管理AWS Athena SQL查询。
manage_aws_athena_workgroups管理AWS Athena工作组,支持读写操作。
manage_aws_emr_clusters全面控制EMR集群生命周期,管理AWS EMR EC2集群。
manage_aws_emr_ec2_instances管理AWS EMR EC2实例,支持读写操作。
manage_aws_emr_ec2_steps管理AWS EMR EC2步骤,用于在EMR集群上处理数据。
manage_aws_glue_catalog管理AWS Glue数据目录,支持读写操作。
manage_aws_glue_classifiers管理AWS Glue分类器,以确定数据格式和模式。
manage_aws_glue_connections管理AWS Glue数据目录连接,支持读写操作。
manage_aws_glue_crawler_management管理AWS Glue爬虫调度并监控性能指标。
manage_aws_glue_crawlers管理AWS Glue爬虫,以发现和编目数据源。
manage_aws_glue_databases管理AWS Glue数据目录数据库,支持读写操作。
manage_aws_glue_encryption管理AWS Glue数据目录加密设置,用于数据保护。
manage_aws_glue_jobs管理AWS Glue ETL作业和作业运行,支持读写操作。
manage_aws_glue_partitions管理AWS Glue数据目录分区,支持读写操作。
manage_aws_glue_resource_policies管理AWS Glue资源策略,用于访问控制。
manage_aws_glue_security_configurations管理AWS Glue安全配置,用于数据加密。
manage_aws_glue_sessions管理AWS Glue交互式会话,用于运行Spark和Ray工作负载。
manage_aws_glue_statements管理AWS Glue交互式会话语句,用于执行代码和检索结果。
manage_aws_glue_tables管理AWS Glue数据目录表,支持读写操作。
manage_aws_glue_triggers管理AWS Glue触发器,以自动化工作流和作业执行。
manage_aws_glue_usage_profiles管理AWS Glue使用配置文件,用于资源分配和成本管理。
manage_aws_glue_workflows管理AWS Glue工作流,以编排复杂的ETL活动。
upload_to_s3使用putObject将Python代码内容直接上传到S3存储桶。

工具详情

工具:add_inline_policy

向IAM角色添加新的内联策略。

此工具创建具有指定权限的新内联策略,并将其添加到IAM角色。内联策略嵌入在角色中,不能附加到多个角色。通常用于授予数据处理服务对AWS资源的访问权限,启用Glue作业访问数据源,以及配置CloudWatch日志和S3访问权限。

要求

  • 服务器必须使用--allow-write标志运行
  • 角色必须存在于您的AWS账户中
  • 策略名称在角色内必须唯一
  • 无法使用此工具修改现有策略

权限格式

permissions参数可以是单个策略语句或语句列表。

单语句示例
json
{
    "Effect": "Allow",
    "Action": ["s3:GetObject", "s3:PutObject"],
    "Resource": "arn:aws:s3:::example-bucket/*"
}

常见数据处理权限示例

Glue作业权限
json
{
    "Effect": "Allow",
    "Action": [
        "glue:*",
        "s3:GetObject",
        "s3:PutObject",
        "s3:DeleteObject",
        "s3:ListBucket",
        "iam:PassRole"
    ],
    "Resource": "*"
}
EMR集群权限
json
{
    "Effect": "Allow",
    "Action": [
        "elasticmapreduce:*",
        "ec2:DescribeInstances",
        "ec2:DescribeSecurityGroups",
        "s3:ListBucket",
        "s3:GetObject",
        "s3:PutObject"
    ],
    "Resource": "*"
}
Athena查询权限
json
{
    "Effect": "Allow",
    "Action": [
        "athena:*",
        "glue:GetDatabase",
        "glue:GetTable",
        "glue:GetPartition",
        "s3:GetObject",
        "s3:ListBucket",
        "s3:PutObject"
    ],
    "Resource": "*"
}

使用提示

  • 遵循最小权限原则,仅授予必要的权限
  • 尽可能使用特定资源而非"*"
  • 考虑使用条件进一步限制权限
  • 将相关权限分组到具有描述性名称的逻辑策略中
参数类型描述
permissionsstring要包含在策略中的权限,格式为JSON格式的IAM策略语句。可以是单个语句对象或语句对象数组。
policy_namestring要创建的内联策略的名称。在角色内必须唯一。
role_namestring要添加策略的IAM角色的名称。该角色必须存在。

工具:analyze_s3_usage_for_data_processing

分析数据处理服务(Glue、EMR、Athena)的S3存储桶使用模式。

此工具帮助识别哪些存储桶被数据处理服务积极使用,哪些可能处于空闲或未充分利用状态。

参数类型描述
bucket_namestring 可选要分析的特定存储桶(留空则分析所有存储桶)

工具:create_data_processing_role

为数据处理服务创建新的IAM角色。

此工具创建具有指定数据处理服务(Glue、EMR或Athena)适当信任关系的新IAM角色。它还可以附加托管策略并向内联策略添加权限。

要求

  • 服务器必须使用--allow-write标志运行
  • 角色名称在您的AWS账户中必须唯一
  • 具有创建IAM角色权限的有效AWS凭证

服务类型

  • glue:创建可由Glue服务承担的角色
  • emr:创建可由EMR服务承担的角色
  • athena:创建可由Athena服务承担的角色

常见托管策略

建议添加以下策略:

  • Glue: 'arn:aws:iam::aws:policy/service-role/AWSGlueServiceRole'
  • EMR: 'arn:aws:iam::aws:policy/service-role/AmazonElasticMapReduceRole'
  • Athena: 'arn:aws:iam::aws:policy/service-role/AmazonAthenaFullAccess'

使用提示

  • 始终为角色提供描述性名称和说明
  • 仅附加必要的托管策略以遵循最小权限原则
  • 对特定于用例的自定义权限使用内联策略
  • 考虑添加对数据源和目标的S3访问权限
参数类型描述
role_namestring要创建的IAM角色的名称。在您的AWS账户中必须唯一。
service_typestring数据处理服务类型:'glue'、'emr'或'athena'。
descriptionstring 可选IAM角色的可选描述。
inline_policystring 可选要添加到角色的可选内联策略。
managed_policy_arnsstring 可选要附加到角色的可选托管策略ARN列表。

工具:get_policies_for_role

获取附加到IAM角色的所有策略。

此工具检索与IAM角色关联的所有策略,提供角色权限和信任关系的全面视图。它帮助您了解当前权限,识别缺失或过多的权限,排查数据处理问题,并验证服务角色的信任关系。

要求

  • 角色必须存在于您的AWS账户中
  • 具有读取IAM角色信息权限的有效AWS凭证

响应信息

响应包括角色ARN、假设角色策略文档(信任关系)、角色描述、托管策略及其文档,以及内联策略及其文档。

使用提示

  • 在添加新权限之前使用此工具了解现有访问权限
  • 检查假设角色策略以验证哪些服务或角色可以承担此角色
  • 查找可能带来安全风险的过度宽松策略
  • 结合add_inline_policy实施最小权限原则
  • 对于Glue作业,确保角色有权访问所需的数据源和目标
  • 对于EMR集群,验证EC2实例配置文件权限
  • 对于Athena查询,检查S3存储桶访问权限
参数类型描述
role_namestring要获取策略的IAM角色的名称。该角色必须存在于您的AWS账户中。

工具:get_roles_for_service

获取可由特定AWS服务承担的所有IAM角色。

此工具检索您AWS账户中所有与指定服务具有信任关系的IAM角色。它帮助您识别可用于Glue作业、EMR集群或Athena查询等服务的角色,使您在创建这些资源时更容易选择合适的角色。

服务类型

常见服务类型包括:

  • glue:AWS Glue服务(glue.amazonaws.com)
  • emr:Amazon EMR服务(elasticmapreduce.amazonaws.com)
  • athena:Amazon Athena服务(athena.amazonaws.com)
  • 您也可以指定其他AWS服务主体

响应信息

响应包括可由指定服务承担的角色列表,包含角色名称、ARN、描述、创建日期以及完整的假设角色策略文档等详细信息。

使用提示

  • 在创建新角色之前使用此工具查找现有角色
  • 验证角色是否具有您用例所需的权限
  • 对于Glue作业,查找具有AWSGlueServiceRole或类似策略的角色
  • 对于EMR集群,查找具有AmazonElasticMapReduceRole或类似策略的角色
  • 对于Athena查询,查找具有AmazonAthenaFullAccess或类似策略的角色
参数类型描述
service_typestring数据处理服务类型:'glue'、'emr'、'athena'或其他AWS服务名称。

工具:list_s3_buckets

列出名称中包含“glue”且位于指定区域的S3存储桶。

此工具帮助识别通常用于数据处理工作流的S3存储桶,特别是与AWS Glue操作相关的存储桶。它提供使用统计信息和空闲时间信息,以帮助进行资源管理。

要求

  • 具有列出S3存储桶权限的有效AWS凭证
  • S3:ListAllMyBuckets权限

响应信息

响应包括存储桶名称、创建日期、区域、对象计数、最后修改日期和空闲时间分析。

使用提示

  • 在创建新存储桶之前使用此工具查找现有数据处理存储桶
  • 监控90天以上未访问的空闲存储桶
  • 验证存储桶区域是否与您的数据处理服务区域匹配
  • 检查对象计数以了解存储桶使用模式
参数类型描述
regionstring 可选用于筛选存储桶的AWS区域(默认为AWS_REGION环境变量)

工具:manage_aws_athena_data_catalogs

管理AWS Athena数据目录,支持读写操作。

此工具提供管理Athena数据目录的操作,包括创建、检索、列出、更新和删除数据目录。数据目录用于组织和访问Athena中的数据源,使您能够跨各种源(如AWS Glue数据目录、Apache Hive元存储或联邦源)查询数据。

要求

  • 对于create-data-catalog、delete-data-catalog和update-data-catalog操作,服务器必须使用--allow-write标志运行
  • Athena数据目录操作的适当AWS权限

操作

  • create-data-catalog:创建新数据目录
  • delete-data-catalog:删除现有数据目录
  • get-data-catalog:获取单个数据目录的信息
  • list-data-catalogs:列出所有数据目录
  • update-data-catalog:更新现有数据目录

使用提示

  • 使用list-data-catalogs查找可用数据目录
  • 数据目录类型可以是LAMBDA、GLUE、HIVE或FEDERATED
  • 参数特定于数据目录类型

示例

# 列出所有数据目录
{'operation': 'list-data-catalogs', 'max_results': 10}

# 创建Glue数据目录
{
    'operation': 'create-data-catalog',
    'name': 'my-glue-catalog',
    'type': 'GLUE',
    'description': '我的Glue数据目录',
    'parameters': {'catalog-id': '123456789012'},
}
参数类型描述
operationstring要执行的操作:create-data-catalog、delete-data-catalog、get-data-catalog、list-data-catalogs、update-data-catalog。当禁用写访问时选择只读操作。
delete_catalog_onlystring 可选对于delete-data-catalog操作,是否仅删除Athena数据目录(true)还是也删除其资源(false)。仅适用于FEDERATED目录。
descriptionstring 可选数据目录的描述(create-data-catalog和update-data-catalog可选)。
max_resultsstring 可选list-data-catalogs操作返回的最大结果数(范围:2-50)。
namestring 可选数据目录名称(create-data-catalog、delete-data-catalog、get-data-catalog、update-data-catalog必需)。目录名称
查看更多 aws-dataprocessing-mcp-server 相关镜像 →
linuxserver/code-server logo
linuxserver/code-server
linuxserver
linuxserver/code-server是VS Code服务器版Docker镜像,可在浏览器中运行完整VS Code开发环境,无需本地安装即可跨设备访问。支持全部VS Code扩展、代码同步与终端功能,适配远程开发、团队协作或低配置设备场景。镜像经linuxserver优化,兼容ARM/AMD架构,内置持久化存储与安全配置,开箱即用,轻松打造云端IDE,提升开发灵活性与效率。
728 次收藏5000万+ 次下载
11 天前更新
linuxserver/openssh-server logo
linuxserver/openssh-server
linuxserver
提供OpenSSH服务器服务,支持远程登录与服务器管理,具备易于部署、配置灵活的特点,适用于各类需要安全远程访问的场景。
143 次收藏1000万+ 次下载
12 天前更新
mailserver/docker-mailserver logo
mailserver/docker-mailserver
mailserver
一个全栈且简单易用的邮件服务器,支持SMTP、IMAP协议,集成LDAP、反垃圾邮件及反病毒等功能。
260 次收藏1000万+ 次下载
14 天前更新
linuxserver/sonarr logo
linuxserver/sonarr
linuxserver
由LinuxServer.io提供的Sonarr容器,是一款专为电视节目集管理设计的自动化工具,能够监控指定剧集的更新信息、自动从索引器获取下载链接并通过下载客户端(如Deluge、qBittorrent等)完成资源下载,同时支持按自定义规则整理文件结构、重命名剧集文件以保持媒体库整洁有序;LinuxServer.io作为专注于提供高质量容器化应用的团队,其构建的Sonarr容器基于轻量级Linux系统,优化了资源占用与运行稳定性,适合家庭媒体服务器或个人影视库的自动化管理场景使用。
2.1千 次收藏10亿+ 次下载
27 天前更新
linuxserver/jackett logo
linuxserver/jackett
linuxserver
这是由LinuxServer.io提供的Jackett容器,其中Jackett是一款实用的种子索引聚合工具,能够整合多个torrent追踪器的搜索结果,为qBittorrent、Deluge等各类P2P下载客户端提供统一的搜索接口,帮助用户更便捷地查找和获取所需资源;而LinuxServer.io团队凭借专业的容器化技术,确保该Jackett容器具备稳定的运行环境、简便的部署流程以及持续的更新支持,可满足用户在不同系统环境下高效使用Jackett的需求。
1.2千 次收藏10亿+ 次下载
9 天前更新
linuxserver/tautulli logo
linuxserver/tautulli
linuxserver
Tautulli Docker镜像是监控和分析Plex媒体服务器的工具,可跟踪用户活动、媒体播放统计及服务器性能,帮助用户掌握Plex使用情况。
431 次收藏5亿+ 次下载
12 天前更新

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

使用与功能问题

docker search 报错:专属域名下仅支持 Docker Hub 查询

docker search 报错问题

网页搜不到镜像:Docker Hub 有但轩辕镜像搜索无结果

镜像搜索不到

离线传输镜像:无法直连时用 docker save/load 迁移

离线传输镜像

Docker 插件安装错误:application/vnd.docker.plugin.v1+json

Docker 插件安装错误

WSL 下 Docker 拉取慢:网络与挂载目录影响及优化

WSL 拉取镜像慢

轩辕镜像是否安全?镜像完整性校验(digest)说明

镜像安全性

如何用轩辕镜像拉取镜像?登录方式与专属域名配置

如何拉取镜像

错误码与失败问题

manifest unknown 错误:镜像不存在或标签错误

manifest unknown 错误

TLS/SSL 证书验证失败:Docker pull 时 HTTPS 证书错误

TLS 证书验证失败

DNS 解析超时:无法解析镜像仓库地址或连接超时

DNS 解析超时

410 Gone 错误:Docker 版本过低导致协议不兼容

410 错误:版本过低

402 Payment Required 错误:流量耗尽错误提示

402 错误:流量耗尽

401 UNAUTHORIZED 错误:身份认证失败或登录信息错误

身份认证失败错误

429 Too Many Requests 错误:请求频率超出专业版限制

429 限流错误

Docker login 凭证保存错误:Cannot autolaunch D-Bus(不影响登录)

凭证保存错误

账号 / 计费 / 权限

免费版与专业版区别:功能、限额与使用场景对比

免费版与专业版区别

支持的镜像仓库:Docker Hub、GCR、GHCR、K8s 等列表

轩辕镜像支持的镜像仓库

拉取失败是否扣流量?计费规则说明

拉取失败流量计费

KYSEC 权限不够:麒麟 V10/统信 UOS 下脚本执行被拦截

KYSEC 权限错误

如何申请开具发票?(增值税普票/专票)

开具发票

如何修改网站与仓库登录密码?

修改网站和仓库密码

配置与原理类

registry-mirrors 未生效:仍访问官方仓库或报错的原因

registry-mirrors 未生效

如何去掉镜像名称中的轩辕域名前缀?(docker tag)

去掉域名前缀

如何拉取指定架构镜像?(ARM64/AMD64 等多架构)

拉取指定架构镜像

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
mcp/aws-dataprocessing-mcp-server
博客公告Docker 镜像公告与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
镜像拉取问题咨询请 提交工单,官方技术交流群:1072982923。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
镜像拉取问题咨询请提交工单,官方技术交流群:。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.