microsoft/mmlsparkMMLSpark是一个旨在从多个新方向扩展分布式计算框架Apache Spark的工具生态系统。MMLSpark为Spark生态系统添加了许多深度学习和数据科学工具,包括Spark机器学习管道与Microsoft Cognitive Toolkit (CNTK)、LightGBM和OpenCV的无缝集成。这些工具支持针对各种数据源构建强大且高度可扩展的预测和分析模型。
MMLSpark还为Spark生态系统带来了新的网络功能。通过HTTP on Spark项目,用户可以将任何Web服务嵌入到其SparkML模型中。为此,MMLSpark为各种Microsoft 认知服务提供了易于使用的SparkML转换器。对于生产级部署,Spark Serving项目支持由Spark集群支持的高吞吐量、亚毫秒级延迟Web服务。
latest要启动容器,请运行以下命令:
bashdocker run -it -p 8888:8888 -e ACCEPT_EULA=yes mcr.microsoft.com/mmlspark/release
在Web浏览器中导航至http://localhost:8888/以运行示例笔记本。有关Docker使用的更多信息,请参阅文档。
要阅读使用docker镜像的最终用户许可协议(EULA),请运行
docker run -it -p 8888:8888 mcr.microsoft.com/mmlspark/release eula
标签列表待补充。
访问我们的GitHub或网站。
观看Spark+AI Summit 2018主题演讲演示。
阅读我们的论文深入了解MMLSpark。
了解MMLSpark如何用于帮助濒危物种。
探索我们与Apache Spark的合作在图像分析方面的应用。
在Azure机器学习中使用MMLSpark。
观看Spark Summit上的MMLSpark演讲。
本项目采用Microsoft开源行为准则。有关更多信息,请参阅行为准则常见问题或联系***提出其他问题或意见。
有关贡献指南,请参见CONTRIBUTING.md。
如需提供反馈和/或报告问题,请创建GitHub Issue。
Microsoft Cognitive Toolkit
LightGBM
DMTK: Microsoft分布式机器学习工具包
推荐系统
Azure机器学习预览功能
用于将MMLSpark LightGBM模型转换为PMML的JPMML-SparkML插件
Azure机器学习工作室
Apache®、Apache Spark和Spark®是Apache软件基金会在美国和/或其他国家的注册商标或商标。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务