MMLSpark 介绍
MMLSpark ,即 Microsoft Machine Learning for Apache Spark ,是微软开源的一个针对 Apache
Spark
的深度学习和数据可学工具,为大型映像和文本数据库快速创建强大、可缩放性能优越的预测和分析模型。
MMLSpark 可与 Microsoft Cognitive Toolkit
(CNTK,微软认知工具包) 和
OpenCV (计算机视觉库)无缝集成,允许:
-
流入和预处理图像数据
-
使用预先定型的深度学习模型特征化图像和文本
-
使用隐式特征化对分类和回归模型进行定型和评分
示例:
... import mmlspark # Initialize CNTKModel and define input and output columns cntkModel = mmlspark.CNTKModel() \ .setInputCol("images").setOutputCol("output") \ .setModelLocation(modelFile) # Train on dataset with internal spark pipeline scoredImages = cntkModel.transform(imagesWithLabels) ...
MMLSpark 官网
https://github.com/Azure/mmlspark
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。