Pipeline

机器学习 Pipeline 由一系列执行于 Data Frame 的 Transformer 构成。Pipeline 允许我们结合多个特征 Transformer 和实际的预测算法在一起。Pipeline 既能简单到仅有单个 Transformer,也能复杂到包含成百个 Transformer 和多个预测算法。

Pipeline 的一个简单例子

下图演示了一个非常简单的 Pipeline 的例子,它能够被序列化成 Bundle 然后使用 MLeap Runtime 来进行评分。一个更复杂的 Pipeline 可能会包含降维 Transformer,比如 PCA 算法,或者是特征选择 Transformer,比如卡方选择器等。

Very Simple Pipeline

进阶 Pipeline

可以参见我们的 MLeap demo notebooks ,获得更多复杂 Pipeline 的例子。