CREATE MODEL

功能描述

训练机器学习模型并保存模型。

注意事项

  • 模型名称具有唯一性约束,注意命名格式。
  • AI训练时长波动较大,在部分情况下训练运行时间较长,设置的GUC参数statement_timeout时长过短会导致训练中断。建议statement_timeout设置为0,不对语句执行时长进行限制。

语法格式

  1. CREATE MODEL model_name USING architecture_name
  2. FEATURES { {attribute_list} }
  3. [TARGET attribute_name, [,attribute_name]*],
  4. FROM ([schema.]table_name | subquery)
  5. WITH (hyper_parameter_name [= {hp_value | DEFAULT}]) [, ...]*]

参数说明

  • model_name

    对训练模型进行命名,模型名称具有唯一性约束。

    取值范围:字符串,需要符合标识符的命名规范。

  • architecture_name

    训练模型的算法类型。

    取值范围:字符型,当前支持:logistic_regression、linear_regression、svm_classification、kmeans。

  • attribute_list

    枚举训练模型的输入列名。

    取值范围:字符型,需要符合数据属性名的命名规范。

  • attribute_name

    在监督学习任务重训练模型的目标列名(可进行简单的表达式处理)。

    取值范围:字符型,需要符合数据属性名的命名规范。

  • subquery

    数据源。

    取值范围:字符串,符合数据库SQL语法。

  • hyper_parameter_name

    机器学习模型的超参名称。

    取值范围:字符串,针对不同算法超参类型范围不同,取值范围详情请参考:表2

  • hp_value

    超参数值。

    取值范围:字符串,针对不同算法范围不同,取值范围详情请参考:表3

示例

  1. CREATE MODEL price_model USING logistic_regression
  2. FEATURES size, lot
  3. TARGET price
  4. FROM HOUSES
  5. (WITH learning_rate=0.88, max_iterations=default);

相关链接

DROP MODELPREDICT BY