6.2. 玩具数据集

scikit-learn 内置有一些小型标准数据集,不需要从某个外部网站下载任何文件。

调用描述
load_boston([return_X_y])Load and return the boston house-prices dataset (regression).
load_iris([return_X_y])Load and return the iris dataset (classification).
load_diabetes([return_X_y])Load and return the diabetes dataset (regression).
load_digits([n_class, return_X_y])Load and return the digits dataset (classification).
load_linnerud([return_X_y])Load and return the linnerud dataset (multivariate regression).
load_wine([return_X_y])Load and return the wine dataset (classification).
load_breast_cancer([return_X_y])Load and return the breast cancer wisconsin dataset (classification).

这些数据集有助于快速说明在 scikit 中实现的各种算法的行为。然而,它们数据规模往往太小,无法代表真实世界的机器学习任务。

译者注:各个玩具数据集的具体描述此处不翻译,若需查询请点击链接查看英文描述