开始学习sklearn啦,官网参考文档:http://scikit-learn.org/stable/documentation.html
sklearn是基于numpy和scipy的一个机器学习算法库。
包含的主要模块:
监督学习(supervised learning)
-- neighbors:近邻算法
-- svm:支持向量机
-- kernel-ridge:核岭回归
-- discriminant_analysis:判别分析
-- linear_model:广义线性模型
-- ensemle:集成方法
-- tree:决策树
-- naive_bayes:朴素贝叶斯
-- cross_decomposition:交叉分解
-- gaussian_process:高斯过程
-- neural_network:神经网络
-- calibration:概率校
-- isotonic:保序回归
-- feature_selection:特征选择
-- multiclass:多类多标签算法
无监督学习(unsupervised learning)
-- decomposition:矩阵因子分解
-- cluster:聚类
-- manifold:流形学习
-- mixture:高斯混合模型
-- neural_network:无监督神经网络
-- density:密度估计
-- covariance:协方差估计
数据变换
-- feature_extraction:特征抽取
-- feature_selection:特征选择
-- preprocess:预处理
-- random_projection:随机投影
-- kernel_approximation:核逼近
-- pipline:管道流
一些基础类:
baseEstimator:所有评估器的父类
ClassifierMixin:所有分类器的父类,其子类必须实现一个score函数
RegressorMixin:所有回归器的父类,其子类必须实现一个score函数
ClusterMixin:所有聚类的父类,其子类必须实现一个fit_predict函数
BiClusterMixin:
TransformerMixin:所有数据变换的父类,其子类必须实现一个fit_transform函数
DensityMixin:所有密度估计相关的父类,其子类必须实现一个score函数
MetaEsimatorMixin:
参考:http://scikit-learn.org/stable/documentation.html