One - One Code All

Blog Content

sklearn模块组织结构

机器学习 Python   2013-05-01 15:26:18

开始学习sklearn啦,官网参考文档:http://scikit-learn.org/stable/documentation.html


sklearn是基于numpy和scipy的一个机器学习算法库。

包含的主要模块:

  1. 监督学习(supervised learning)

    -- neighbors:近邻算法

    -- svm:支持向量机

    -- kernel-ridge:核岭回归

    -- discriminant_analysis:判别分析

    -- linear_model:广义线性模型

    -- ensemle:集成方法

    -- tree:决策树

    -- naive_bayes:朴素贝叶斯

    -- cross_decomposition:交叉分解

    -- gaussian_process:高斯过程

    -- neural_network:神经网络

    -- calibration:概率校

    -- isotonic:保序回归

    -- feature_selection:特征选择

    -- multiclass:多类多标签算法

  2. 无监督学习(unsupervised learning)

    -- decomposition:矩阵因子分解

    -- cluster:聚类

    -- manifold:流形学习

    -- mixture:高斯混合模型

    -- neural_network:无监督神经网络

    -- density:密度估计

    -- covariance:协方差估计

  3. 数据变换

    -- feature_extraction:特征抽取

    -- feature_selection:特征选择

    -- preprocess:预处理

    -- random_projection:随机投影

    -- kernel_approximation:核逼近

    -- pipline:管道流


一些基础类:

baseEstimator:所有评估器的父类

ClassifierMixin:所有分类器的父类,其子类必须实现一个score函数

RegressorMixin:所有回归器的父类,其子类必须实现一个score函数

ClusterMixin:所有聚类的父类,其子类必须实现一个fit_predict函数

BiClusterMixin:

TransformerMixin:所有数据变换的父类,其子类必须实现一个fit_transform函数

DensityMixin:所有密度估计相关的父类,其子类必须实现一个score函数

MetaEsimatorMixin:


参考:http://scikit-learn.org/stable/documentation.html 



上一篇:范数介绍,数字两边双竖线
下一篇:sklearn数据预处理之归一化,标准化,正则化

The minute you think of giving up, think of the reason why you held on so long.