Sklearn包含的常用算法-office365ios版本-在线365bet盘口-beat365体育亚洲网页版-office365ios版本

参考资料来自sklearn官方网站：http://scikit-learn.org/stable/

总的来说，Sklearn可实现的函数或功能可分为以下几个方面：

分类算法

回归算法

聚类算法

降维算法

文本挖掘算法

模型优化

数据预处理

分类算法线性判别分析（LDA）>>> from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

>>> lda = LinearDiscriminantAnalysis(solver="svd", store_covariance=True)

二次判别分析（QDA）>>> from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis

>>> qda = QuadraticDiscriminantAnalysis(store_covariances=True)

支持向量机（SVM）>>> from sklearn import svm

>>> clf = svm.SVC()

Knn算法>>> from sklearn import neighbors

>>> clf = neighbors.KNeighborsClassifier(n_neighbors, weights=weights)

神经网络（nn）>>> from sklearn.neural_network import MLPClassifier

>>> clf = MLPClassifier(solver='lbfgs', alpha=e-,

... hidden_layer_sizes=(, ), random_state=)

朴素贝叶斯算法（Naive Bayes）>>> from sklearn.naive_bayes import GaussianNB

>>> gnb = GaussianNB()

决策树算法（decision tree）>>> from sklearn import tree

>>> clf = tree.DecisionTreeClassifier()

集成算法（Ensemble methods）1、Bagging>>> from sklearn.ensemble import BaggingClassifier

>>> from sklearn.neighbors import KNeighborsClassifier

>>> bagging = BaggingClassifier(KNeighborsClassifier(),

... max_samples=0., max_features=0.)

2、随机森林（Random Forest）

>>> from sklearn.ensemble import RandomForestClassifier

>>> clf = RandomForestClassifier(n_estimators=0)

3、AdaBoost>>> from sklearn.ensemble import AdaBoostClassifier

>>> clf = AdaBoostClassifier(n_estimators=00)/4、GBDT（Gradient Tree Boosting）

>>> from sklearn.ensemble import GradientBoostingClassifier

>>> clf = GradientBoostingClassifier(n_estimators=00, learning_rate=.0,

... max_depth=, random_state=0).fit(X_train, y_train)

回归算法最小二乘回归（OLS）>>> from sklearn import linear_model

>>> reg = linear_model.LinearRegression()

岭回归（Ridge Regression）>>> from sklearn import linear_model

>>> reg = linear_model.Ridge (alpha = .)

核岭回归（Kernel ridge regression）>>> from sklearn.kernel_ridge import KernelRidge

>>> KernelRidge(kernel='rbf', alpha=0., gamma=0)

支持向量机回归（SVR）>>> from sklearn import svm

>>> clf = svm.SVR()

套索回归（Lasso）>>> from sklearn import linear_model

>>> reg = linear_model.Lasso(alpha = 0.)

弹性网络回归（Elastic Net）>>> from sklearn.linear_model import ElasticNet

>>> regr = ElasticNet(random_state=0)

贝叶斯回归（Bayesian Regression）>>> from sklearn import linear_model

>>> reg = linear_model.BayesianRidge()

逻辑回归（Logistic regression）>>> from sklearn.linear_model import LogisticRegression

>>> clf_l_LR = LogisticRegression(C=C, penalty='l', tol=0.0)

稳健回归（Robustness regression）>>> from sklearn import linear_model

>>> ransac = linear_model.RANSACRegressor()

多项式回归（Polynomial regression——多项式基函数回归）>>> from sklearn.preprocessing import PolynomialFeatures

>>> poly = PolynomialFeatures(degree=)

>>> poly.fit_transform(X)

高斯过程回归（Gaussian Process Regression）

偏最小二乘回归（PLS）>>> from sklearn.cross_decomposition import PLSCanonical

>>> PLSCanonical(algorithm='nipals', copy=True, max_iter=00, n_components=,scale=True, tol=e-0)

典型相关分析（CCA）

>>> from sklearn.cross_decomposition import CCA

>>> cca = CCA(n_components=)

聚类算法 Knn算法

>>> from sklearn.neighbors import NearestNeighbors

>>> nbrs = NearestNeighbors(n_neighbors=, algorithm='ball_tree').fit(X)

Kmeans算法

>>> from sklearn.cluster import KMeans

>>> kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=0)

层次聚类（Hierarchical clustering）——支持多种距离>>> from sklearn.cluster import AgglomerativeClustering

>>> model = AgglomerativeClustering(linkage=linkage,

connectivity=connectivity, n_clusters=n_clusters)

降维算法主成分方法（PCA）>>> from sklearn.decomposition import PCA

>>> pca = PCA(n_components=)

核函主成分（kernal pca）>>> from sklearn.decomposition import KernelPCA

>>> kpca = KernelPCA(kernel="rbf", fit_inverse_transform=True, gamma=0)

因子分析（Factor Analysis）>>> from sklearn.decomposition import FactorAnalysis

>>> fa = FactorAnalysis()

文本挖掘算法主题生成模型（Latent Dirichlet Allocation）>>> from sklearn.decomposition import NMF, LatentDirichletAllocation

潜在语义分析（latent semantic analysis）模型优化不具体列出函数，只说明提供的功能

特征选择

随机梯度方法

交叉验证

参数调优

模型评估：支持准确率、召回率、AUC等计算，ROC,损失函数等作图

数据预处理

标准化

异常值处理

非线性转换

二值化

独热编码（one-hot）

缺失值插补：支持均值、中位数、众数、特定值插补、多重插补

衍生变量生成

Sklearn包含的常用算法

相关推荐

什么不什么晴的成语

wow蜘蛛收割者多久刷一次

小米净水器滤芯 PP棉使用说明

1982年大薄膜唱片，尼太戈尔、我为什么痛哭、朝阳、不安的波澜、变迁、您好啊朋友

Atmel单片机选型指南|Atmel单片机型号大全

如何制作一个网页

随时现金签约放款审核中，这是过还是没过呢，多久到账！ ...

闻的成语

战国时最残酷的刑罚凿颠，用铁器在人的头顶打孔

友情链接