scikit-learn专题提供scikit-learn的最新资讯内容,帮你更好的了解scikit-learn。
层次聚类(Hierarchical Clustering)是聚类算法的一族算法的总称,它通过连续合并或拆分聚类来构建嵌套聚类。这种聚类的层次结构就像树
我的数据集(例如,dataset_train)具有43个分类特征,我想在每个列中应用LabelEncoder。 在这里,我得到了
我正在使用将RandomForest和BaggedLogisticRegression作为第一层<code>estimators</code>,并将LogisticRegression用于<code>fin
我对编程非常陌生,将不胜感激。我已经使用RandomForest开发了ML模型。当我独立运行模型时,我的代码工
我创建了一个推荐引擎,该引擎为来自不同用户的11个项目生成预测的评分,这些评分存储在意外数据集
我从理论上理解了ROC曲线的原理,但是在sklearn中实施它使我感到困惑。我了解到ROC会绘制TPR与FPR的比率
我对数据科学还很陌生,有点困惑。 并且只是想确保我的方法有意义。 我创建如下模型: <pre><
我尝试使用本地二进制模式(LBP)描述符训练KNN模型。 我的数据是<code>numpy.array</code>形(67,26)
我正在尝试学习ML,并获得了几个月糖的每日价格数据。并将尝试预测未来几天。到目前为止,我已经编
当我使用<code>scikit-optimize</code>版本0.7.4优化<code>scikit-learn</code> 0.23模型时: <pre><code> rf = BayesSearchCV
我正在构建机器学习模型管道。我有一个自定义函数,它将更改特定列的值。我已经定义了自定义转换
我有一个看起来像这样的数据集: <a href="https://i.stack.imgur.com/J4kOe.png" rel="nofollow noreferrer"><img src="h
我有2个回归变量: <pre class="lang-py prettyprint-override"><code>import lightgbm as lgb from sklearn.model_selection import
我试图在pyspark中做一些与sklearn编写的代码平行的事情: <pre><code> def init_coef(self, W): sample = np
我有一个包含单词(无标点符号)的单列(“字符串”)的数据框。我需要计算在此数据框中出现的某
我正在使用RobustScaler来拟合和转换x_train和x_test。我是否也应该转型 y_train和y_test也是如此。我之所以这
我正在使用Python 3.7并正在学习已发布的代码。在我第一次编写代码的尝试中,它没有错误地运行,这意
我正在处理数据集,必须做出两个预测,即y的2列,每列也是多类的。 因此,我将XGBoost与MultiOutput Classfi
我想从<code>sklearn.decomposition</code>创建一个PCA转换对象。我想绘制奇异值,然后选择要使用的组件数量。
我尝试下面的代码,但是有一些错误。 <pre><code>imp=SimpleImputer(missing_values=&#39;NaN&#39;,strategy=&#34;mean&#34;