scikit-learn - 编程之家

层次聚类（Hierarchical Clustering）是聚类算法的一族算法的总称，它通过连续合并或拆分聚类来构建嵌套聚类。这种聚类的层次结构就像树

我的数据集（例如，dataset_train）具有43个分类特征，我想在每个列中应用LabelEncoder。在这里，我得到了

我正在使用将RandomForest和BaggedLogisticRegression作为第一层<code>estimators</code>，并将LogisticRegression用于<code>fin

我对编程非常陌生，将不胜感激。我已经使用RandomForest开发了ML模型。当我独立运行模型时，我的代码工

我创建了一个推荐引擎，该引擎为来自不同用户的11个项目生成预测的评分，这些评分存储在意外数据集

我从理论上理解了ROC曲线的原理，但是在sklearn中实施它使我感到困惑。我了解到ROC会绘制TPR与FPR的比率

我对数据科学还很陌生，有点困惑。并且只是想确保我的方法有意义。我创建如下模型： <pre><

我尝试使用本地二进制模式（LBP）描述符训练KNN模型。我的数据是<code>numpy.array</code>形（67，26）

我正在尝试学习ML，并获得了几个月糖的每日价格数据。并将尝试预测未来几天。到目前为止，我已经编

当我使用<code>scikit-optimize</code>版本0.7.4优化<code>scikit-learn</code> 0.23模型时： <pre><code> rf = BayesSearchCV

我正在构建机器学习模型管道。我有一个自定义函数，它将更改特定列的值。我已经定义了自定义转换

我有一个看起来像这样的数据集： <a href="https://i.stack.imgur.com/J4kOe.png" rel="nofollow noreferrer"><img src="h

我有2个回归变量： <pre class="lang-py prettyprint-override"><code>import lightgbm as lgb from sklearn.model_selection import

我试图在pyspark中做一些与sklearn编写的代码平行的事情： <pre><code> def init_coef(self, W): sample = np

我有一个包含单词（无标点符号）的单列（“字符串”）的数据框。我需要计算在此数据框中出现的某

我正在使用RobustScaler来拟合和转换x_train和x_test。我是否也应该转型 y_train和y_test也是如此。我之所以这

我正在使用Python 3.7并正在学习已发布的代码。在我第一次编写代码的尝试中，它没有错误地运行，这意

我正在处理数据集，必须做出两个预测，即y的2列，每列也是多类的。因此，我将XGBoost与MultiOutput Classfi

我想从<code>sklearn.decomposition</code>创建一个PCA转换对象。我想绘制奇异值，然后选择要使用的组件数量。

我尝试下面的代码，但是有一些错误。 <pre><code>imp=SimpleImputer(missing_values='NaN',strategy="mean"