sklearn-pandas - 编程之家

我试图用我的信用卡流失数据集绘制决策树。我得到的图表太小，难以阅读。我该如何解决这个问题？

<pre><code>pred = model.predict(X_test) indexes = tf.argmax(pred, axis=1) f1_score(y_test, indexes, average=None) result: array([0.

我已经对数据集进行了预处理，将分类值转换为虚拟值，将某些列转换为浮动值，我已经执行了 train_test

我生成了一个 if else 形式的决策树。有什么办法可以在 sklearn 中将其转换为树形式，以便我可以在树上

我正面临一个奇怪的问题，我试图用取自具有相关值的另一个（相同长度）的值替换数据帧中的所有 NaN

AttributeError: 'NoneType' 对象没有属性 'lower' 谁能帮我弄清楚如何解决这个错误！？搜索了很多

我想做特征选择，我使用了随机森林分类器，但做了不同的事情。我使用了 <code>sklearn.feature_selecti

<em>我是初学者，请谁能告诉我这段代码哪里出错了</em> <em>使用的数据集是kaggle tiatanic</em> <str

我正在尝试运行多个 XGBoost 模型并以实验的形式保存生成的模型。但是，当我在 pyspark 数据帧上调用 UDF

我看到一篇关于 <a href="https://www.sciencedirect.com/science/article/pii/S0167923609001377" rel="nofollow noreferrer">ScienceDire

我需要在稀疏矩阵上使用线性回归。我得到的结果很差，所以我决定在一个稀疏表示的非稀疏矩阵上测

我想知道如何/是否可以为大型数据集运行 sklearn 模型/xgboost 训练。如果我使用包含几 GB 的数据帧，机

这是我的代码.. <pre><code> import imp from sklearn.metrics import classification_report from sklearn import metrics

我有一个包含大约 300,000 行和 35 列的大型数据集。我正在尝试使用自定义转换器删除异常值，然后将其

我已经在大数据中拟合了 <code>MinMaxScalar()</code>，现在我在 <code>sklearn-pandas</code> 中使用了 <code>DataFrameMapp

晚上好，我目前正在攻读化学博士学位，在这个框架中，我试图应用我在 Python 和统计方面的一些

我有一个数据框。我正在实现句子转换器并根据搜索查询返回一行。例如 <pre><code>search_string = "thor

#Code 任务 10 #在<code>X_tr</code>上调用StandardScalers fit方法来拟合scaler #then 使用它的 <code>transform()

我正在使用 Python 开发逻辑回归模型，并设法手动调整阈值。但是，当我使用 pickle 保存模型时，阈值似

我有一个大小为 <code>(1250,13)</code> 的数据集。不幸的是，有很多 NaN，但列之间应该有很多相关性。 <p