sklearn-pandas专题提供sklearn-pandas的最新资讯内容,帮你更好的了解sklearn-pandas。
我试图用我的信用卡流失数据集绘制决策树。我得到的图表太小,难以阅读。我该如何解决这个问题?
<pre><code>pred = model.predict(X_test) indexes = tf.argmax(pred, axis=1) f1_score(y_test, indexes, average=None) result: array([0.
我已经对数据集进行了预处理,将分类值转换为虚拟值,将某些列转换为浮动值,我已经执行了 train_test
我生成了一个 if else 形式的决策树。有什么办法可以在 sklearn 中将其转换为树形式,以便我可以在树上
我正面临一个奇怪的问题,我试图用取自具有相关值的另一个(相同长度)的值替换数据帧中的所有 NaN
AttributeError: 'NoneType' 对象没有属性 'lower' 谁能帮我弄清楚如何解决这个错误!? 搜索了很多
我想做特征选择,我使用了随机森林分类器,但做了不同的事情。 我使用了 <code>sklearn.feature_selecti
<em>我是初学者,请谁能告诉我这段代码哪里出错了</em> <em>使用的数据集是kaggle tiatanic</em> <str
我正在尝试运行多个 XGBoost 模型并以实验的形式保存生成的模型。但是,当我在 pyspark 数据帧上调用 UDF
我看到一篇关于 <a href="https://www.sciencedirect.com/science/article/pii/S0167923609001377" rel="nofollow noreferrer">ScienceDire
我需要在稀疏矩阵上使用线性回归。我得到的结果很差,所以我决定在一个稀疏表示的非稀疏矩阵上测
我想知道如何/是否可以为大型数据集运行 sklearn 模型/xgboost 训练。 如果我使用包含几 GB 的数据帧,机
这是我的代码.. <pre><code> import imp from sklearn.metrics import classification_report from sklearn import metrics
我有一个包含大约 300,000 行和 35 列的大型数据集。我正在尝试使用自定义转换器删除异常值,然后将其
我已经在大数据中拟合了 <code>MinMaxScalar()</code>,现在我在 <code>sklearn-pandas</code> 中使用了 <code>DataFrameMapp
晚上好, 我目前正在攻读化学博士学位,在这个框架中,我试图应用我在 Python 和统计方面的一些
我有一个数据框。我正在实现句子转换器并根据搜索查询返回一行。例如 <pre><code>search_string = &#34;thor
#Code 任务 10 #在<code>X_tr</code>上调用StandardScalers fit方法来拟合scaler #then 使用它的 <code>transform()
我正在使用 Python 开发逻辑回归模型,并设法手动调整阈值。但是,当我使用 pickle 保存模型时,阈值似
我有一个大小为 <code>(1250,13)</code> 的数据集。不幸的是,有很多 NaN,但列之间应该有很多相关性。 <p