feature-engineering专题提供feature-engineering的最新资讯内容,帮你更好的了解feature-engineering。
因此,我试图清理多边形数据以在Tableau中制作地图,并且我有一列(wkt_polygon)由一长串经度和纬度组
我不确定是否可以使用operators列返回一个熊猫系列,该系列将根据其通过分数,运算符和实际值来确定
我是新来的,并且对滞后特征以及如何在数据集上使用滞后特征有疑问。 我想用不同的模型(自动
我对boxcox转换(或对数转换)有疑问。我正在研究一个具有许多偏斜特征的数据集。现在,当我进行boxco
在训练二进制分类器之前,我已经使用Pandas进行数据处理。我找不到的一件事是一个函数,该函数告诉
PS:我的数据有100万行,所以我正在寻找一种不需要花费很长时间就可以运行大数据的解决方案。
<h3>我正在使用此数据集:</h3> <a href="https://www.kaggle.com/shahir/protein-data-set" rel="nofollow noreferrer">https://www.k
我必须在One Hot中编码7个特征,因此结果创建了稀疏矩阵。 我的问题是: <ol> <li>由于我看不到稀疏矩
我的目标是预测出售给定财产所需的天数,我们将此变量称为“ DaysForSale”-简称DfS。 使用DfS,我
可以执行正弦和余弦之类的常规转换。但是,如何确定哪个周期最大持续时间呢? 示例: <pre><c
我有一个这样的数据框 <pre><code>data = {&#39;Customer&#39;:[&#39;C1&#39;, &#39;C1&#39;, &#39;C1&#39;, &#39;C2&#39;, &#39;C2
我正在尝试运行基本模型,但似乎管道的插补阶段正在失败,而且我并不十分了解为什么。 这是最
我正在使用类似以下的Times Series数据集: <a href="https://i.stack.imgur.com/IGxqa.png" rel="nofollow noreferrer"><i
我有几组更正的功能。我将每组功能组合在一起以创建四个新功能。下面的示例: <pre><code># Combine thr
让我说我有2个CSV文件(非常大的文件), <ul> <li>第一个文件代表餐厅,并具有6个属性<code>restaurant_id
我有一个csv文件,其中包含的属性很少,其中之一是不同餐厅<code>etoiles</code>的星级(法语中的星级)。
我有一个数据框,其中包含顾客对他们去过的餐馆的评价以及其他一些属性。 <ul> <li> <strong>我要做的
我有一个数据框,代表顾客对餐厅的评价。 <code>rating_year</code>是评分的年份,<code>first_year</code>是餐厅
我有一个数据框,代表顾客对餐厅的评价。 <code>star_rating</code>是此数据框中客户的评价。 <ul> <li> <str
我有一个数据框,代表顾客对餐厅的评价。 <code>star_rating</code>是此数据框中客户的评价。 <ul> <li>我