如何解决Tidyr:pivot_wider错误:无法将<double>转换为<list>
我有一个数据框,其中列出了跨多个调查样地的物种观测结果(数据为here)。我正在尝试使用tidyr的pivot_wider将丰度数据分布在几列中,新列是每个观察到的物种。这是我要用来执行此操作的代码行:
>>> start = 50
>>> step = 75
>>> end = 550
>>> np.stack((np.arange(0,end - start,step),np.arange(start,end,step)),axis=1)
array([[ 0,50],[ 75,125],[150,200],[225,275],[300,350],[375,425],[450,500]])
但是,这给了我两条错误消息:
data %>% pivot_wider(names_from = Species,values_from = Total.Abundance,values_fill = 0)
我不确定问题出在哪里,因为这对于其他(看起来)与此数据帧相同的其他数据帧来说效果很好。我尝试谷歌搜索第一条错误消息,但无法找到导致该错误的原因-我不知道double R试图将其转换为列表的原因,也不知道为什么它试图将其转换为列表。 Total.Abundance列应该是整数,但是我想知道它是否是双精度数据类型? 根据我的发现,当数据框中有相同的行时,会出现第二条错误消息。但是,当我将语句修改为
时,错误仍然存在Error: Can't convert <double> to <list>.
Values are not uniquely identified; output will contain list-cols.
我本以为会删除重复的行。 任何帮助将不胜感激!
解决方法
根据我的评论,您数据中的重复项无法被unique()
或dplyr
,distinct()
删除:
dat %>%
distinct() %>%
group_by(Plot.ID,Species) %>%
count()
# Plot.ID Species n
# <dbl> <chr> <int>
# 1 1 Calliopius 1
# 2 1 Idotea 2
# 3 1 Lacuna vincta 2
# 4 1 Mitrella lunata 2
# 5 1 Podoceropsis nitida 1
# 6 1 Unk. Amphipod 1
# 7 1 Unk. Bivalve 1
# 8 2 Calliopius 1
# 9 2 Caprella penantis 1
#10 2 Corophium insidiosum 1
需要找出为什么会有这样的重复项并进行调和,例如将它们加起来。问题可能出在解决编码错误的数据上,在这种情况下,求和不一定适用。或者,也许说您对同一图样进行了两次采样,您想用均值而不是总和来归一化与采样工作量,或者可能需要额外的列来表示采样工作量。但是,这很完美:
dat %>%
group_by(Plot.ID,Species) %>%
summarise(abundance = sum(Total.Abundance)) %>%
tidyr::pivot_wider(names_from = Species,values_from = abundance,values_fill = 0)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。