如何解决如何使用多个条件创建数据库的子集?
我有一个这样的数据库:
我需要创建一个较小的数据框,其中包含哥伦比亚,哥斯达黎加,萨尔瓦多和洪都拉斯(数据库中还有许多其他国家),其中C列的sub_region为空,E列的metro_area为空,并且包含L和M列中的数据。类似这样的东西:
我尝试了以下操作:
COL <- subset(Basetotal,country_region == "Colombia" & sub_region_1 == "",select = c("date","transit_stations_percent_change_from_baseline"))
每个国家都有,但这太慢了。如何用更少的代码行更有效地解决我的问题?
解决方法
尝试:
char name[31];
char *names[32];
int count = 5;
for (int i =0; i<count;i++) {
scanf("%s",name);
names[i]=(char*)malloc(strlen(name)+1);
strcpy(names[i],name);
}
for (int i =0; i<count;i++) {
printf("%d: %s\n",i+1,names[count]);
}
您可以使用library(tidyverse)
Basetotal %>%
filter(
sub_region_1 == "",metro_area == ""
) %>%
pivot_wider(
id_cols = date,names_from = country_region,values_from = c(
transit_stations_percent_change_from_baseline,workplaces_percent_change_from_baseline
) # spreads data from both columns L and M
)
来使用多种条件对数据库进行子集化,并且可以使用filter()
在表格中分布多个国家/地区数据。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。