如何解决解决Stata中的重复行
我有由两个合并的数据集组成的数据集。首先是来自国家统计局的官方失业数据,而另一个是来自国际劳工组织模型估计的失业数据。
对于约旦等一些国家/地区,它在另一个数据集中被命名为 JOR,但名为 JOR_total,尽管它测量的是相同的人口群体。这导致同一年每个性别有两行。但是,我基本上想为每个国家/地区和每个性别保留一行。
以下是数据集的样子:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19
2019 Male JOR 8
2019 Female JOR_total 17.3
2019 Male JOR_total 7.4
我想将数据集更改为如下所示:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19 17.3
2019 Male JOR 8 7.4
2019 Female EGY 17 22
2019 Male EGY 5 9.4
解决方法
在合并两个数据集之前解决了这个问题,如下:
// Removing countries with duplicate entries
drop if country=="JOR"
replace country="JOR" if country=="JOR_total"
它看起来像:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19 17.3
2019 Male JOR 8 7.4
2019 Female EGY 17 22
2019 Male EGY 5 9.4
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。