如何解决Stata:合并和排序类别
是否可以要求Stata组合变量并按顺序对其进行排序?
我的数据文件是清单的清单,看起来类似于下面发布的图片。我共有7个类别,分别分配给特定特征。但是,这些类别不是按顺序排列的。例如,一个将具有缎和锦缎,而下一个将具有锦缎和缎。是否可以要求Stata组合变量并按顺序对其进行排序?
我希望最后一列包含所有7个类别并按顺序排列。例如,不管上一列的顺序是缎和锦缎还是锦缎和缎纹,都将在末尾全部变成缎和锦缎。不管前几列以什么顺序写狐狸毛缎子,在最后一列它都变成相同的顺序。第一个类别中大约有100个不同的单词,然后在接下来的类别中越来越少。
然后,我可以将其从长格式转换为短格式,以形成人员列表,而不是清单列表,以便进行进一步的绘图和计算。enter image description here
解决方法
* Example generated by -dataex-. To install: ssc install dataex
clear
input str6(cat1 cat2) str5 cat3
"satin" "damask" ""
"damask" "satin" ""
"wool" "fox" "satin"
"satin" "fox" "wool"
end
您想要的一部分可能只是组合表。使用tab_chi
从SSC安装ssc install tab_chi
,然后安装tabm
:有关更多信息,请参见其帮助。
. tabm cat?
| values
variable | damask fox satin wool | Total
-----------+--------------------------------------------+----------
cat1 | 1 0 2 1 | 4
cat2 | 1 2 1 0 | 4
cat3 | 0 0 1 1 | 2
-----------+--------------------------------------------+----------
Total | 2 2 4 2 | 10
. tabm cat?,transpose
| variable
values | cat1 cat2 cat3 | Total
-----------+---------------------------------+----------
damask | 1 1 0 | 2
fox | 0 2 0 | 2
satin | 2 1 1 | 4
wool | 1 0 1 | 2
-----------+---------------------------------+----------
Total | 4 4 2 | 10
注意。狐狸怎么了?狐狸是否必须死掉以便人们戴上它们?
注意。您可能需要咬住子弹和reshape long
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。