如何解决解析和推广用于重命名变量的Stata程序
我第一次学习如何在Stata中编写程序,并且难以概括我的程序,因此在重命名数据集中的变量时可以解析任意变量列表。
我正在处理两个数据集。第一个是面板数据集,其中包含在26年的调查中受访者的生活满意度(与我之前的问题相同)。变量最初以以下格式命名:ap6801
bp9301
cp9601
,一直到zp15701
。 ap6801
包含受访者对1985年的生活满意度,bp9301
包含对1986年的生活满意度,依此类推。
我编写了以下程序来重命名变量,因此它不是ap6801
而是lsat1985
。
program myprogram
local mcode 1984
foreach stub in a b c d e f g h i j k l m n o p q r s t u v w x y z {
local mcode = `mcode' + 1
rename `stub'* lsat`mcode'
}
现在,我想修改和推广该程序,以便可以在第二个数据集上使用任意编号使用它。第二个数据集一直由变量abetto
bbetto
cbetto
组成,直到zbetto
。这些变量指示在特定年份是否曾采访过特定人员,如果没有,原因为何。 abetto
对应1985年,bbetto
对应1986年,依此类推。
我的目标是编写程序的通用版本,以便在我输入变量和其他信息的任意列表(例如lsat
和数字列表(例如:1985-2010))时: myprogram ap6801-zp15701
,变量将重命名为lsat1985 lsat1986
... lsat2010
我猜该程序将具有以下基本结构:
program myprogram
syntax varlist
foreach x of varlist {
}
在循环中,可能会有local letter = substr("`x'",1,1)
来标识变量的首字母(a,b,c,d ...)。下一步是将字母与用户指定的数字链接,然后执行rename
命令,将变量重命名为以下格式: lsat / betto year 。我很难将所有内容都整合到代码中。
我不熟悉Stata和编程,因此对您的帮助表示感谢!
解决方法
您的程序仅在您的特殊情况下有效。 (通常,没有end
语句。)如果没有任何通配符a* b*
等在数据中作为相应的变量名出现,它将失败。反之,每个rename
从通配符a*
到一个变量名lsat1985
,只有在每种情况下仅存在一个变量时,这才起作用
更一般而言,这是一个过早编程的示例。偏见警报:为此类高度特定的任务,在特定的变量名前缀中进行接线以及在此类异常情况下编写程序并不是一种好的样式。最多,这是do文件中代码的区域。但是,如果允许使用变量名缩写,则应该可以使用。这里的好作风意味着要解释情况。
* each wildcard a* b* ... is matched by a single variable
set varabbrev on
local mcode = 1985
foreach pre in `c(alpha)' {
rename `pre' lsat`mcode'
local ++mcode
}
请注意,无需键入所有小写字母a
至z
。斯塔塔将所有这些作为c(alpha)
放在一处。您不应该知道这一点。为了完整起见,这可能与您的问题无关,请注意,Stata变量名称可以以其他字符开头,尤其是下划线_
。我不知道有关2011年以来多年的数据。
如果不冒着令人讨厌的光顾的风险,就很难不写这个。而且评论似乎完全不公平,因为您的目标恰恰是对该程序进行概括的目的!但是,在Stata中,通常是一个更好的主意,那就是,当且仅当您在如此多种不同的情况下使用了do文件时,才需要先编写do文件并移至程序,以至于需要更通用的程序。因此,我不会在更通用的程序上回答您的问题。这显然不是一个好主意,即使是局外人也很难知道该程序的外观。您提供了一个示例,其中后缀看起来不可预测(6801 9301 9601
,依此类推),而另一个后缀看起来可预测(betto
),我们不知道还有什么是正确的(除非怪异的人认识到您的数据集)。为数据集编写的程序只有26个变量a
到z
是可能的,但是您会使用它多次吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。