如何解决在 Stata 中看似无关的回归太慢后的利润率
我有一个 300 万个 obs 数据集。我需要用 SUR 估计 LPM,并获得边际效应。
我使用了 gsem... vce(cluster x)
,然后是 margins,... force
。但是得到margin结果需要很长时间(2个多小时)。我确实需要 CI 的标准错误,所以我不能不使用 nose
选项。
还有其他方法可以提高速度吗?
解决方法
确切的代码取决于您确切指的是哪种边际效应。您可以使用 lincom
计算部分效应,这很可能比 margins
更快。
举个例子,假设我们估计这个模型:
x1 对 y 的偏影响可以通过对 x1 求偏导数得到:
通过插入均值,我们可以在x2和x3的均值处得到x1对y的影响。要在 Stata 中执行此操作:
// Get data
webuse regress
// Run the regression
qui reg y c.x1##c.(x2 x3)
// Get the sample means of x2 and x3
sum x2 if e(sample),meanonly
scalar m_x2 = r(mean)
sum x3 if e(sample),meanonly
scalar m_x3 = r(mean)
// Calculate partial effect
lincom x1 + m_x2 * c.x1#c.x2 + m_x3*c.x1#c.x3
结果:
. lincom x1 + m_x2 * c.x1#c.x2 + m_x3*c.x1#c.x3
( 1) x1 - .2972973*c.x1#c.x2 + 3019.459*c.x1#c.x3 = 0
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
(1) | 1.409372 1.005254 1.40 0.163 -.5778255 3.396569
------------------------------------------------------------------------------
如您所见,这与通过边距获得的结果相同:
. qui reg y c.x1##c.(x2 x3)
. margins,dydx(x1) atmeans
Conditional marginal effects Number of obs = 148
Model VCE : OLS
Expression : Linear prediction,predict()
dy/dx w.r.t. : x1
at : x1 = 3.014865 (mean)
x2 = -.2972973 (mean)
x3 = 3019.459 (mean)
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | 1.409372 1.005254 1.40 0.163 -.5778256 3.396569
------------------------------------------------------------------------------
这里的速度比较显示 lincom
比 margins
快 14 倍,在这种情况下有 300 万次观察:
clear
webuse regress
expand 20271
gen lincom = .
gen margins = .
qui reg y c.x1##c.(x2 x3)
forval i = 1/50 {
timer clear
timer on 1
sum x2 if e(sample),meanonly
scalar m_x2 = r(mean)
sum x3 if e(sample),meanonly
scalar m_x3 = r(mean)
lincom x1 + m_x2 * c.x1#c.x2 + m_x3*c.x1#c.x3
timer off 1
timer on 2
margins,dydx(x1) atmeans
timer off 2
timer list
replace lincom = r(t1) in `i'
replace margins = r(t2) in `i'
}
ttest lincom == margins
di "On average,lincom is " %4.2f `=r(mu_2) / r(mu_1)' " times faster than margins with `=_N' observations"
// On average,lincom is 13.88 times faster than margins with 3000108 observations
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。