如何解决在lm中过滤多个变量
我正在处理一个电子表格,并希望创建一个线性模型,该模型考虑多个变量如何影响R&D支出。变量之一(称为CEO)指出,CEO是否拥有博士学位。这在数据中可以识别,因为CEO = 1(有博士学位),CEO = 0(没有博士学位)。当我仅与CEO一起为线性模型编写代码时,就会同时使用这两种方法,这使得很难解释每种方法对研发支出的影响。
#This is my initial code:
reg3 <- lm(RD.exp ~ NETincome*Assets..total.*CEO,data = data1,na.action=na.omit)
我想对其进行过滤,以便可以运行相同的回归,但仅考虑CEO = 1。 我试过通过dplyr对其进行过滤,但没有成功。我还尝试了以下代码行:
CEO1 <- data3[which(data3$CEO==1),]
但是这使数据再次变成了chr,当我尝试使用as.numeric时,它不会将其恢复为num。
然后这个想法就是让代码看起来像这样:
reg3 <- lm(RD.exp ~ NETincome*Assets..total.*CEO1,na.action=na.omit)
真的很感谢您的帮助!
谢谢
解决方法
在注释之后,采取三种可能的方式,假设所有三个变量均为数字,则所有方法都会产生相同的结果。对于这三个变量,您可能都希望从公式中删除CEO
,因为它将是一个常数并产生交互NA
。
在subset
内使用lm
one <- lm(RD.exp ~ NETincome * Assets..total.,data = data1,subset = CEO == 1,na.action = na.omit)
使用dplyr::filter
library(dplyr)
two <- data1 %>%
dplyr::filter(CEO == 1) %>%
lm(RD.exp ~ NETincome * Assets..total.,data = .,na.action = na.omit)
使用基本r
(不要使用which
)
three <- lm(RD.exp ~ NETincome * Assets..total.,data = data1[data1$CEO == 1,],na.action = na.omit)
对所有三个产生相同的系数
all.equal(one$coefficients,two$coefficients,three$coefficients)
#> [1] TRUE
希望数据像您一样
set.seed(2020)
data1 <- data.frame(
RD.exp = sample(10000:20000,100,replace = TRUE),NETincome = sample(50000:90000,Assets..total. = sample(100000:900000,CEO = sample(0:1,replace = TRUE)
)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。