如何解决SAS HPGENSELECT中的型号选择详细信息
我使用SAS HPGENSELECT对二进制目标进行变量选择:proc hpgenselect data = build lassosteps = 100;类var2;模型目标(降序)=&vars。 / distribution = binary; 选择方法= LASSO(选择= AIC停止=无)details = all;
我在这里有几个问题:
-
基于文档,我对一般过程的理解是: a)在步骤1中,&vars中的每个候选自变量(x)。使用GLM函数拟合逻辑回归模型y〜x。然后选择其中的重要效应子作为固定变量。 b)在第2步中,&vars中的每个剩余候选变量(x)。使用拟合逻辑回归模型y〜x + var1 + var2,并选择最重要的效应子作为固定变量,依此类推。 c)当&vars中的每个变量时,该过程停止。已输入模型。那么,具有最小AIC值的步骤就是最终选择的模型。 这种理解正确吗?如果是的话,我想知道LASSO在这里何时起作用。
-
根据文档,在每个步骤中输入最重要的效应子。但是,我注意到输入顺序不是基于每个变量的P值(y〜x)。我想知道这里使用哪个标准来确定每个步骤的最重要效应子。
-
在步骤2中显示了2个lambda数字,我想知道对lambda = 0.5流程做了什么?
-
在步骤3中,删除了var3。我想知道使用哪个标准来确定var3的删除。
如果您有上述任何问题,请分享。非常感谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。