如何解决R caretsvmRadial保持sigma不变,并使用网格搜索C
我正在用useMachine()
实现带有径向基函数内核('svmRadial')的支持向量机。据我了解的文档和源代码,caret
使用解析公式来获取sigma的合理估计并将其固定为该值(根据输出:调整参数'sigma'保持恒定为一个值0.1028894)。此外,caret
对一组成本参数C(默认= 3)进行交叉验证。
但是,如果现在要设置自己的成本参数网格(tuneGrid),则必须另外指定sigma值。否则会出现以下错误:
错误:调整参数网格的列应为sigma,C
如何根据解析公式修复Sigma并仍然实现自己的成本参数C网格?
这是MWE:
caret
解决方法
如果您查看该模型的信息,它会显示如果不提供该网格将如何生成:
getModelInfo("svmRadial")$svmRadial$grid
function(x,y,len = NULL,search = "grid") {
sigmas <- kernlab::sigest(as.matrix(x),na.action = na.omit,scaled = TRUE)
if(search == "grid") {
out <- expand.grid(sigma = mean(as.vector(sigmas[-2])),C = 2 ^((1:len) - 3))
} else {
rng <- extendrange(log(sigmas),f = .75)
out <- data.frame(sigma = exp(runif(len,min = rng[1],max = rng[2])),C = 2^runif(len,min = -5,max = 10))
}
out
}
所以获取它的方法是使用kernlab::sigest
估计sigma,首先我们为svmRadial提取出网格方法:
models <- getModelInfo("svmRadial",regex = FALSE)[[1]]
由于要提供公式,因此请设置输入x和y:
preProcValues = preProcess(Boston.train,method = c("center","scale"))
processData = predict(preProcValues,Boston.train)
x = model.matrix(medv ~ .,data=processData)[,-1]
y = processData$medv
我们为此模型使用了网格功能,您可以看到它与您的输出相同:
set.seed(1)
models$grid(x,3)
sigma C
1 0.1028894 0.25
2 0.1028894 0.50
3 0.1028894 1.00
svmR$results
sigma C RMSE Rsquared MAE RMSESD RsquaredSD MAESD
1 0.1028894 0.25 5.112750 0.7591398 2.982241 0.8569208 0.05387213 0.4032354
2 0.1028894 0.50 4.498887 0.8046234 2.594059 0.7823051 0.05357678 0.3644430
3 0.1028894 1.00 4.055564 0.8349416 2.402248 0.8403222 0.06825159 0.3732571
这是下面发生的事情:
set.seed(1)
sigmas = kernlab::sigest(as.matrix(x),scaled = TRUE)
# from the code,you can see it takes the mean of the two extreme quantiles
mean(sigmas[-2])
[1] 0.1028894
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。