如何解决R caret XGBoost不会在Ubuntu Server上终止
我有一个奇怪的问题,我也不知道如何正确地对问题进行分类。
基本上,我在本地计算机上训练了caret
ML模型(XGBoost
),并且对它进行并行化没有问题。
这是我在本地R Studio
中运行的代码:
train.control <- trainControl(method = "repeatedcv",number = 10,repeats = 3,search = "grid")
tune.grid <- expand.grid(eta = c(0.05,0.075,0.1),nrounds = c(50,75,100),max_depth = 9:11,min_child_weight = c(2.0,2.25,2.5),colsample_bytree = c(0.3,0.4,0.5),gamma = 0,subsample = 1)
cl <- snow::makeCluster(4,type = "SOCK")
doSNOW::registerDoSNOW(cl)
xgboost.train.500.solver <- train(target ~ .,data = data,method = "xgbTree",preProcess = c("scale","center"),tuneGrid = tune.grid,trControl = train.control)
stopCluster(cl)
正如我所说的那样,它可以并行运行并且工作正常(精简版的时间消耗约为10分钟)
现在,我在Ubuntu
上设置了一个16核Google Cloud Platform
服务器,并在那里安装了R + R Studio服务器。当我运行相同的脚本(将内核设置为16 ofc)时,模型将不会终止(尝试> 10小时)。这里发生了什么?我已经检查过htop
,R进程使用了全部16个内核。因此,工人的后端注册就可以了。
非常感谢您能启发解决此问题的任何方法。
谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。