我有一个
Windows HPC Server在后端运行一些节点.我想使用后端的多个节点运行Parallel R.我认为Parallel R可能在Windows上使用SNOW,但对它不太确定.我的问题是,我是否还需要在后端节点上安装R?
假设我想使用两个节点,每个节点32个核心:
假设我想使用两个节点,每个节点32个核心:
cl <- makeCluster(c(rep("COMP01",32),rep("COMP02",32)),type="SOCK")
现在,它只是挂起.
我还需要做什么?后端节点是否需要运行某种sshd以便能够相互通信?
在Windows群集上设置雪是相当困难的.每台机器都需要安装R和雪,但这很容易.要启动SOCK集群,您需要在每台工作计算机上运行一个sshd守护程序,但是您仍然可能遇到麻烦,所以除非您擅长调试和Windows系统管理,否则我不建议这样做.
我认为Windows群集的最佳选择是使用MPI.我自己在Windows上没有任何MPI经验,但我听说有人在Windows上使用MPICH和DeinoMPI MPI发行版取得了成功.在群集上安装MPI后,还需要在每台工作计算机上从源安装Rmpi软件包.然后,您将使用makeMPIcluster函数创建集群对象.这是一项很多工作,但我认为由于Windows上的ssh / sshd问题,它最终可能比尝试使用SOCK集群更有效.
如果您迫切希望在Windows群集上运行一次或两次并行作业,则可以尝试使用手动模式.它允许您在没有ssh的情况下创建SOCK集群:
workers <- c(rep("COMP01",32)) cl <- makeSOCKluster(workers,manual=TRUE)
makeSOCKcluster函数将提示您启动每个worker,显示每个worker使用的命令.您必须在指定的计算机上手动打开命令窗口并执行指定的命令.它可能非常繁琐,特别是对于许多工人来说,但至少它并不复杂或棘手.它与outfile =”选项结合使用也非常有用.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。