如何解决使用 MPI_Alltoallv 转置矩阵
我想使用 MPI_Alltoallv 转置矩阵 b 并将其存储在 bt 中。
每个进程包含 b 的 nlocal 行。例如:
Proc0: 0 | 10 | 20 | 30
Proc0: 1 | 11 | 21 | 31
Proc1: 100 | 110 | 120 | 130
Proc1: 101 | 111 | 121 | 131
我希望 bt 是这样的:
Proc0: 0 | 1 | 100 | 101
Proc0: 10 | 11 | 110 | 111
Proc1: 20 | 21 | 120 | 121
Proc1:30 | 31 | 130 | 131
子矩阵存储在二维数组中(b[0] 包含第一行,b[1] 包含第二行)。 按照建议,我使用了 MPI_Alltoallv()。这是我所做的:
int n=4; //matrix of size 4x4
int nlocal=n/nbProc; // the submatrices are of size 2x4
int sc[nbProc];
int dis[nbProc];
int rdis[nbProc];
for(int i=0;i<nbProc;i++){
sc[i]=1;
}
for(int i=0;i<nlocal;i++){//loop on the b[i]
for(int j=0;j<nlocal;j++){ //loop on the bt[j]
for(int k=0;k<nbProc;k++){
dis[k] = j+k*nlocal;
rdis[k] = i+k*nlocal;
}
MPI_Alltoallv(b[i],sc,dis,MPI_INT,bt[j],rdis,MPI_COMM_WORLD);
}
}
但是,我有 3 个循环,我想我可能会少一些。有什么问题吗?
解决方法
我找到了只调用一次 MPI_Alltoallv
的解决方案。所有子矩阵必须存储在一个向量中。但是不是存储 n 个第一个值,第一行,然后是 n 个下一个值,第二行等等......我们存储将进入第一个过程的 m 个值,接下来的 p 将进入第二个过程进程,等等...在我写的例子中,我们将有 buf = {0,10,1,11,20,30,21,31}
作为第一个进程。然后我们使用 MPI_Alltoallv
发送向量中的值(例如称为 buft),然后我们将这些值分布在矩阵中。
请注意,有两种方法可以将值存储在 buf 中。第二个是 buf={0,31}
,我使用它是因为我认为它更容易实现,但想法保持不变。
此外,即使进程没有相同大小的子矩阵(例如,如果我们的 Proc1 在 b 中只有 1 行),这也有效。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。