如何解决所有线程在CUDA中使用相同数量的寄存器吗?
if (threadIdx.x < 128) {
float reg[32];
// do something with reg...
} else {
return;
}
假设每个块有256个线程,但是只有一半的线程在使用寄存器,而另一半则在做其他事情(在这种情况下什么也不做)。我的问题是,此线程块将使用多少个寄存器(仅考虑 reg )? 32 * 256或32 * 128吗?
解决方法
所有线程使用相同数量的寄存器。
这是一个编译时决策,该决策与运行时行为无关,并且编译器确定网格中所有线程的寄存器使用情况(即内核启动),而决不是以每个线程来决定。在运行时,必须为每个线程分配必要数量的寄存器,无论它们是否“使用”它们。参见here。
您的问题的答案是,不管线程“做什么”,每个块的寄存器数等于每个线程的寄存器数(在编译时确定)乘以每个块的线程数。>
因此在您的示例中,大概是32*256
,而不是32*128
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。