微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在Nvidia下读取OpenCL可执行文件的读取共享/本地内存存储/装载库冲突的硬件计数器

如何解决在Nvidia下读取OpenCL可执行文件的读取共享/本地内存存储/装载库冲突的硬件计数器

可以使用nvprof来访问/读取CUDA执行程序的库冲突计数器:

nvprof --events shared_st_bank_conflict,shared_ld_bank_conflict my_cuda_exe

但是,它不适用于使用OpenCL而不是CUDA代码代码

  • 是否有办法从OpenCL环境(也许直接从ptx)中提取nvprof之外的这些计数器?
  • 或者,可以使用clGetProgramInfoCL_PROGRAM_BINARIEScuModuleLoadDataExnvprof一起使用n {{1} }}?
  • 是否有任何允许设置诸如库大小等参数的模拟cpu后端?

其他选项:

  • 使用opencl到cuda代码的转换器,包括CUDA中缺少的功能,例如vloadn / vstoren,float16和其他各种访问器。 #define仅适用于简单内核。有提供它的工具吗?

解决方法

有什么方法可以从OpenCL的nvprof外部提取这些计数器 环境,也许直接来自ptx?

不。 CUDA中也没有,OpenGL,DirectX或Vulkan中也没有计算着色器。

或者有什么方法可以转换从 使用clGetProgramInfo和
的nvidia OpenCL编译器 CL_PROGRAM_BINARIES到CUDA内核并使用
运行 cuModuleLoadDataEx,从而能够使用nvprof?

不。 OpenCL PTX和CUDA PTX不同,不能互换使用

是否有任何允许设置此类参数的仿真CPU后端 如银行规模等?

我不知道。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。