如何解决在Nvidia下读取OpenCL可执行文件的读取共享/本地内存存储/装载库冲突的硬件计数器
可以使用nvprof来访问/读取CUDA执行程序的库冲突计数器:
nvprof --events shared_st_bank_conflict,shared_ld_bank_conflict my_cuda_exe
- 是否有办法从OpenCL环境(也许直接从ptx)中提取
nvprof
之外的这些计数器? - 或者,可以使用
clGetProgramInfo
和CL_PROGRAM_BINARIES
将cuModuleLoadDataEx
和nvprof
一起使用n {{1} }}? - 是否有任何允许设置诸如库大小等参数的模拟cpu后端?
其他选项:
解决方法
有什么方法可以从OpenCL的nvprof外部提取这些计数器 环境,也许直接来自ptx?
不。 CUDA中也没有,OpenGL,DirectX或Vulkan中也没有计算着色器。
或者有什么方法可以转换从 使用clGetProgramInfo和
的nvidia OpenCL编译器 CL_PROGRAM_BINARIES到CUDA内核并使用
运行 cuModuleLoadDataEx,从而能够使用nvprof?
不。 OpenCL PTX和CUDA PTX不同,不能互换使用
是否有任何允许设置此类参数的仿真CPU后端 如银行规模等?
我不知道。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。