有什么方法可以将vtable从主机复制到设备CUDA和C ++

如何解决有什么方法可以将vtable从主机复制到设备CUDA和C ++

由于某些与“虚拟表”或“虚拟指针”相关的原因,Cuda似乎不允许我“将从虚拟基类派生的类的对象传递给__global__函数”。

我想知道是否可以通过某种方式手动设置“虚拟指针”,以便可以使用多态性?

解决方法

有什么方法可以将vtable从主机复制到设备

您不想将vtable从主机复制到设备。主机上的vtable(即在主机上创建的对象中)在vtable中具有一组主机函数指针。将此类对象复制到设备时,vtable不会被更改或“固定”,因此最终在设备上出现一个对象,该对象的vtable充满了主机指针。

如果您随后尝试调用这些虚拟功能之一(使用设备代码中的设备上的对象),则会发生不良情况。 vtable中列出的数字函数入口点是在设备代码中没有任何意义的地址。

以便我可以使用多态性

我建议在设备代码中使用多态的方法是在设备上创建对象。这使用一组设备函数指针(而不是主机函数指针)设置了vtable,并且诸如this之类的问题证明了它可以工作。一阶近似,如果您有一种方法可以在宿主代码中创建一组多态对象,那么我不知道您为什么不能在设备代码中使用类似方法。问题确实与互操作性有关-在主机和设备之间移动此类对象-the stated limitations in the programming guide所指的是这种情况。

我想知道是否可以通过某种方式手动设置“虚拟指针”

可能有。为了共享知识,我将概述一种方法。但是,我对C ++的了解还不够多,很难说这是否可以接受/合法。我唯一可以说的是在非常有限的测试中,它似乎可以正常工作。 但是我认为这是不合法的,因此我不建议您将这种方法用于实验以外的其他用途。即使我们不确定该方法是否合法,也已经有明确规定CUDA限制(如上所述),您不应尝试在主机和设备之间传递具有虚拟功能的对象。因此,我仅提供它作为观察,这可能对实验或研究很有趣。我不建议将其用于生产代码。

this thread中概述了基本思想。它基于这样的想法,即普通的对象复制似乎并不复制虚拟函数指针表,这对我来说很有意义,但是整个对象确实包含该表。因此,如果我们使用这样的方法:

template<typename T>
__device__ void fixVirtualPointers(T *other) {
        T temp =  T(*other); // object-copy moves the "guts" of the object w/o changing vtable
        memcpy(other,&temp,sizeof(T)); // pointer copy seems to move vtable
}

似乎可以获取给定的对象,创建该类型的新“虚拟”对象,然后通过对对象进行基于指针的复制来“修复” vtable(考虑整个对象的大小)而不是“典型的”对象副本。使用此方法后果自负。 This blog也许也很有趣,尽管我不能保证那里任何陈述的正确性。

除此之外,cuda标签上还有许多其他建议,您不妨查看them

,

我想提供一种不同的方法来修复vtable,它不依赖于在对象之间复制vtable。这个想法是在设备上使用new放置,以使编译器生成适当的vtable。但是,这种方法也违反了编程指南中规定的限制。

#include <cstdio>

struct A{
    __host__ __device__
    virtual void foo(){
        printf("A\n");
    }
};

struct B : public A{

    B(int i = 13) : data(i){}

    __host__ __device__
    virtual void foo() override{
        printf("B %d\n",data);
    }

    int data;
};

template<class T>
__global__
void fixKernel(T* ptr){
    T tmp(*ptr);

    new (ptr) T(tmp);
}

__global__
void useKernel(A* ptr){
    ptr->foo();
}


int main(){

    A a;
    a.foo();

    B b(7); 
    b.foo();

    A* ab = new B();

    ab->foo();

    A* d_a;
    cudaMalloc(&d_a,sizeof(A));
    cudaMemcpy(d_a,&a,sizeof(A),cudaMemcpyHostToDevice);

    B* d_b;
    cudaMalloc(&d_b,sizeof(B));
    cudaMemcpy(d_b,&b,sizeof(B),cudaMemcpyHostToDevice);

    fixKernel<<<1,1>>>(d_a);

    useKernel<<<1,1>>>(d_a);

    fixKernel<<<1,1>>>(d_b);

    useKernel<<<1,1>>>(d_b);

    cudaDeviceSynchronize();

    cudaFree(d_b);
    cudaFree(d_a);
    delete ab;
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-