计算能力7.5中的缓存行为

如何解决计算能力7.5中的缓存行为

这些是我的假设:

  1. 有两种类型的加载,已缓存和未缓存。在第一个中,流量通过L1和L2,而在第二个中,流量仅通过L2。
  2. 计算能力6.x和7.x中的默认行为是缓存访问。
  3. L1高速缓存行为128字节,L2高速缓存行为32字节,因此对于每个生成的L1事务,应该有四个L2事务(每个扇区一个)。
  4. 在Nsight中,SM-> TEX请求表示从32个线程合并的翘曲级指令。 L2-> TEX返回和TEX-> SM返回是对每个存储单元之间传输多少扇区的度量。

假设计算能力7.5,这些是我的问题:

  1. 第三个假设似乎暗示对于全局缓存的负载,L2-> TEX返回值应始终为四的倍数,但并非总是如此。这是怎么回事?
  2. 用const和__restrict__限定符标记指针是否还有一点意义?过去曾经向编译器暗示过,数据是只读的,因此可以缓存在L1 /纹理缓存中,但是现在所有数据都缓存在了那里,包括只读和非只读。
  3. 从我的第四个假设出发,我认为只要TEX-> SM Returns大于L2-> TEX Returns,差异就来自缓存命中。这是因为,当发生高速缓存命中时,您会从L1中读取一些扇区,而从L2中却没有读取。这是真的吗?

解决方法

CC 6.x / 7.x

  • L1缓存行大小为128字节,分为4个32字节扇区。如果未命中,则只能从L2中提取寻址的扇区。
  • L1高速缓存行大小为128字节,分为4个32字节扇区。
    • CC 7.0(HBM)64B升级已启用。如果高速缓存行的低64字节未命中,则低64字节将从DRAM中获取。如果高速缓存行的高64字节未命中,则将提取高64字节。
    • 只能从DRAM中获取CC 6.x / 7.5只能访问的32B扇区。
  • 关于L1缓存策略
    • CC 6.0默认情况下启用了负载缓存
    • CC 6.x默认情况下禁用了加载缓存-请参阅编程指南
    • CC 7.x默认情况下启用了负载缓存-有关缓存控制的详细信息,请参阅PTX

在Nsight Compute中,术语请求在6.x和7.x之间变化。

  • 对于5.x-6.x,每条指令的请求数因操作类型和数据宽度而异。例如,32位负载是每个请求8个线程,64位负载是每个请求4个线程,而128位负载是每个请求2个线程。
  • 对于7.x,请求应等效于指令,除非访问模式具有导致序列化的地址差异。

回答CC 7.5问题

  1. 第三个假设似乎暗示对于全局缓存的负载,L2-> TEX返回值应始终为四的倍数,但并非如此 总是这样。这是怎么回事?

L1TEX单元只会在高速缓存行中提取丢失的32B扇区。

  1. 用const和 restrict 限定词标记指针是否还有一点意义?以前是向编译器提示数据是只读的,因此可以将其缓存在L1 /纹理缓存中, 但是现在所有数据都缓存在了那里,只读和非只读。

如果已知数据是只读的,则编译器可以执行其他优化。

  1. 从我的第四个假设来看,我认为只要TEX-> SM回报大于L2-> TEX回报,差异就来自 缓存命中。那是因为当缓存命中时,您会得到一些 扇区从L1读取,但从L2读取。这是真的吗?

从L1TEX到SM的返回黑白是128B /周期。 从L2到SM的返回黑白在32B扇区中。

Nsight计算内存工作量分析| L1 / TEX缓存表显示

  • L2的扇区未命中(32B扇区)
  • 返回到SM(周期== 1-128B)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 <select id="xxx"> SELECT di.id, di.name, di.work_type, di.updated... <where> <if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 <property name="dynamic.classpath" value="tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-