联合是否比现代编译器更有效?

如何解决联合是否比现代编译器更有效?

| 考虑简单的代码:
UINT64 result;
UINT32 high,low;
...
result = ((UINT64)high << 32) | (UINT64)low;
现代编译器是将其转换为高电平时的实际偏移,还是将其优化为简单复制到正确的位置? 如果不是这样,那么使用工会似乎比大多数人似乎使用的转变更为有效。但是,让编译器进行优化是理想的解决方案。 我想知道当人们需要额外的性能时我该如何建议他们。     

解决方法

我编写了以下(希望有效)测试:
#include <stdio.h>
#include <stdint.h>
#include <stdlib.h>

void func(uint64_t x);

int main(int argc,char **argv)
{
#ifdef UNION
  union {
    uint64_t full;
    struct {
      uint32_t low;
      uint32_t high;
    } p;
  } result;
  #define value result.full
#else
  uint64_t result;
  #define value result
#endif
  uint32_t high,low;

  if (argc < 3) return 0;

  high = atoi(argv[1]);
  low = atoi(argv[2]);

#ifdef UNION
  result.p.high = high;
  result.p.low = low;
#else
  result = ((uint64_t) high << 32) | low;
#endif

  // printf(\"%08x%08x\\n\",(uint32_t) (value >> 32),(uint32_t) (value & 0xffffffff));
  func(value);

  return 0;
}
运行未优化输出the2 un的差异:
<   mov -4(%rbp),%eax
<   movq    %rax,%rdx
<   salq    $32,%rdx
<   mov -8(%rbp),%eax
<   orq %rdx,%rax
<   movq    %rax,-16(%rbp)
---
>   movl    -4(%rbp),%eax
>   movl    %eax,-12(%rbp)
>   movl    -8(%rbp),-16(%rbp)
我不了解汇编程序,因此我很难对其进行分析。但是,似乎在非联盟(顶部)版本上发生了预期的变化。 但是启用优化
-O2
,输出是相同的。因此,生成了相同的代码,并且两种方式都将具有相同的性能。 (Linux / AMD64上的gcc版本4.5.2) 优化的
-O2
代码的部分输出(带有或不带有联合):
    movq    8(%rsi),%rdi
    movl    $10,%edx
    xorl    %esi,%esi
    call    strtol

    movq    16(%rbx),%rdi
    movq    %rax,%rbp
    movl    $10,%esi
    call    strtol

    movq    %rbp,%rdi
    mov     %eax,%eax
    salq    $32,%rdi
    orq     %rax,%rdi
    call    func
片段由
if
线产生的跳转后立即开始。     ,现代编译器比您想像的要聪明;-)(所以,是的,我认为您可以期望任何不错的编译器都会发生重大变化)。 无论如何,我将使用语义更接近您实际尝试执行的选项。     ,如果这应该是平台无关的,那么唯一的选择就是在这里使用shift。 使用
union { r64; struct{low;high}}
,您无法确定将映射到哪个低/高场。考虑一下耐力。 现代编译器很好地处理了这种变化。     ,编辑:此响应基于没有强制转换的OP的代码的早期版本 此代码
result = (high << 32) | low;
实际上会产生未定义的结果...因为使用
high
,您要将32位值移动32位(值的宽度),结果将是不确定的,并且将取决于编译器和OS平台决定应对这一转变。然后,该不确定的移位的结果将与ѭ11或,由于您将一个未定义的值与定义的值进行比对,因此它也将是不确定的,因此最终结果很可能不是随心所欲的64位值。例如,OSX 10.6上的“ 2”发出的代码如下:
movl    -4(%rbp),%eax      //retrieving the value of \"high\"
movl    $32,%ecx          
shal    %cl,%eax           //performing the 32-bit shift on \"high\"
orl    -8(%rbp),%eax       //OR\'ing the value of \"low\" to the shift op result
因此,您可以看到,移位仅发生在具有32位汇编命令的32位寄存器中的32位值上……结果最终与ѭ14same完全相同,而没有任何移位,因为在这种情况下,
shal $32,%eax
只是返回in16ѭ中的原始值。您没有得到64位结果。 为了避免这种情况,请将
high
转换为
uint64_t
,例如:
result = ((uint64_t)high << 32) | low;
    

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-