如何使用单位移位有效地左移N位？编辑

如何解决如何使用单位移位有效地左移N位？编辑

某些MSP430等CPU没有多位移位，而只有一位移位或旋转指令。这让我很好奇，在过去的程序员中，他们所能做的就是一次移位一位。

我知道这样做的“愚蠢”方式：

#include <cstdint>

uint64_t lshift(uint64_t x,uint64_t shift) {
    for (uint64_t i = 0; i < shift; ++i) {
        x <<= 1;
    }
}

有什么方法可以做到这不具有O（n）的复杂性吗？还是至少有一种实现方式可以使我在编译时知道移位（通常是移位）？

我的直觉是x << (1 << (1 << 1))与x << 4相同，因此也许可以通过组合这样的移位将其降低到O（log n）。

编辑

我的直觉是错误的，但是其他操作也会产生类似的效果。 x << 1等效于x += x，因此x += x,x += x,x += x等效于x << 4。乘以2的幂也可以。

注意：这里使用C ++只是为了方便起见，我知道总是会有一个左移运算符。我只是不想在MP430装配中考虑这一点。

解决方法

有关以下代码的背景信息，请在Internet上搜索“达夫设备”。

您可以通过以下方式使用switch语句：

uint32_t Shift_Value(uint32_t value,unsigned int shift_quantity)
{
  switch (shift_quantity)
  {
     case 31:
         value <<= 1;
     case 30:
         value <<= 1;
     case 29:
         value <<= 1;
// ...
     case  1:
         value <<= 1;
   }
   return value;
}

上面的代码很有趣，因为它是进入移位操作数组的跳转表。可以将其与展开for循环进行比较，但是它具有执行跳入“展开”的适当位置的优点。

我以前在嵌入式系统中使用过这种模式来提高性能。

我建议打印出编译器生成的汇编语言并研究汇编语言。：-）

此外，由于没有循环，只有计算和跳转，因此优化可能是O（1）。

如果有乘数，那么

uint32_t multipliers[] = {1,2,4,8,16 ...};
uint32_t shift(uint32_t x,uint32_t shift)
{
    return x * multipliers[shift];
}

TL; DR：实际上，如您所想，多步转换通常会由多个转换完成。但是可以使用一些技巧来避免移动太多次。例如，某些算法被设计为只需要移位1，或者如果需要更大的移位，则可以使用ISA中的一些特殊的按位指令进行优化

为嵌入式系统编程需要更深入地了解该体系结构，以实现良好的性能和RAM / ROM使用率。例如，选择变量使它们适合机器字。除非绝对必要，否则没有人会在16位或8位MCU上使用uint64_t。多字变量的运算（包括位移）需要更多指令，因此通常不会内联。通常，对字大小倍数的移位与对数组元素进行移位相似，因此它们将非常快

按任意变量移动需要一个barrel shifter，比简单的shift register占用更多的裸片空间，因此大多数嵌入式体系结构一次只能移位一位。它们中的大多数还包括某种交换半字指令，以克服该限制并允许足够快的大距离移位。例如，诸如8051，PIC或AVR之类的8位微控制器具有交换半字节指令。参见：

MSP430是16位MCU，因此它具有一条SWPB指令来交换 bytes ，该指令可以类似地用于快速移位8。这里是some examples generated by Clang（加上我的评论，请注意如何完成8倍移位和大于8的移位）：

shift_left_15(unsigned short):                     ; @shift_left_15(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 7 times
        add     r12,r12
        add     r12,r12
        ret
shift_left_12(unsigned short):                     ; @shift_left_12(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 4 times
        add     r12,r12
        ret
shift_left_10(unsigned short):                     ; @shift_left_10(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 2 times
        add     r12,r12
        ret
shift_left_9(unsigned short):                      ; @shift_left_9(unsigned short)
        mov.b   r12,r12
        swpb    r12
        add     r12,r12
        ret
shift_left_8(unsigned short):                      ; @shift_left_8(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; just swap bytes
        ret
shift_left_7(unsigned short):                      ; @shift_left_7(unsigned short)
        add     r12,r12
        ret
shift_left_3(unsigned short):                      ; @shift_left_3(unsigned short)
        add     r12,r12
        ret

您可以打开上方的Godbolt链接以获取完整的输出

如果您使用的是MSP430X，那么它可以从1 greatly simplifies the shifting procedure到4位位置

shift_left_15(unsigned short):
        PUSHM.W #1,R4
        MOV.W   R1,R4
        rpt     #15 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_12(unsigned short):
        PUSHM.W #1,R4
        rpt     #12 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_10(unsigned short):
        PUSHM.W #1,R4
        rpt     #10 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_9(unsigned short):
        PUSHM.W #1,R4
        rpt     #9 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_8(unsigned short):
        PUSHM.W #1,R4
        rpt     #8 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_7(unsigned short):
        PUSHM.W #1,R4
        rpt     #7 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_3(unsigned short):
        PUSHM.W #1,R4
        rpt     #3 { rlax.w       R12
        POPM.W  #1,r4
        RET

可以以相同的方式进行右移，但是将add替换为rrc/rra，rlax替换为rrax。参见demo on Godbolt

如何使用单位移位有效地左移N位？ 编辑

如何解决如何使用单位移位有效地左移N位？ 编辑

编辑

解决方法

相关推荐

如何使用单位移位有效地左移N位？编辑

如何解决如何使用单位移位有效地左移N位？编辑