如何解决如何使用单位移位有效地左移N位? 编辑
某些MSP430等CPU没有多位移位,而只有一位移位或旋转指令。这让我很好奇,在过去的程序员中,他们所能做的就是一次移位一位。
我知道这样做的“愚蠢”方式:
#include <cstdint>
uint64_t lshift(uint64_t x,uint64_t shift) {
for (uint64_t i = 0; i < shift; ++i) {
x <<= 1;
}
}
有什么方法可以做到这不具有O(n)的复杂性吗?还是至少有一种实现方式可以使我在编译时知道移位(通常是移位)?
我的直觉是x << (1 << (1 << 1))
与x << 4
相同,因此也许可以通过组合这样的移位将其降低到O(log n)。
编辑
我的直觉是错误的,但是其他操作也会产生类似的效果。 x << 1
等效于x += x
,因此x += x,x += x,x += x
等效于x << 4
。乘以2的幂也可以。
注意:这里使用C ++只是为了方便起见,我知道总是会有一个左移运算符。我只是不想在MP430装配中考虑这一点。
解决方法
有关以下代码的背景信息,请在Internet上搜索“达夫设备”。
您可以通过以下方式使用switch
语句:
uint32_t Shift_Value(uint32_t value,unsigned int shift_quantity)
{
switch (shift_quantity)
{
case 31:
value <<= 1;
case 30:
value <<= 1;
case 29:
value <<= 1;
// ...
case 1:
value <<= 1;
}
return value;
}
上面的代码很有趣,因为它是进入移位操作数组的跳转表。可以将其与展开for
循环进行比较,但是它具有执行跳入“展开”的适当位置的优点。
我以前在嵌入式系统中使用过这种模式来提高性能。
我建议打印出编译器生成的汇编语言并研究汇编语言。 :-)
此外,由于没有循环,只有计算和跳转,因此优化可能是O(1)。
,如果有乘数,那么
uint32_t multipliers[] = {1,2,4,8,16 ...};
uint32_t shift(uint32_t x,uint32_t shift)
{
return x * multipliers[shift];
}
,
TL; DR:实际上,如您所想,多步转换通常会由多个转换完成。但是可以使用一些技巧来避免移动太多次。例如,某些算法被设计为只需要移位1,或者如果需要更大的移位,则可以使用ISA中的一些特殊的按位指令进行优化
为嵌入式系统编程需要更深入地了解该体系结构,以实现良好的性能和RAM / ROM使用率。例如,选择变量使它们适合机器字。除非绝对必要,否则没有人会在16位或8位MCU上使用uint64_t
。多字变量的运算(包括位移)需要更多指令,因此通常不会内联。通常,对字大小倍数的移位与对数组元素进行移位相似,因此它们将非常快
按任意变量移动需要一个barrel shifter,比简单的shift register占用更多的裸片空间,因此大多数嵌入式体系结构一次只能移位一位。它们中的大多数还包括某种交换半字指令,以克服该限制并允许足够快的大距离移位。例如,诸如8051,PIC或AVR之类的8位微控制器具有交换半字节指令。参见:
MSP430是16位MCU,因此它具有一条SWPB
指令来交换 bytes ,该指令可以类似地用于快速移位8。这里是some examples generated by Clang(加上我的评论,请注意如何完成8倍移位和大于8的移位):
shift_left_15(unsigned short): ; @shift_left_15(unsigned short)
mov.b r12,r12
swpb r12 ; swap bytes then shift left 7 times
add r12,r12
add r12,r12
ret
shift_left_12(unsigned short): ; @shift_left_12(unsigned short)
mov.b r12,r12
swpb r12 ; swap bytes then shift left 4 times
add r12,r12
ret
shift_left_10(unsigned short): ; @shift_left_10(unsigned short)
mov.b r12,r12
swpb r12 ; swap bytes then shift left 2 times
add r12,r12
ret
shift_left_9(unsigned short): ; @shift_left_9(unsigned short)
mov.b r12,r12
swpb r12
add r12,r12
ret
shift_left_8(unsigned short): ; @shift_left_8(unsigned short)
mov.b r12,r12
swpb r12 ; just swap bytes
ret
shift_left_7(unsigned short): ; @shift_left_7(unsigned short)
add r12,r12
ret
shift_left_3(unsigned short): ; @shift_left_3(unsigned short)
add r12,r12
ret
您可以打开上方的Godbolt链接以获取完整的输出
如果您使用的是MSP430X,那么它可以从1 greatly simplifies the shifting procedure到4位位置
shift_left_15(unsigned short):
PUSHM.W #1,R4
MOV.W R1,R4
rpt #15 { rlax.w R12
POPM.W #1,r4
RET
shift_left_12(unsigned short):
PUSHM.W #1,R4
rpt #12 { rlax.w R12
POPM.W #1,r4
RET
shift_left_10(unsigned short):
PUSHM.W #1,R4
rpt #10 { rlax.w R12
POPM.W #1,r4
RET
shift_left_9(unsigned short):
PUSHM.W #1,R4
rpt #9 { rlax.w R12
POPM.W #1,r4
RET
shift_left_8(unsigned short):
PUSHM.W #1,R4
rpt #8 { rlax.w R12
POPM.W #1,r4
RET
shift_left_7(unsigned short):
PUSHM.W #1,R4
rpt #7 { rlax.w R12
POPM.W #1,r4
RET
shift_left_3(unsigned short):
PUSHM.W #1,R4
rpt #3 { rlax.w R12
POPM.W #1,r4
RET
可以以相同的方式进行右移,但是将add
替换为rrc/rra
,rlax
替换为rrax
。参见demo on Godbolt
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。