ARM位置无关代码设计规范

/*******************************************/
参考:ARM的位置无关程序设计在bootloader中的应用.黄振华
/*******************************************/
位置无关代码(PIC)在嵌入式系统设计中具有很重要的作用,尤其是在裸机状态下bootloader程序以及进行内核初始化设计;利用PIC也可以构建高效的动态链接库。

概念

在设计bootloader的时候,必须在裸机状态下运行,这时bootloader映像文件的运行地址必须由程序员指定。通常情况下,将bootloader程序下载到ROM的0x0地址进行启动(比如固化到NorFlash中)。然而在很多的设计中,比如将bootloader固化在NAND中,在系统复位后S3C2440A中NAND控制器自动读取NAND中存储的前4K的代码到s3c2440a中称之为steppingstone的RAM中,steppingstone中的代码用进行一些非核心的硬件初始化,再将NAND中剩下的bootloader代码拷贝到RAM中运行。一般境况下两者的地址并不相同,程序在SDRAM中的地址重定位过程必须由程序员来完成。这样就有了位置无关代码的概念,指代码不在连接时制定的运行地址空间,也可以执行,它一段加载到任意地址空间都能执行的特殊代码。这样在steppingstone设计的代码要用位置无关设计。

位置无关代码可以用于以下场合:

  1. 程序在运行期间动态加载到内存;
  2. 程序在不同场合与不同程序组合后加载到内存(共享的动态链接库);
  3. 在运行期间不同地址相互之间的映射(如bootloader)

ARM位置无关程序设计要点

ARM程序的位置无关可执行文件PIE(position independent executable)包括位置无关代码PIC(position independent code)和位置无关数据PID(position independent data)两部分。

PID 主要针对可读写数据段(.data 段),其中保存已赋初值的全局变量。为实现其位置无关性,通常使用寄存器R9作为静态基址寄存器,使其指向该可读写段的首地址,并使用相对于基址寄存器的偏移量来对该段的变量进行寻址。这种方法常用于为可重入程序的多个实例产生多个独立的数据段。在程序设计中,一般不必考虑可读写段的位置无关性,这主要是因为可读写数据主要分配在SDRAM 中。

PIC包括程序中的代码和只读数据(.text段),为了保证程序能在ROM和SDRAM空间中能真确的运行,必须采用位置无关代码程序设计。PIC 遵循只读段位置无关ROPI(Read-Only PositionIndependence)的ATPCS(ARM2Thumb Procedure Call Standard)的程序设计规范:

  1. 程序设计规范

引用同一ROPI 段或相对位置固定的另一ROPI 段中的符号时,必须是基于PC 的符号引用,即使用相对于当前PC 的偏移量来实现跳转或进行常量访问。

  • 位置无关的程序跳转。

在ARM 汇编程序中,使用相对跳转指令B/BL 实现程序跳转。指令中所跳转的目标地址用基于当前PC 的偏移量来表示,与链接时分配给地址标号的绝对地址值无关,因而代码可以在任何位置进行跳转,实现位置无关性。

另外,还可使用ADR 或ADRL 伪指令将地址标号值读取到PC 中实现程序跳转。这是因为ADR或ADRL等伪指令会被编译器替换为对基于PC 的地址值进行操作,但这种方式所能读取的地址范围较小,并且会因地址值是否为字对齐而异。

但在ARM 程序中,使用LDR 等指令直接将地址标号值读取到PC 中实现程序跳转不是位置无关的。

例如:

LDR   PC,= main
上面的LDR 汇编伪指令编译后的结果为:
LDR   PC,[ PC,OFFSET_ TO_L POOL ]
...
LPOOL  DCD main

可见,虽然LDR 是把基于PC 的一个存储单元LPOOL 的内容加载到PC 中,但该存储单元中保存的却是链接时所决定的main 函数入口的绝对地址,所以main函数实际所在的段不是位置无关。

  • 位置无关常量访问

在应用程序中,经常要读写相关寄存器以完成必要的硬件初始化。为增强程序的可读性,利用EQU 伪指令对一些常量进行赋值,但在访问过程中,必须实现位置无关性。下面以 U-boot的
SDRAM初始化介绍位置无关的常量访问方法。

#define BWSCON0x48000000

/* BWSCON */
#define DW8 (0x0)
#define DW16 (0x1)
#define DW32 (0x2)

...
_TEXT_BASE:
.wordTEXT_BASE

.globl lowlevel_init
lowlevel_init:
/* memory control configuration */
/* make r0 relative the current location so that it */
/* reads SMRDATA out of FLASH rather than memory ! */
ldr r0,=SMRDATA
ldrr1,_TEXT_BASE
subr0,r0,r1
ldrr1,=BWSCON/* Bus Width Status Controller */
add r2,#13*4
0:
ldr r3,[r0],#4
str r3,[r1],#4
cmp r2,r0
bne 0b

/* everything is fine now */
movpc,lr

.ltorg
/* the literal pools origin */

...

.word ((REFEN<<23)+(TREFMD<<22)+(Trp<<20)+(Trc<<18)+(Tchr<<16)+REFCNT)
.word 0x32
.word 0x30
.word 0x30

汇编反汇编后
lowlevel_init.o: file format elf32-littlearm

Disassembly of section .text:

00000000 <_TEXT_BASE>:
0:00000000 andeqr0,r0

00000004 <lowlevel_init>:
4:e59f0020 ldrr0,[pc,#32]; 2c <.text+0x2c>
8:e51f1010 ldrr1,#-16]; 0 <_TEXT_BASE>
c:e0400001 subr0,r1

由此可以得出如下结论:

使用LDR 伪指令将一个常量读取到非PC 的其他通用寄存器中可实现位置无关的常量访问;但将一个地址值读取到PC 中进行程序跳转时,跳转目标则是位置相关的。

其他被ROPI 段中的代码引用的必须是绝对地址,或者是基于可读写位置无关( RWPI) 段的静态基址寄存器的可写数据。使用绝对地址只能引用被重定位到特定位置的代码段中的符号,通过在位置无关代码中引入绝对地址,可以让程序跳转到指定位置。例如,假设Bootloader 的阶段1将其自身代码拷贝到链接时所指定的SDRAM 地址空间后,当要跳转到阶段2 的C 程序入口时,可以使用指令“LDR PC,= main”跳转到程序在SDRAM 中的main 函数入口地址开始执行。这是因为程序在编译链接时给main 函数分派绝对地址,系统通过将main 函数的绝对地址直接赋给PC 实现程序跳转。如果使用相对跳转指令“B  main”,那么只会跳转到启动ROM 内部的main 函数入口。

bootloadr、内核等程序刚开始执行的时候,他们所处的地址通常不等于运行地址。在程序的开头,先使用b、bl、mov等“位置无关”的指令将代码从flash等设备中复制到内存的“运行地址”处,然后再跳到“运行地址”去执行。

U-Boot位置无关分析举例来自100ask,我做了以下修改

-T board/smdk2410/U-Boot.lds-Ttext0x33f80000
...
SECTIONS
{
.=0x00000000;
...
}

来自cpu/arm920t/start.S
relocate:
adr r0,_start
ldr r1,_TEXT_BASE
cmpr0,r1
beq stack_setup

当映像文件在nor flash中时,adr r0,_start 就想当于 sub r0,pc,#offset, 假设_start在映像文件的0位置出, nor flash地址从0开始,那么这时r0中的值就是0。

当映像文件被加载到RAM后,adr r0,_start 还是相当于 sub r0,#offset,但这里的pc值已经是基于RAM加载地址的了。所以结果r0中的值就是0x33f80000, 等于_TEXT_BASE。 判断这两个值是否相等,就可以确定映像是否已经加载到内存中了。

上面的代码的修改如下也行!

T board/smdk2410/U-Boot.lds
...
SECTIONS
{
.=0x33f80000;
...
}

u-boot的连接地址是0x33f80000,意味着它“最后”将被复制到0x33f80000的内存中。
但是“刚开始时”肯定不在内存中,而是在NOR FLASH中──而NOR FLASH的起始地址是0。
为什么本应该在0x33f80000运行的指令,在0地址也可以运行?

答:u-boot中第一个执行的文件是start.S,它都是使用b、bl等等指令写成的,它们是“位置无关的”,就是说它们可以在任何位置运行,而不是非要在“0x33f80000那段地址”运行。

start.S完成什么功能呢?初始化、复制代码到SDRAM,然后跳到SDRAM去运行。

上面的NorFlash你可以理解成S3C2440A中的steppingstone

文件: ARM的位置无关程序设计在Bootloader中的应用.pdf
大小: 502KB
下载: 下载
文件: 基于“Steppingstone”的Bootloader的设计与优化.pdf
大小: 187KB
下载: 下载

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


什么是设计模式一套被反复使用、多数人知晓的、经过分类编目的、代码 设计经验 的总结;使用设计模式是为了 可重用 代码、让代码 更容易 被他人理解、保证代码 可靠性;设计模式使代码编制  真正工程化;设计模式使软件工程的 基石脉络, 如同大厦的结构一样;并不直接用来完成代码的编写,而是 描述 在各种不同情况下,要怎么解决问题的一种方案;能使不稳定依赖于相对稳定、具体依赖于相对抽象,避免引
单一职责原则定义(Single Responsibility Principle,SRP)一个对象应该只包含 单一的职责,并且该职责被完整地封装在一个类中。Every  Object should have  a single responsibility, and that responsibility should be entirely encapsulated by t
动态代理和CGLib代理分不清吗,看看这篇文章,写的非常好,强烈推荐。原文截图*************************************************************************************************************************原文文本************
适配器模式将一个类的接口转换成客户期望的另一个接口,使得原本接口不兼容的类可以相互合作。
策略模式定义了一系列算法族,并封装在类中,它们之间可以互相替换,此模式让算法的变化独立于使用算法的客户。
设计模式讲的是如何编写可扩展、可维护、可读的高质量代码,它是针对软件开发中经常遇到的一些设计问题,总结出来的一套通用的解决方案。
模板方法模式在一个方法中定义一个算法的骨架,而将一些步骤延迟到子类中,使得子类可以在不改变算法结构的情况下,重新定义算法中的某些步骤。
迭代器模式提供了一种方法,用于遍历集合对象中的元素,而又不暴露其内部的细节。
外观模式又叫门面模式,它提供了一个统一的(高层)接口,用来访问子系统中的一群接口,使得子系统更容易使用。
单例模式(Singleton Design Pattern)保证一个类只能有一个实例,并提供一个全局访问点。
组合模式可以将对象组合成树形结构来表示“整体-部分”的层次结构,使得客户可以用一致的方式处理个别对象和对象组合。
装饰者模式能够更灵活的,动态的给对象添加其它功能,而不需要修改任何现有的底层代码。
观察者模式(Observer Design Pattern)定义了对象之间的一对多依赖,当对象状态改变的时候,所有依赖者都会自动收到通知。
代理模式为对象提供一个代理,来控制对该对象的访问。代理模式在不改变原始类代码的情况下,通过引入代理类来给原始类附加功能。
工厂模式(Factory Design Pattern)可细分为三种,分别是简单工厂,工厂方法和抽象工厂,它们都是为了更好的创建对象。
状态模式允许对象在内部状态改变时,改变它的行为,对象看起来好像改变了它的类。
命令模式将请求封装为对象,能够支持请求的排队执行、记录日志、撤销等功能。
备忘录模式(Memento Pattern)保存一个对象的某个状态,以便在适当的时候恢复对象。备忘录模式属于行为型模式。 基本介绍 **意图:**在不破坏封装性的前提下,捕获一个对象的内部状态,并在该
顾名思义,责任链模式(Chain of Responsibility Pattern)为请求创建了一个接收者对象的链。这种模式给予请求的类型,对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为
享元模式(Flyweight Pattern)(轻量级)(共享元素)主要用于减少创建对象的数量,以减少内存占用和提高性能。这种类型的设计模式属于结构型模式,它提供了减少对象数量从而改善应用所需的对象结