在我看来,学习一门中级编程语言比学习一门特定体系结构的汇编更有用,而且我很想学习ARM汇编程序只是为了好玩,由于我晓得一些386汇编语言。这个看法不是想成为大师,而是想了解下边发生了哪些。
ARM简介
下边的解释不会力求面面俱到的述说arm的体系结构,我会尽量精简讲解其中实用的部份。
ARM是一种32位体系结构,具有一个简单的目标:灵活性。虽然这对集成商特别有用(由于她们在设计硬件时有很大的自由度),但对于必须应对ARM硬件差别的系统开发人员来说却不是这么好。为此,在本文中,我将假定一切都在运行Raspbian的RaspberryPiModelB上完成。
有些部份将是ARM通用的,而有些将是RaspberryPi专用的。我不会分辨。ARM网站上有好多文档可查!
开始写汇编
汇编语言只是二补码代码之上的一个薄句型层。
二补码代码是计算机可以运行的,它由以二补码表示方式编码的指令组成(这种编码已在ARM指南中记录)。您可以编撰二补码代码编码指令,但这会很麻烦(不仅与Linux本身相关的其他一些技术,我们如今可以很高兴地忽视它们)。
因为计算机难以运行汇编程序,为此我们必须从中获取二补码代码。我们使用一种称为汇编器的工具将汇编器代码汇编成可以运行的二补码代码。
在本课程中我们使用gnuassembler,这个工具是gnuproject中的其中一个,有时又被称为gas.
只需打开vim,nano或emacs之类的编辑器即可。我们的汇编语言文件(称为源文件)将带有后缀.s。我不晓得为何是.s,但这是一般的惯例。
第一个程序
从一个简单的程序开始,这个程序只有返回值,在其中不做任何事。
/* -- first.s */ /* This is a comment */ .global main /* 'main' is our entry point and must be global */ main: /* This is main */ mov r0, #2 /* Put a 2 inside the register r0 */ bx lr /* Return from main */
创建一个文件,将上述内容保存其中,之后开始编译,命令如下:
$as-ofirst.ofirst.s
上述命令执行完后将会创建一个first.o的文件,下边我们将这个文件链接成为可执行文件
$gcc-ofirstfirst.o
假如上述步骤执行顺利,你将得到一个first的文件,这个就是你的程序,下边来执行吧。
$./first
它应当不会有任何反应,的确,有点小沮丧,而且这个程序是执行了的,让我们看一下它的返回值
$ ./first ; echo $? 2
太棒了国内linux主机,返回值2并非碰巧,这是因为汇编代码中的#2造成的。
因为运行汇编器和链接器很快会显得很无趣,因而建议您使用以下Makefile文件或类似的文件。
# Makefile all: first first: first.o gcc -o $@ $+ first.o : first.s as -o $@ lt; clean: rm -vf first *.o
OK,让我们来解释一下吧
我们作弊只是为了使事情显得容易一些。我们在汇编器中编撰了一个Cmain函数,它仅返回2;。这样,我们的程序就更容易了在树莓派linux系统下写c程序,由于C运行时为我们处理了程序的初始化和中止。我将仍然使用这些技巧。
让我们回顾一下最小汇编文件的每一行。
/* -- first.s */ /* This is a comment */
这种是评论。注释包含在/和/中。使用它们来记录您的汇编器,由于它们会被忽视。一般,不要将/和/嵌套在/*内,由于它不起作用。
.global main /* 'main' is our entry point and must be global */
这是GNU汇编程序的指令。指令告诉GNU汇编器做一些非常的事情。它们以点号(。)开头,后跟指令名称和一些参数。在这些情况下linux关机命令,我们说main是一个全局名称。这是必需的,由于C运行时将调用main。倘若不是全局的,则C运行时将难以调用它,但是链接阶段将失败。
main: /* This is main */
GNU汇编程序中不是指令的每一行都将一直像label:指令。我们可以省略label:和指令(忽视空行和空行)。仅带有标签:的行将该标签应用于下一行(您可以通过这些方法将多个标签引用相同的内容)。指令部份是ARM汇编语言本身。在这些情况下,因为没有指令,我们只是在定义main。
mov r0, #2 /* Put a 2 inside the register r0 */
在行的开头,空格被忽视,而且缩进在视觉上暗示该指令属于主要功能。
这是mov指令,表示联通。我们将值2移至寄存器r0。在下一章中,我们将了解有关寄存器的更多信息,如今不用担忧。是的,句型很难堪在树莓派linux系统下写c程序,由于目的地实际上在右边。在ARM句型中,它仍然在左边,因而我们说的是将r0寄存到立刻数2之类的操作。在下一章中,我们将了解ARM中立即数的含意,不用担忧。
总而言之,该指令将2装入寄存器r0中(这实际上会覆盖此时的r0寄存器)。
bx lr /* Return from main */
该指令bx表示分支和交换。在这一点上,我们实际上并不关心交换部份。分支意味着我们将改变指令执行的流程。ARM处理器一个接一个地依次运行指令,因而在上述动作以后,该bx将被运行(此次序执行并非特定于ARM,而是在几乎所有构架中就会发生)。分支指令用于修改此隐式次序执行。在这些情况下,我们跳转到lr寄存器说的内容。我们如今不在意lr包含哪些。足以理解该指令只是离开了主要功能,进而有效地结束了我们的程序。
main的结果是程序的错误代码,但是在离开函数时必须将结果储存在寄存器r0中,因而我们main执行的mov指令实际中将错误代码设置为2。