探索Lua5.2内部实现:虚拟机指令(2) MOVE & LOAD

原文链接
| name | args | desc |
| OP_MOVE | A B | R(A) := R(B) |
OP_MOVE用来将寄存器B中的值拷贝到寄存器A中。由于Lua是register based vm,大部分的指令都是直接对寄存器进行操作,而不需要对数据进行压栈和弹栈,所以需要OP_MOVE指令的地方并不多。最直接的使用之处就是将一个local变量复制给另一个local变量时:

1
2
local a;
local b = a;

1
2
3
1	[1]	LOADNIL  	0 0
2 [2] MOVE 1 0
3 [2] RETURN 0 1

在编译过程中,Lua会将每个local变量都分配到一个指定的寄存器中。在运行期,lua使用local变量所对应的寄存器id来操作local变量,而local变量的名字除了提供debug信息外,没有其他作用。

在这里a被分配给register 0,b被分配给register 1。第二行的MOVE表示将a(register 0)的值赋给b(register 1)。其他使用的地方基本都是对寄存器的位置有特殊要求的地方,比如函数参数的传递等等。

name args desc
OP_LOADK A Bx R(A) := Kst(Bx)
LOADK将Bx表示的常量表中的常量值装载到寄存器A中。很多其他指令,比如数学操作指令,其本身可以直接从常量表中索引操作数,所以可以不依赖于LOADK指令。

1
2
local a=1;
local b="foo";

1
2
3
4
5
6
	1	[1]	LOADK    	0 -1	; 1
2 [2] LOADK 1 -2 ; "foo"
3 [2] RETURN 0 1
constants (2) for 0x80048eb0:
1 1
2 "foo"

name args desc
OP_LOADKX A R(A) := Kst(extra arg)
LOADKX是lua5.2新加入的指令。当需要生成LOADK指令时,如果需要索引的常量id超出了Bx所能表示的有效范围,那么就生成一个LOADKX指令,取代LOADK指令,并且接下来立即生成一个EXTRAARG指令,并用其Ax来存放这个id。5.2的这个改动使得一个函数可以处理超过262143个常量。

name args desc
OP_LOADBOOL A B C R(A) := (Bool)B; if (C) pc++
LOADBOOL将B所表示的boolean值装载到寄存器A中。B使用0和1分别代表false和true。C也表示一个boolean值,如果C为1,就跳过下一个指令。

1
2
3
local a = true;
1 [1] LOADBOOL 0 1 0
2 [1] RETURN 0 1

C在这里的作用比较特殊。要了解C的具体用处,首先要知道lua中对于逻辑和关系表达式是如何处理的,比如:

1
local a = 1 < 2

对于上面的代码,一般我们会认为lua应该先对1<2求出一个boolean值,然后放入到a中。然而实际上产生出来的代码为:

1
2
3
4
5
6
7
8
	1	[1]	LT       	1 -1 -2	; 1 2
2 [1] JMP 0 1 ; to 4
3 [1] LOADBOOL 0 0 1
4 [1] LOADBOOL 0 1 0
5 [1] RETURN 0 1
constants (2) for 0x80048eb0:
1 1
2 2

可以看到,lua生成了LT和JMP指令,另外再加上两个LOADBOOL对于a赋予不同的boolean值。LT(后面会详细讲解)指令本身并不产生一个boolean结果值,而是配合后面紧跟的JMP实现true和false的不同跳转。如果LT评估为true,就继续执行,也就是执行到JMP,然后调转到4,对a赋予true;否则就跳过下一条指令到达第三行,对a赋予false,并且跳过下一个指令。所以上面的代码实际的意思被转化为:

1
2
3
4
5
6
local a;
if 1 < 2 then
a = true;
else
a = false;
end

逻辑或者关系表达式之所以被设计成这个样子,主要是为if语句和循环语句所做的优化。不用将整个表达式估值成一个boolean值后再决定跳转路径,而是评估过程中就可以直接跳转,节省了很多指令。
C的作用就是配合这种使用逻辑或关系表达式进行赋值的操作,他节省了后面必须跟的一个JMP指令。

name args desc
OP_LOADNIL A B R(A), R(A+1), …, R(A+B) := nil
LOADNIL将使用A到B所表示范围的寄存器赋值成nil。用范围表示寄存器主要为了对以下情况进行优化:

local a,b,c;
1 [1] LOADNIL 0 2
2 [1] RETURN 0 1
对于连续的local变量声明,使用一条LOADNIL指令就可以完成,而不需要分别进行赋值。

对于一下情况

1
2
3
4
5
6
local a;
local b = 0;
local c;
1 [1] LOADNIL 0 0
2 [2] LOADK 1 -1 ; 0
3 [3] LOADNIL 2 0

在Lua5.2中,a和c不能被合并成一个LOADNIL指令。所以以上写法理论上会生成更多的指令,应该予以避免,而改写成

1
2
local a,c;
local b = 0;

-------------本文结束 感谢阅读-------------