指令格式之操作码地址码

在这里插入图片描述

一、指令格式

           操作码字段        地址码字段

操作码字段:表征指令的操作特性与功能 (指令的唯一标识) 不同的指令操作码不能相同
地址码字段:指定参与操作的操作数的地址码

二、操作码分类

操作码可以分为固定长度的代码和可变长度的代码

1、固定长度的代码

所有指令操作码的长度相等
例如:某计算机共有64条指令,采用固定长度操作码,需要6位编码,从000000~111111 2的6次方为64
优点:编码方法简单,便于指令的译码
缺点:不方便指令系统中增加新的指令(扩展不方便)

2、可变长度的代码

不等长的指令操作码可以减小操作码的平均长度,提高指令编码的效率,从指令的扩展性来看,也希望操作码长度可变。
这是操作码不固定的指令格式,四位是基本的操作码,还可以扩充,但是指令的字数不变,就是说把不用的地址码部分可以做操作码用。
例如:假设某机器的指令长度为16位,包括4位基本操作码和三个4位地址码段。
①表示三地址指令:因有4位操作码则能表示16条;②表示二地址指令:因有8位操作码则可表示256条;③表示一地址指令:因有12位操作码则可表示4096条
如果需要三地址、二地址、一地址指令各15条、零地址指令16条,则一样能够采用可变格式操作码实现。例如可以这样规定:
15条三地址指令的操作码为:0000 ~ 1110 (操作码4位可表示16条指令,由于只有15条,所以还剩余一种状态1111,可以做二地址指令的标记)
15条二地址指令的操作码为:前4位1111, 即 1111 0000 ~ 1111 1110
15条一地址指令的操作码为:前8位均为1, 即 11111111 0000 ~11111111 1110
16条零地址指令的操作码为:前12位均为1, 即 1111111111110000~1111111111111111

我当时看的时候也想问为什么 不过最后我知道了不是一定要 多少条的,是为了方便 才 15条的。(操作码4位可表示16条指令,由于只有15条,所以还剩余一种状态1111,可以做二地址指令的标记)

例如:设某台计算机有100条指令,要求:

  1. 采用固定长度操作码编码,请设计其操作码编码
  2. 假设这100条指令中有10条指令的使用改了达到90%。其余90条指令的使用概率达到10%.

请采用不定长编码设计一种操作码编码的方案,并求出操作码的平均长度(常用指令用短编码 不常用指令用长编码)

答、1)采用固定长度操作码编码,需要7位操作码,取其中100个代码作为操作码 0000000~1100011之间的代码代表100条指令(长度为7)
其余的1100100~1111111共28个代码可用于增加新的操作码

2)采用不固定长度的操作码编码,可以用4位代码对10条指令进行编码,用8位代码对90条指令进行编码。0000~1001对应10条常用的指令,从未使用的1010~1111的代码后面扩展4位

10100000~10101111     1610110000~10111111     1611000000~11001111     1611010000~11011111     1611100000~11101111     1611110000~11111001     10

已上的1010 ,0000~1111,1001之间的90个代码表示其余90条指令
指令操作码的平均长度为:

4*90%+8*10%=4.4  小于等长编码的7

剩余的编码11111010~1111111(6个)可用于操作码长度的进一步的扩展
在这里插入图片描述

三、地址码

指令中指定操作数存储位置的字段称为地址码,地址码中可以包含存储器地址。也可包含寄存器编号。

指令中可以有一个、两个或者三个操作数,也可没有操作数,根据一条指令有几个操作数地址,可将指令分为零地址指令。一地址指令、二地址指令、三地址指令。4个地址码的指令很少被使用。

操作码字段	  地址码
操作码	  A1	A2	A3	  三指令地址
操作码	  A1	A2	      二指令地址
操作码	  A1	          一指令地址
操作码	 	              零指令地址

零地址指令:只有操作码,没有地址码(空操作 停止等)

一地址指令:指令编码中只有一个地址码,指出了参加操作的一个操作数的存储位置,如果还有另一个操作数则隐含在累加器中

eg: INC AL 
    INC [S1]

二地址指令:指令编码中有两个地址,分别指出了参加操作的两个操作数的存储位置,结果存储在其中一个地址中

(op a1,a2:a1 op a2 a1)
eg:  MOV  AL,BL
     ADD  AL,30

三地址指令:指令编码中有3个地址码,指出了参加操作的两个操作数的存储位置和一个结果的地址

(op a1,a2,a3: a1 op a2  a3)

二地址指令格式中,从操作数的物理位置来说有可归为三种类型

  • 寄存器-寄存器(RR)型指令:需要多个通用寄存器或个别专用寄存器,从寄存器中取操作数,把操作结果放入另一个寄存器,机器执行寄存器-寄存器型的指令非常快,不需要访存。

  • 寄存器-存储器(RS)型指令:执行此类指令时,既要访问内存单元,又要访问寄存器。

  • 存储器-存储器(SS)型指令:操作时都是涉及内存单元,参与操作的数都是放在内存里,从内存某单元中取操作数,操作结果存放至内存另一单元中,因此机器执行指令需要多次访问内存。

四、指令字

指令字长度:一个指令字中包含二进制代码的位数,其长度应该与计算机的数据字长相匹配,以简化指令访存的操作,一般指令字长为计算机字长的整数倍。

机器字长:计算机能直接处理的二进制数据的位数,他决定了计算机的运算精度。指令字长等于机器字长称为单字长指令。

指令字长等于两个机器字长指令称为双字长指令,三字长以上指令较少使用。

使用多字长指令,目的在于提供足够的地址位来解决访问内存任何单元的寻址问题。

缺点:是必须两次或多次访问内存以取出一整条指令,降低了CPU的运算速度,又占用了更多的存储空间。

五、操作码的设计

操作码的设计应当与地址码的设计相匹配,以形成高效合理的指令编码。

如指令长度固定的情况下,地址码数量较多的指令可以安排较短的操作码,地址码数量较少的指令中可以安排较长的操作码。

、某计算机要求如下形式的指令:三地址指令4条,单地址指令254条,0地址指令16条,设指令字长12位每个地址码3位,设计其编码。

答:

3地址指令   3位操作码   9位地址码 
1地址指令   9位操作码   3位地址码 
0地址指令   12位操作码

先设计3地址操作码用000~011这4个编码作为3地址指令操作码
单地址指令地址码是3位,操作码最多可以9位,前3位用了4个还剩4个,一地址指令中操作码可扩展9位 2的6次方64个。
100 xxx xxx 1地址的64条 (100 000 000~100 111 111)
101 xxx xxx 1地址的64条(101 000 000~101 111 111)
110 xxx xxx 1地址的64条 (110 000 000~110 111 111)
111 xxx xxx 1地址的62条 (111 000 000~111 111 111)

剩余为111111110 0地址的8个
111111111 0地址的8个

:计算机指令长度为20位,有2地址指令,1地址指令,0地址指令。地址码长度为6位,问若操作码字段固定长度为8位,先设计出m条2地址指令,n条0地址指令,此时改计算机最多可以有多少条1地址指令。

答:

       操作码(20-12=8位)  地址码 8位    地址码8位

因为操作码字段固定长度为8位,1地址指令为m条,0地址指令为n条,最多可以设计出1地址指令为2的8次方-m-n

:某16位计算机指令格式如下所示,其中OP为操作码,试分析指令格式的特点

15 14 13 12 11 10 987 6 5 43 2 1 0
OP-源寄存器目标寄存器

答:单字长二地址指令

  操作码字段op可以指定128条指令(2的7次方)

  源寄存器和目标寄存器都是通用寄存区(可分别指定16个通用寄存器)所以是RR型指令,两个操作数均在寄存器中

例:16位机指令格式如下。op为操作码字段,试分析指令格式特点

15 14 13 12 11 10987 6 5 43 2 1 0
OP--源寄存器变址寄存器
位移量(16位)

答:双字长(指令32位 机器16位)二地址指令,用于访问存储器。操作码字段op为6位,可以指定64种操作。一个操作数在源寄存区(16个),另一个操作数在存储器中(由变址寄存器和位移量决定)所以是RS行指令。

注意:

设计扩展操作码指令格式时,必须注意:

  1. 不允许短码是长码的前缀(短操作码不能与长操作码前面部分的代码相同)
  2. 各指令的操作码一定不能重复

频率较高的指令,分配较短的操作码,减少指令译码和分析的时间。
PC存放当前执行指令的地址。
指令的地址码字段则保存操作数地址。
运算型指令寻址的是操作数。
转移性指令寻址的是下次欲执行指令的地址。
程序控制类指令:
无条件转移、有条件转移、子程序调用、返回、循环指令。
中断隐指令由硬件实现,不属于指令系统中的指令。
零地址的运算类指令又称堆栈运算指令,参与的两个操作数来自栈顶和次栈顶单元。
为了便于取指,指令的长度通常为存储字长的整数倍。
单字长指令是指令长度等于机器字长的指令。
单字长指令可加快取指令的速度。

单地址指令可能有一个操作数,也可能有两个操作数(其中一个存于ACC)

问:一个计算机系统采用32位单字长指令,地址码为12位,如果定义了250条二地址指令,那么还可以有( )条单地址指令
答:地址码为12位,则二地址指令的操作码长度为32-12-12=8位,已定义了250条二地址指令,28-250=6,则可以设计出单地址指令6X212=24K条。

问:某计算机按字节编址,指令字长固定且只有两种指令格式,其中三地址指令29条,二地址指令107条,每个地址字段为6位,则指令字长至少是?
答:三地址指令有29条,所以它的操作码至少为5位。以5位进行计算,它剩余32-29=3种操作码给二地址。给而二地址另外多了6位给操作码。因此它数量最大达3*64=192.所以指令字长最少为23位,因为计算机按字节编址,需要是8的倍数,所以指令字长至少应该是24位。

概念术语

指令(Instruction):
是计算机硬件能够识别并直接执行的操作命令。用二进制序列表示,由操作码和地址码两部分组成。
指令系统(Instruction Set):
是计算机中所有指令的集合。
操作码(Operate Code):
指令中用于指出操作性质的字段。一般分为定长操作码和扩展操作码。定长操作码是指机器中所有指令的操作码字段位数相同。扩展操作码是指机器中指令的操作码字段位数不是都相同,也称为不定长操作码。
地址码(Address Code):
指令中用于指出操作数地址的字段。一条指令中一般有多个地址码字段。地址码字段的个数与许多因素有关。一个地址码字段可能是一个立即数;可能是一个直接内存地址;可能是一个间接地址;可能是寄存器编号;可能是I/O端口号;可能是一个形式地址等等。
定长指令(Fixed Length Instruction):
指令系统中所有指令具有相同的长度,称为规整型指令,目前定长指令字大多是32位指令字。
变长指令(Variable Length Instruction):
指令系统中的指令具有不同的长度,有长有短,但每条指令的长度一般都是8的倍数。
程序计数器(Program Counter,PC):
是一个特殊的地址寄存器,专门用来存放下一条要执行指令的地址,称为程序计数器PC或指令指针IP。本身它是个寄存器,所以也称为指令指针寄存器。
指令指针(Instruction Pointer):
是一个特殊的地址寄存器,专门用来存放下一条要执行指令的地址,称为程序计数器PC或指令指针IP。本身它是个寄存器,所以也称为指令指针寄存器。
程序状态字(Program Status Word, PSW):
表示程序运行状态的一个二进制位序列。一般包含一些反映指令执行结果的标志信息(如:进位标志、溢出标志、符号标志等)和设定的一些状态信息(如:中断允许/禁止状态、管理程序/用户程序状态等)。
程序状态字寄存器(Program Status Word Register, PSWR):
用来存放程序状态字的寄存器。
标志寄存器(Flags Register):
80x86体系结构中用来表示程序状态和标志的寄存器。
堆栈(Stack):
堆栈是一块特殊的存储区。采用“先进后出”的方式进行访问。主要用来在程序切换时保存各种信息。栈底固定不动,栈顶浮动,用一个专门的寄存器(SP)来作为栈顶指针。从堆栈生长的方向来分,有“自顶向下”和“自底向上”两种堆栈。从堆栈的位置来分,有硬堆栈和软堆栈。硬堆栈的堆栈区由寄存器实现,软堆栈的堆栈区由内存区实现。
堆栈指针(Stack Pointer, SP):
是一个特殊的地址寄存器,用来存放堆栈的栈顶指针。如果是硬堆栈的话,栈顶指针是栈顶寄存器的编号;如果是软堆栈的话,栈顶指针是栈顶内存单元的地址。
最高有效字节(Most Significant Byte,MSB):
数据最左边的一个字节,即最高位字节。
最高有效位(Most Significant Bit,MSB):
数据最左边的一位,即最高一位。
最低有效字节(Least Significant Byte, LSB):
数据最右边的一个字节,即最低位字节。
最低有效位(Least Significant Bit, LSB):
数据最右边的一位,即最低一位。
大端次序(Big Endian Ordering):
操作数在内存存放时,指令给出地址所指定的内存单元中存放的是操作数最高有效字节(MSB)。例如,假设一个32位数据“12345678H”的地址为100#,则大端存放次序为:100#:12H,101#:34H,102#:56H,103#:78H。IBM S/370,Motorola 680x0等是大端序机器。
小端次序(Little Endian Ordering):
操作数在内存存放时,指令给出地址所指定的内存单元内存放的是操作数最低有效字节(LSB)。例如,假设一个32位数据“12345678H”的地址为100#,则小端存放次序为:100#:78H,101#:56H,102#:34H,103#:12H。Intel 80x86等是小端序机器。
双目运算(two-operand operate):
需要两个操作数才能进行的运算。如:加、减、乘、除、与、或等算术或逻辑运算都是双目运算。
单目运算(one-operand operate):
只需要一个操作数就能进行的运算。如:取负、取反等算术或逻辑运算都是单目运算。
寻址方式(Addressing Mode):
在程序执行过程中,需要取指令和操作数,确定指令和操作数的存放位置的方式称为寻址方式。确定指令存放位置的过程称为指令寻址,确定操作数存放位置的过程称为数据寻址。
有效地址(Effective Address):
操作数所在实际位置的地址。若操作数在寄存器中,则有效地址是寄存器的编号;若操作数在内存单元中,则有效地址是内存单元的地址;若操作数在I/O端口中,则有效地址是I/O端口的编号。
相对转移(Relative jump):
转移目标地址通过PC的值加上一个偏移量形成。所以,转移到的目的地和当前指令的位置有关。
绝对转移(Absolute jump):
转移目标地址由指令指定的一个绝对地址确定,而与当前指令的位置没有关系。
条件转移(Conditional jump, Branch):
是一种分支指令,根据前面指令或本条指令执行的结果确定是跳转到转移目标地址处执行,还是顺序执行。
无条件转移(Unconditional jump):
是一种直接跳转指令,执行完本条指令后,无条件地跳转到目标转移地址处执行。
CISC(Complex Instruction Set Computer):
复杂指令系统计算机。早期的计算机为了增加功能和更好地支持高级语言而不断地增加新的指令类型,使系统可以实现复杂的操作。这种指令系统功能复杂,寻址方式多,指令长度可变,指令格式多样。因而采用这种指令系统的计算机被称为复杂指令系统计算机。
RISC(Reduced Instruction Set Computer):
精简指令系统计算机。这种计算机采用简化的指令系统,指令集中只包含程序中常用的指令,运算类指令只能是R-R型,提供大量通用寄存器以减少访存次数,采用流水线方式执行指令,控制器用硬连阵列逻辑实现,并采用优化的编译技术。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐