RISC-V 指令-526互联

参考
- 《计算机组成与设计第五版》
- 《RISC-V-Reader-Chinese-v2p1》（包云岗老师）
- 《手把手教你设计CPU RISC-V处理器》
- https://blog.csdn.net/qq_38915354/article/details/115696721
- https://zhuanlan.zhihu.com/p/374235855

1. 寄存器相关

RISC-V 架构可选32bit（RV32）/64bit(RV64)，可选32个寄存器（I架构）/16个寄存器（E架构）。
- 考虑整数通用寄存器组：其中0寄存器被预留为常数0，其余31/15个寄存器为通用整数寄存器。
- 考虑浮点寄存器组（一般为F/D类扩展指令集），有32个通用浮点寄存器；寄存器位宽由扩展指令集类型决定，F类：单精度、32bit，D类：双精度、64bit。
RISC-V 的汇编语言是对寄存器的数据进行处理。
- 算术运算（加、减、立即数加）。
- 数据传输（取：从存储器取数据到寄存器；存：从寄存器读数据存到存储器，更多关于存储器访问指令下面有介绍）。
- 逻辑运算（与，或，异或...）。
- 移位操作（逻辑左/右移，算数左/右移）。
- 条件分支（相等、不等、大于、小于跳转）。
- 无条件跳转（跳转 - 链接）。
存储器访问指令
- 对于更复杂的数据结构（例如数组和结构体）包含比寄存器更多的数据元素，只能存放于存储器中，使用数据传输指令进行读取。
- 与RISC架构策略一致，只有Load和Store指令可以访问存储器，其它指令都不可访问存储器。
- 存储器读写指令基本单位是字节（Byte）。
- RISC-V架构存储模式只支持小端格式。
- RISC-V推荐使用地址对齐的存储器读写操作，但也支持地址非对齐。
- RISC-V架构的存储器读写指令不支持地址自增/自减的模式。

2. RV32I 指令格式

下图介绍了六种基本指令格式

R-type
- 实现rs1，rs2两个寄存器的值运算，并将运算后的结果存在rd中。opcode 和 func 共同决定实现哪种运算。
I-type
- 可以实现带一个常数的算数指令以及Load指令。注意immediate字段为补码值。
- 对于Load指令：可以取相对于rd中的基地址+imm字节的数据。
  - 例如下面的指令，从x22寄存器中获取基地址，并加上偏移地址（64/8bit = 8Byte），取出字，放到x9寄存器中。
    - 其中(x)22放在rs1寄存器中，(x)9放在rd字段，64放在imm字段。
```
lw x9, 64(x22)
```
- 考虑到逻辑操作中的移位，使用的也是I型指令格式，考虑到寄存器位宽为32bit，所以shamt也不会超过32，所以imm只需要划出5bit空间，其余几bit作为额外的操作码字段。
S-type
- 用于Store指令，immediate字段仍为补码值。
- 存在两个源寄存器，一个存放基址，一个存放数据。
- 设计选择与R-type保持类似的指令格式，将imm进行拆分，可以一定程度降低硬件的复杂性。
  - 例如下面的指令，x9中写着要存入的值，x10中写着存储器基地址，并加上偏移地址（240/8bit = 30Byte）。
    - 其中(x)9放在rs2字段中，(x)10放在rs1字段中，240放在imm字段中（要被拆分）。
```
sw x9, 240(x10)
```
U-type
- I、S型指令格式中已经有12bit imm，但是需要考虑有时常数很大，12bit不够，此时可以使用LUI指令。
  - 将高20bit常数加载到寄存器的第31-12bit，低12bit用常数0填充。之后可以使用 addi 指令与低12bit立即数相加，以实现对32bit寄存器数值的配置。
  - 上面介绍的ADDI和LUI指令结和还需注意一个问题，即如果ADDI的立即数将本来一个数据为设置为一个符号位，可能会造成一个数据缺口，需要进行补值。相关处理可以看这篇文章。
B-type
- 比较两个源寄存器rs1和rs2，并进行跳转。
- 例子如下：
  - 指令格式上可以看到imm[0]被舍弃掉了，因为该bit被设置为0；汇编器根据label的地址计算出相对的偏移量为16bytes = 'b1_0000，映射如下图。
```
beq x19, x10, label
```
- 看到这里，其实就会有一个疑问，为什么B型和J型立即数在inst中分散的奇奇怪怪，但是寄存器却是固定位置的，知乎上搜到了这个问题的一些回答。我认为其中有一个解释的很有道理，为了平衡（寄存器索引到读出寄存器值的时间）和（通过inst生成参与操作的立即数选择逻辑的时间），提高整体的运算速度。
J-type
- 主要用在无条件跳转指令jal和jalr上。
```
jal rd, label
jalr rd, rsl, imm
```
- jal
  - 主要实现两步：
    - J-type和前面介绍的B-type一样，舍弃掉imm[0]，强制设置该bit为0；将imm偏移量加到该指令的PC值，得到最终跳转目标地址。RV32I的J指令格式中imm有21bit，但是imm[0]被舍弃掉了，因此可以跳转±2^(21-1) = ±1MB，其中21-1是因为有1bit的符号位。
    - 并且将下一条指令的PC（当前指令PC值+4）写入寄存器rd中。+4是因为对于RV32I来说，其指令长度为4个字节，且使用字节寻址。将下一条地址写入寄存器中，是为返回做准备。
- jalr
  - ！！注意，jalr不是J型指令格式而是I型指令格式。
  - imm的12bit立即数为偏移量，基地址保存在rs1中，两者相加为最终跳转的目标地址。只能跳转±2KB（2^11=2KB，去掉符号位）。
  - jalr也需要将下一条指令的PC值写入rd寄存器中。