Linux笔记:11-开机流程、模块管理与 Loader

发布时间 2023-05-29 00:10:56作者: CD、小月

@

开机流程、模块管理与 Loader

Linux 的开机流程分析

开机流程一览

假设以个人计算机架设的 Linux 主机为例 ,当你按下电源按键后计算机硬件会主动的读取 BIOS 或 UEFI BIOS 来加载硬件信息及进行硬件系统的自我测试, 之后系统会主动的去读取第一个可开机的装置 (由 BIOS 设定的)此时就可以读入开机管理程序了。

开机管理程序可以指定使用哪个核心文件来开机,并实际加载核心到内存当中解压缩与执行, 此时核心就能够开始在内存内活动,并侦测所有硬件信息与加载适当的驱动程序来使整部主机开始运作,等到核心侦测硬件与加载驱动程序完毕后,一个操作系统就开始在你的 PC 上面跑了。

主机系统开始运作后,此时 Linux 才会呼叫外部程序开始准备软件执行的环境,并且实际的加载所有系统运作所需要的软件程序,最后系统就会开始等待你的登入与操作 。

系统开机的经过可以汇整成底下的流程的:

  1. 加载 BIOS 的硬件信息与进行自我测试,并依据设定取得第一个可开机的装置;
  2. 读取并执行第一个开机装置内 MBR 的 boot Loader (亦即是 grub2, spfdisk 等程序);
  3. 依据 boot loader 的设定加载 Kernel ,Kernel 会开始侦测硬件与加载驱动程序;
  4. 在硬件驱动成功后,Kernel 会主动呼叫 systemd 程序,并以 default.target 流程开机;
    • systemd 执行 sysinit.target 初始化系统及 basic.target 准备操作系统;
    • systemd 启动 multi-user.target 下的本机与服务器服务;
    • systemd 执行 multi-user.target 下的 /etc/rc.d/rc.local 文件;
    • systemd 执行 multi-user.target 下的 getty.target 及登入服务;
    • systemd 执行 graphical 需要的服务

BIOS, boot loader 与 kernel 载入

  • BIOS:不论传统 BIOS 还是 UEFI BIOS 都会被简称为 BIOS;
  • MBR:虽然分区表有传统 MBR 以及新式 GPT,不过 GPT 也有保留一块兼容 MBR 的区块,因此,底下的说明在安装 boot loader 的部份, 都简称为 MBR 。总之,MBR 就代表该磁盘的最前面可安装 boot loader 的那个区块就对了

BIOS, 开机自我测试与 MBR/GPT

个人计算机架构下,你想要启动整部系统首先就得要让系统去加载 BIOS (Basic Input Output System),并透过 BIOS 程序去加载 CMOS 的信息,并且藉由 CMOS 内的设定值取得主机的各项硬件配置,例如 CPU 与接口设备的沟通频率、开机装置的搜寻顺序、硬盘的大小与类型、 系统时间、各周边总线的是否启动 Plug and Play(PnP, 即插即用装置) 、 各接口设备的 I/O 地址、以及与 CPU 沟通的 IRQ 岔断等等的信息。

在取得这些信息后,BIOS 还会进行开机自我测试 (Power-on Self Test, POST) 。 然后开始执行硬件侦测的初始化,并设定 PnP 装置,之后再定义出可开机的装置顺序,接下来就会开始进行开机装置的数据读取了。

由于我们的系统软件大多放置到硬盘中;所以 BIOS 会指定开机的装置好让我们可以读取磁盘中的操作系统核心文件。 但由于不同的操作系统他的文件系统格式不相同,因此我们必须要以一个开机管理程序来处理核心文件加载 (load) 的问题, 因此这个开机管理程序就被称为 Boot Loader 了。那这个 Boot Loader 程序安装在哪里呢?就在开机装置的第一个扇区 (sector) 内,也就是我们一直谈到的 MBR (Master Boot Record, 主要启动记录区)

BIOS 又是如何读取 MBR 内的 loader ?

其实 BIOS 是透过硬件的INT 13 中断功能来读取 MBR 的,也就是说,只要 BIOS 能够侦测的到你的磁盘 (不论该磁盘是SATA 还是 SAS 接口),那他就有办法透过 INT 13 这条信道来读取该磁盘的第一个扇区内的 MBR软件;
这样 boot loader 也就能够被执行

提示:

我们知道每颗硬盘的最前面区块含有 MBR 或 GPT 分区表的提供 loader 的区块,那么如果我的主机上面有两颗硬盘的话, 系统会去哪颗硬盘的最前面区块读取 boot loader 呢?这个就得要看 BIOS的设定了。 基本上,我们常常讲的『系统的 MBR』其实指的是 第一个开机装置的 MBR 才对! 所以,改天如果你要将开机管理程序安装到某颗硬盘的 MBR 时, 要特别注意当时系统的『第一个开机装置』是哪个,否则会安装到错误的硬盘上面的 MBR 。

Boot Loader 的功能

Loader 的最主要功能是要认识操作系统的文件格式并据以加载核心到主存储器中去执行。由于不同操作系统的文件格式不一致,因此每种操作系统都有自己的 boot loader ;用自己的 loader才有办法载入核心文件

你应该有听说过多重操作系统 ,也就是在一部主机上面安装多种不同的操作系统。

既然你 (1)必须要使用自己的 loader 才能够加载属于自己的操作系统核 心,而 (2)系统的 MBR 只有一个,那你怎么会有办法同时在一部主机上面安装 Windows 与 Linux呢?

其实每个文件系统 (filesystem,或者是 partition) 都会保留一块启动扇区 (boot sector) 提供操作系统安装 boot loader , 而通常操作系统默认都会安装一份 loader 到他根目录所在的文件系统的 boot sector 上。如果我们在一部主机上面安装 Windows 与 Linux 后,该 boot sector, boot loader 与 MBR 的相关性会有点像下图:
在这里插入图片描述

如上图所示,每个操作系统默认是会安装一套 boot loader 到他自己的文件系统中 (就是每个filesystem 左下角的方框),而在 Linux 系统安装时,你可以选择将 boot loader 安装到 MBR 去,也可以选择不安装。 如果选择安装到 MBR 的话,那理论上你在 MBR 与 boot sector 都会保有一份boot loader 程序的至于 Windows 安装时,他预设会主动的将 MBR 与 boot sector 都装上一份boot loader!所以, 你会发现安装多重操作系时,你的 MBR 常常会被不同的操作系统的 bootloader 所覆盖。

虽然各个操作系统都可以安装一份 boot loader 到他们的boot sector 中, 这样操作系统可以透过自己的 boot loader 来加载核心了问题是系统的 MBR 只有一个! 你要怎么执行 boot sector 里面的 loader ?

要回忆一下boot loader 主要的功能如下:

  • 提供选单:用户可以选择不同的开机项目,这也是多重引导的重要功能
  • 载入核心文件:直接指向可开机的程序区段来开始操作系统
  • 转交其他 loader:将开机管理功能转交给其他 loader 负责

由于具有选单功能,因此我们可以选择不同的核心来开机。而由于具有控制权转交的功能,因此我们可以加载其他 boot sector 内的 loader 啦!不过 Windows 的 loader 预设不具有控制权转交的功能,因此你不能使用 Windows 的 loader 来加载 Linux 的 loader。

这也是为啥,谈到 MBR 与多重引导时,会特别强调先装 Windows 再装 Linux 的缘故。

我们将上述的三个功能以底下的图标来解释:
在这里插入图片描述

如上图所示,我的 MBR 使用 Linux 的 grub2 这个开机管理程序,并且里面假设已经有了三个选单,第一个选单可以直接指向 Linux 的核心文件并且直接加载核心来开机第二个选单可以将开机管理程控权交给 Windows 来管理此时 Windows 的 loader 会接管开机流程,这个时候他就能够启动windows 了第三个选单则是使用 Linux 在 boot sector 内的开机管理程序,此时就会跳出另一个grub2 的选单

  • 选单一:MBR(grub2) --> kernel file --> booting
  • 选单二:MBR(grub2) --> boot sector(Windows loader) --> Windows kernel --> booting
  • 选单三:MBR(grub2) --> boot sector(grub2) --> kernel file --> booting

而最终 boot loader 的功能就是『加载 kernel 文件』

加载核心侦测硬件与 initramfs 的功能

当我们藉由 boot loader 的管理而开始读取核心文件后,接下来, Linux 就会将核心解压缩到主存储器当中, 并且利用核心的功能,开始测试与驱动各个周边装置,包括储存装置、CPU、网络卡、声卡等等此时 Linux 核心会以自己的功能重新侦测一次硬件,而不一定会使用 BIOS 侦测到的硬件信息也就是说,核心此时才开始接管 BIOS 后的工作了

一般来说,核心会被放置到 /boot 里面,并且取名为 /boot/vmlinuz 才对。

[root@study ~]# ls --format=single-column -F /boot
config-3.10.0-229.el7.x86_64 <==此版本核心被编译时选择的功能与模块配置文件
grub/ <==旧版 grub1 ,不需要理会这目录了!
grub2/ <==就是开机管理程序 grub2 相关数据目录
initramfs-0-rescue-309eb890d3d95ec7a.img <==底下几个为虚拟文件系统档!这一个是用来救援的!
initramfs-3.10.0-229.el7.x86_64.img <==正常开机会用到的虚拟文件系统
initramfs-3.10.0-229.el7.x86_64kdump.img <==核心出问题时会用到的虚拟文件系统
System.map-3.10.0-229.el7.x86_64 <==核心功能放置到内存地址的对应表
vmlinuz-0-rescue-309eb890d09543d95ec7a* <==救援用的核心文件
vmlinuz-3.10.0-229.el7.x86_64* <==就是核心文件啦!最重要者!

由上我们可以知道 CentOs 7.x 的 Linux 核心为 3.10.0-229.el7.x86_64 这个版本 ;

为了硬件开发商与其他核心功能开发者的便利, 因此 Linux 核心是可以透过动态加载核心模块的(就请想成驱动程序即可),这些核心模块就放置在 /lib/modules/ 目录内

由于模块放置到磁盘根目录内 (要记得 /lib 不可以与 / 分别放在不同的 partition !), 因此在开机的过程中核心必须要挂载根目录,这样才能够读取核心模块提供加载驱动程序的功能。 而且为了担心影响到磁盘内的文件系
统,因此开机过程中根目录是以只读的方式来挂载的 。

一般来说,必要的功能且可以编译成为模块的核心功能,目前的 Linux distributions 都会将他编译成为模块。 因此 USB, SATA, SCSI... 等磁盘装置的驱动程序通常都是以模块的方式来存在的

现在来思考一种情况,假设你的 linux 是安装在 SATA 磁盘上面的,你可以透过 BIOS 的 INT 13 取得 boot loader 与 kernel 文件来开机,然后 kernel 会开始接管系统并且侦测硬件及尝试挂载根目录来取得额外的驱动程序

问题是,核心根本不认识 SATA 磁盘,所以需要加载 SATA 磁盘的驱动程序, 否则根本就无法挂载根目录但是 SATA 的驱动程序在 /lib/modules 内,你根本无法挂载根目录又怎么读取到/lib/modules/ 内的驱动程序

我们可以透过虚拟文件系统来处理这个问题

虚拟文件系统 (Initial RAM DiskInitial RAM Filesystem) 一般使用的档名为 /boot/initrd 或/boot/initramfs ,这个文件的特色是,他也能够透过 boot loader 来加载到内存中,然后这个文件会被解压缩并且在内存当中仿真成一个根目录, 且此仿真在内存当中的文件系统能够提供一支可执行的程序,透过该程序来加载开机过程中所最需要的核心模块, 通常这些模块就是 USB, RAID, LVM,SCSI 等文件系统与磁盘接口的驱动程序等载入完成后, 会帮助核心重新呼叫 systemd 来开始后续的正常开机流程
在这里插入图片描述

如上图所示,boot loader 可以加载 kernel 与 initramfs然后在内存中让 initramfs 解压缩成为根目录, kernel 就能够藉此加载适当的驱动程序,最终释放虚拟文件系统,并挂载实际的根目录文件系统,就能够开始后续的正常开机流程。 更详细的 initramfs 说明,你可以自行使用 man initrd 去查阅看看。

CentOS 7.x 的 initramfs 文件内容如下:

# 1. 先来直接看一下 initramfs 里面的内容有些啥数据?
[root@study ~]# lsinitrd /boot/initramfs-3.10.0-229.el7.x86_64.img
# 首先会呼叫出 initramfs 最前面文件头的许多数据介绍,这部份会占用一些容量!
Image: /boot/initramfs-3.10.0-229.el7.x86_64.img: 18M
========================================================================
Early CPIO image
========================================================================
drwxr-xr-x 3 root root 0 May 4 17:56 .
-rw-r--r-- 1 root root 2 May 4 17:56 early_cpio
drwxr-xr-x 3 root root 0 May 4 17:56 kernel
drwxr-xr-x 3 root root 0 May 4 17:56 kernel/x86
drwxr-xr-x 2 root root 0 May 4 17:56 kernel/x86/microcode
-rw-r--r-- 1 root root 10240 May 4 17:56 kernel/x86/microcode/GenuineIntel.bin
========================================================================
Version: dracut-033-240.el7
Arguments: -f
dracut modules: # 开始一堆模块的加载行为
bash
nss-softokn
.....(中间省略).....
========================================================================
drwxr-xr-x 12 root root 0 May 4 17:56 .
crw-r--r-- 1 root root 5, 1 May 4 17:56 dev/console
crw-r--r-- 1 root root 1, 11 May 4 17:56 dev/kmsg
crw-r--r-- 1 root root 1, 3 May 4 17:56 dev/null
.....(中间省略).....
lrwxrwxrwx 1 root root 23 May 4 17:56 init -> usr/lib/systemd/systemd
.....(中间省略).....
drwxr-xr-x 2 root root 0 May 4 17:56 var/lib/lldpad
lrwxrwxrwx 1 root root 11 May 4 17:56 var/lock -> ../run/lock
lrwxrwxrwx 1 root root 10 May 4 17:56 var/log -> ../run/log
lrwxrwxrwx 1 root root 6 May 4 17:56 var/run -> ../run
========================================================================
# 最后则会列出这个 initramfs 里头的所有文件!也就是说,这个 initramfs 文件大概存着两部份,
# 先是档头宣告的许多文件部份,再来才是真的会被核心取用的全部附加的文件数据!

从上面我们大概知道了这个 initramfs 里头含有两大区块,一个是事先宣告的一些数据,包括
kernel/x86/microcode/GenuineIntel.bin 这些东西。 在这些数据后面,才是真的我们的核心会去读取的重要文件 ;如果看一下文件的内容,你会发现到 init 那只程序已经被 systemd 所取代。

如果你想要进一步将这个文件解开的话,那得要先将前面的kernel/x86/microcode/GenuineIntel.bin 之前的文件先去除掉,这样才能够顺利的解开。 因此,得要这样进行:

# 1. 先将 /boot 底下的文件进行去除前面不需要的文件头数据部份。
[root@study ~]# mkdir /tmp/initramfs
[root@study ~]# cd /tmp/initramfs
[root@study initramfs]# dd if=/boot/initramfs-3.10.0-229.el7.x86_64.img of=initramfs.gz \
> bs=11264 skip=1
[root@study initramfs]# ll initramfs.gz; file initramfs.gz
-rw-r--r--. 1 root root 18558166 Aug 24 19:38 initramfs.gz
initramfs.gz: gzip compressed data, from Unix, last modified: Mon May 4 17:56:47 2015,
max compression
# 2. 从上面看到文件是 gzip 压缩文件,所以将它解压缩后,再查阅一下文件的类型!
[root@study initramfs]# gzip -d initramfs.gz
[root@study initramfs]# file initramfs
initramfs: ASCII cpio archive (SVR4 with no CRC)
# 3. 解开后又产生一个 cpio 文件,得要将它用 cpio 的方法解开!加上不要绝对路径的参数较保险!
[root@study initramfs]# cpio -i -d -H newc --no-absolute-filenames < initramfs
[root@study initramfs]# ll
lrwxrwxrwx. 1 root root 7 Aug 24 19:40 bin -> usr/bin
drwxr-xr-x. 2 root root 42 Aug 24 19:40 dev
drwxr-xr-x. 12 root root 4096 Aug 24 19:40 etc
lrwxrwxrwx. 1 root root 23 Aug 24 19:40 init -> usr/lib/systemd/systemd
-rw-r--r--. 1 root root 42263552 Aug 24 19:38 initramfs
lrwxrwxrwx. 1 root root 7 Aug 24 19:40 lib -> usr/lib
lrwxrwxrwx. 1 root root 9 Aug 24 19:40 lib64 -> usr/lib64
drwxr-xr-x. 2 root root 6 Aug 24 19:40 proc
drwxr-xr-x. 2 root root 6 Aug 24 19:40 root
drwxr-xr-x. 2 root root 6 Aug 24 19:40 run
lrwxrwxrwx. 1 root root 8 Aug 24 19:40 sbin -> usr/sbin
-rwxr-xr-x. 1 root root 3041 Aug 24 19:40 shutdown
drwxr-xr-x. 2 root root 6 Aug 24 19:40 sys
drwxr-xr-x. 2 root root 6 Aug 24 19:40 sysroot
drwxr-xr-x. 2 root root 6 Aug 24 19:40 tmp
drwxr-xr-x. 7 root root 61 Aug 24 19:40 usr
drwxr-xr-x. 3 root root 47 Aug 24 19:40 var
# 看吧!上面几乎就像是一个小型的文件系统根目录耶!这样就能让 kernel 去挂载了!
# 4. 接下来瞧一瞧到底这个小型的文件系统中,systemd 是要以哪个 target 来执行开机呢?
[root@study initramfs]# ll usr/lib/systemd/system/default.target
lrwxrwxrwx. 1 root root 13 Aug 24 19:40 usr/lib/systemd/system/default.target -> initrd.target
# 5. 最终,让我们瞧一瞧系统内默认的 initrd.target 相依的所有服务数据吧!
[root@study initramfs]# systemctl list-dependencies initrd.target
initrd.target
├─dracut-cmdline.service
.....(中间省略).....
├─basic.target
│ ├─alsa-restore.service
.....(中间省略).....
│ ├─slices.target
│ │ ├─-.slice
│ │ └─system.slice
│ ├─sockets.target
│ │ ├─dbus.socket
.....(中间省略).....
│ │ └─systemd-udevd-kernel.socket
│ ├─sysinit.target
│ │ ├─dev-hugepages.mount
.....(中间省略).....
│ │ ├─local-fs.target
│ │ │ ├─-.mount
│ │ │ ├─boot.mount
.....(中间省略).....
│ │ └─swap.target
│ │ ├─dev-centos-swap.swap
.....(中间省略).....
│ │ └─dev-mapper-centos\x2dswap.swap
│ └─timers.target
│ └─systemd-tmpfiles-clean.timer
├─initrd-fs.target
└─initrd-root-fs.target
# 依旧透过 systemd 的方式,一个一个的将所有的侦测与服务加载系统中!

透过上面解开 initramfs 的结果,你会知道其实 initramfs 就是一个小型的根目录,这个小型根目录里面也是透过 systemd 来进行管理,同时观察 default.target 的链接,会发现其实这个小型系统就是透过 initrd.target 来开机,而 initrd.target 也是需要读入一堆例如 basic.target, sysinit.target 等等的硬件侦测、核心功能启用的流程, 然后开始让系统顺利运作。最终才又卸除 initramfs 的小型文件系统,实际挂载系统的根目录!

此外,initramfs 并没有包山包海,它仅是带入开机过程会用到的核心模块而已。所以如果你在initramfs 里面去找 modules 这个关键词的话, 就可以发现主要的核心模块大概就是 SCSI、virtio、RAID 等等跟磁盘相关性比较高的模块

现在由于磁盘大部分都是使用 SATA 这玩意儿, 并没有 IDE 的格式!所以,没有 initramfs 的话,你的 Linux 几乎就是不能顺利开机的!除非你将 SATA 的模块直接编译到核心去。

在核心完整的加载后,您的主机应该就开始正确的运作了,接下来,就是要开始执行系统的第一支程序: systemd !

第一支程序 systemd 及使用 default.target 进入开机程序分析

在核心加载完毕、进行完硬件侦测与驱动程序加载后,此时你的主机硬件应该已经准备就绪了(ready) , 此时核心会主动的呼叫第一支程序,那就是 systemd。

systemd 的 PID 号码是一号。

systemd 最主要的功能就是准备软件执行的环境,包括系统的主机名、网络设定、语系处理、文件系统格式及其他服务的启动等。 而所有的动作都会透过 systemd 的默认启动服务集合,亦即是/etc/systemd/system/default.target 来规划。 另外,systemd 已经舍弃沿用多年的 system V 的 runlevel 了

常见的操作环境 target 与兼容于 runlevel 的等级

可以作为预设的操作环境 (default.target) 的主要项目有: multi-user.target 以及 graphical.target 这两个。当然还有某些比较特殊的操作环境, 包括前面谈到的 rescue.target, emergency.target,shutdown.target 等等,以及本章在 initramfs 里面谈到的 initrd.target。

但是过去的 systemV 使用的是一个称为 runlevel (执行等级) 的概念来启动系统的,systemd 为了兼容于旧式的 systemV 操作行为, 所以也将 runlevel 与操作环境做个结合。

查询两者间的对应:

[root@study ~]# ll -d /usr/lib/systemd/system/runlevel*.target | cut -c 28-
May 4 17:52 /usr/lib/systemd/system/runlevel0.target -> poweroff.target
May 4 17:52 /usr/lib/systemd/system/runlevel1.target -> rescue.target
May 4 17:52 /usr/lib/systemd/system/runlevel2.target -> multi-user.target
May 4 17:52 /usr/lib/systemd/system/runlevel3.target -> multi-user.target
May 4 17:52 /usr/lib/systemd/system/runlevel4.target -> multi-user.target
May 4 17:52 /usr/lib/systemd/system/runlevel5.target -> graphical.target
May 4 17:52 /usr/lib/systemd/system/runlevel6.target -> reboot.target

如果你之前已经使用过 systemV 的方式来管理系统的话,那应该会知道切换执行等级可以使用『 init3 』转成文字界面,『 init 5 』转成图形界面吧? 这个 init 程序依旧是保留下来的,只是 init 3 会相当于 systemctl isolate multi-user.target 就是了!如果做个完整的迭代,这两个东西的对应为:

SystemV systemd
init 0 systemctl poweroff
init 1 systemctl rescue
init [234] systemctl isolate multi-user.target
init 5 systemctl isolate graphical.target
init 6 systemctl reboot

systemd 的处理流程

如前所述,当我们取得了 /etc/systemd/system/default.target 这一个预设操作界面的设定之后,接下来系统帮我们做了什么呢?

首先,它会链接到 /usr/lib/systemd/system/ 这个目录下去取得multi-user.target 或 graphical.target 这两个其中的一 ;

假设我们是使用 graphical.target 好了,接着下来 systemd 会去找两个地方的设定, 就是如下的目录:

  • /etc/systemd/system/graphical.target.wants/:使用者设定加载的 unit
  • /usr/lib/systemd/system/graphical.target.wants/:系统默认加载的 unit

然后再由 /usr/lib/systemd/system/graphical.target 这个配置文件内发现如下的资料:

[root@study ~]# cat /usr/lib/systemd/system/graphical.target
[Unit]
Description=Graphical Interface
Documentation=man:systemd.special(7)
Requires=multi-user.target
After=multi-user.target
Conflicts=rescue.target
Wants=display-manager.service
AllowIsolate=yes

[Install]
Alias=default.target

这表示 graphical.target 必须要完成 multi-user.target 之后才能够进行,而进行完 graphical.target 之后,还得要启动 display-manager.service 才行的意思。

透过同样的方式,我们来找找multi-user.target 要执行完毕得要加载的项目有哪些:

# 先来看看 multi-user.target 配置文件内规范了相依的操作环境有哪些呢?
[root@study ~]# cat /usr/lib/systemd/system/multi-user.target
[Unit]
Description=Multi-User System
Documentation=man:systemd.special(7)
Requires=basic.target
Conflicts=rescue.service rescue.target
After=basic.target rescue.service rescue.target
AllowIsolate=yes

[Install]
Alias=default.target

# 然后看看系统默认要加载的 unit 有哪些?
[root@study ~]# ls /usr/lib/systemd/system/multi-user.target.wants
brandbot.path plymouth-quit.service systemd-logind.service
dbus.service plymouth-quit-wait.service systemd-user-sessions.service
getty.target systemd-ask-password-wall.path

# 使用者自定义要加载的 unit 又有哪些呢?
[root@study ~]# ls /etc/systemd/system/multi-user.target.wants
abrt-ccpp.service crond.service mdmonitor.service sshd.service
abrtd.service hypervkvpd.service ModemManager.service sysstat.service
abrt-oops.service hypervvssd.service NetworkManager.service tuned.service
abrt-vmcore.service irqbalance.service postfix.service vmtoolsd.service
abrt-xorg.service kdump.service remote-fs.target vsftpd2.service
atd.service ksm.service rngd.service vsftpd.service
auditd.service ksmtuned.service rsyslog.service
backup2.timer libstoragemgmt.service smartd.service
backup.timer libvirtd.service sshd2.service

透过上面的结果,我们又能知道 multi-usre.target 需要在 basic.target 运作完毕才能够载入上述的许多 unit ;然后再去 basic.target 里头找数据等等~ 最终这些数据就可以透过『 systemctl list-dependencies graphical.target 』这个指令来列出所有的相关性的服务!这就是 systemd 的呼叫所需要的服务的流程。

提示:

要知道系统的服务启用的流程,最简单的方法就是『 systemctl list-dependencies graphical.target 』这个指令!只是,如果你想要知道背后的配置文件意义, 那就是分别去找出 /etc 与 /usr/lib 底下的 graphical.target.wants/ 目录下的数据就对了!当然,配置文件脚本里面的 Requires 这个设定值所代表的服务,也是需要是先加载 。

约略分析一下『 systemctl list-dependencies graphical.target 』所输出的相依属性服务,基本上我们CentOS 7.x 的 systemd 开机流程大约是这样:

  1. local-fs.target + swap.target:这两个 target 主要在挂载本机 /etc/fstab 里面所规范的文件系统与相关的内存置换空间。
  2. sysinit.target:这个 target 主要在侦测硬件,加载所需要的核心模块等动作
  3. basic.target:加载主要的外围硬件驱动程序与防火墙相关任务
  4. multi-user.target 底下的其它一般系统或网络服务的加载
  5. 图形界面相关服务如 gdm.service 等其他服务的加载

systemd 执行 sysinit.target 初始化系统、basic.target 准备系统

如果你自己使用『 systemctl list-dependencies sysinit.target 』来瞧瞧的话,那就会看到很多相依的服务!这些服务你应该要一个一个去查询看看设定脚本的内容, 就能够大致理解每个服务的意义。基本上,我们可以将这些服务归类成几个大项:

  • 特殊文件系统装置的挂载:包括 dev-hugepages.mount dev-mqueue.mount 等挂载服务,主要在挂载跟巨量内存分页使用与消息队列的功能。 挂载成功后,会在 /dev 底下建立 /dev/hugepages/, /dev/mqueue/ 等目录;
  • 特殊文件系统的启用:包括磁盘阵列、网络驱动器 (iscsi)、LVM 文件系统、文件系统对照服务 (multipath)
    等等,也会在这里被侦测与使用到!
  • 开机过程的讯息传递与动画执行:使用 plymouthd 服务搭配 plymouth 指令来传递动画与讯息
  • 日志文件的使用:就是 systemd-journald 这个服务的启用啊!
  • 加载额外的核心模块:透过 /etc/modules-load.d/*.conf 文件的设定,让核心额外加载管理员所需要的核心模
    块!
  • 加载额外的核心参数设定:包括 /etc/sysctl.conf 以及 /etc/sysctl.d/*.conf 内部设定!
  • 启动系统的随机数生成器:随机数生成器可以帮助系统进行一些密码加密演算的功能
  • 设定终端机 (console) 字形
  • 启动动态设备管理器:就是 udevd 这个家伙!用在动态对应实际装置存取与装置文件名对应的一个服务!
    相当重要喔!也是在这里启动的!

不论你即将使用哪种操作环境来使用系统,这个 sysinit.target 几乎都是必要的工作!从上面你也可以看的出来,基本的核心功能、文件系统、文件系统装置的驱动等等, 都在这个时刻处理完毕。

执行完 sysinit.target 之后,再来则是 basic.target 这个项目了。 sysinit.target 在初始化系统,而这个
basic .target 则是一个最简单的操作系统! 这个 basic.target 的阶段主要启动的服务大概有这些:

  • 加载 alsa 音效驱动程序:这个 alsa 是个音效相关的驱动程序,会让你的系统有音效产生啰;
  • 载入 firewalld 防火墙:CentOS 7.x 以后使用 firewalld 取代 iptables 的防火墙设定,虽然最终都是使用iptables 的架构, 不过在设定上面差很多喔!
  • 加载 CPU 的微指令功能;
  • 启动与设定 SELinux 的安全本文:如果由 disable 的状态改成 enable 的状态,或者是管理员设定强制重新设定一次 SELinux 的安全本文, 也在这个阶段处理。
  • 将目前的开机过程所产生的开机信息写入到 /var/log/dmesg 当中
  • 由 /etc/sysconfig/modules/*.modules 及 /etc/rc.modules 加载管理员指定的模块!
  • 加载 systemd 支持的 timer 功能;

在这个阶段完成之后,你的系统已经可以顺利的运作!就差一堆你需要的登入服务、网络服务、本机认证服务等等的 service 类别!于是就可以进入下个服务启动的阶段。

systemd 启动 multi-user.target 下的服务

在加载核心驱动硬件后,经过 sysinit.target 的初始化流程让系统可以存取之后,加上 basic.target 让系统成为操作系统的基础, 之后就是服务器要顺利运作时,需要的各种主机服务以及提供服务器功能的网络服务的启动了。这些服务的启动则大多是附挂在 multi-user.target 这个操作环境底下, 你可以到 /etc/systemd/system/multi-user.target.wants/ 里头去瞧瞧预设要被启动的服务.

一般来说服务的启动脚本设定都是放在底下的目录内:

  • /usr/lib/systemd/system (系统默认的服务启动脚本设定)
  • /usr/lib/systemd/system (系统默认的服务启动脚本设定)

用户针对主机的本地服务与服务器网络服务的各项 unit 若要 enable 的话,就是将它放到/etc/systemd/system/multi-user.target.wants/ 这个目录底下做个链接~ 这样就可以在开机的时候去启动他.

systemd 启动 graphical.target 底下的服务

如果你的 default.target 是 multi-user.target 的话,那么这个步骤就不会进行。反之,如果是graphical.target 的话,那么 systemd 就会开始加载用户管理服务与图形界面管理员 (window displaymanager, DM) 等,启动图形界面来让用户以图形界面登入系统 .

开机过程会用到的主要配置文件

基本上, systemd 有自己的配置文件处理方式,不过为了兼容于 systemV ,其实很多的服务脚本设定还是会读取位于 /etc/sysconfig/ 底下的环境配置文件! 底下我们就来谈谈几个常见的比较重要的配置文件.

关于模块: /etc/modprobe.d/.conf 及 /etc/modules-load.d/.conf

还记得我们在 sysinit.target 系统初始化当中谈到的加载用户自定义模块的地方吗?其实有两个地方可以处理模块加载的问题,包括:

  • /etc/modules-load.d/*.conf:单纯要核心加载模块的位置;
  • /etc/modprobe.d/*.conf:可以加上模块参数的位置

基本上 systemd 已经帮我们将开机会用到的驱动程序全部加载了,因此这个部份你应该无须更动才对!不过, 如果你有某些特定的参数要处理时,应该就得要在这里进行了。

/etc/sysconfig/*

比较重要的环境配置文件:

  • authconfig:

    这个文件主要在规范使用者的身份认证的机制,包括是否使用本机的 /etc/passwd, /etc/shadow 等, 以及/etc/shadow 密码记录使用何种加密算法,还有是否使用外部密码服务器提供的账号验证 (NIS, LDAP) 等。系统默认使用 SHA512 加密算法,并且不使用外部的身份验证机制;另外,不建议手动修改这个文件喔!你应该使用『 authconfig-tui 』指令来修改较佳!

  • cpupower:

    如果你有启动 cpupower.service 服务时,他就会读取这个配置文件。主要是 Linux 核心如何操作 CPU 的原则。 一般来说,启动 cpupower.service 之后,系统会让 CPU 以最大效能的方式来运作,否则预设就是用多少算多少的模式来处理的。

  • firewalld, iptables-config, iptables-config, ebtables-config:

    与防火墙服务的启动外带的参数有关。

  • network-scripts/:

    至于 network-scripts 里面的文件,则是主要用在设定网络卡~

核心与核心模块

谈完了整个开机的流程,您应该会知道,在整个开机的过程当中,是否能够成功的驱动我们主机的硬件配备, 是核心 (kernel) 的工作而核心一般都是压缩文件,因此在使用核心之前,就得要将他解压缩后,才能加载主存储器当中。

另外,为了应付日新月异的硬件,目前的核心都是具有『可读取模块化驱动程序』的功能, 亦即是所谓的『 modules (模块化)』的功能所谓的模块化可以将他想成是一个『插件』, 该插件可能由硬件开发厂商提供,也有可能我们的核心本来就支持~不过,较新的硬件, 通常都需要硬件开发商提供驱动程序模块.

核心与核心模块放置的位置:

  • 核心: /boot/vmlinuz 或 /boot/vmlinuz-version;
  • 核心解压缩所需 RAM Disk: /boot/initramfs (/boot/initramfs-version);
  • 核心模块: /lib/modules/version/kernel 或 /lib/modules/$(uname -r)/kernel;
  • 核心原始码: /usr/src/linux 或 /usr/src/kernels/ (要安装才会有,预设不安装)

如果该核心被顺利的加载系统当中了,那么就会有几个信息纪录下来:

  • 核心版本: /proc/version
  • 系统核心功能: /proc/sys/kernel/

如果我有个新的硬件,偏偏我的操作系统不支持,该怎么办? 可以通过以下方式:

  • 重新编译核心,并加入最新的硬件驱动程序原始码;
  • 将该硬件的驱动程序编译成为模块,在开机时加载该模块

上面第一点还很好理解,反正就是重新编译核心就是了。不过,核心编译很不容易啊!

我们会在后续章节约略介绍核心编译的整个程序。

比较有趣的则是将该硬件的驱动程序编译成为模块啦! 关于编译的方法,可以参考后续的 原始码与 tarball 的介绍。

核心模块与相依性

既然要处理核心模块,自然就得要了解了解我们核心提供的模块之间的相关性!

基本上,核心模块的放置处是在 /lib/modules/$(uname -r)/kernel 当中,里面主要还分成几个目录:

arch :与硬件平台有关的项目,例如 CPU 的等级等等;
crypto :核心所支持的加密的技术,例如 md5 或者是 des 等等;
drivers :一些硬件的驱动程序,例如显示适配器、网络卡、PCI 相关硬件等等;
fs :核心所支持的 filesystems ,例如 vfat, reiserfs, nfs 等等;
lib :一些函式库;
net :与网络有关的各项协议数据,还有防火墙模块 (net/ipv4/netfilter/*) 等等;
sound :与音效有关的各项模块;

不需要打开文件,手动分析模块的相依性,我们的 Linux 当然会提供一些模块相依性的解决方案~ 那就是
查 /lib/modules/$(uname -r)/modules.dep 这个文件他记录了在核心支持的模块的各项相依性

那么这个文件如何建立呢?利用 depmod 这个指令就可以达到建立该文件的需求

[root@study ~]# depmod [-Ane]
选项与参数:
-A :不加任何参数时, depmod 会主动的去分析目前核心的模块,并且重新写入
    /lib/modules/$(uname -r)/modules.dep 当中。若加入 -A 参数时,则 depmod
    会去搜寻比 modules.dep 内还要新的模块,如果真找到新模块,才会更新。
-n :不写入 modules.dep ,而是将结果输出到屏幕上(standard out);
-e :显示出目前已加载的不可执行的模块名称

范例一:若我做好一个网卡驱动程序,档名为 a.ko,该如何更新核心相依性?
[root@study ~]# cp a.ko /lib/modules/$(uname -r)/kernel/drivers/net
[root@study ~]# depmod

以上面的范例一为例,我们的 kernel 核心模块扩展名一定是 .ko 结尾的,当你使用 depmod 之后,该程序会跑到模块标准放置目录 /lib/modules/$(uname -r)/kernel , 并依据相关目录的定义将全部的模块捉出来分析,最终才将分析的结果写入 modules.dep 文件中的吶! 这个文件很重要!因为他会影响到稍后会介绍的 modprobe 指令的应用.

核心模块的观察

观察目前核心加载了多少的模块 ,使用指令 lsmod

[root@study ~]# lsmod
Module 			Size 		Used by
nf_conntrack_ftp 18638 		 0
nf_conntrack 	105702 		 1    nf_conntrack_ftp
....(中间省略)....
qxl 			73766 		1
drm_kms_helper 	98226 		 1    qxl
ttm 			93488 		1    qxl
drm 			311588 		4    qxl,ttm,drm_kms_helper # drm 还被 qxl, ttm..等模块使用
....(底下省略)....

使用 lsmod 之后,系统会显示出目前已经存在于核心当中的模块,显示的内容包括有:

  • 模块名称(Module);
  • 模块的大小(size);
  • 此模块是否被其他模块所使用 (Used by)

也就是说,模块其实真的有相依性喔!举上表为例,nf_conntrack 先被加载后,nf_conntrack_ftp 这个
模块才能够进一步的加载系统中! 这两者间是有相依性的。

查看模块具体内容,使用指令 modinfo

[root@study ~]# modinfo [-adln] [module_name|filename]
选项与参数:
-a :仅列出作者名称;
-d :仅列出该 modules 的说明 (description);
-l :仅列出授权 (license);
-n :仅列出该模块的详细路径。

范例一:由上个表格当中,请列出 drm 这个模块的相关信息:
[root@study ~]# modinfo drm
filename: /lib/modules/3.10.0-229.el7.x86_64/kernel/drivers/gpu/drm/drm.ko
license: GPL and additional rights
description: DRM shared core routines
author: Gareth Hughes, Leif Delgass, José Fonseca, Jon Smirl
rhelversion: 7.1
srcversion: 66683E37FDD905C9FFD7931
depends: i2c-core
intree: Y
vermagic: 3.10.0-229.el7.x86_64 SMP mod_unload modversions
signer: CentOS Linux kernel signing key
sig_key: A6:2A:0E:1D:6A:6E:48:4E:9B:FD:73:68:AF:34:08:10:48:E5:35:E5
sig_hashalgo: sha256
parm: edid_fixup:Minimum number of valid EDID header bytes (0-8, default 6) (int)
.....(底下省略).....
# 可以看到这个模块的来源,以及该模块的简易说明!

范例二:我有一个模块名称为 a.ko ,请问该模块的信息为?
[root@study ~]# modinfo a.ko
....(省略)....

事实上,这个 modinfo 除了可以『查阅在核心内的模块』之外,还可以检查『某个模块文件』, 因此,如果你想要知道某个文件代表的意义为何,利用 modinfo 加上完整檔名

核心模块的加载与移除

如果我想要自行手动加载模块,有很多方法;

最简单而且建议的,是使用modprobe 这个指令来加载模块, 这是因为 modprobe 会主动的去搜寻modules.dep 的内容,先克服了模块的相依性后, 才决定需要加载的模块有哪些,很方便。至于 insmod 则完全由使用者自行加载一个完整文件名的模块, 并不会主动的分析模块相依性

[root@study ~]# insmod [/full/path/module_name] [parameters]

范例一:请尝试载入 cifs.ko 这个『文件系统』模块
[root@study ~]# insmod /lib/modules/$(uname -r)/kernel/fs/fat/fat.ko
[root@study ~]# lsmod | grep fat
fat 	65913 	0

insmod 立刻就将该模块加载~但是 insmod 后面接的模块必须要是完整的『档名』才行

那如何移除这个模块呢?

[root@study ~]# rmmod [-fw] module_name
选项与参数:
-f :强制将该模块移除掉,不论是否正被使用;

范例一:将刚刚加载的 fat 模块移除!
[root@study ~]# rmmod fat

范例二:请加载 vfat 这个『文件系统』模块
[root@study ~]# insmod /lib/modules/$(uname -r)/kernel/fs/vfat/vfat.ko
insmod: ERROR: could not load module /lib/modules/3.10.0-229.el7.x86_64/kernel/fs/vfat/
vfat.ko: No such file or directory
# 无法加载 vfat 这个模块啊!伤脑筋!

使用 insmod 与 rmmod 的问题就是,你必须要自行找到模块的完整文件名才行而且如同上述范例二的结果, 万一模块有相依属性的问题时,你将无法直接加载或移除该模块

所以近年来我们都建议直接使用 modprobe 来处理模块加载的问题,这个指令的用法是

[root@study ~]# modprobe [-cfr] module_name
选项与参数:
-c :列出目前系统所有的模块!(更详细的代号对应表)
-f :强制加载该模块;
-r :类似 rmmod ,就是移除某个模块啰~

范例一:加载 vfat 模块
[root@study ~]# modprobe vfat
# 很方便吧!不需要知道完整的模块文件名,这是因为该完整文件名已经记录到
# /lib/modules/`uname -r`/modules.dep 当中的缘故啊!如果要移除的话:
[root@study ~]# modprobe -r vfat

使用 modprobe 真的是要比 insmod 方便很多!因为他是直接去搜寻 modules.dep 的纪录,所以,当然可以克服模块的相依性问题,而且还不需要知道该模块的详细路径 .

核心模块的额外参数设定:/etc/modprobe.d/*conf

如果有某些特殊的需求导致你必须要让核心模块加上某些参数时;可参考 开机过程会用到的主要配置文件 ;

重点就是要自己建立扩展名为 .conf 的文件,透过 options 来带入核心模块参数

Boot Loader: Grub2

boot loader 的两个 stage

第一小节开机流程的地方曾经讲过,在 BIOS 读完信息后,接下来就是会到第一个开机装置的 MBR 去读取 boot loader 了。这个 boot loader 可以具有选单功能、直接加载核心文件以及控制权移交的功能等, 系统必须要有 loader 才有办法加载该操作系统的核心但是我们都知道, MBR 是整个硬盘的第一个 sector 内的一个区块,充其量整个大小也才 446 bytes 而已****。即使是 GPT 也没有很大的扇区来储存 loader 的数据。 我们的 loader 功能这么强,光是程序代码与设定数据不可能只占这么一点点的容量吧?那如何安装?

为了解决这个问题,所以 Linux 将 boot loader程序代码执行设定值加载分成两个阶段 (stage)来执行 :

  • Stage 1:执行 boot loader 主程序

    第一阶段为执行 boot loader 的主程序这个主程序必须要被安装在开机区,亦即是 MBR 或者是 bootsector 。但如前所述,因为 MBR 实在太小了,所以,MBR 或 boot sector 通常仅安装 boot loader 的最小主程序, 并没有安装 loader 的相关配置文件

  • Stage 2:主程序加载配置文件

    第二阶段为透过 boot loader 加载所有配置文件与相关的环境参数文件 (包括文件系统定义与主要配置文件
    grub.cfg), 一般来说,配置文件都在 /boot 底下

与 grub2 有关的配置文件 都放置到 /boot/grub2 中;

[root@study ~]# ls -l /boot/grub2
-rw-r--r--. device.map <==grub2 的装置对应文件(底下会谈到)
drwxr-xr-x. fonts <==开机过程中的画面会使用到的字型数据
-rw-r--r--. grub.cfg <==grub2 的主配置文件!相当重要!
-rw-r--r--. grubenv <==一些环境区块的符号
drwxr-xr-x. i386-pc <==针对一般 x86 PC 所需要的 grub2 的相关模块
drwxr-xr-x. locale <==就是语系相关的数据啰
drwxr-xr-x. themes <==一些开机主题画面数据

[root@study ~]# ls -l /boot/grub2/i386-pc
-rw-r--r--. acpi.mod <==电源管理有关的模块
-rw-r--r--. ata.mod <==磁盘有关的模块
-rw-r--r--. chain.mod <==进行 loader 控制权移交的相关模块
-rw-r--r--. command.lst <==一些指令相关性的列表
-rw-r--r--. efiemu32.o <==底下几个则是与 uefi BIOS 相关的模块
-rw-r--r--. efiemu64.o
-rw-r--r--. efiemu.mod
-rw-r--r--. ext2.mod <==EXT 文件系统家族相关模块
-rw-r--r--. fat.mod <==FAT 文件系统模块
-rw-r--r--. gcry_sha256.mod <==常见的加密模块
-rw-r--r--. gcry_sha512.mod
-rw-r--r--. iso9660.mod <==光盘文件系统模块
-rw-r--r--. lvm.mod <==LVM 文件系统模块
-rw-r--r--. mdraid09.mod <==软件磁盘阵列模块
-rw-r--r--. minix.mod <==MINIX 相关文件系统模块
-rw-r--r--. msdospart.mod <==一般 MBR 分区表
-rw-r--r--. part_gpt.mod <==GPT 分区表
-rw-r--r--. part_msdos.mod <==MBR 分区表
-rw-r--r--. scsi.mod <==SCSI 相关模块
-rw-r--r--. usb_keyboard.mod <==底下两个为 USB 相关模块
-rw-r--r--. usb.mod
-rw-r--r--. vga.mod <==VGA 显示适配器相关模块
-rw-r--r--. xfs.mod <==XFS 文件系统模块

# 这里只拿一些模块作说明,没有全部的文件都列上来!

从上面的说明你可以知道 /boot/grub2/ 目录下最重要的就是配置文件 (grub2.cfg) 以及各种文件系统的定义! 我们的 loader 读取了这种文件系统定义数据后,就能够认识文件系统并读取在该文件系统内的核心文件

所以从上面的文件来看, grub2 认识的文件系统与磁盘分区格式真的非常多!正因为如此,所以grub2 才会取代 Lilo / grub 这个老牌的 boot loader

grub2 的配置文件 /boot/grub2/grub.cfg 初探

grub2 的优点挺多的,包括有:

  • 认识与支持较多的文件系统,并且可以使用 grub2 的主程序直接在文件系统中搜寻核心档名;
  • 开机的时候,可以『自行编辑与修改开机设定项目』,类似 bash 的指令模式;
  • 可以动态搜寻配置文件,而不需要在修改配置文件后重新安装 grub2 。亦即是我们只要修改完
    /boot/grub2/grub.cfg 里头的设定后,下次开机就生效了!

上面第三点其实就是 Stage 1, Stage 2 分别安装在 MBR (主程序) 与文件系统当中 (配置文件与定义档) 的原因。

让我们好好了解一下 grub2 的配置文件: /boot/grub2/grub.cfg

磁盘与分区槽在 grub2 中的代号

安装在 MBR 的 grub2 主程序,最重要的任务之一就是从磁盘当中加载核心文件, 以让核心能够顺利的驱动整个系统的硬件。所以, grub2 必须要认识硬盘才行!那么 grub2 到底是如何认识硬盘的呢? grub2 对硬盘的代号设定与传统的 Linux 磁盘代号可完全是不同的!grub2 对硬盘的识别使用的是如下的代号:

(hd0,1) 	 # 一般的默认语法,由 grub2 自动判断分区格式
(hd0,msdos1) # 此磁盘的分区为传统的 MBR 模式
(hd0,gpt1) 	 # 此磁盘的分区为 GPT 模式

只要注意几个东西即可,那就是:

  • 硬盘代号以小括号 ( ) 包起来;
  • 硬盘以 hd 表示,后面会接一组数字;
  • 以『搜寻顺序』做为硬盘的编号!(这个重要!)
  • 第一个搜寻到的硬盘为 0 号,第二个为 1 号,以此类推;
  • 每颗硬盘的第一个 partition 代号为 1 ,依序类推。

所以说,第一颗『搜寻到的硬盘』代号为:『(hd0)』,而该颗硬盘的第一号分区槽为『(hd0,1)』

另外,为了区分不同的分区格式,因此磁盘后面的分区号码可以使用类似 msdos1 与gpt1 的方式来调整

最终要记得的是,磁盘的号码是由 0 开始编号,分区槽的号码则与 Linux 一样,是由 1 号开始编号

注意:

跟旧版的 grub 有点不一样,因为旧版的 grub 不论磁盘还是分区槽的起始号码都是 0号,而 grub2 在分区槽的部份是以 1 号开始编! 此外,由于 BIOS 可以调整磁盘的开机顺序,因此上述的磁盘对应的 (hdN) 那个号码 N 是可能会变动的!这要先有概念才行!

所以说,整个硬盘代号为:

硬盘搜寻顺序 在 Grub2 当中的代号
第一颗(MBR) (hd0) (hd0,msdos1) (hd0,msdos2) (hd0,msdos3)....
第二颗(GPT) (hd1) (hd1,gpt1) (hd1,gpt2) (hd1,gpt3)....
第三颗 (hd2) (hd2,1) (hd2,2) (hd2,3)....

/boot/grub2/grub.cfg 配置文件(重点在了解,不要随便改!)

配置文件的内容大致如下:

[root@study ~]# vim /boot/grub2/grub.cfg
# 开始是 /etc/grub.d/00_header 这个脚本执行的结果展示,主要与基础设定与环境有关
### BEGIN /etc/grub.d/00_header ###
set pager=1

if [ -s $prefix/grubenv ]; then
load_env
fi
.....(中间省略).....
if [ x$feature_timeout_style = xy ] ; then
	set timeout_style=menu
	set timeout=5
# Fallback normal timeout code in case the timeout_style feature is
# unavailable.
else
	set timeout=5
fi
### END /etc/grub.d/00_header ###

# 开始执行 /etc/grub.d/10_linux,主要针对实际的 Linux 核心文件的开机环境
### BEGIN /etc/grub.d/10_linux ###
menuentry 'CentOS Linux 7 (Core), with Linux 3.10.0-229.el7.x86_64' --class rhel fedora \
--class gnu-linux --class gnu --class os --unrestricted $menuentry_id_option \
'gnulinux-3.10.0-229.el7.x86_64-advanced-299bdc5b-de6d-486a-a0d2-375402aaab27' {
	load_video
	set gfxpayload=keep
	insmod gzio
	insmod part_gpt
	insmod xfs
	set root='hd0,gpt2'
	if [ x$feature_platform_search_hint = xy ]; then
		search --no-floppy --fs-uuid --set=root --hint='hd0,gpt2' 94ac5f77-cb8a-495e-a65b-...
	else
		search --no-floppy --fs-uuid --set=root 94ac5f77-cb8a-495e-a65b-2ef7442b837c
	fi
	linux16 /vmlinuz-3.10.0-229.el7.x86_64 root=/dev/mapper/centos-root ro \
			rd.lvm.lv=centos/root rd.lvm.lv=centos/swap crashkernel=auto rhgb quiet \
			LANG=zh_TW.UTF-8
	initrd16 /initramfs-3.10.0-229.el7.x86_64.img
}
### END /etc/grub.d/10_linux ###
.....(中间省略).....

### BEGIN /etc/grub.d/30_os-prober ###
### END /etc/grub.d/30_os-prober ###

### BEGIN /etc/grub.d/40_custom ###
### END /etc/grub.d/40_custom ###
.....(底下省略)....

基本上,grub2 不希望你自己修改 grub.cfg 这个配置文件取而代之的是修改几个特定的配置文件之后由 grub2-mkconfig 这个指令来产生新的 grub.cfg 文件。不过,你还是得要了解一下 grub2.cfg的大致内容。

grub.cfg 最开始的部份,其实大多是环境设定与默认值设定等,比较重要的当然是默认由哪个选项开机 (set default) 以及预设的秒数 (set timeout)再来则是每一个选单的设定,就是在『 menuentry 』这个设定值之后的项目

在 menuentry 之后会有几个项目的规范,包括『 --class, --unrestricted --id 』等等的指定项目,之后透过『 { } 』将这个选单会用到的数据框起来,在选择这个选单之后就会进行括号内的动作的意思。如果真的点选了这个选单,那 grub2 首先会加载模块,例如上表中的『 load_video, insmod gzio,insmod part_gpt, insmod xfs 』等等的项目, 都是在加载要读取核心文件所需要的磁盘、分区槽、文件系统、解压缩等等的驱动程序。之后就是三个比较重要的项目:

  • set root='hd0,gpt2'

这 root 是指定 grub2 配置文件所在的那个装置。以我们的测试机来说,当初安装的时候分区出 / 与 /boot两个装置,而 grub2 是在 /boot/grub2 这个位置上, 而这个位置的磁盘文件名为 /dev/vda2 ,因此完整的 grub2 磁盘名称就是 (hd0,2) 啰!因为我们的系统用的是 GTP 的磁盘分区格式, 因此全名就是『 hd0,gpt2 』

  • linux16 /vmlinuz-... root=/dev/mapper/centos-root ...

这个就是 Linux 核心文件以及核心执行时所下达的参数。你应该会觉得比较怪的是,我们的核心文件不是/boot/vmlinuz-xxx 吗? 怎么这里的设定会是在根目录呢?这个跟上面的 root 有关!大部分的系统大多有 /boot 这个分区槽,如果 /boot 没有分区, 那会是怎么回事呢?我们用底下的迭代来说明一下:

  • 如果没有 /boot 分区,仅有 / 分区:所以档名会这样变化:

    /boot/vmlinuz-xxx --> (/)/boot/vmlinuz-xxx --> (hd0,msdos1)/boot/vmlinuz-xxx

  • 如果 /boot 是独立分区,则档名的变化会是这样:

    /boot/vmlinuz-xxx --> (/boot)/vmlinuz-xxx --> (hd0,msdos1)/vmlinuz-xxx

因此,这个 linux16 后面接的档名得要跟上面的 root 搭配在一起,才是完整的绝对路径文件名;

至于 linux16 /vmlinuz-xxx root=/file/name 那个 root 指的是『 linux 文件系统中,根目录是在哪个装置上』的意思;从本章一开始的开机流程中,我们就知道核心会主动去挂载根目录,并且从根目录中读取配置文件, 再进一步开始开机流程。所以,核心文件后面一定要接根目录的装置;我们从/etc/fstab 里面也知道根目录的挂载可以是装置文件名、 UUID 与 LABEL 名称,因此这个 root 后面也是可以带入类似 root=UUID=1111.2222.33... 之类的模式 。

  • initrd16 /initramfs-3.10...

这个就是 initramfs 所在的檔名,跟 linux16 那个 vmlinuz-xxx 相同,这个档名也是需要搭配『 set root=xxx 』那个项目的装置, 才会得到正确的位置

grub2 配置文件维护 /etc/default/grub 与 /etc/grub.d

前面谈到的是 grub2 的主配置文件 grub.cfg 约略的内容,但是因为该文件的内容太过复杂,数据量非常庞大,grub2 官方说明不建议我们手动修改! **而是应该要透过 /etc/default/grub 这个主要环境配置文件与 /etc/grub.d/ 目录内的相关配置文件来处理比较妥当 ** 。

/etc/default/grub 主要环境配置文件

[root@study ~]# cat /etc/default/grub
GRUB_TIMEOUT=5 				    # 指定预设倒数读秒的秒数
GRUB_DEFAULT=saved 			    # 指定预设由哪一个选单来开机,预设开机选单之意
GRUB_DISABLE_SUBMENU=true 		# 是否要隐藏次选单,通常是藏起来的好!
GRUB_TERMINAL_OUTPUT="console"   # 指定数据输出的终端机格式,默认是透过文字终端机
GRUB_CMDLINE_LINUX="rd.lvm.lv=centos/root rd.lvm.lv=centos/swap crashkernel=auto rhgb quiet"
								# 就是在 menuentry 括号内的 linux16 项目后续的核心参数
GRUB_DISABLE_RECOVERY="true" 	  # 取消救援选单的制作

详细配置可以通过 info grub 查看;比较重要的设置项目如下:

  • 倒数时间参数: GRUB_TIMEOUT :

这个设定值相当简单,后面就是接你要倒数的秒数即可~例如要等待 30 秒,就在这边改成
『GRUB_TIMEOUT=30』即可!如果不想等待则输入 0 , 如果一定要使用者选择,则填 -1 即可!

  • 是否隐藏选单项目:GRUB_TIMEOUT_STYLE:

这个项目可选择的设定值有 menu, countdown, hidden 等等。如果没有设定,预设是 menu 的意思。这个项目主要是在设定要不要显示选单! 如果你不想要让使用者看到选单,这里可以设定为countdown!那 countdown 与 hidden 有啥差异呢?countdown 会在屏幕上显示剩余的等待秒数,而 hidden 则空空如也~除非你有特定的需求,否则这里建议设定为 menu 较佳 。

  • 讯息输出的终端机模式:GRUB_TERMINAL_OUTPUT:

这个项目是指定输出的画面应该使用哪一个终端机来显示的意思,主要的设定值有『 console, serial,gfxterm, vga_text 』等等。 除非有特别的需求,否则一般使用 console 即可!

  • 默认开机选单项目:GRUB_DEFAULT

这个项目在指定要用哪一个选单 (menuentry) 来作为默认开机项目的意思。能使用的设定值包括有『 saved, 数字, title 名, ID 名』等等。 假设你有三笔 menuentry 的项目大约像这样:

menuentry '1st linux system' --id 1st-linux-system { ...}
menuentry '2nd linux system' --id 2nd-linux-system { ...}
menuentry '3rd win system' --id 3rd-win-system { ...}

几个常见的设定值是这样的:

[root@study ~]#
GRUB_DEFAULT=1
	代表使用第二个 menuentry 开机,因为数字的编号是以 0 号开始编的!
GRUB_DEFAULT=3rd-win-system
	代表使用第三个 menuentry 开机,因为里头代表的是 ID 的项目!它会找到 --id 喔!
GRUB_DEFAULT=saved
	代表使用 grub2-set-default 来设定哪一个 menuentry 为默认值的意思。通常预设为 0

一般来说,预设就是以第一个开机选单来作为默认项目,如果想要有不同的选单设定,可以在这个项目填选所需要的 --id 即可。 当然啦,你的 id 就应该不要重复。

  • 核心的外加参数功能:GRUB_CMDLINE_LINUX

如果你的核心在启动的时候还需要加入额外的参数,就在这里加入吧!举例来说,如果你除了预设的核心参数之外,还需要让你的磁盘读写机制为 deadline 这个机制时, 可以这样处理:

GRUB_CMDLINE_LINUX="..... crashkernel=auto rhgb quiet elevator=deadline

在暨有的项目之后加上如同上表的设定,这样就可以在开机时额外的加入磁盘读写的机制项目设定了!

  • 总结:

这个主要环境配置文件编写完毕之后,必须要使用 grub2-mkconfig 来重建 grub.cfg 才行喔!因为主配置文件就是 grub.cfg 而已, 我们是透过许多脚本的协力来完成 grub.cfg 的自动建置。当然啰,额外自己设定的项目,就是写入 /etc/default/grub 文件内就是了。

选单建置的脚本 /etc/grub.d/*

你应该会觉得很奇怪, grub2-mkconfig 执行之后,屏幕怎么会主动的去抓到 linux 的核心,还能够找到对应核心版本的 initramfs 呢? 怎么这么厉害?其实 grub2-mkconfig 会去分析 /etc/grub.d/*里面的文件,然后执行该文件来建置 grub.cfg 。

一般来说,该目录下会有这些文件存在:

  • 00_header:主要在建立初始的显示项目,包括需要加载的模块分析、屏幕终端机的格式、倒数秒数、选单是否需要隐藏等等,大部分在 /etc/default/grub 里面所设定的变量,大概都会在这个脚本当中被利用来重建grub.cfg 。
  • 10_linux:根据分析 /boot 底下的文件,尝试找到正确的 linux 核心与读取这个核心需要的文件系统模块与参数等,都在这个脚本运作后找到并设定到 grub.cfg 当中。 因为这个脚本会将所有在 /boot 底下的每一个核心文件都对应到一个选单,因此核心文件数量越多,你的开机选单项目就越多了。 如果未来你不想要旧的核心出现在选单上,那可以透过移除旧核心来处理即可。
  • 30_os-prober:这个脚本默认会到系统上找其他的 partition 里面可能含有的操作系统,然后将该操作系统做成选单来处理就是了。如果你不想要让其他的操作系统被侦测到并拿来开机,那可以在 /etc/default/grub 里面加上『 GRUB_DISABLE_OS_PROBER=true 』取消这个文件的运作。
  • 40_custom:如果你还有其他想要自己手动加上去的选单项目,或者是其他的需求,那么建议在这里补充即可!

所以,一般来说,我们会更动到的就是仅有 40_custom 这个文件即可。那这个文件内容也大多在放置管理员自己想要加进来的选单项目就是了。 好了,那问题来了,我们知道 menuentry 就是一个选单,那后续的项目有哪些东西呢?简单的说,就是这个 menuentry 有几种常见的设定? 亦即是menuentry 的功能啦!常见的有这几样:

  • 直接指定核心开机

    基本上如果是 Linux 的核心要直接被用来开机,那么你应该要透过 grub2-mkconfig 去抓
    10_linux 这个脚本直接制作即可,因此这个部份你不太需要记忆! 因为在 grub.cfg 当中就已经
    是系统能够捉到的正确的核心开机选单了!不过如果你有比较特别的参数需要进行呢?这时候你
    可以这样作: (1)先到 grub.cfg 当中取得你要制作的那个核心的选单项目,然后将它复制到
    40_custom 当中 (2)再到 40_custom 当中依据你的需求修改即可。

  • 透过 chainloader 的方式移交 loader 控制权

所谓的 chain loader (开机管理程序的链结) 仅是在将控制权交给下一个 boot loader 而已, 所以grub2 并不需要认识与找出 kernel 的檔名 ,『 他只是将 boot 的控制权交给下一个 boot sector 或MBR 内的 boot loader 而已 』 所以通常他也不需要去查验下一个 boot loader 的文件系统!

一般来说, chain loader 的设定只要两个就够了,一个是预计要前往的 boot sector 所在的分区槽代号, 另一个则是设定 chainloader 在那个分区槽的 boot sector (第一个扇区) 上!假设我的Windows 分区槽在 /dev/sda1 ,且我又只有一颗硬盘,那么要 grub 将控制权交给 windows 的loader 只要这样就够了:

menuentry "Windows" {
    insmod chain # 你得要先加载 chainloader 的模块对吧?
    insmod ntfs # 建议加入 windows 所在的文件系统模块较佳!
    set root=(hd0,1) # 是在哪一个分区槽~最重要的项目!
    chainloader +1 # 请去 boot sector 将 loader 软件读出来的意思!
}

透过这个项目我们就可以让 grub2 交出控制权了!

initramfs 的重要性与建立新 initramfs 文件

之前『 boot loader 与 kernel 载入』的地方已经提到过 initramfs 这玩意儿,他的目的在于提供开机过程中所需要的最重要核心模块,以让系统开机过程可以顺利完成。 会需要initramfs 的原因,是因为核心模块放置于 /lib/modules/$(uname -r)/kernel/ 当中, 这些模块必须要根目录 (/) 被挂载时才能够被读取。但是如果核心本身不具备磁盘的驱动程序时, 当然无法挂载根目录,也就没有办法取得驱动程序,因此造成两难的地步。

initramfs 可以将 /lib/modules/.... 内的『开机过程当中一定需要的模块』包成一个文件 (檔名就是initramfs)然后在开机时透过主机的 INT 13 硬件功能将该文件读出来解压缩并且 initramfs 在内存内会仿真成为根目录由于此虚拟文件系统 (Initial RAM Disk) 主要包含磁盘与文件系统的模块,因此我们的核心最后就能够认识实际的磁盘,那就能够进行实际根目录的挂载!所以说:『initramfs内所包含的模块大多是与开机过程有关,而主要以文件系统及硬盘模块 (如 usb, SCSI 等) 为主

一般来说,需要 initramfs 的时刻为:

  • 根目录所在磁盘为 SATA、USB 或 SCSI 等连接接口;
  • 根目录所在文件系统为 LVM, RAID 等特殊格式;
  • 根目录所在文件系统为非传统 Linux 认识的文件系统时;
  • 其他必须要在核心加载时提供的模块。

比较早期的硬件, 使用的是 IDE 接口的硬盘而且并没有使用 LVM 等特殊格式的文件系统而 Linux 核心本身就认识 IDE 接口的磁盘, 因此不需要 initramfs 也可以顺利开机完成的自从 SATA 硬盘流行起来后,没有 initramfs 就没办法开机了因为 SATA 硬盘使用的是 SCSI 模块来驱动的,而 Linux 默认将 SCSI 功能编译成为模块....

一般来说,各 distribution 提供的核心都会附上 initramfs 文件,但如果妳有特殊需要所以想定制initramfs 文件的话, 可以使用 dracut / mkinitrd 来处理的。

这个文件的处理方式很简单, 通过 man dracut或 man mkinitrd 可以查看具体处理方式;

CentOS 7 应该要使用 dracut 才对,不过 mkinitrd 还是有保留下来, 这里主要是介绍 dracut 。

[root@study ~]# dracut [-fv] [--add-drivers 列表] initramfs 檔名 核心版本
选项与参数:
-f :强迫编译出 initramfs ,如果 initramfs 文件已经存在,则覆盖掉旧文件
-f :显示 dracut 的运作过程
--add-drivers 列表:在原本的默认核心模块中,增加某些你想要的模块!模块位于核心所在目录
			/lib/modules/$(uname -r)/kernel/*
initramfs 檔名 :就是你需要的檔名!开头最好就是 initramfs,后面接版本与功能
核心版本 :预设当然是目前运作中的核心版本,不过你也可以手动输入其他不同版本!
其实 dracut 还有很多功能,例如底下的几个参数也可以参考看看:
--modules :将 dracut 所提供的开机所需模块 (核心核模块) 加载,可用模块在底下的目录内
			/usr/lib/dracut/modules.d/
--gzip|--bzip2|--xz:尝试使用哪一种压缩方式来进行 initramfs 压缩。预设使用 gzip 喔!
--filesystems :加入某些额外的文件系统支持!

范例一:以 dracut 的默认功能建立一个 initramfs 虚拟磁盘文件
[root@study ~]# dracut -v initramfs-test.img $(uname -r)
Executing: /sbin/dracut -v initramfs-test.img 3.10.0-229.el7.x86_64
*** Including module: bash *** # 先加载 dracut 本身的模块支持
*** Including module: nss-softokn ***
*** Including modules done ***
.....(中间省略)..... # 底下两行在处理核心模块
*** Installing kernel module dependencies and firmware ***
*** Installing kernel module dependencies and firmware done ***
.....(中间省略).....
*** Generating early-microcode cpio image *** # 建立微指令集
*** Constructing GenuineIntel.bin ****
*** Store current command line parameters ***
*** Creating image file *** # 开始建立 initramfs 啰!
*** Creating image file done ***

范例二:额外加入 e1000e 网卡驱动与 ext4/nfs 文件系统在新的 initramfs 内
[root@study ~]# dracut -v --add-drivers "e1000e" --filesystems "ext4 nfs" \
> initramfs-new.img $(uname -r)
[root@study ~]# lsinitrd initramfs-new.img | grep -E '(e1000|ext4|nfs)'
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/drivers/net/ethernet/intel/e1000e
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/drivers/net/ethernet/intel/e1000e/e1000e.ko
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/fs/ext4
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/fs/ext4/ext4.ko
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/fs/nfs
usr/lib/modules/3.10.0-229.el7.x86_64/kernel/fs/nfs/nfs.ko
# 你可以看得到,新增的模块现在正在新的 initramfs 当中了呢!很愉快喔!

initramfs 建立完成之后,同时核心也处理完毕后,我们就可以使用 grub2 来建立选单

测试与安装 grub2

如果你的 Linux 主机本来就是使用 grub2 作为 loader 的话,那么你就不需要重新安装 grub2 了,因为 grub2 本来就会主动去读取配置文件; 但如果你的 Linux 原来使用的并非 grub2 ,那么就需要来安装啦!如何安装呢?首先,你必须要使用 grub-install 将一些必要的文件复制到/boot/grub2 里面去,你应该这样做的:

[root@study ~]# grub2-install [--boot-directory=DIR] INSTALL_DEVICE
选项与参数:
--boot-directory=DIR 那个 DIR 为实际的目录,使用 grub2-install 预设会将
grub2 所有的文件都复制到 /boot/grub2/* ,如果想要复制到其他目录与装置去,
就得要用这个参数。
INSTALL_DEVICE 安装的装置代号啦!

范例一:将 grub2 安装在目前系统的 MBR 底下,我的系统为 /dev/vda:
[root@study ~]# grub2-install /dev/vda
# 因为原本 /dev/vda 就是使用 grub2 ,所以似乎不会出现什么特别的讯息。
# 如果去查阅一下 /boot/grub2 的内容,会发现所有的文件都更新了,因为我们重装了!
# 但是注意到,我们并没有配置文件喔!那要自己建立!

基本上,grub2-install 大概仅能安装 grub2 主程序与相关软件到 /boot/grub2/ 那个目录去,如果后面的装置填的是整个系统 (/dev/vda, /dev/sda...), 那 loader 的程序才会写入到 MBR 里面去。如果是XFS 文件系统的 /dev/vda2 装置的话 (个别 partition),那 grub2-install 就会告诉你, 该文件系统并不支持 grub2 的安装;也就是你不能用 grub2-install 将你的主程序写入到 boot sector 里头去的意思;但是可以强制安装;方法如下:

# 尝试看一下你的系统中有没有其他的 xfs 文件系统,且为传统的 partition 类型?
[root@study ~]# df -T |grep -i xfs
/dev/mapper/centos-root xfs 10475520 4128728 6346792 40% /
/dev/mapper/centos-home xfs 5232640 665544 4567096 13% /home
/dev/mapper/raidvg-raidlv xfs 1558528 33056 1525472 3% /srv/raidlvm
/dev/vda2 xfs 1038336 144152 894184 14% /boot
/dev/vda4 xfs 1038336 63088 975248 7% /srv/myproject
# 看起来仅有 /dev/vda4 比较适合做个练习的模样了!来瞧瞧先!

# 将 grub2 的主程序安装到 /dev/vda4 去看看!
[root@study ~]# grub2-install /dev/vda4
Installing for i386-pc platform.
grub2-install: error: hostdisk//dev/vda appears to contain a xfs filesystem which isn't
known to reserve space for DOS-style boot. Installing GRUB there could result in
FILESYSTEM DESTRUCTION if valuable data is overwritten by grub-setup (--skip-fs-probe
disables this check, use at your own risk).
# 说是 xfs 恐怕不能支持你的 boot sector 概念!这个应该是误判!所以我们还是给它强制装一下!

[root@study ~]# grub2-install --skip-fs-probe /dev/vda4
Installing for i386-pc platform.
grub2-install: warning: File system ‘xfs’ doesn't support embedding.
grub2-install: warning: Embedding is not possible. GRUB can only be installed in this
setup by using blocklists. However, blocklists are UNRELIABLE and their use is
discouraged..
grub2-install: error: will not proceed with blocklists.
# 还是失败!因为还是担心 xfs 被搞死~好!没问题!加个 --force 与 --recheck 重新处理一遍!

[root@study ~]# grub2-install --force --recheck --skip-fs-probe /dev/vda4
Installing for i386-pc platform.
grub2-install: warning: File system ‘xfs’ doesn't support embedding.
grub2-install: warning: Embedding is not possible. GRUB can only be installed in this
setup by using blocklists. However, blocklists are UNRELIABLE and their use is
discouraged..
Installation finished. No error reported.
# 注意看!原本是无法安装的错误,现在仅有 warning 警告讯息,所以这样就安装到 partition 上了!

上面这样就将 grub2 的主程序安装到 /dev/vda4 以及重新安装到 MBR 里面去了。现在来思考一下,我们知道 grub2 主程序会去找 grub.cfg 这个文件,大多是在 /boot/grub2/grub.cfg 里面,那有趣了,我们的 MBR 与 /dev/vda4 都是到 /boot/grub2/grub.cfg 去抓设定吗? 如果是多重操作系统那怎办?这就需要重新进入新系统才能够安装!

最后总结一下:

  1. 如果是从其他 boot loader 转成 grub2 时,得先使用 grub2-install 安装 grub2 配置文件;
  2. 承上,如果安装到 partition 时,可能需要加上额外的许多参数才能够顺利安装上去!
  3. 开始编辑 /etc/default/grub 及 /etc/grub.d/* 这几个重要的配置文件;
  4. 使用 grub2-mkconfig -o /boot/grub2/grub.cfg 来建立开机的配置文件!

开机前的额外功能修改

事实上,前几个小节设定好之后,你的 grub2 就已经在你的 Linux 系统上面了,而且同时存在于MBR 与 boot sector 当中呢!所以,我们已经可以重新启动来查阅看看啦! 另外,如果你正在进行开机,那么请注意,我们可以在预设选单 (范例当中是 40 秒) 按下任意键,还可以进行 grub2的『在线编修』功能;开机画面如下:
在这里插入图片描述

由于预设选单就没有隐藏,因此你会直接看到这 5 个选单而已,同时会有读秒的咚咚在倒数。 选单部分的画面其实就是 menuentry 后面的文字啦!你现在知道如何修改 menuentry 后面的文字了吧!

然后如果你点选了『Goto MBR』与『Goto /dev/vda4』时,怪了!怎么发现到选单又重新回来了呢? 这是因为这两个 Goto 的选单都是重新读取主配置文件,而 MBR 与 /dev/vda4 配置文件的读取都是来自(/dev/vda2)/boot/grub2/grub.cfg 的缘故!因此这个画面就会重复出现了 。

另外,如果你再仔细看的话,会发现到上图中底部还有一些细部的选项,似乎有个 'e' edit 的样子!没错~ grub2 支持在线编修指令;这是个很有用的功能!假如刚刚你将 grub.cfg 的内容写错了,导致出现无法开机的问题时, 我们可以查阅该 menuentry 选单的内容并加以修改。

举例来说,我想要知道第一个选单的实际内容时,将反白光棒移动到第一个选单, 再按下 'e' 会进入如下画面:
在这里插入图片描述

因为 CentOS 7 预设没有提供美美的底图给我们使用,因此这里会看到无法分辨的两个区块!事实上它真的是两个区块, 上方是实际你可以编辑的内容区段,仔细看,这不就是我们在 grub.cfg 里面设定的东西吗?没错!此时你还可以继续进一步修改,用上/下/左/右按键到你想要编辑的地方,直接删除、新增即可!

至于下方画面则仅是一些编辑说明,重点在告诉你,编辑完毕之后,若想要取消而回到前一个画面,请使用 [crtl]+c 或者是 [esc] 回去, 若是修改完毕,想要直接开机时,请使用 [crtl]+x 来开机。

关于开机画面与终端机画面的图形显示方式

如果你想要让你的开机画面使用图形显示方式,例如使用中文来显示你的画面啊!因为我们预设的locale 语系就是 zh_TW.utf8 嘛! 所以理论上 grub2 会显是中文出来才对啊!有没有办法达成呢?是有的~透过图形显是的方法即可!不过, 我们得要重新修改 grub.cfg 才行喔!依据底下的方式来处理:

# 先改重要的配置文件
[root@study ~]# vim /etc/default/grub
.....(前面省略).....
GRUB_TERMINAL=gfxterm # 设定主要的终端机显示为图形界面!
GRUB_GFXMODE=1024x768x24 # 图形界面的 X, Y, 彩度资料
GRUB_GFXPAYLOAD_LINUX=keep # 保留图形界面,不要使用 text 喔!

# 重新建立配置文件
[root@study ~]# grub2-mkconfig -o /boot/grub2/grub.cfg

再次的重新启动,这时你会看到有点像底下的模样的画面
在这里插入图片描述

未来如果你有需要在你的开机选单当中加入许多属于你自己的公司/企业的画面, 可以依次设置。

开机过程的问题解决

很多时候,我们可能因为做了某些设定,或者是因为不正常关机 (例如未经通知的停电等等) 而导致系统的 filesystem 错乱,此时,Linux 可能无法顺利开机成功;不需要重装系统,进入 rescue 模式去处理就可以。

忘记 root 密码的解决之道

如果连 root 的密码都忘记了 ,怎么办?

其实在 Linux 环境中 root 密码忘记时还是可以救回来的!只要能够进入并且挂载 / , 然后重新设定一下 root 的密码,就救回来。

只是新版的 systemd 的管理机制中,默认的 rescue 模式是无法直接取得 root 权限的!还是得要使用 root 的密码才能够登入 rescure 环境

还是有办法的,透过一个名为『 rd.break 』的核心参数来处理即可喔!只是需要注意的是, rd.break 是在 Ram Disk 里面的操作系统状态,因此你不能直接取得原本的 linux 系统操作环境。所以,还需要 chroot 的支持! 更由于 SELinux 的问题,你可能还得要加上某些特殊的流程才能顺利的搞定 root 密码的救援。

示例如下:

(1)按下 systemctl reboot 来重新启动,

(2)进入到开机画面,在可以开机的选单上按下 e 来进入编辑模式, 然后就在 linux16 的那个核心项目上面使用这个参数来处理:
在这里插入图片描述

改完之后按下 [crtl]+x 开始开机,开机完成后屏幕会出现如下的类似画面,此时请注意,你应该是在RAM Disk 的环境,并不是原本的环境, 因此根目录底下的东西跟你原本的系统无关!而且,你的系统应该会被挂载到 /sysroot 目录下,因此,你得要这样作:

Generating "/run/initramfs/rdsosreport.txt"

Enter emergency mode. Exit the shell to continue.
Type "journalctl" to view system logs.
You might want to save "/run/initramfs/rdsosreport.txt" to a USB stick or /boot
after mounting them and attach it to a bug report.

switch_root:/# 			# 无须输入密码即可取得 root 权限!
switch_root:/# mount #   检查一下挂载点!一定会发现 /sysroot 才是对的!
.....(前面省略).....
/dev/mapper/centos-root on /sysroot type xfs (ro,relatime,attr,inode64,noquota)
switch_root:/# mount -o remount,rw /sysroot 	# 要先让它挂载成可擦写!
switch_root:/# chroot /sysroot 					# 实际切换了根目录的所在!取回你的环境了!
sh-4.2# echo "your_root_new_pw" | passwd --stdin root
sh-4.2# touch /.autorelabel 					# 很重要!变回 SELinux 的安全本文~
sh-4.2# exit
switch_root:/# reboot

关键问题为:(1)chroot 是啥? (2)为何需要 /.autorelabel这个文件?

  • chroot 目录:代表将你的根目录『暂时』切换到 chroot 之后所接的目录。因此,以上表为例,那个/sysroot将会被暂时作为根目录, 而我们知道那个目录其实就是最原先的系统根目录,所以你当然就能够用来处理你的文件系统与相关的账号管理!
  • 为何需要 /.autorelabel:在 rd.break 的 RAM Disk 环境下,系统是没有 SELinux 的,而你刚刚更改了/etc/shadow (因为改密码啊!), 所以『这个文件的 SELinux 安全本文的特性将会被取消』!如果你没有让系统于开机时自动的回复 SELinux 的安全本文, 你的系统将产生『无法登入』的问题 (在 SELinux 为Enforcing 的模式下!)加上 /.autorelabel 就是要让系统在开机的时候自动的使用预设的 SELinux type 重新写入 SELinux 安全本文到每个文件去。

不过加上 /.autorelabel 之后,系统在开机就会重新写入 SELinux 的 type 到每个文件,因此会花不少的时间喔!如果你不想要花太多时间, 还有个方法可以处理:

  • 在 rd.break 模式下,修改完 root 密码后,将 /etc/selinux/config 内的 SELinux 类型改为 permissive
  • 重新启动后,使用 root 的身份下达『 restorecon -Rv /etc 』仅修改 /etc 底下的文件;
  • 重新修改 /etc/selinux/config 改回 enforcing ,然后『 setenforce 1 』即可!

直接开机就以 root 执行 bash 的方法

除了上述的 rd.break 之外,我们还可以直接开机取得系统根目录后,让系统直接丢一个 bash 给我们使用喔! 使用的方法很简单,就同样在开机的过程中,同在 linux16 的那一行,最后面不要使用rd.break 而是使用『 init=/bin/bash 』即可! 最后开机完成就会丢一个 bash 给我们!同样不需要 root密码而有 root 权限!

但是要完整的操作该系统是不可能的,因为我们将 PID 一号更改为 bash !所以,最多还是用在救援方面就是了! 而且,同样的,要操作该系统你还是得要 remount 根目录才行啊!否则无法更改文件系统啦!基本上,这个系统的处理方法你应该是要这样作的:
在这里插入图片描述

如上图的完整截图,你会发现由于是最预设的 bash 环境,所以连 PATH 都仅有 /bin 而已~所以你不能下达 reboot !同时, 由于没有 systemd 或者是 init 的存在,所以真的使用绝对路径来下达reboot 时,系统也是无法协助你重新启动啦! 此时只能按下 reset 或者是强制关机后,才能再次开机!所以...感觉上还是 rd.break 比较保险...

鸟哥上面刻意忘记处理 /.autorelabel 的文件建置~你如果按照鸟哥上述的方法实作的话此时应该是无法登入的;请重新启动进入 rd.break 模式,然后使用 SELinux 改为 permissive;等到可以顺利以 root 登入系统后, 使用 restorecon -Rv /etc 来瞧一瞧,应该会像底下这样:

[root@study ~]# getenforce
Permissive

[root@study ~]# restorecon -Rv /etc
restorecon reset /etc/shadow context system_u:object_r:unlabeled_t:s0
	->system_u:object_r:shadow_t:s0
restorecon reset /etc/selinux/config context system_u:object_r:unlabeled_t:s0
	->system_u:object_r:selinux_config_t:s0

[root@study ~]# vim /etc/selinux/config
SELINUX=enforcing

[root@study ~]# setenforce 1

因文件系统错误而无法开机

如果因为设定错误导致无法开机时,要怎么办啊?这就更简单了!最容易出错的设定而导致无法顺利开机的步骤,通常就是 /etc/fstab 这个文件了,尤其是使用者在实作 Quota/LVM/RAID 时,最容易写错参数, 又没有经过 mount -a 来测试挂载,就立刻直接重新启动。

这种情况的问题大多如下面的画面所示:
在这里插入图片描述

看到最后两行,他说可以输入 root 的密码继续加以救援喔!那请输入 root 的密码来取得 bash 并以mount -o remount,rw / 将根目录挂载成可擦写后,继续处理 ;

其实会造成上述画面可能的原因除了/etc/fstab 编辑错误之外,如果你曾经不正常关机后,也可能导致文件系统不一致 (Inconsistent) 的情况, 也有可能会出现相同的问题啊!如果是扇区错乱的情况,请看到上图中的第二行处, fsck 告知其实是 /dev/md0 出错, 此时你就应该要利用 fsck.ext3 去检测 /dev/md0 才是!等到系统发现错误,并且出现『clear [Y/N]』时,输入『 y 』

当然啦,如果是 XFS 文件系统的话,可能就得要使用 xfs_repair 这个指令来处理。这个fsck/xfs_repair 的过程可能会很长,而且如果你的 partition 上面的 filesystem 有过多的数据损毁时,即使 fsck/xfs_repair 完成后,可能因为伤到系统槽,导致某些关键系统文件数据的损毁,那么依旧是无法进入 Linux 的。

此时,就好就是将系统当中的重要数据复制出来,然后重新安装,并且检验一下,是否实体硬盘有损伤的现象才好!不过一般来说,不太可能会这样啦~ 通常都是文件系统处理完毕后,就能够顺利再次进入 Linux 了。