《Unix/Linux系统编程》教材学习笔记第十章

发布时间 2023-09-23 16:50:35作者: シバ鳥

chapter10


sh编程

sh脚本

包含sh语句的文本文件,命令解释程序sh要执行该语句。
eg.mysh.sh
#! /bin/bash
# comment line
echo hello

使用chmod +x mysh可以执行该文件。
#!开头一般称为shebang,若未指定,则将运行默认sh,即Linux中的/bin/bash。

sh脚本与C程序比较

不难看出两者有一定的相似之处,但是从根本上看还是不同的。
首先,sh是解释程序,逐行读取sh脚本文件并直接执行这些行。如果行是可执行命令且为内置命令,那么sh可直接执行。否则,它会复刻一个子进程执行命令,并等待子进程终止后再继续,这与它执行单个命令行完全一样。子进程终止后再继续,这与它执行单个命令行完全一样。相反,C程序必须先编译链接到一个二进制可执行文件,然后通过主sh的子进程运行二进制可执行文件。其次,在C程序中每个变量必须有一个类型,例如char、int、float、派生类型(如struct)等。相反,在sh脚本中,每个变量都是字符串。因此不需要类型,因为只有一种类型,即字符串。最后,每个C程序必须有一个main()函数,每个函数必须定义一个返回值类型和参数(如有)。相反,sh脚本不需要main函数。在sh脚本中,第一个可执行语句是程序的入口点。

命令行参数

可使用与运行sh命令完全相同的参数调用sh脚本,如:mysh one two three
在sh脚本中,可通过位置参数$0、$1、$2等访问命令行参数。前10个参数可以作为$0~$9被访问。其他参数必须称为${10}~${n},n>10。可通过稍后显示的shift命令查看它们。通常$0为程序名本身,$1到$n是程序的参数。在sh中,可用内置变量$#和$*计数并显示命令行参数。

$#=命令行参数$1到$n的数量
$*=所有命令行参数,包括$0
sh还有与命令执行相关的以下内置变量:
$S=执行sh的进程PID
$?=最后一个命令执行的退出状态(成功为0,否则为非0)

sh变量

sh有许多内置变量,如 PATH、HOME、TERM等。除了内置变量外,用户还可使用任何符号作为sh变量。不需要声明。所有的sh变量值都是字符串。未赋值的sh变量是NULL字符串。sh变量可用以下方法设置或赋值:
variable=string		# NOTE: no white spaces allowed between tokens
如果A是一个变量,则$A是变量的值。

sh中特殊字符的引用

sh中有许多特殊字符,例如:$、/、*、>、<等,要想用作普通字符需要使用\(转义符)或单引号''来引用它们。通常,/用于引用单个字符。单引号用于引用长字符串。单引号内没有替换。双引号用于保留双引号字符串中的空格,但在双引号内会发生替换。

sh语句例子

sh语句包括所有Unix/Linux命令,以及可能的I/O重定向。例如:
ls
ls > outfile
date
cp f1 f2
mkdir newdir
cat < filename
此外,sh编程语言还支持控制sh程序执行的测试条件、循环、case等语句。

sh命令

内置命令

sh有许多内置命令,这些命令由sh执行,不需要创建一个新进程。常用内置sh命令:
.file:读取并执行文件。
break[n]:从最近的第n个嵌套循环中退出。
cd[dirname]:更换目录。
continue[n]:重启最近的第n个嵌套循环。
eval[arg ...]:计算一次参数并让sh执行生成的命令。
exec[arg ...]:通过这个sh执行命令,sh将会推出。
exit[n]:使sh退出,退出状态为n。
export[var ...]:将变量导出到随后执行的命令。
read[var ...]:从stdin中读取一行并为变量赋值。
set[arg ...]:在执行环境中设置变量。
shift:将位置参数 $2 $3...重命名为 $1 $2...。
trap[arg][n]:接收到信号n后执行参数。
umask[ddd]:将掩码设置为八进制数ddd的。
wait[pid]:等待进程pid,如果没有给出pid,则等待所有活动子进程。

read命令:当sh执行read命令时,它会等待来自stdin的输入行,将输入行划分为几个标记,分配给列出的变量。read的一个常见用法是允许用户与正在执行的sh进行交互,例如:
	echo -n "enter yes or no:"	#wait for user input line from stdin
	read ANS					#sh reads a line from stdin
	echo $ANS					#display the input string
在获得输入后,sh可能会测试输入字符串,以决定下一步做什么。

Linux命令

echo:echo只是将参数字符串作为行回显到stdout。它通常将相邻的多个空格压缩为一个空格,除非有引号。

expr:因为所有的sh变量都是字符串,所以不能直接把它们改为数值,但可通过expr命令间接更改sh变量的值(数值),例如:
	I=123
	I=$(expr $I + 1)

管道命令:在sh脚本中经常使用管道作为过滤器,例如:
	ps -ax | grep httpd
	cat file | grep word

其他实用命令
awk:数据处理程序。
cmp:比较两个文件。
comm:选择两个排序文件共有的行。
grep:匹配一系列文件的模式。
diff:找出两个文件的差异。
join:通过使用相同的键来连接记录以比较两个文件。
sed:流或行编辑命令。
sort:排序或合并文件。
tail:打印某个文件的最后n行。
tr:一对一字符翻译。
uniq:从文件中删除连续重复行。

命令替换

在sh中,$A会被替换成A值,同样,当sh遇到'cmd'或$(cmd)时,它会先执行cmd,然后用执行的结果字符串替换$(cmd)。

sh控制语句

1.if-else-fi语句语法:
if[condition]	#NOTE:must have white space between tokens
	then
		statements
	else		#as usual, the else part is optional
		statements
fi				#each if must end with a matching fi
也可以表示为如下:
if[condition]; then
		statements
	else		
		statements
fi				
if-elif-else-fi复合语句:
if[condition1]; then
		commands
	elif[condition2]; then
		commands
	#additional elif[condition3]; then etc.
	else		
		commands
fi		
复合条件:&&和||,但是需要用一对匹配的双括号[[和]]括起来。可以使用()进行条件分组。

2.for语句:
for VARIABLE in string1 string2 .... stringn
	do
		commands
	done
每次迭代中,变量接受一个参数的字符串值,并执行关键字do和done之间的命令。

3.while语句:
while[condition]
	do
		commands
	done
当条件为真时,sh将重复执行do-done关键字中的命令。预计条件会有变化,所以循环将在某个时间点退出。

4.until-do语句:
until[$ANS="give up"]
	do
		echo -n "enter your answer:"
		read ANS
	done

5.case语句:
case $variable in
	pattern1) commands;;	#note the double semicolons;;
	pattern2) command;;
	patternN) command;;
esac

6.continue和break语句
与C语言一样,continue重启最近循环的下一次迭代,break退出最近循环。工作原理与在C语言中完全相同。

I/O重定向

当进入sh命令时,可以指示sh将I/O重定向到除默认stdin、stdout和sterr以外的文件。I/O重定向有以下形式和含义:
>file	stdout转向文件,如果文件不存在,将会创建文件。
>>file	stdout追加到文件。
<file	将文件用作stdin;文件必须存在并具有r权限。
<<word	从“here”文件中获取输入,直到只包含“word”的行。

嵌入文档

可以指示输出命令从stdin获取输入,将其回显到stdout,直到遇到预先安排的关键字。
这些文档通常被称为嵌入文档。它们通常用在sh脚本中,以生成长块的描述性文本,不需要分别回显每一行。

sh函数

sh函数定义:
func()
{
	#function code
}
由于sh逐行执行命令,所以必须在任何可执行语句之前定义sh脚本中的所有函数。与C不同,sh脚本中无法声明函数原型。sh函数调用方式与sh脚本文件的执行方式完全相同。sh语句
	func s1 s2 ... sn
调用sh函数,以参数(字符串)形式传递s1~sn。在被调函数中,参数被引用为$0、$1到$n。通常,$0是函数名,$1到$n是与命令行参数对应的位置参数。函数执行结束时,$?表示其退出状态,如果成功,状态为0,否则,状态为非0。$?值可用函数的显式返回值进行更改。但是,为了测试$?的最后一次执行,必须将其分配给一个变量,然后测试该变量。

sh中的通配符

星号通配符:sh中最有用的通配符是*,可扩展到当前目录中的所有文件。
?通配符:查询某文件名中的字符
[]通配符:查询文件名中一对[]中的字符。

命令分组

在sh脚本中可以用{}或()对命令进行分组。例如:
{ls;mkdir abc;ls;}
(cd newdir;ls;A=value;mkdir $A)
{}命令分组唯一用处是在相同环境下执行这些命令,如为分组中的所有命令重定向I/O
()是更有用的命令分组,由subsh进程执行。subsh进程可在不影响父sh的情况下更改其工作目录,当subsh进程终止时,subsh中的任何赋值变量都不起作用。

eval语句

eval [arg1 arg1 .. argn]
eval是sh的一个内置命令,它由sh自己执行,而不需要复刻新进程。它将输入参数字符串连接到一个字符串中,计算一次,即执行变量和命令替换,然后给出结果字符串供sh执行。
注意:使用eval可省去一些替换语句,但也可能使代码难以理解。因此应当避免使用任何不必要的eval。

调试sh脚本

sh脚本可由带有-x选项的子sh运行,以进行调试,如:
bash -x mysh
子sh将在执行命令之前显示要执行的每个sh命令,包括变量和命令替换。它允许用户跟踪命令执行。如果出现错误,sh将在错误行上停止并显示错误消息。

GPT提问环节

sh脚本

Linux常用命令

在学习中遇到的一些问题

问题1:

在测试sh脚本时出现了如下图报错。

然后我向GPT提出该问题。

仔细检查了代码后,发现并不是真的指中括号有问题,而是我在写if语句时没有给代码封口,即没有加上fi,导致条件语句没有处于闭合,造成语法错误。正确使用了if-fi后就能正常运行sh脚本文件了(错误出现在下图for语句的示例代码中,错误已纠正)。

问题2:

当我运行教材上的示例代码后,结果并没有和教材说的相同,结果如下图。

可以看到,sh脚本正常打印了文件类型,而教材中说即使参数是目录结果始终会得到$A是一个REG文件。到这里我就产生了一些疑惑,但是我想到了教材使用的是14x老版本的Linux系统了,而我使用的是20.04版本的新系统,所以可能是因为老版本的系统会有bug,导致得到的结果有误,然后我向GPT提出了这里的问题,GPT所给的解释如下图。

所以,有时候自己独立思考也是非常重要的。

有关学习中的疑惑和GPT的解答

1.关于单双引号引用

2.关于如何将打印的文件内容显示行号

3.关于编写与进行sh脚本调试的流程

代码实践

课堂代码实践

静态库链接代码

动态库链接代码

教材代码实践

部分代码实践截图如前面知识点总结内容

递归复制文件代码