Shell命令--find

发布时间 2023-04-18 16:26:56作者: 时间在哪

1. 功能说明

在目录中递归处理文件,默认在当前目录 。

2. 语法格式

find [-H] [-L] [-P] [-D debugopts] [-Olevel] [path...] [expression]
搜索目录树上的每一个文件名,它从左至右运算给定的表达式,按照优先级进行匹配,直到得出结果(左边运算在 '与' 操作中得出假, 在'或' 操作中得出真),然后移向下一个文件名。
第一个以 '-' , '(' , ')' , ',' 或 '!' 这些字符起始的参数是表达式的开始; 在它之前的任何参数是要搜索的路径,在它之后的任何参数都是表达式的余下部分。 如果没有路径参数,缺省用当前目录。如果没有表达式,缺省表达式 用 '-print'。

3. 表达式

表达式是由选项(选项总是影响所有的操作, 而不仅仅是一个指定的文件的处理, 而且总是返回真值),测试(返回一个真值或假值),还有动 作(动作有side effects, 返回一个真值或假值) 组成。
它们都以运算符分开,忽略运算符的时候,默认使用 -and 连接。如果表达式没有包含 -prune 以外的动作,当表达式为真时会执行 -print 动作。

3.1 选项

-d                       -depth的简写,先处理目录的内容,再处理目录的本身;
-daystart                搭配(-amin, -atime, -cmin, -ctime, -mmin, -mtime)使用。
-maxdepth levels         进入命令行参数指定的目录下层目录时,最深不超过levels(一个非负整数) 层。
范例:
[root@citta00 shell]# find -maxdepth 0 -name "*.c"
[root@citta00 shell]# find -maxdepth 1 -name "*.c"
./t0.c
[root@citta00 shell]# find -maxdepth 2 -name "*.c"
./t1/t1.c
./t0.c
[root@citta00 shell]# find -maxdepth 3 -name "*.c"
./t1/t1.c
./t1/t2/t2.c
./t0.c

-mindepth levels    不在levels(一个非负整数)层之内执行任何测试和动作。
范例:
[root@citta00 shell]# find -mindepth 0 -name "*.c"
./t1/t1.c
./t1/t2/t2.c
./t0.c
[root@citta00 shell]# find -mindepth 1 -name "*.c"
./t1/t1.c
./t1/t2/t2.c
./t0.c
[root@citta00 shell]# find -mindepth 2 -name "*.c"
./t1/t1.c
./t1/t2/t2.c
[root@citta00 shell]# find -mindepth 3 -name "*.c"
./t1/t2/t2.c

3.2 测试

-amin/-atime       文件最后一次访问的时间:-amin以分钟为单位,-atime以天数为单位。
-cmin/-ctime       文件状态最后一次改变的时间:-cmin以分钟为单位,-ctime以天数为单位。
-mmin/-mtime       文件内容最后一次改变的时间:-mmin以分钟为单位,-mtime以天数为单位。
min                从当前时刻开始,往前60s为一分钟。
time                从当前时刻开始,往前24h为一天,如果和-daystart一起使用,则是从今日凌晨开始。
范例:每15s产生一个新文件
date && find -amin 1
Sun Mar  5 15:13:45 CST 2023
./t0_1315.c
./t0_1330.c
./t0_1345.c
date && find -amin 2
Sun Mar  5 15:13:45 CST 2023
./t0_1215.c
./t0_1230.c
./t0_1245.c
date && find -amin -2
Sun Mar  5 15:13:45 CST 2023
./t0_1145.c
./t0_1215.c
./t0_1230.c
./t0_1245.c
./t0_1315.c
./t0_1330.c
./t0_1345.c
date && find -amin +2
Sun Mar  5 15:13:45 CST 2023
./t0_0945.c
./t0_1015.c
./t0_1030.c
./t0_1045.c
./t0_1115.c
./t0_1130.c
范例:每天产生3个新文件 
find -atime 0    24小时内访问过的文件
Fri Mar  3 06:07:23 CST 2023
./file_2_1212
./file_2_1818
./file_3_0606
find -atime 1    一天前的24小时内访问过的文件
Fri Mar  3 06:07:24 CST 2023
./file_1_1212
./file_1_1818
./file_2_0606
find -atime +1    两天前访问过的文件
Fri Mar  3 06:07:25 CST 2023
./file_1_0606
find -atime -1    两天内访问过的文件(在当前时间点后访问过的文件也会搜索到)
Fri Mar  3 06:07:26 CST 2023
./file_1_1212
./file_1_1818
./file_2_0606
./file_2_1212
./file_2_1818
./file_3_0606
./file_3_1212
find -daystart -atime 1    以今天凌晨为起点,24小时内访问过的文件
Fri Mar  3 06:07:28 CST 2023
./file_2_0606
./file_2_1212
./file_2_1818
find -daystart -atime 2    以今天凌晨为起点,一天前的24小时内访问过的文件
Fri Mar  3 06:07:29 CST 2023
./file_1_0606
./file_1_1212
./file_1_1818

-name pattern  指定文件名(不要带目录) 。使用 -prune 来略过一个目录及其中的文件。
-iname pattern  和 -name 类似,但是匹配时是不区分大小写的。
-path pattern   指定路径名,如果要跳过 'src/emacs' 目录和其中所有的文件和子目录,把其他找到的文件打印出来,应当这样:
find . -path './src/emacs' -prune -o -print
-ipath pattern   和 -path 类似,但是匹配时是不区分大小写的。
-size n[ckMG]     使用了 n 个存储单元的文件。默认的单位是512字节的块;n 后面加上 `c' ,代表单位是字节;n 后面加上`k'代表是千字节。
-type c          文件是 c 类型的。类型可取值如下:
    b    特殊块文件(缓冲的)
    c    特殊字符文件(不缓冲)
    d    目录
    p    命名管道 (FIFO)
    f    普通文件
    l    符号链接
    s    套接字
-empty       文件是空的普通文件或者空目录。
下面是-atime/-ctime/-mtime的+n/-n/n使用示意图:

 3.3 动作

-exec command \;     执行 command。如果命令返回状态值0,那么 exec 返回true。所有 find 其余的命令行参数将作为提供给命令的参数,直到遇到一个由 '\;' 组成的参数为止。命令的参数中,字符串 '{}' 将被正在处理的文件名替换。
-fls file            返回true;类似 -ls 但是是把内容写入 file-fprint file         返回true;将文件全名打印到文件 file 中。
-fprint0 file        返回true;类似 -print0 但是像 -fprint 那样写入 file-fprintf file format 返回true;类似 -printf 但是像 -fprint 那样写入 file-ok command ;        类似 -exec 但是会先向用户询问 (在标准输入); 如果回应不是以 'y''Y' 起始则不会运行 command 而是返回false。
-print               返回true;在标准输出打印文件全名,然后是一个换行符。
-print0              返回true;在标准输出打印文件全名,然后是一个null字符。这样可以使得处理 find 的输出的程序可以正确地理解带有换行符的文件名。
-printf format       返回true;指定输出格式 。与 -print 不同的是, -printf 在字符串末端不会添加一个新行。
    \c   立即停止以当前格式输出,刷新输出设备。
    \n   新行
    \r   回车
    \t   水平tab
    \\   输出自身'\'
    \NNN ASCII编码是NNN(八进制)的字符
    在一个 '\' 字符后面使用任何其他字符会被作为普通的字符,因此它们都会被打印出来。
    
    %%输出自身'%'
    %a  文件最后一次访问时间。格式是C函数 'ctime' 返回值的格式。
    %Ak 文件最后一次访问时间。格式以 k 指定,可以是 '@' 或者是C函数 'strftime' 的指令格式。下面列出了 k 可用的值;(有一些并不是在所有系统上都可用,因为不同系统中 'strftime' 也不同。)
        @ 从 Jan. 1, 1970, 00:00 GMT 起的秒数
    时间字段:
        H 小时 (00..23)
        I 小时 (01..12)
        k 小时 ( 0..23)
        l 小时 ( 1..12)
        M 分钟 (00..59)
        p 本地的 AM 或者 PM
        r 12小时格式的时间 (hh:mm:ss [AP]M)
        S 秒 (00..61)
        T 24小时格式的时间 (hh:mm:ss)
        X 本地的时间表示方法 (H:M:S)
    日期字段:
        a 本地一星期中每天的名称的缩写(Sun..Sat)
        A 本地一星期中每天的全名,可变长度 (Sunday..Saturday)
        b 本地每月的名称的缩写 (Jan..Dec)
        B 本地每月的全名,可变长度 (January..December)
        c 本地的日期和时间表示 (Sat Nov 04 12:02:33 EST 1989)
        d 一个月当中的日子 (01..31)
        D 日期 (mm/dd/yy)
        h 与 b 相同
        j 一年当中的日子 (001..366)
        m 月份 (01..12)
        U 以星期日作为每周起始,一年当中的星期 (00..53)
        w 一星期当中的日子 (0..6)
        W 以星期一当作每周起始,一年当中的星期 (00..53)
        x 本地的日期表示 (mm/dd/yy)
        y 年份的最后两位 (00..99)
        Y 年份 (1970...)
    
    %c  文件状态最后一次修改的时间。格式是C函数 'ctime' 返回值的格式。
    %Ck 文件状态最后一次修改的时间。格式以 k 指定,类似于%A。
    %t  文件最后一次修改的时间。格式是C函数 'ctime' 返回值的格式。
    %Tk 文件最后一次修改的时间。格式以 k 指定,类似于%A。
    
    %f  去掉了前面的目录的文件名 (只剩下最后的成分)。
    %h  文件名的前面的目录部分 (仅除去最后的成分)。
    %p  文件名。
    %P  文件名,去掉了据以找到了文件的命令行参数的名称部分。
    %s  文件大小,以字节为单位。
    %u  文件的用户名,如果用户没有名称就是数字形式的用户ID。
    %U  文件的数字形式的用户ID。
    ......
    在一个 '%' 字符后面使用任何其他字符,'%' 将被忽略 (但是其他字符会被打印出来)。
范例:
find  -name "*.c" -printf '%AY-%Am-%Ad %AH:%Ak:%AM %f\n'

-prune 如果没有给出 -depth 则返回 true; 不进入当前目录。如果给出了 -depth 则返回false; 没有效果。
-ls    返回true;以 'ls -dils' 格式在标准输出列出文件。块以1kB 字节为单位计数,除非设置了环境变量POSIXLY_CORRECT,那样的话会使用 512字节的块。

3.4 运算符

以优先级高低顺序排列:
( expr )       强制为优先
! expr        非;如果 exprfalse 则返回 true
-not expr       与 ! expr 相同
expr1 expr2     与(隐含的默认运算符);如果 expr1 为 false 则不会执行 expr2
expr1 -a expr2    与 expr1 expr2 相同
expr1 -and expr2  与 expr1 expr2 相同
expr1 -o expr2   或;如果 expr1 为 true 则不会执行 expr2
expr1 -or expr2  与 expr1 -o expr2 相同
expr1 , expr2    列表;expr1 和 expr2 都会被执行;expr1 的值被忽略,列表的值是 expr2 的值

  • 提示:find: paths must precede expression

# find -name *.c
find: paths must precede expression: t.c
Usage: find [-H] [-L] [-P] [-Olevel] [-D help|tree|search|stat|rates|opt|exec] [path...][expression]
通过man手册发现,这是因为shell会对*.c 扩展,以至find实际接收到的命令像这样的:
[root@citta00 shell]# find -name t0.c t.c
find: paths must precede expression: t.c
Usage: find [-H] [-L] [-P] [-Olevel] [-D help|tree|search|stat|rates|opt|exec] [path...][expression]
shell会发生扩展是因为当前目录有多个.c文件,如果只有单个.c文件,则不会发生这样的问题。
为了避免这种问题,应该改成这样:
find -name "*.c"
find -name \*.c