Shell 接收到用户输入的命令以后,会根据空格将用户的输入,拆分成一个个词元(token)。然后,Shell 会扩展词元里面的特殊字符,扩展完成后才会调用相应的命令。
这种特殊字符的扩展,称为模式扩展(globbing)。其中有些用到通配符,又称为通配符扩展(wildcard expansion)。Bash 一共提供八种扩展。
? 字符扩展* 字符扩展$字符扩展模式扩展与正则表达式的关系是,模式扩展早于正则表达式出现,可以看作是原始的正则表达式。它的功能没有正则那么强大灵活,但是优点是简单和方便。
Bash 允许用户关闭扩展。
1 | $ set -o noglob |
下面的命令可以重新打开扩展。
1 | $ set +o noglob |
~字符扩展~会自动扩展成当前用户的主目录。
1 | [root@dengpangpang ~]$ echo ~ |
~/dir表示扩展成主目录的某个子目录,dir是主目录里面的一个子目录名。
1 | [root@dengpangpang ~]$ echo ~/test |
~user表示扩展成用户user的主目录。
1 | [root@dengpangpang ~]$ echo ~www |
~+会扩展成当前所在的目录,等同于pwd命令。
1 | [root@dengpangpang nginx]$ echo ~+ |
? 字符扩展?字符代表文件路径里面的任意单个字符,不包括空字符。
1 | # 存在文件 a.txt 和 b.txt |
如果匹配多个字符,就需要多个?连用。
1 | # 存在文件 a.txt、b.txt 和 ab.txt |
? 字符扩展属于文件名扩展,只有文件确实存在的前提下,才会发生扩展。如果文件不存在,扩展就不会发生。
1 | # 当前目录为空目录 |
上面例子中,如果?.txt可以扩展成文件名,echo命令会输出扩展后的结果;如果不能扩展成文件名,echo就会原样输出?.txt。
* 字符扩展*字符代表文件路径里面的任意数量的任意字符,包括零个字符。
1 | # 存在文件 a.txt、b.txt 和 ab.txt |
注意:上面的例子,如果文本文件在子目录,*.txt不会产生匹配,必须写成*/*.txt。有几层子目录,就必须写几层星号。
$字符扩展Bash 将美元符号$开头的词元视为变量,将其扩展成变量值,详见《Bash 变量》一章。
1 | $ echo $SHELL |
变量名也可以放在{}里面,${SHELL}同样表示变量,也同样可以扩展。
!表示间接引用。${!string*}或${!string@}返回所有匹配给定字符串string的变量名。
1 | # 下面例子,`${!S*}`扩展成所有以`S`开头的变量名。 |
$(...)可以扩展成另一个命令的运行结果,该命令的所有输出都会作为返回值。
1 | # 下面例子中,$(date)返回`date`命令的运行结果。 |
还有另一种较老的语法,子命令放在反引号之中,也可以扩展成命令的运行结果。
1 | $ echo `date` |
$(...)可以嵌套,比如$(ls $(pwd))。
$((...))可以扩展成整数运算的结果,详见《Bash 的算术运算》一章。
1 | $ echo $((2 + 2)) |
[]扩展[abc]扩展方括号扩展的形式是[...],括号之中的任意一个字符。比如,[aeiou]可以匹配五个元音字母中的任意一个。
(只有文件确实存在的前提下才会扩展。如果文件不存在,就会原样输出)
1 | # 存在文件 a.txt 和 b.txt |
方括号扩展还有两种变体:[^...]和[!...],这两种写法是等价的,它们表示匹配不在方括号里面的字符。
比如,[^abc]或[!abc]表示匹配除了a、b、c以外的字符。
1 | # 存在 aaa、bbb、aba 三个文件,[!a]表示文件名第二个字符不是a的文件名,所以返回了aba和bbb两个文件。 |
注意,如果需要匹配[字符,可以放在方括号内,比如[[aeiou]。如果需要匹配连字号-,只能放在方括号内部的开头或结尾,比如[-aeiou]或[aeiou-]。
[start-end]扩展方括号扩展有一个简写形式[start-end],表示匹配一个连续的范围。比如,[a-c]等同于[abc],[0-9]匹配[0123456789]。
1 | # 存在文件 a.txt、b.txt 和 c.txt |
下面是一些常用简写的例子。
[a-z]:所有小写字母。[a-zA-Z0-9]:所有小写字母、大写字母与数字。[abc]*:所有以a、b、c字符之一开头的文件名。BACKUP.[0-9][0-9][0-9]:所有以BACKUP.开头,后面是三个数字的文件名。这种简写形式有一个否定形式[!start-end],表示匹配不属于这个范围的字符。比如,[!a-zA-Z]表示匹配非英文字母的字符。
1 | $ ls report[!1–3].txt |
{}扩展{a,b,c}扩展大括号扩展{...}表示分别扩展成大括号里面的所有值,各个值之间使用逗号分隔。比如,{1,2,3}扩展成1 2 3。
1 | $ echo {1,2,3} |
注意,大括号扩展不是文件名扩展。它会扩展成所有给定的值,而不管是否有对应的文件存在。
另一个需要注意的地方是,大括号内部的逗号前后不能有空格。否则,大括号扩展会失效。
1 | # 逗号前后有空格,Bash 就会认为这不是大括号扩展,而是三个独立的参数 |
大括号可以嵌套。
1 | $ echo {j{p,pe}g,png} |
大括号也可以与其他模式联用,并且总是先于其他模式进行扩展。
1 | $ echo /bin/{cat,b*} |
{start..end}扩展大括号扩展有一个简写形式{start..end},表示扩展成一个连续序列。
比如,{a..z}可以扩展成26个小写英文字母。这种简写形式同样支持逆序,比如{z..a}
1 | $ echo {a..c} |
注意,如果遇到无法理解的简写,大括号模式就会原样输出,不会扩展。
这种简写形式可以嵌套使用,形成复杂的扩展。
1 | # 大括号扩展的常见用途为新建一系列目录,下面的命令会建立36个目录 |
这个写法的另一个常见用途,是直接用于for循环。下面例子会循环4次。
1 | for i in {1..4} |
这种简写形式还可以使用第二个双点号(start..end..step),用来指定扩展的步长。
1 | # 下面代码将0扩展到8,每次递增的长度为2,所以一共输出5个数字。 |
[[:class:]]表示一个字符类,扩展成某一类特定字符之中的一个。常用的字符类如下。
[[:alnum:]]:匹配任意英文字母与数字[[:alpha:]]:匹配任意英文字母[[:blank:]]:空格和 Tab 键。[[:cntrl:]]:ASCII 码 0-31 的不可打印字符。[[:digit:]]:匹配任意数字 0-9。[[:graph:]]:A-Z、a-z、0-9 和标点符号。[[:lower:]]:匹配任意小写字母 a-z。[[:print:]]:ASCII 码 32-127 的可打印字符。[[:punct:]]:标点符号(除了 A-Z、a-z、0-9 的可打印字符)。[[:space:]]:空格、Tab、LF(10)、VT(11)、FF(12)、CR(13)。[[:upper:]]:匹配任意大写字母 A-Z。[[:xdigit:]]:16进制字符(A-F、a-f、0-9)。字符类的第一个方括号后面,可以加上感叹号!,表示否定。比如,[![:digit:]]匹配所有非数字。
字符类也属于文件名扩展,如果没有匹配的文件名,字符类就会原样输出。
通配符有一些使用注意点,不可不知。
(1)通配符是先解释,再执行。
Bash 接收到命令以后,发现里面有通配符,会进行通配符扩展,然后再执行命令。
1 | $ ls a*.txt |
上面命令的执行过程是,Bash 先将a*.txt扩展成ab.txt,然后再执行ls ab.txt。
(2)文件名扩展在不匹配时,会原样输出。
文件名扩展在没有可匹配的文件时,会原样输出。
1 | # 不存在 r 开头的文件名 |
上面代码中,由于不存在r开头的文件名,r*会原样输出。
下面是另一个例子。
1 | $ ls *.csv |
另外,前面已经说过,大括号扩展{...}不是文件名扩展。
(3)只适用于单层路径。
所有文件名扩展只匹配单层路径,不能跨目录匹配,即无法匹配子目录里面的文件。或者说,?或*这样的通配符,不能匹配路径分隔符(/)。
如果要匹配子目录里面的文件,可以写成下面这样。
1 | $ ls */*.txt |
Bash 4.0 新增了一个globstar参数,允许**匹配零个或多个子目录,详见后面shopt命令的介绍。
(4)文件名可以使用通配符。
Bash 允许文件名使用通配符,即文件名包括特殊字符。这时引用文件名,需要把文件名放在单引号或双引号里面。
1 | $ touch 'fo*' |
上面代码创建了一个fo*文件,这时*就是文件名的一部分。
量词语法用来控制模式匹配的次数。
量词语法只有在 Bash 的extglob参数打开的情况下才能使用,不过一般是默认打开的。
1 | # 查询量词语法是否开启 |
量词语法有下面几个,注意下面作为量词语法的?或者*之类的字符,与前面的字符扩展没有关系
?(pattern-list):模式匹配零次或一次。*(pattern-list):模式匹配零次或多次。+(pattern-list):模式匹配一次或多次。@(pattern-list):只匹配一次模式。!(pattern-list):匹配给定模式以外的任何内容。1 | # `?(.)`匹配零个或一个点。 |
量词语法也属于文件名扩展,如果不存在可匹配的文件,就会原样输出。
shopt命令可以调整 Bash 的行为。它有好几个参数跟通配符扩展有关。
shopt命令的使用方法如下:
1 | # 打开某个参数 |
dotglob 参数
dotglob参数可以让扩展结果包括隐藏文件(即点开头的文件)
nullglob 参数
nullglob参数可以让通配符不匹配任何文件名时,返回空字符。
默认情况下,通配符不匹配任何文件名时,会保持不变。打开nullglob参数,就可以让不匹配的通配符返回空字符串。
failglob 参数
failglob参数使得通配符不匹配任何文件名时,Bash 会直接报错,而不是让各个命令去处理。
extglob 参数
extglob参数使得 Bash 支持量词语法。它默认应该是打开的。
nocaseglob 参数
nocaseglob参数可以让通配符扩展整体不区分大小写。比如program*可以匹配ProgramData等。
globstar 参数
globstar参数可以使得**匹配零个或多个子目录。该参数默认是关闭的。