2011年7月4日星期一

使用 Shell 第四篇

* 文件名匹配

文件名匹配使得您不必一一写出名称,就可以指定多个文件。您将用到一些特殊的字符,称为通配符(wildcards)

假设您想用‘rm’命令删除目录下所有以字符串‘.bak’结尾的文件。除了在‘rm’后跟上所有文件名作为参数,您还可以用通配符‘*’:

rm *.bak

‘*’可匹配一个或多个字符。在本例中,您告诉 shell 将命令‘rm’的参数扩展到“所有以‘*.bak’结尾的文件”,shell 就将扩展后的参数告诉‘rm’命令。

您将看到,shell 在命令执行前,就将读取并解释命令行。正是因为这个,您才可以将通配符用于 shell 命令的参数中。

让我们更进一步地来认识通配符‘*’。假定您有个目录,其中含文件‘124.bak’、‘346.bak’及‘583.bak’。您想只保留文件‘583.bak’,可以用:

rm *4*.bak

shell 就将‘*4*.bak’扩展成“所有含‘4’并以‘.bak’结尾的字符串”。
注意到 rm 4*.bak 无法工作,因为这匹配的是以‘4’开头的文件。由于目录中没有这样的文件,shell 将这个模式扩展为空的字符串,故‘rm’将返回出错信息:

rm: cannot remove `4*.bak': No such file or directory

如果您想保留文件‘345.bak’,而删除‘124.bak’和‘583.bak’。这看起来有些难度,因为被删文件的名称除了后缀其他都不同。但幸运的是,您可以用不含有来指定文件:

rm *[!6].bak

这将被读为:除了以‘6.bak’结尾的文件,删除其他所有以‘.bak’结尾的文件。您必须将取反号(negation sign)与取反字符(这里是 6)放到括号中,不然的话,shell 会将惊叹号(exclamation mark)解释成历史记录替换的开始(the beginning of a history substitution)。取反号在本篇介绍的所有匹配模式中都有效。

请注意:通配符‘*’与取反号连用,容易产生问题。猜猜

rm *[!6]*.bak

表示什么?这个命令将删除所有文件,甚至包括名称中包含‘6’的文件。如果您将通配符‘*’放到了取反号前面和后面,实际上取反号将失效,因为 shell 将其解释为“所有名称中任何位置都不含该字符的文件”。在我们的例子里,只有文件‘666.bak’不符合该模式。

第二个通配符是问号(question mark):‘?’。在匹配时,一个问号只能代表一个字符。为了示范其用途,我们在上例的假设中添加两个新文件:‘311.bak~’和‘some.text’。现在,列出所有在点号后有四个字符的文件:

ls *.????

问号通配符能够有效地避免上面提到的‘取反号陷阱’(negation trap)

rm *[!4]?.*

将扩展成“所有除了点号前倒数第二个字符为‘4’的文件”,也就是只保留文件‘346.bak’。

您可能会问,有没有其他匹配方式?到目前为止,您只看到了在指定位置匹配唯一字符的方法。但其实您也可以这样:

ls [13]*

将列出所有以字符‘1’‘3’开头的文件;在我们的例子中,文件‘124.bak’、‘311.bak~’和‘346.bak’匹配。注意到您必须用中括号将匹配的模式括起来,否则模式只匹配以字符串‘13’开头的文件。

接下来,您将高兴地看到还可以定义匹配的范围:

ls *[3-8]?.*

将列出所有点号前倒数第二个字符落在‘3’到‘8’范围的文件。在我们的例子中,匹配的文件是‘346.bak’和‘583.bak’。

引用 shell 的特殊字符

但是,上面的那些机制存在一个缺点:shell 总在命令执行前,试着进行扩展。有时候,会变得很棘手:

  • 文件名包含特殊字符。假设您在那个目录中还有一个名为‘!56.bak’的文件。下面试图进行模式匹配:

    rm !*
    rm
    rm: too few arguments

    shell 将‘!*’解释成历史记录的替换(加入前一个命令的所有参数),而不是匹配方式。

  • 命令本身带特殊字符作参数。一些 Linux 下的命令行工具,比如 (e)grep、sed、awk、find 及 locate ,都使用自己的正则表达式(regular expressions)。这些表达式与模式匹配看起来惊人地相似,但在某些地方又有所不同。
    但为了使这些特殊命令生效,shell 就不能先将其当作模式匹配来解释:

    find . -name [1-9]* -print
    find: paths must precede expression

    应该是:

    find . -name '[1-9]*' -print
    ./346.bak
    ./124.bak
    ./583.bak
    ./311.bak~

您可以通过反斜线(back slash)来引用特殊字符,比如 ! 、$ 、? 或空格:

ls \!*
!56.bak

或者用(单)引号:

ls '!'*
!56.bak

请注意,要看清楚引号应该放在什么位置。命令 ls '!*' 将查找名为‘!*’的文件,这是由于通配符也在引号间,所以只能依照字面来解释。


* 输出重定向

Unix 的理念是汇集许多小程序,每个东东都有特殊的专长。复杂的任务不是由大型软件完成,而是运用 shell 的机制,组合许多小程序共同完成。重定向就在其中发挥着重要的作用。

在多个命令间重定向

这要通过管道(pipe),由管道符号|来标识。语法是:

command1 | command2 | command3 等等

这种格式您一定已经见到过了。管道经常将一个程序的输出送到‘more’或‘less’来阅读。

ls -l | less

其中,第一个命令提供目录内容,第二个则将其以翻页的方式显示。更复杂的例子如:

rpm -qa | grep ^x | less

第一个命令给出所有已安装的 RPM 包,第二个则将其过滤(filter:‘grep’),只剩下以‘^x’开头的包,第三个命令则将结果以翻页的方式显示。

重定向至文件

有时,您希望将命令的输出结果保存到文件中,或以文件内容作为命令的参数。这可以通过‘>’和‘<’来实现。

command > file

command 的输出保存到 file 中,这将覆盖 file 中的内容:

ls > dirlist

将当前目录的内容保存到‘dirlist’文件。

command < file

file 内容作为 command 的输入:

sort < dirlist > sdirlist

将文件‘dirlist’的内容送到命令‘sort’,然后再将排序后的结果送到文件‘sdirlist’。当然,您也可以步到位:

ls | sort > sdirlist

一种特殊的方式是‘command 2> file’。这将 command 执行的出错信息送到 file 中。这个您到时候会需要……
另一种操作符是‘>>’,这将输出添加到已存在的文件中:

echo "string" >> file

string 加到文件 file 中。这是不打开文件而完成编辑的好办法!
但是,‘<’和‘>’操作符都有一个重要的限制:

command < file1 > file1

将删除 file1 的内容,而

command < file1 >> file1

却可以很好地工作,将加工过的 file1 内容加回到文件中。

是不是有点多?;-) 不必惊慌,您完全可以按照自己的速度,一步步地来学习。别忘了,实践是最好的学习方法……
熟知了许多 shell 的机制后, 您可能急着想知道如何来定制环境。在后面的两篇中,您将得到这方面的启示。在最后一篇中,还有一段如何处理 shell 出错信息的常见问答(FAQ),及一些配置技巧。

没有评论:

发表评论