19 嵌入文档

Here and now, boys.
    —Aldous Huxley, Island

嵌入文档是一段有特殊作用的代码块,它用 I/O 重定向 在交互程序和交互命令中传递和反馈一个命令列表,例如 ftpcat 或者是 ex 文本编辑器

  1. COMMAND <<InputComesFromHERE
  2. ...
  3. ...
  4. ...
  5. InputComesFromHERE

嵌入文档用限定符作为命令列表的边界,在限定符前需要一个指定的标识符 <<,这会将一个程序或命令的标准输入(stdin)进行重定向,它类似 交互程序 < 命令文件 的方式,其中命令文件内容如下

  1. command #1
  2. command #2
  3. ...

嵌入文档的格式大致如下

  1. interactive-program <<LimitString
  2. command #1
  3. command #2
  4. ...
  5. LimitString

限定符的选择必须保证特殊以确保不会和命令列表里的内容发生混淆。

注意嵌入文档有时候用作非交互的工具和命令有着非常好的效果,例如 wall

样例 19-1. broadcast: 给每个登陆者发送信息

  1. #!/bin/bash
  2. wall <<zzz23EndOfMessagezzz23
  3. E-mail your noontime orders for pizza to the system administrator.
  4. (Add an extra dollar for anchovy or mushroom topping.)
  5. # 额外的信息文本.
  6. # 注意: 'wall' 会打印注释行.
  7. zzz23EndOfMessagezzz23
  8. # 更有效的做法是通过
  9. # wall < 信息文本
  10. # 然而, 在脚本里嵌入信息模板不乏是一种迅速而又随性的解决方式.
  11. exit

样例: 19-2. dummyfile:创建一个有两行内容的虚拟文件

  1. #!/bin/bash
  2. # 非交互的使用 `vi` 编辑文件.
  3. # 仿照 'sed'.
  4. E_BADARGS=85
  5. if [ -z "$1" ]
  6. then
  7. echo "Usage: `basename $0` filename"
  8. exit $E_BADARGS
  9. fi
  10. TARGETFILE=$1
  11. # 插入两行到文件中保存
  12. #--------Begin here document-----------#
  13. vi $TARGETFILE <<x23LimitStringx23
  14. i
  15. This is line 1 of the example file.
  16. This is line 2 of the example file.
  17. ^[
  18. ZZ
  19. x23LimitStringx23
  20. #----------End here document-----------#
  21. # 注意 "^" 对 "[" 进行了转义
  22. #+ 这段起到了和键盘上按下 Control-V <Esc> 相同的效果.
  23. # Bram Moolenaar 指出这种情况下 'vim' 可能无法正常工作
  24. #+ 因为在与终端交互的过程中可能会出现问题.
  25. exit

上述脚本实现了 ex 的功能, 而不是 vi. 嵌入文档包含了 ex 足够通用的命令列表来形成自有的类别, 所以又称之为 ex 脚本.

  1. #!/bin/bash
  2. # 替换所有的以 ".txt" 后缀结尾的文件的 "Smith" 为 "Jones"
  3. ORIGINAL=Smith
  4. REPLACEMENT=Jones
  5. for word in $(fgrep -l $ORIGINAL *.txt)
  6. do
  7. # -------------------------------------
  8. ex $word <<EOF
  9. :%s/$ORIGINAL/$REPLACEMENT/g
  10. :wq
  11. EOF
  12. # :%s is the "ex" substitution command.
  13. # :wq is write-and-quit.
  14. # -------------------------------------
  15. done

类似的 ex 脚本cat 脚本.

样例 19-3. 使用 cat 的多行信息

  1. #!/bin/bash
  2. # 'echo' 可以输出单行信息,
  3. #+ 但是如果是输出消息块就有点问题了.
  4. # 'cat' 嵌入文档却能解决这个局限.
  5. cat <<End-of-message
  6. -------------------------------------
  7. This is line 1 of the message.
  8. This is line 2 of the message.
  9. This is line 3 of the message.
  10. This is line 4 of the message.
  11. This is the last line of the message.
  12. -------------------------------------
  13. End-of-message
  14. # 替换上述嵌入文档内的 7 行文本
  15. #+ cat > $Newfile <<End-of-message
  16. #+ ^^^^^^^^^^
  17. #+ 将输出追加到 $Newfile, 而不是标准输出.
  18. exit 0
  19. #--------------------------------------------
  20. # 由于上面的 "exit 0",下面的代码将不会生效.
  21. # S.C. points out that the following also works.
  22. echo "-------------------------------------
  23. This is line 1 of the message.
  24. This is line 2 of the message.
  25. This is line 3 of the message.
  26. This is line 4 of the message.
  27. This is the last line of the message.
  28. -------------------------------------"
  29. # 然而, 文本可能不包括双引号除非出现了字符串逃逸.

- 的作用是标记了一个嵌入文档限制符 (<<-LimitString) ,它能抑制输出的行首的 tab (非空格). 这在脚本可读性方面可能非常有用.

样例 19-4. 抑制 tab 的多行信息

  1. #!/bin/bash
  2. # 和之前的样例一样, 但...
  3. # 嵌入文档内的 '-' ,也就是 <<-
  4. #+ 抑制了文档行首的 'tab',
  5. #+ 但 *不是* 空格.
  6. cat <<-ENDOFMESSAGE
  7. This is line 1 of the message.
  8. This is line 2 of the message.
  9. This is line 3 of the message.
  10. This is line 4 of the message.
  11. This is the last line of the message.
  12. ENDOFMESSAGE
  13. # 脚本的输出将左对齐.
  14. # 行首的 tab 将不会输出.
  15. # 上面 5 行的 "信息" 以 tab 开始, 不是空格.
  16. # 空格不会受影响 <<- .
  17. # 注意这个选项对 *内嵌的* tab 没有影响.
  18. exit 0

嵌入文档支持参数和命令替换. 因此可以向嵌入文档传递不同的参数,变向的改其输出.

样例 19-5. 可替换参数的嵌入文档

  1. #!/bin/bash
  2. # 另一个使用参数替换的 'cat' 嵌入文档.
  3. # 试一试没有命令行参数, ./scriptname
  4. # 试一试一个命令行参数, ./scriptname Mortimer
  5. # 试试用一两个单词引用命令行参数,
  6. # ./scriptname "Mortimer Jones"
  7. CMDLINEPARAM=1 # Expect at least command-line parameter.
  8. if [ $# -ge $CMDLINEPARAM ]
  9. then
  10. NAME=$1 # If more than one command-line param,
  11. #+ then just take the first.
  12. else
  13. NAME="John Doe" # Default, if no command-line parameter.
  14. fi
  15. RESPONDENT="the author of this fine script"
  16. cat <<Endofmessage
  17. Hello, there, $NAME.
  18. Greetings to you, $NAME, from $RESPONDENT.
  19. # 这个注释在输出时显示 (为什么?).
  20. Endofmessage
  21. # 注意输出了空行.
  22. # 所以可以这样注释.
  23. exit

这个包含参数替换的嵌入文档是相当有用的

样例 19-6. 上传文件对到 Sunsite 入口目录

  1. #!/bin/bash
  2. # upload.sh
  3. # 上传文件对 (Filename.lsm, Filename.tar.gz)
  4. #+ 到 Sunsite/UNC (ibiblio.org) 的入口目录.
  5. # Filename.tar.gz 是个 tarball.
  6. # Filename.lsm is 是个描述文件.
  7. # Sunsite 需要 "lsm" 文件, 否则将会退回给发送者
  8. E_ARGERROR=85
  9. if [ -z "$1" ]
  10. then
  11. echo "Usage: `basename $0` Filename-to-upload"
  12. exit $E_ARGERROR
  13. fi
  14. Filename=`basename $1` # Strips pathname out of file name.
  15. Server="ibiblio.org"
  16. Directory="/incoming/Linux"
  17. # 脚本里不需要硬编码,
  18. #+ 但最好可以替换命令行参数.
  19. Password="your.e-mail.address" # Change above to suit.
  20. ftp -n $Server <<End-Of-Session
  21. # -n 禁用自动登录
  22. user anonymous "$Password" # If this doesn't work, then try:
  23. # quote user anonymous "$Password"
  24. binary
  25. bell # Ring 'bell' after each file transfer.
  26. cd $Directory
  27. put "$Filename.lsm"
  28. put "$Filename.tar.gz"
  29. bye
  30. End-Of-Session
  31. exit 0

在嵌入文档头部引用或转义”限制符”来禁用参数替换.原因是 引用/转义 限定符能有效的转义 “$”, “`”, 和 “\” 这些特殊符号, 使他们维持字面上的意思. (感谢 Allen Halsey 指出这点.)

样例 19-7. 禁用参数替换

  1. #!/bin/bash
  2. # A 'cat' here-document, but with parameter substitution disabled.
  3. NAME="John Doe"
  4. RESPONDENT="the author of this fine script"
  5. cat <<'Endofmessage'
  6. Hello, there, $NAME.
  7. Greetings to you, $NAME, from $RESPONDENT.
  8. Endofmessage
  9. # 当'限制符'引用或转义时不会有参数替换.
  10. # 下面的嵌入文档也有同样的效果
  11. # cat <<"Endofmessage"
  12. # cat <<\Endofmessage
  13. # 同样的:
  14. cat <<"SpecialCharTest"
  15. Directory listing would follow
  16. if limit string were not quoted.
  17. `ls -l`
  18. Arithmetic expansion would take place
  19. if limit string were not quoted.
  20. $((5 + 3))
  21. A a single backslash would echo
  22. if limit string were not quoted.
  23. \\
  24. SpecialCharTest
  25. exit

生成脚本或者程序代码时可以用禁用参数的方式来输出文本.

样例 19-8. 生成其他脚本的脚本

  1. #!/bin/bash
  2. # generate-script.sh
  3. # Based on an idea by Albert Reiner.
  4. OUTFILE=generated.sh # Name of the file to generate.
  5. # -----------------------------------------------------------
  6. # '嵌入文档涵盖了生成脚本的主体部分.
  7. (
  8. cat <<'EOF'
  9. #!/bin/bash
  10. echo "This is a generated shell script."
  11. # 注意我们现在在一个子 shell 内,
  12. #+ 我们不能访问 "外部" 脚本变量.
  13. echo "Generated file will be named: $OUTFILE"
  14. # 上面这行并不能按照预期的正常工作
  15. #+ 因为参数扩展已被禁用.
  16. # 相反的, 结果是文字输出.
  17. a=7
  18. b=3
  19. let "c = $a * $b"
  20. echo "c = $c"
  21. exit 0
  22. EOF
  23. ) > $OUTFILE
  24. # -----------------------------------------------------------
  25. # 在上述的嵌入文档内引用'限制符'防止变量扩展
  26. if [ -f "$OUTFILE" ]
  27. then
  28. chmod 755 $OUTFILE
  29. # 生成可执行文件.
  30. else
  31. echo "Problem in creating file: \"$OUTFILE\""
  32. fi
  33. # 这个方法适用于生成 C, Perl, Python, Makefiles 等等
  34. exit 0

可以从嵌入文档的输出设置一个变量的值. 这实际上是种灵活的 命令替换.

  1. variable=$(cat <<SETVAR
  2. This variable
  3. runs over multiple lines.
  4. SETVAR
  5. )
  6. echo "$variable"

同样的脚本里嵌入文档可以作为函数的输入.

样例 19-9. 嵌入文档和函数

  1. #!/bin/bash
  2. # here-function.sh
  3. GetPersonalData ()
  4. {
  5. read firstname
  6. read lastname
  7. read address
  8. read city
  9. read state
  10. read zipcode
  11. } # 可以肯定的是这应该是个交互式的函数, 但 . . .
  12. # 作为函数的输入.
  13. GetPersonalData <<RECORD001
  14. Bozo
  15. Bozeman
  16. 2726 Nondescript Dr.
  17. Bozeman
  18. MT
  19. 21226
  20. RECORD001
  21. echo
  22. echo "$firstname $lastname"
  23. echo "$address"
  24. echo "$city, $state $zipcode"
  25. echo
  26. exit 0

可以这样使用: 作为一个虚构的命令接受嵌入文档的输出. 这样实际上就创建了一个 “匿名” 嵌入文档.

样例 19-10. “匿名” 嵌入文档

  1. #!/bin/bash
  2. : <<TESTVARIABLES
  3. ${HOSTNAME?}${USER?}${MAIL?} # Print error message if one of the variables not set.
  4. TESTVARIABLES
  5. exit $?
  • 上面技巧的一种变体允许 “可添加注释” 的代码块.

样例 19-11. 可添加注释的代码块

  1. #!/bin/bash
  2. # commentblock.sh
  3. : <<COMMENTBLOCK
  4. echo "This line will not echo."
  5. 这些注释没有 "#" 前缀.
  6. 则是另一种没有 "#" 前缀的注释方法.
  7. &*@!!++=
  8. 上面这行不会产生报错信息,
  9. 因为 bash 解释器会忽略它.
  10. COMMENTBLOCK
  11. echo "Exit value of above \"COMMENTBLOCK\" is $?." # 0
  12. # 没有错误输出.
  13. echo
  14. # 上面的技巧经常用于工作代码的注释用作排错目的
  15. # 这省去了在每一行开头加上 "#" 前缀,
  16. #+ 然后调试完不得不删除每行的前缀的重复工作.
  17. # 注意我们用了 ":", 在这之上,是可选的.
  18. echo "Just before commented-out code block."
  19. # 下面这个在双破折号之间的代码不会被执行.
  20. # ===================================================================
  21. : <<DEBUGXXX
  22. for file in *
  23. do
  24. cat "$file"
  25. done
  26. DEBUGXXX
  27. # ===================================================================
  28. echo "Just after commented-out code block."
  29. exit 0
  30. ######################################################################
  31. # 注意, 然而, 如果将变量中包含一个注释的代码块将会引发问题
  32. # 例如:
  33. #/!/bin/bash
  34. : <<COMMENTBLOCK
  35. echo "This line will not echo."
  36. &*@!!++=
  37. ${foo_bar_bazz?}
  38. $(rm -rf /tmp/foobar/)
  39. $(touch my_build_directory/cups/Makefile)
  40. COMMENTBLOCK
  41. $ sh commented-bad.sh
  42. commented-bad.sh: line 3: foo_bar_bazz: parameter null or not set
  43. # 有效的补救办法就是在 49 行的位置加上单引号,变为 'COMMENTBLOCK'.
  44. : <<'COMMENTBLOCK'
  45. # 感谢 Kurt Pfeifle 指出这一点.
  • 另一个漂亮的方法使得”自文档化”的脚本成为可能

样例 19-12. 自文档化的脚本

  1. #!/bin/bash
  2. # self-document.sh: self-documenting script
  3. # Modification of "colm.sh".
  4. DOC_REQUEST=70
  5. if [ "$1" = "-h" -o "$1" = "--help" ] # 请求帮助.
  6. then
  7. echo; echo "Usage: $0 [directory-name]"; echo
  8. sed --silent -e '/DOCUMENTATIONXX$/,/^DOCUMENTATIONXX$/p' "$0" |
  9. sed -e '/DOCUMENTATIONXX$/d'; exit $DOC_REQUEST; fi
  10. : <<DOCUMENTATIONXX
  11. List the statistics of a specified directory in tabular format.
  12. ---------------------------------------------------------------
  13. The command-line parameter gives the directory to be listed.
  14. If no directory specified or directory specified cannot be read,
  15. then list the current working directory.
  16. DOCUMENTATIONXX
  17. if [ -z "$1" -o ! -r "$1" ]
  18. then
  19. directory=.
  20. else
  21. directory="$1"
  22. fi
  23. echo "Listing of "$directory":"; echo
  24. (printf "PERMISSIONS LINKS OWNER GROUP SIZE MONTH DAY HH:MM PROG-NAME\n" \
  25. ; ls -l "$directory" | sed 1d) | column -t
  26. exit 0

使用 cat script 是另一种可行的方法.

  1. DOC_REQUEST=70
  2. if [ "$1" = "-h" -o "$1" = "--help" ] # Request help.
  3. then # Use a "cat script" . . .
  4. cat <<DOCUMENTATIONXX
  5. List the statistics of a specified directory in tabular format.
  6. ---------------------------------------------------------------
  7. The command-line parameter gives the directory to be listed.
  8. If no directory specified or directory specified cannot be read,
  9. then list the current working directory.
  10. DOCUMENTATIONXX
  11. exit $DOC_REQUEST
  12. fi

另请参阅 样例 A-28, 样例 A-40, 样例 A-41, and 样例 A-42 更多样例请阅读脚本附带的注释文档.

  • 嵌入文档创建了临时文件, 但这些文件在打开且不可被其他程序访问后删除.
  1. bash$ bash -c 'lsof -a -p $$ -d0' << EOF
  2. > EOF
  3. lsof 1213 bozo 0r REG 3,5 0 30386 /tmp/t1213-0-sh (deleted)
  • 某些工具在嵌入文档内部并不能正常运行.

  • 在嵌入文档的最后关闭限定符必须在起始的第一个字符的位置开始.行首不能是空格. 限制符后尾随空格同样会导致意想不到的行为.空格可以防止限制符被当做其他用途. [1]

  1. #!/bin/bash
  2. echo "----------------------------------------------------------------------"
  3. cat <<LimitString
  4. echo "This is line 1 of the message inside the here document."
  5. echo "This is line 2 of the message inside the here document."
  6. echo "This is the final line of the message inside the here document."
  7. LimitString
  8. #^^^^限制符的缩进. 出错! 这个脚本将不会如期运行.
  9. echo "----------------------------------------------------------------------"
  10. # 这些评论在嵌入文档范围外并不能输出
  11. echo "Outside the here document."
  12. exit 0
  13. echo "This line had better not echo." # 紧跟着个 'exit' 命令.
  • 有些人非常聪明的使用了一个单引号(!)做为限制符. 但这并不是个好主意
  1. # 这个可以运行.
  2. cat <<!
  3. Hello!
  4. ! Three more exclamations !!!
  5. !
  6. # 但是 . . .
  7. cat <<!
  8. Hello!
  9. Single exclamation point follows!
  10. !
  11. !
  12. # Crashes with an error message.
  13. # 然而, 下面这样也能运行.
  14. cat <<EOF
  15. Hello!
  16. Single exclamation point follows!
  17. !
  18. EOF
  19. # 使用多字符限制符更为安全.

为嵌入文档设置这些任务有些复杂, 可以考虑使用 expect, 一种专门用来和程序进行交互的脚本语言。

Notes:
  除此之外, Dennis Benzinger 指出, 使用 <<- 抑制 tab.