逐行读取文本文件

逐行读取文本文件是最常用的方式。这也是我们首先介绍它的原因。byLine.go程序分为三部分,将帮助你理解这个技巧。

byLine.go第一部分代码如下:

  1. package main
  2. import (
  3. "bufio"
  4. "flag"
  5. "fmt"
  6. "io"
  7. "os"
  8. )

引入bufio包表示我们将使用缓冲区输入。

  1. func lineByLine(file string) error {
  2. var err error
  3. f, err := os.Open(file)
  4. if err != nil {
  5. return err
  6. }
  7. defer f.Close()
  8. r := bufio.NewReader(f)
  9. for {
  10. line, err := r.ReadString('\n')
  11. if err == io.EOF {
  12. break
  13. } else if err != nil {
  14. fmt.Printf("error reading file %s", err)
  15. break
  16. }
  17. fmt.Printf(line)
  18. }
  19. return nil
  20. }

所有的实现都在lineByLine()函数中。在确保可以打开指定的文件名进行读取之后,你调用bufio.NewReader()创建一个新的读实例,然后你可以调用bufio.ReadString()逐行读取文件。行分隔符通过bufio.ReadString()参数指定,它指示bufio.ReadString()一直读取,直到碰到行分隔符为止。当参数是换行符时,不断调用bufio.ReadString()会逐行读取输入文件!注意,使用fmt.Print()而不是fmt.Println()输出读取行,说明每个输入行中都包含了换行符。

byLine.go第三部分代码如下:

  1. func main() {
  2. flag.Parse()
  3. if len(flag.Args()) == 0 {
  4. fmt.Printf("usage: byLine <file1> [<file2> ...]\n")
  5. return
  6. }
  7. for _, file := range flag.Args() {
  8. err := lineByLine(file)
  9. if err != nil {
  10. fmt.Println(err)
  11. }
  12. }
  13. }

执行byLine.go,并使用wc(1)处理输出会产生如下的输出内容:

  1. $ go run byLine.go /tmp/swtag.log /tmp/adobegc.log | wc
  2. 4761 88521 568402

如下的命令会校验前述输出的精确性:

  1. $ wc /tmp/swtag.log /tmp/adobegc.log
  2. 131 693 8440 /tmp/swtag.log
  3. 4630 87828 559962 /tmp/adobegc.log
  4. 4761 88521 568402 total