读取文件

ch12-02-reading-a-file.md
commit 0f87daf683ae3de3cb725faecb11b7e7e89f0e5a

现在我们要增加读取由 filename 命令行参数指定的文件的功能。首先,需要一个用来测试的示例文件:用来确保 minigrep 正常工作的最好的文件是拥有多行少量文本且有一些重复单词的文件。示例 12-3 是一首艾米莉·狄金森(Emily Dickinson)的诗,它正适合这个工作!在项目根目录创建一个文件 poem.txt,并输入诗 "I'm nobody! Who are you?":

文件名: poem.txt

  1. I'm nobody! Who are you?
  2. Are you nobody, too?
  3. Then there's a pair of us - don't tell!
  4. They'd banish us, you know.
  5. How dreary to be somebody!
  6. How public, like a frog
  7. To tell your name the livelong day
  8. To an admiring bog!

示例 12-3:艾米莉·狄金森的诗 “I’m nobody! Who are you?”,一个好的测试用例

创建完这个文件之后,修改 src/main.rs 并增加如示例 12-4 所示的打开文件的代码:

文件名: src/main.rs

  1. use std::env;
  2. use std::fs;
  3. fn main() {
  4. // --snip--
  5. let args: Vec<String> = env::args().collect();
  6. let query = &args[1];
  7. let filename = &args[2];
  8. println!("Searching for {}", query);
  9. println!("In file {}", filename);
  10. let contents = fs::read_to_string(filename)
  11. .expect("Something went wrong reading the file");
  12. println!("With text:\n{}", contents);
  13. }

示例 12-4:读取第二个参数所指定的文件内容

首先,我们增加了一个 use 语句来引入标准库中的相关部分:我们需要 std::fs 来处理文件。

main 中新增了一行语句:fs::read_to_string 接受 filename,打开文件,接着返回包含其内容的 Result

在这些代码之后,我们再次增加了临时的 println! 打印出读取文件之后 contents 的值,这样就可以检查目前为止的程序能否工作。

尝试运行这些代码,随意指定一个字符串作为第一个命令行参数(因为还未实现搜索功能的部分)而将 poem.txt 文件将作为第二个参数:

  1. $ cargo run the poem.txt
  2. Compiling minigrep v0.1.0 (file:///projects/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.0s
  4. Running `target/debug/minigrep the poem.txt`
  5. Searching for the
  6. In file poem.txt
  7. With text:
  8. I'm nobody! Who are you?
  9. Are you nobody, too?
  10. Then there's a pair of us - don't tell!
  11. They'd banish us, you know.
  12. How dreary to be somebody!
  13. How public, like a frog
  14. To tell your name the livelong day
  15. To an admiring bog!

好的!代码读取并打印出了文件的内容。虽然它还有一些瑕疵:main 函数有着多个职能,通常函数只负责一个功能的话会更简洁并易于维护。另一个问题是没有尽可能的处理错误。虽然我们的程序还很小,这些瑕疵并不是什么大问题,不过随着程序功能的丰富,将会越来越难以用简单的方法修复他们。在开发程序时,及早开始重构是一个最佳实践,因为重构少量代码时要容易的多,所以让我们现在就开始吧。