数据类型

传统上,Unix Shell 命令之间使用字符串文本进行通信。一个命令通过标准输出(通常缩写为 “stdout”)输出文本,另一个命令通过标准输入(或 “stdin”)读入文本,以此来让两个命令进行通信。

我们可以认为这种通信是基于字符串的。

Nu 在其命令中采用了这种方法,并将其扩展到包括其他类型的数据。目前,Nu 支持两种数据类型:简单的和结构化的数据。

像许多编程语言一样,Nu 使用一组简单和结构化的数据类型对数据进行建模。简单的数据类型包括整数、浮点数、字符串、布尔、日期和路径。它还包括一个用于表示文件大小的特殊类型。

整数

整数(或整形)数字:例子包括 1、5 和 100。

小数

小数是指带有一些小数成分的数字,例如,1.5,2.0,和 15.333。

字符串

代表文本的字符串。在 Nushell 中,我们有几种方法可以表示字符串:

双引号

  1. "my message"

双引号是最常见的引号形式,只要是需要文字的地方,你都可能看到。

单引号

  1. 'my message'

单引号也生成一个字符串值,就像双引号一样。这里的区别是,它们允许你在文本中使用双引号,例如:'他说:"你能帮我拿下杯子吗?"'

字符串插值

Nushell 支持字符串插值,允许你在以$为前缀的字符串中运行子表达式。比如:

  1. > echo $"6 x 7 = (6 * 7)"
  2. 6 x 7 = 42
  1. > ls | each { |it| echo $"($it.name) is ($it.size)" }
  2. ───┬─────────────────────
  3. 0 genawait is 4.1 KB
  4. 1 learncpp is 4.1 KB
  5. 2 nuscripts is 4.1 KB
  6. ───┴─────────────────────

裸字符串

  1. > echo hello

Nushell 的一个独特特征是,你也可以创建一个没有任何引号的单字字符串。

上面的内容和如下写法是一样的:

  1. > echo "hello"

另见 字符串的使用

文本行

文本行(Lines)是具有隐含的操作系统特定行结尾的字符串。使用时需要加上操作系统特定的行尾标识。

列路径

列路径(Column Paths)是指通过表格到特定子表、列、行或单元格的路径。

例如) open data.toml | get foo.0.bar中的值foo.0.bar

Glob 模式(通配符)

在 Nushell 中,文件操作也允许你传入一个 glob 模式,有时被称为 “通配符”。这允许你给出一个可以匹配多个文件路径的模式。

最常见的模式是 *,它将匹配所有的路径。通常,你会看到这个模式被用作另一个模式的一部分,例如*.baktemp\*

在 Nushell 中,我们也支持通过双 * 来遍历其他目录内嵌套得更深的路径。例如,ls **/*将列出所有嵌套在当前目录下的非隐藏路径。

除了*,还有?模式,它将匹配一个单一的字符。例如,你可以通过使用模式p???来匹配 “port”。

布尔类型

布尔类型是指真或假的状态。它通常用于一个比较的结果,而非直接使用该值。

布尔类型的两个值是truefalse

日期

日期和时间被保存在日期(Date)值类型中。系统使用的日期值是有时区的,默认使用 UTC 时区。

日期有三种形式,基于 RFC 3339 标准:

  • 日期:
    • 2022-02-02
  • 日期和时间 (GMT 格式):
    • 2022-02-02T14:30:00
  • 包含时区的日期和时间:
    • 2022-02-02T14:30:00+05:00

时间间隔

时间间隔(Duration)表示时间的长短。一秒钟、五周和一年都是时间间隔。

Eg) 1wk是一个星期的时间间隔。

下表显示了目前支持的所有时间间隔:

Duration时长
1ns1 纳秒
1us1 微秒
1ms1 毫秒
1sec1 秒
1min1 分钟
1hr1 小时
1day1 天
1wk1 周

区间

区间(Ranges)是一种表达从开始到结束的数值序列的方式。它们的形式是'start' + '..' + 'end'。例如,范围 1..3表示数字 1、2、和 3。

闭区间和开区间

默认情况下,区间是包含性的,也就是说,结束值被算作区间的一部分。区间1..3包括数字3作为区间内的最后一个值。

有时,你可能想要一个达到某个数字的区间,但在输出中不包含该数字。对于这种情况,你可以使用..<代替..。例如,1..<5包含数字 1、2、3 和 4。

开放式区间

区间也可以是开放式的。你可以去掉区间的起点或终点,使其成为开放式的。

比方说,你想从 3 开始计数,但你心里没有一个具体的终点。你可以用 3.. 这个区间来表示。当你在右边使用一个无限制的区间时,请记住,这将持续计数尽可能长的时间,这可能是一个非常长的时间,你可能会在 first 这样的命令中使用开放式区间,这样你就可以从区间中取出你想要的指定数量的元素。

你也可以使区间的开始部分开放。在这种情况下,Nushell 将从0开始向上计数。区间..2包含数字 0、1 和 2。

文件路径

文件路径(File Paths)是在给定的操作系统中代表文件路径的一种与平台无关的方式。比如/usr/binC:\Users\file.txt

文件大小

文件大小(File Sizes)保存在一种特殊的称为字节的整数类型中。例如包括 100b, 15kb, 和 100mb

文件大小单位的完整列表是:

  • b: bytes
  • kb: kilobytes (aka 1000 bytes)
  • mb: megabytes
  • gb: gigabytes
  • tb: terabytes
  • pb: petabytes
  • kib: kibibytes (aka 1024 bytes)
  • mib: mebibytes
  • gib: gibibytes
  • tib: tebibytes
  • pib: pebibytes

二进制数据

二进制数据,像图像文件的数据一样,是一组原始字节。

你可以使用 0x[...]0b[...]0o[...] 形式将二进制写成一个字面值:

  1. > 0x[1F FF]
  2. > 0b[1 1010]
  3. > 0o[777]

不完整的字节将用零来填充。

结构化数据

结构化数据是在简单数据的基础上建立的。例如,结构化数据给我们提供了一种在同一数值中表示多个整数的方法,而不是一个单一的整数。目前支持的结构化数据类型有:记录、列表和表格。

记录

记录(Records)持有键值对,很像 JSON 中的对象。由于这些记录有时会有很多字段,所以记录是从上到下打印的,而不是从左到右:

  1. > echo {name: sam, rank: 10}
  2. ╭──────┬─────╮
  3. name sam
  4. rank 10
  5. ╰──────┴─────╯

你可以将其转换到一个表然后遍历该记录:

  1. > echo {name: sam, rank: 10} | transpose key value
  2. ╭───┬──────┬───────╮
  3. # │ key │ value │
  4. ├───┼──────┼───────┤
  5. 0 name sam
  6. 1 rank 10
  7. ╰───┴──────┴───────╯

列表

列表(Lists)可以容纳一个以上的值。这些可以是简单的值,也可以容纳行,而一组记录的组合通常被称为 “表”。

例如,一个字符串的列表:

  1. > echo [sam fred george]
  2. ───┬────────
  3. 0 sam
  4. 1 fred
  5. 2 george
  6. ───┴────────

表(Table)是 Nushell 的一个核心数据结构。当你运行 Nushell 命令时,你会发现许多命令都会将表作为输出返回。表由行和列组成。

我们可以创建自己的表,就像我们创建一个列表一样。因为表也包含列,而不仅仅是值,所以我们需要传入列的名称:

  1. > echo [[column1, column2]; [Value1, Value2]]
  2. ───┬─────────┬─────────
  3. # │ column1 │ column2
  4. ───┼─────────┼─────────
  5. 0 Value1 Value2
  6. ───┴─────────┴─────────

我们还可以创建一个有多行数据的表格:

  1. > echo [[column1, column2]; [Value1, Value2] [Value3, Value4]]
  2. ───┬─────────┬─────────
  3. # │ column1 │ column2
  4. ───┼─────────┼─────────
  5. 0 Value1 Value2
  6. 1 Value3 Value4
  7. ───┴─────────┴─────────

你也可以通过一个记录列表来创建表格:

  1. > echo [{name: sam, rank: 10}, {name: bob, rank: 7}]
  2. ╭───┬──────┬──────╮
  3. # │ name │ rank │
  4. ├───┼──────┼──────┤
  5. 0 sam 10
  6. 1 bob 7
  7. ╰───┴──────┴──────╯

块(Blocks)表示 Nu 中的一个代码块。例如,在命令 each { |it| echo $it } 中,块是包含在大括号中的部分,{ |it| echo $it }。如果有必要,可以在一对管道符号(例如,|it|)之间指定块参数。

块是表示可以在每行数据上执行的代码的一种有效方法。在each块中使用$it作为参数名是惯例,但并不是必须的:each { |x| echo $x }each { |it| echo $it }的结果相同。

以此为例:

  1. foo {
  2. line1
  3. line2; line3 | line4
  4. }

在该代码块内,你有两个独立的组(Groups)直到运行完毕。组是一个以分号分隔的管道集合,其中最后一个管道会输出到屏幕。

  • line1 是一个独立的组,所以该命令将运行到结束并显示在屏幕上。
  • line2 是第二组中的一个管道。它会运行,但其内容不会在屏幕上显示。
  • line3 | line4 是第二组中的第二个管道。它会运行并且它的内容会在屏幕上显示。