9. 构建基于特征的语法 - 1.3 术语 - 《Python 自然语言处理第二版》

1.3 术语

1.3 术语

到目前为止，我们只看到像sg和pl这样的特征值。这些简单的值通常被称为原子——也就是，它们不能被分解成更小的部分。原子值的一种特殊情况是布尔值，也就是说，值仅仅指定一个属性是真还是假。例如，我们可能要用布尔特征AUX区分助动词，如 can，may，will 和 do。例如，产生式V[TENSE=pres, AUX=+] -> 'can'意味着 can 接受TENSE的值为pres，并且AUX的值为+或true。有一个广泛采用的约定用缩写表示布尔特征f；不用AUX=+或AUX=-，我们分别用+AUX和-AUX。这些都是缩写，然而，分析器就像+和-是其他原子值一样解释它们。(15)显示了一些有代表性的产生式：

V[TENSE=pres, +AUX] -> 'can'
V[TENSE=pres, +AUX] -> 'may'
V[TENSE=pres, -AUX] -> 'walks'
V[TENSE=pres, -AUX] -> 'likes'

在传递中，我们应该指出有显示 AVM 的替代方法；1.3显示了一个例子。虽然特征结构呈现的(16)中的风格不太悦目，我们将坚持用这种格式，因为它对应我们将会从 NLTK 得到的输出。

关于表示，我们也注意到特征结构，像字典，对特征的顺序没有指定特别的意义。所以(16)等同于︰

[AGR = [NUM = pl  ]]
[      [PER = 3   ]]
[      [GND = fem ]]
[                  ]
[POS = N           ]