1.3 术语

到目前为止,我们只看到像sgpl这样的特征值。这些简单的值通常被称为原子——也就是,它们不能被分解成更小的部分。原子值的一种特殊情况是布尔值,也就是说,值仅仅指定一个属性是真还是假。例如,我们可能要用布尔特征AUX区分助动词,如 can,may,will 和 do。例如,产生式V[TENSE=pres, AUX=+] -> 'can'意味着 can 接受TENSE的值为pres,并且AUX的值为+true。有一个广泛采用的约定用缩写表示布尔特征f;不用AUX=+AUX=-,我们分别用+AUX-AUX。这些都是缩写,然而,分析器就像+-是其他原子值一样解释它们。(15)显示了一些有代表性的产生式:

  1. V[TENSE=pres, +AUX] -> 'can'
  2. V[TENSE=pres, +AUX] -> 'may'
  3. V[TENSE=pres, -AUX] -> 'walks'
  4. V[TENSE=pres, -AUX] -> 'likes'

在传递中,我们应该指出有显示 AVM 的替代方法;1.3显示了一个例子。虽然特征结构呈现的(16)中的风格不太悦目,我们将坚持用这种格式,因为它对应我们将会从 NLTK 得到的输出。

关于表示,我们也注意到特征结构,像字典,对特征的 顺序 没有指定特别的意义。所以(16)等同于︰

  1. [AGR = [NUM = pl ]]
  2. [ [PER = 3 ]]
  3. [ [GND = fem ]]
  4. [ ]
  5. [POS = N ]