8 深入阅读

本章的附加材料发布在http://nltk.org/,包括网络上免费提供的资源的链接。关于使用 NLTK 分析的更多的例子,请看在http://nltk.org/howto上的分析 HOWTO。

有许多关于句法的入门书籍。(O’Grady et al, 2004)是一个语言学概论,而(Radford, 1988)以容易接受的方式介绍转换语法,推荐其中的无限制依赖结构的转换文法。在形式语言学中最广泛使用的术语是生成语法,虽然它与生成并没有关系(Chomsky, 1965)。X-bar 句法来自于(Jacobs & Rosenbaum, 1970),并在(Jackendoff, 1977)得到更深的拓展(The primes we use replace Chomsky’s typographically more demanding horizontal bars)。

(Burton-Roberts, 1997)是一本面向实践的关于如何分析英语成分的教科书,包含广泛的例子和练习。(Huddleston & Pullum, 2002)提供了一份最新的英语句法现象的综合分析。

(Jurafsky & Martin, 2008)的第 12 章讲述英语的形式文法;13.1-3 节讲述简单的分析算法和歧义处理技术;第 14 章讲述统计分析;第 16 章讲述乔姆斯基层次和自然语言的形式复杂性。(Levin, 1993)根据它们的句法属性,将英语动词划分成更细的类。

有几个正在进行的建立大规模的基于规则的语法的项目,如 LFG Pargram 项目http://www2.parc.com/istl/groups/nltt/pargram/,HPSG LinGO 矩阵框架http://www.delph-in.net/matrix/以及 XTAG 项目http://www.cis.upenn.edu/~xtag/