2.4 regexp — 正则表达式

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式为文本处理提供了强大的功能。Go 作为一门通用语言,自然提供了对正则表达式的支持。

regexp 包实现了正则表达式搜索。

正则表达式采用 RE2 语法(除了 \c、\C),和 Perl、Python 等语言的正则基本一致。确切地说是兼容 RE2 语法。相关资料:http://code.google.com/p/re2/wiki/Syntax包:regexp/syntax

注意:regexp 包的正则表达式实现保证运行时间随着输入大小线性增长的(即复杂度为 O(n),其中 n 为输入的长度),这一点,很多正则表达式的开源实现无法保证,参见:RSC 的 《Regular Expression Matching Can Be Simple And Fast
(but is slow in Java, Perl, PHP, Python, Ruby, …)》

另外,所有的字符都被视为 utf-8 编码的码值 (Code Point)。

Regexp 类型提供了多达 16 个方法,用于匹配正则表达式并获取匹配的结果。它们的名字满足如下正则表达式:

  1. Find(All)?(String)?(Submatch)?(Index)?

未完待续。。。

https://github.com/StefanSchroeder/Golang-Regex-Tutorial

导航