匹配模式

HTTPS、Websocket需要开启HTTPS拦截才可以正常抓包及使用所有匹配模式,否则只能用域名匹配

有些老版本可能不支持以下的某种匹配模式,遇到这种情况可以升级下whistle即可

whistle的匹配模式(pattern)大体可以分成 域名、路径、正则、精确匹配、通配符匹配

其中 正则匹配、精确匹配、通配符匹配支持取非,即 !pattern,表示不匹配 pattern关键字符:^(通配路径表示符)、$(精确匹配)、*(通配符)、!(取非)

域名匹配

域名匹配,不仅支持匹配某个域名,也可以限定端口号、协议(httphttpswswsstunnel),如果operatorURI不为请求路径,pattern和operatorURI位置可以调换:

  1. # 匹配域名www.test.com下的所有请求,包括http、https、ws、wss,tunnel
  2. www.test.com operatorURI
  3. # 匹配域名www.test.com下的所有http请求
  4. http://www.test.com operatorURI
  5. # 匹配域名www.test.com下的所有https请求
  6. https://www.test.com operatorURI
  7. # 上述匹配也可以限定域名的端口号
  8. www.test.com:8888 operatorURI # 8888端口
  9. www.test.com/ operatorURI # http为80端口,其它443端口

其中,tunnel为Tunnel代理请求的协议,tunnel协议的url只有域名没有路径。

路径匹配

指定匹配某个路径,也可以限定端口号、协议(httphttpswswss)等等,如果operatorURI不为请求路径,pattern和operatorURI位置可以调换。

  1. # 限定请求协议,只能匹配http请求
  2. http://www.test.com/xxx operatorURI
  3. http://www.test.com:8080/xxx operatorURI
  4. # 匹配指定路径下的所有请求
  5. www.test.com/xxx operatorURI
  6. www.test.com:8080/xxx operatorURI

路径匹配不支持tunnel协议的url。

正则匹配

正则的语法及写法跟js的正则表达式一致,支持两种模式:/reg/、/reg/i 忽略大小写,支持子匹配,但不支持/reg/g,且可以通过正则的子匹配把请求url里面的部分字符串传给operatorURI,pattern和operatorURI位置可以调换。

  1. #匹配所有请求
  2. /./ operatorURI
  3. #匹配url里面包含摸个关键字的请求,且忽略大小写
  4. /keyword/i operatorURI
  5. # 利用子匹配把url里面的参数带到匹配的操作uri
  6. # 下面正则将把请求里面的文件名称,带到匹配的操作uri
  7. # 最多支持10个子匹配 $0...9,其中$0表示整个请求url,其它跟正则的子匹配一样
  8. /[^?#]\/([^\/]+)\.html/ protocol://...$1...

正则匹配支持非匹配 !pattern

精确匹配

与上面的路径匹配不同,路径匹配不仅匹配对应的路径,而且还会匹配该路径下面的子路径,而精确匹配只能指定的路径,只要在路径前面加$即可变成精确匹配,类似$url operatorURI,pattern和operatorURI位置可以调换。

  • 包含请求协议

    1. $http://www.test.com operatorURI
    2. $https://www.test.com/xxx? operatorURI

    这种情况分别只能匹配这两种请求:

    1. http://www.test.com # 浏览器会自动改为http://www.test.com/
    2. https://www.test.com/xxx?
  • 不包含请求协议

    1. $www.test.com/xxx operatorURI

    这种情况可以匹配如下四种请求:

    1. http://www.test.com/xxx
    2. https://www.test.com/xxx
    3. ws://www.test.com/xxx
    4. wss://www.test.com/xxx

    精确匹配支持非匹配 !$url

通配符匹配

域名、路径匹配不能满足一些复杂的情况,虽然正则匹配可以解决所有匹配问题,但门槛还是有点高,且涉及转义及设置匹配的起始位置等,对一些常用匹配whistle提供了一些更简单的配置方式,包含通配符匹配,通配域名匹配、通配路径匹配

通配符匹配

匹配模式必须以 ^ 开头(如果需要限制结束位置可以用 $),* 为通配符,支持通过\$0…9获取通配符匹配的字符串,其中$0表示整个请求url

  1. # 以 ^ 开头
  2. ^www.example.com/test/*** referer://http://www.test.com/$1
  3. # 限定结束位置
  4. ^www.example.com/test/***test$ referer://http://www.test.com/$1

如果请求url为 https://www.example.com/test/abc?123test,这第一个配置 $1 = abc?123&test,第二个配置 $1 = abc?123,而 https://www.example.com/test/abc?123test2 只能匹配第一个。

通配符在请求url里面的不同位置及个数匹配的字符类型也不一样,一般请求url的结果:

  1. protocol://domain/path?query

完整通配符匹配:

  1. ^*://*.test.**.com:*/**?a=*&** opProtocol://opValue($0, $1, ..., $9)

其中:\$0表示整个请求url,$1…9分别表示从左到右的通配符串,也可以不指定协议:

  1. ^*/cgi-* operatorURI # 相当于 /^\w+:\/\/([^./]*)\/cgi-(.*)/i operatorURI
  2. ^**/cgi-* operatorURI # 相当于 /^\w+:\/\/([^/]*)\/cgi-(.*)/i operatorURI
  • 如果通配符串在请求url的protocol里面,不管是一个还是多个 * 都只能匹配 [a-z\d]*
  • 如果通配符串在domain里面,一个 * 表示匹配 [^/.],两个及以上的 * 表示匹配 [^/]*
  • 如果通配符串在path里面,一个 * 表示匹配 [^/],两个 * 表示匹配 [^?]*,三个及以上的 * 表示匹配 .*
  • 如果通配符串在query里面,一个 * 表示匹配 [^&],两个及以上的 * 表示匹配 .*

    通配符匹配支持非匹配 !pattern

通配域名匹配

  1. # 匹配二级域名以 .com 结尾的所有url,如: test.com, abc.com,但不包含 *.xxx.com
  2. *.com file:///User/xxx/test
  3. //*.com file:///User/xxx/test
  4. # 匹配 test.com 的子域名,不包括 test.com
  5. # 也不包括诸如 *.xxx.test.com 的四级域名,只能包含: a.test.com,www.test.com 等test.com的三级域名
  6. *.test.com file:///User/xxx/test
  7. //*.test.com file:///User/xxx/test
  8. # 如果要配置所有子域名生效,可以使用 **
  9. **.com file:///User/xxx/test
  10. **.test.com file:///User/xxx/test
  11. # 限定协议,只对http生效
  12. http://*.com file:///User/xxx/test
  13. http://**.com file:///User/xxx/test
  14. http://*.test.com file:///User/xxx/test
  15. http://**.test.com file:///User/xxx/test
  16. # 路径
  17. *.com/abc/efg file:///User/xxx/test
  18. **.com/abc/efg file:///User/xxx/test
  19. *.test.com/abc/efg file:///User/xxx/test
  20. **.test.com/abc/efg file:///User/xxx/test
  21. http://*.com/abc/efg file:///User/xxx/test
  22. http://**.com/abc/efg file:///User/xxx/test
  23. http://*.test.com/abc/efg file:///User/xxx/test
  24. http://**.test.com/abc/efg file:///User/xxx/test

通配路径匹配

  1. # 对所有域名对应的路径 protocol://a.b.c/xxx[/yyy]都生效
  2. */ 127.0.0.1
  3. */xxx 127.0.0.1:9999
  4. tunnel://*/ 127.0.0.1:9999 # tunnel只支持根路径匹配
  5. http://*/ 127.0.0.1
  6. https://*/xxx 127.0.0.1
  7. ws://*/xxx 127.0.0.1
  8. wss://*/xxx 127.0.0.1
  9. # 也可以指定路径,不包含该路径的子路径
  10. $*/ 127.0.0.1
  11. $*/xxx 127.0.0.1:9999
  12. $tunnel://*/ 127.0.0.1 # tunnel只支持根路径匹配
  13. $http://*/ 127.0.0.1:9999
  14. $https://*/xxx 127.0.0.1:9999
  15. $ws://*/xxx 127.0.0.1:9999
  16. $wss://*/xxx 127.0.0.1

如: */cgi-bin 10.10.1.1:9999,表示所有 xxx.xxx.xxx/cgi-bin/xxx 的请求都会请求 10.10.1.1:9999 对应的服务器。