# 路径匹配器

在链接解析器和内容解析器中都用到了路径匹配器,用于判断链接是否符合目标规则,在运行过程中,风铃虫会自动根据路径匹配规则动态生成路径匹配器。

其中一组路径匹配规则示例如下:

{
    "expression": "匹配表达式",
    "pattern": "链接匹配模式"
}

路径匹配器的类型由路径匹配器决定,风铃虫会根据路径匹配器创建对应的匹配器。目前支持的匹配器有:

  • KEYWORD : 关键词匹配
  • EXCLUDE : 排除匹配
  • REGEX : 正则匹配
  • NONE : 不匹配

# 关键词匹配

关键词匹配的链接匹配模式为KEYWORD,表示只有当目标URL中包含匹配表达式中指定的关键词时才会匹配通过,在此模式匹配表达式中可以包含多个关键词,多个关键词之间用半角逗号,隔开,匹配时风铃虫会自动忽略大小写。

例如,匹配表达式AAA,BBB时表示带匹配目标中必须包含AAABBB这两个关键词,关键词出现的位置不会影响匹配结果,只有待匹配目标中同时包含AAABBB这两个关键词时才会通过匹配。

# 排除匹配

排除匹配的链接匹配模式为EXCLUDE,表示只有当目标URL中不包含匹配表达式中指定的关键词时才会匹配通过,在此模式匹配表达式中可以包含多个关键词,多个关键词之间用半角逗号,隔开,匹配时风铃虫会自动忽略大小写。

例如,匹配表达式AAA,BBB时表示带匹配目标中必须不能包含AAABBB这两个关键词,关键词出现的位置不会影响匹配结果,只有待匹配目标中同时不包含包含AAABBB这两个关键词时才会通过匹配,在匹配结果中,只要出现AAABBB其中任意一个关键词都会匹配不通过。

# 正则匹配

正则匹配的链接匹配模式为REGEX,其匹配表达式必须是一个正则表达式,只有待匹配目标完全符合正则表达式时才会匹配通过

# 不匹配

正则匹配的链接匹配模式为NONE,风铃虫会忽略此模式下的匹配表达式,直接返回结果为匹配成功

Last Updated: 5/24/2020, 9:59:14 AM