# 路径匹配器
在链接解析器和内容解析器中都用到了路径匹配器,用于判断链接是否符合目标规则,在运行过程中,风铃虫会自动根据路径匹配规则动态生成路径匹配器。
其中一组路径匹配规则示例如下:
{
"expression": "匹配表达式",
"pattern": "链接匹配模式"
}
路径匹配器的类型由路径匹配器决定,风铃虫会根据路径匹配器创建对应的匹配器。目前支持的匹配器有:
- KEYWORD : 关键词匹配
- EXCLUDE : 排除匹配
- REGEX : 正则匹配
- NONE : 不匹配
# 关键词匹配
关键词匹配的链接匹配模式为KEYWORD
,表示只有当目标URL中包含匹配表达式
中指定的关键词时才会匹配通过,在此模式匹配表达式
中可以包含多个关键词,多个关键词之间用半角逗号,
隔开,匹配时风铃虫会自动忽略大小写。
例如,匹配表达式
为 AAA,BBB
时表示带匹配目标中必须包含AAA
和BBB
这两个关键词,关键词出现的位置不会影响匹配结果,只有待匹配目标中同时包含AAA
和BBB
这两个关键词时才会通过匹配。
# 排除匹配
排除匹配的链接匹配模式为EXCLUDE
,表示只有当目标URL中不包含匹配表达式
中指定的关键词时才会匹配通过,在此模式匹配表达式
中可以包含多个关键词,多个关键词之间用半角逗号,
隔开,匹配时风铃虫会自动忽略大小写。
例如,匹配表达式
为 AAA,BBB
时表示带匹配目标中必须不能包含AAA
和BBB
这两个关键词,关键词出现的位置不会影响匹配结果,只有待匹配目标中同时不包含包含AAA
和BBB
这两个关键词时才会通过匹配,在匹配结果中,只要出现AAA
和BBB
其中任意一个关键词都会匹配不通过。
# 正则匹配
正则匹配的链接匹配模式为REGEX
,其匹配表达式
必须是一个正则表达式,只有待匹配目标完全符合正则表达式时才会匹配通过
# 不匹配
正则匹配的链接匹配模式为NONE
,风铃虫会忽略此模式下的匹配表达式
,直接返回结果为匹配成功