【其它设置】和“采集器模式”中的【其它】相同,只不过这里面多了一个【页面类型判断设置】。【页面类型判断设置】包括【页面类型判断】和【正则列表管理】两部分。

(1) 【页面类型判断】允许用户选择“一般逻辑”和“正则判断”;“一般逻辑”是指需要先获得html,再根据页面各元素分布进行判断是否为内容页,而“正则判断”是指直接根据url链接是否包含关键词之一即可判断是否为内容页。

(2) 当用户在【页面类型判断】中选中“正则判断”,则平台会提示用户需要设置【正则列表管理】,平台会默认为用户填写常见的内容页正则表达式,用户可以根据自己下载网站的实际情况继续个性化设置。

results matching ""

    No results matching ""