【内容采集规则】的字段数据获取方式有两种:从源码中获取数据和生成固定格式的数据。

“生成固定格式的数据”比较简单,这里就不多做讲解了。


“从源码中获取数据”

【数据来源】有从默认页、默认页和内容分页源码、关联多页三种方式,其实在选择任何一种方式后,后面都有进一步选择的下拉列表。数据的来源无外乎:响应源代码、请求url和返回的响应头信息三种。

【提取方式】这块就重点讲解下“json提取”方式,其它都从字面能看出是什么意思或者前面【网页采集规则】有使用讲解。

“json提取”这里满只能提取json数据,如果某个key对应值为list类型,那么平台的“json提取”方式无能无力了,只能通过“前后截取”获得所有的源代码,再对这个url正则写个解析后插件并关联起来就可以了。

另外,需要大家注意下,下图所示的对应关系在设置字段提取时要注意。

如果你要选择“源代码”则下拉列表必须选择“源码中”;要选择“相应头”则下拉列表必须选择“返回的头信息中”。

results matching ""

    No results matching ""