Home
Introduction
教程视频
专业知识点介绍
1.XPath基本用法
1.1节点关系
1.2选取节点
1.3谓语(Predicates)
1.4选取未知节点
1.5选取若干路径
2.正则表达式的基本用法
2.1数量词的贪婪模式与非贪婪模式
2.2反斜杠的困扰
3.网页分页结构
4.关联多页
5.什么是任务组
6.平台爬虫解析模式
7.智能XPath选择
如何新建任务
采集器模式
1.网页采集规则设置
1.1新建规则
1.2提取规则配置
2.内容采集规则设置
2.1规则创建
2.2添加字段
2.3数据获取方式
2.4数据处理方式
2.5文件下载
3.其它设置
3.1http请求设置
3.2请求防封设置
3.3翻墙设置
3.3翻墙设置
3.4插件设置
3.5渲染设置
3.6URL规整设置
3.7文件下载设置
4.如何测试解析配置
爬虫模式
1.爬虫设置
2.其它设置
3.使用小节
可视化模式
1.采集规则
2.深度爬取
3.其它设置
各种解析模式小节
爬虫市场
如何快速导入爬虫实例
数据集市
如何启动任务
1.爬虫任务启动设置
2.运行日志查看
如何查看数据
如何获取数据
1.数据导出
2.restful数据获取接口
3.数据发布
3.1新建发布项
3.2新建发布实例
3.3发布实例的发布、修改、删除
3.4发布日志的查看
4.文件数据交付
restful接口文档
插件管理
爬取文件存储
1.存储集群
2.云文件托管
简单爬取任务
中等难度爬取任务
难度爬取任务
本书使用 GitBook 发布
如何快速导入爬虫实例
在如图所示的“快速导入爬虫实例”页面中,提供了十个经典的爬虫实例供用户快速导入。
results matching "
"
No results matching "
"