采集规则 - Pholcus 使用手册

返回介绍

采集规则

发布于 2020-07-06 字数 557 浏览 927 评论 0

3 采集规则

采集规则是Pholcus最重要的组成部分之一,它采用高度灵活的结构化规则实现。

在采集规则里,你可以指定规则名、规则描述、采集网页、采集页数、采集关键词、采集内容字段等。

目前在 https://github.com/pholcus/spider_lib 由所有用户共同维护着一个公共规则库,欢迎大家贡献一份力量!

链接

  • Spider 包讲解
  • Request 结构体
  • Response 结构体
  • 添加一条简单规则
  • 动态字段用法实例
  • 动态Rule用法实例

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

目前还没有任何评论,快来抢沙发吧!