网站程序自带的采集器采集文章(3.PDO类App\Handle.json\PdoHandle.php我们使用PDO来操作)

优采云 发布时间: 2021-10-31 04:03

  网站程序自带的采集器采集文章(3.PDO类App\Handle.json\PdoHandle.php我们使用PDO来操作)

  安装方法:

  composer require guzzlehttp/guzzle:~6.0

  或者:

  加入 composer.json

  "require": {

"guzzlehttp/guzzle": "~6.0"

}

}

  2. 查询列表

  QueryList 是基于 phpQuery 的通用 PHP 列表采集 类。多亏了 phpQuery,使用 QueryList 几乎没有学习成本。只要您了解 CSS3 选择器,就可以轻松使用 QueryList。它让 PHP 做到这一点。 采集就像jQuery选择元素一样简单。 QueryList 的几个特点:

  易学:只有一个核心API好用:使用jQuery选择器选择页面元素,带过滤功能,可以过滤掉无用的内容,支持无限层级的嵌套采集采集 结果是直接的采集规则以列表的形式返回,以便支持扩展

  我们可以用它来过滤html内容

  安装方法:

  composer require jaeger/querylist:V3.2.1

  采集案例

  让我们以 LearnKu 社区为例。我们将采集社区的帖子信息保存在一个文件和一个mysql数据库中。

  1.安装依赖

  在命令行输入以下命令

  composer init

  引入依赖

  {

"require": {

"guzzlehttp/guzzle": "~6.0@dev",

"jaeger/querylist": "V3.2.1"

},

"autoload": {

"psr-4": {

"App\\": "app/"

}

}

}

  安装依赖

  composer install

  2.采集班级

  app\Handle\ClientHandle.php

<p>

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线