网站程序自带的采集器采集文章(3.PDO类App\Handle.json\PdoHandle.php我们使用PDO来操作)
优采云 发布时间: 2021-10-31 04:03网站程序自带的采集器采集文章(3.PDO类App\Handle.json\PdoHandle.php我们使用PDO来操作)
安装方法:
composer require guzzlehttp/guzzle:~6.0
或者:
加入 composer.json
"require": {
"guzzlehttp/guzzle": "~6.0"
}
}
2. 查询列表
QueryList 是基于 phpQuery 的通用 PHP 列表采集 类。多亏了 phpQuery,使用 QueryList 几乎没有学习成本。只要您了解 CSS3 选择器,就可以轻松使用 QueryList。它让 PHP 做到这一点。 采集就像jQuery选择元素一样简单。 QueryList 的几个特点:
易学:只有一个核心API好用:使用jQuery选择器选择页面元素,带过滤功能,可以过滤掉无用的内容,支持无限层级的嵌套采集采集 结果是直接的采集规则以列表的形式返回,以便支持扩展
我们可以用它来过滤html内容
安装方法:
composer require jaeger/querylist:V3.2.1
采集案例
让我们以 LearnKu 社区为例。我们将采集社区的帖子信息保存在一个文件和一个mysql数据库中。
1.安装依赖
在命令行输入以下命令
composer init
引入依赖
{
"require": {
"guzzlehttp/guzzle": "~6.0@dev",
"jaeger/querylist": "V3.2.1"
},
"autoload": {
"psr-4": {
"App\\": "app/"
}
}
}
安装依赖
composer install
2.采集班级
app\Handle\ClientHandle.php
<p>