文章采集api(PHP安装Github地址(截图安装)(图))
优采云 发布时间: 2021-10-09 03:24文章采集api(PHP安装Github地址(截图安装)(图))
截屏
安装
Github地址:
环境要求:PHP 5.6-7.2、MySQL >= 5.7、Redis,Redis扩展
1、安装环境
这里还是简单的路线,使用宝塔面板进行演示,使用命令:
#CentOS系统
wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh
#Ubuntu系统
wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && sudo bash install.sh
#Debian系统
wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && bash install.sh
安装完成后进入面板,点击左侧的软件管理,然后安装PHP7.2、Nginx、Mysql5.7+、Redis。
接下来,找到左侧的软件管理-PHP管理-设置-安装Redis扩展。
2、安装步骤
我们先点击左边的网站添加域名;然后点击左边的database-add database。
运行命令:
#进入网站根目录,将路径修改成自己的再运行
cd /www/wwwroot/www.moerats.com
#拉取源码
git clone https://github.com/hiliqi/hanman.git
#将源码移动到根目录
mv hanman/{,.}* ./
#授权用户组
chown -R www:www ./
3、设置伪静态
点击域名设置-网站目录,运行目录选择public,去掉跨站防范检查,重启PHP。然后点击伪静态并输入以下代码:
if (!-e $request_filename) {
rewrite ^(.*)$ /index.php?s=/$1 last;
break;
}
然后打开域名启动安装程序。
如果要启用404而不显示cms错误信息,需要修改config/app.php文件:
#去掉第一排的//即可
'exception_tmpl' => Env::get('app_path') . 'index/view/pub/404.html',
'exception_tmpl' => Env::get('think_path') . 'tpl/think_exception.tpl',
采集
一般情况下,*敏*感*词*站的图片资源有两种,一种是本地化的,一种是盗链的。建议对图片进行本地化,这样可以保证网站资源的稳定性,同时程序还提供了优采云采集器的API,可以方便地与优采云采集器 用于*敏*感*词*和章节图片 采集。
首先,我们需要一个优采云采集器,官网→门户,但是分为免费版和付费版,但是免费版由于某些原因不能满足图片本地化的需要功能限制,暂时不适用,有钱可以买付费版,没钱可以直接用优采云V7.6企业破解版版本。大概目前最新的破解版也能满足程序采集的具体要求,如何下载请自行百度。许多 网站 提供下载链接。
注:由于优采云V7和V8没有URL编解码功能,不能采集有中文链接的*敏*感*词*网站,但V9版本可以,直接上传即可如果你有钱。
采集api 说明:
采集api地址:域名/api/index/save。
请求方式:post
表单字段及说明:
book_name *敏*感*词*名
nick_name *敏*感*词*别名
tags 分类,多个分类用|隔开
author 作者名字
src 采集源
end 状态,1代表完结,0代表连载中
cover_url 封面图远程地址
chapter_name 章节名
images 由图片标签组成的字符串,示例:
api_key 用于身份验证,要和后台配置的api密钥相同
summary *敏*感*词*简介
详细的采集参数说明可查看→门户。
由于采集的过程有点复杂,不太容易发帖,有兴趣不知道如何采集的可以看官方教程→传送门。一般步骤是打开优采云采集器主界面-Publish-New-Content发布参数,然后写好发布模块后,开始寻找目标站并编写采集规则,最后采集 发布。