海洋cms怎么设置宝塔自动采集,获取链接地址的步骤
优采云 发布时间: 2021-05-02 04:23海洋cms怎么设置宝塔自动采集,获取链接地址的步骤
海洋cms宝塔自动采集教程
海洋cms如何设置自动宝塔采集,因为很多人都在问这个问题,所以这里有本教程。尽管大洋cms提供了脚本代码,但对于初次接触海洋cms的用户来说,这是可以理解的。这并不容易。今天,我将深入详细介绍在海洋cms下使用宝塔现实采集的具体步骤。
海洋cms如何自动设置宝塔采集第一步:获取脚本代码。
【1】以下是Ocean cms官方网站提供的自动采集脚本代码。在使用之前,我们需要修改代码中的3个项目。
#!/bin/bash
########################################################
# 程序名称: 海洋CMS自动采集脚本
# 版本信息:seacmsbot/ v2.0
# 发布链接: https://www.seacms.net/post-update-92579.htm
# 使用方法:直接复制代码到宝塔计划任务shell脚本内容里添加每小时任务使用
# 更新时间:2019.9.26
##########################################################
#①请修改下面的网站域名及管理目录
web_site="http://网站域名/管理目录/admin_reslib2.php"
#②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)
web_pwd="8888e82e85bd4540f0defa3fb7a8e888"
#③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。
#每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。
web_api=(
'?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php'
'?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'
)
#模拟用户浏览器ua,请勿随意修改,以免被目标防火墙拦截!
web_ua="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/76.0.3809.100 Safari/537.36 seacmsbot/1.2;"
#采集单页
function get_content() {
echo "正在采集第$page页..."
#echo " get_content: --->url:--->$1"
cResult=$(curl --connect-timeout 10 -m 20 -k -s -L -A "$web_ua" "$1" )
echo $cResult | grep -q "采集"
#echo -e "$1\n$cResult"
if [ "$?" = "0" ]; then
next_content "$cResult"
else
echo -e "采集失败,请检查设置!\n失败链接-->$1\n返回信息-->$cResult\n采集结束,共0页"
fi
}
#采集下页
function next_content() {
#统计数据
Result=$(echo "$1" | tr "
" "\n")
a=$(echo "$Result" | grep -c "采集成功")
b=$(echo "$Result" | grep -c "更新数据")
c=$(echo "$Result" | grep -c "无需更新")
d=$(echo "$Result" | grep -c "跳过")
echo "采集成功-->已更$c部,新增$a部,更新$b部,跳过$d部"
let add+=$a
let update+=$b
let none+=$c
let jmp+=$d
#检测并采集下页
next_url=${1##*location.href=\'}
next_url=${next_url%%\'*}
#echo $next_url
if [ "${next_url:0:1}" = "?" ]
then
let page++
get_content "$web_site$next_url"
else
echo "采集结束,共$page页"
fi
}
#脚本入口
echo "海洋CMS自动采集脚本开始执行 版本:v1.2"
starttime=$(date +%s)
update=0 #更新
add=0 #新增
none=0 #无变化
jmp=0 # 跳过
for url in ${web_api[@]};
do
if [[ ! -z $url ]]
then
web_param="$web_site$url&password=$web_pwd"
page=1
echo "开始采集:$url"
get_content $web_param
fi
done
endtime=$(date +%s)
echo "============================"
echo "入库-->$add部"
echo "更新-->$update部"
echo "跳过-->$jmp部(未绑定分类或链接错误)"
echo "今日-->$[none+add+update]部"
echo "============================"
echo "全部采集结束,耗时$[endtime - starttime]秒"
海洋cms如何自动设置宝塔采集第二步:修改脚本
[2]脚本中的哪3个项目应特别修改?让我为您一个一个地谈论它们。 (根据上面提供的代码内容,将其复制到记事本或其他html编辑器中进行相应的修改)
#①请修改下面的网站域名及管理目录
web_site="http://网站域名/管理目录/admin_reslib2.php"
这将被修改为您的“ 网站域名”和“海洋cms后端管理目录”。每个人都可以理解域名。后端管理目录对于新手来说需要更多的单词。首先,您必须能够登录到后端以了解您的后端目录。例如:如果我的后端登录地址是/ article /,则“ article”是后端管理目录,我们可以在获取管理目录后直接填写代码。
#②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)
web_pwd="8888e82e85bd4540f0defa3fb7a8e888"
在Ocean cms系统的背景下,此修改需要替换为我们的cookie密码。具体步骤如下。获取您自己的网站 Cookie密码并替换。
#③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。
#每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。
web_api=(
'?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php'
'?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'
)
这是代码中需要修改的最后一项。默认情况下,代码中提供了两个采集链接地址。我们需要获得自己的采集链接地址并将其添加到其中。有关获取链接地址的详细信息,请参见“步骤操作”下面的屏幕截图。如果尚未添加或不知道如何添加采集,则可以参考帮助文档-海洋cms如何添加资源库采集界面
选择“背景-采集-资源库列表”,然后复制资源站右侧的“今天采集今天”,“ 采集本周”和“ 采集全部”链接地址根据您的选择,然后删除?先前的内容。 (在当天或本周在采集上移动鼠标,右键单击鼠标以复制链接以获取采集链接)
例如,这里是:
1
http://127.0.0.1/admin/admin_reslib.php?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php
第2步:删除“?”之前的内容复制到上一步,结果如下:
2
?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php
这将获得最终的采集网址
海洋cms如何设置宝塔自动采集第三步:宝塔计时任务设置。
【3】直接将代码复制到Pagoda Plan Task的Shell脚本中,并按小时添加内容。具体操作步骤如下图所示。步骤⑤是将修改后的脚本复制并粘贴到脚本内容框中。
[4]摘要
通常来说,在修改了脚本中需要修改的多个项目之后,将修改后的脚本复制到宝塔采集任务的计划任务设置中。不要选择错误的任务类型。如果您对本教程不了解或有任何疑问,可以加入社区进行讨论和查询。加入社区