帝国CMS全手动采集——发布更新教程

优采云 发布时间: 2020-08-09 14:37

  首先说明,我对于帝国CMS,也是第一次接触,而且对于程序开发,我本身就是门外汉,我只是一个运用者(做垃圾站的),以前仍然用DEDECMS+采集侠,但介于织梦对于处理百万级数据以上时,确实负载较高,我就想用帝国CMS尝试做做垃圾站瞧瞧。大家晓得,做垃圾站不象做正规站,手动更新,做垃圾站是越手动越好,最好不用人去管理就最好了。这就是我研究的方向,好,废话少说。 一、实现手动采集 实现手动采集我就是对着这篇文章做的: 其实,你不止一个采集节点要采集的,可以把多个节点彰显在一个句子中,以下是我正在使用的句子:

  二、实现手动初审、更新 为了实现手动初审、更新,我几乎把帝国峰会里的帖子都翻了个底朝天,虽然前面那篇帖子里说也可以实现手动初审,但我不会,真不会。最后找到了这篇文章: 这儿不得不提一下,上面这篇文章的作者老西真是个热心的人,多次讨教,都详尽地给我解答,在这里,再一次表示谢谢! 用前面的这个方式手动更新的话,要注意几点: 1、触发里面代码时,要加上密码,例如我的触发方式是,借用第一点手动采集触发的思路,也借助计划任务来触发,在e/tasks/目前下构建一个文件,写上触发代码来触发这段初审代码,然后再利用计划任务来触发。 具体举上我的事例,在e/tasks/下构建一个zdgx.php文件,代码如下:

  然后将zdgx.php列到计划任务中。 2、如果栏目比较多,上了二三百个的话,在老北那代码里,建议使用分时段初审,否则负载会有点高。(分时段代码老西代码里,只是注释了,另外,其实可以不止分三个时间段,我做的是每小时初审几个栏目,反正你可以按你栏目的多少来确实,例如我的大概二百四十个栏目,我就设置每小时初审更新十个栏目),我把我分段初审的代码给你们共享一下:

  $hours = date ( 'H' );

switch($hours){

//频道和列表

case '1': $where = "bclassid = 0 or classid between 1 and 10";

break;

case '2': $where = "bclassid = 0 or classid between 11 and 20";

break;

case '3': $where = "bclassid = 0 or classid between 21 and 30";

break;

case '3': $where = "bclassid = 0 or classid between 31 and 40";

break;

case '4': $where = "bclassid = 0 or classid between 41 and 50";

break;

case '5': $where = "bclassid = 0 or classid between 51 and 60";

break;

case '6': $where = "bclassid = 0 or classid between 61 and 70";

break;

case '7': $where = "bclassid = 0 or classid between 71 and 80";

break;

case '8': $where = "bclassid = 0 or classid between 81 and 90";

break;

case '9': $where = "bclassid = 0 or classid between 91 and 100";

  三、挂着计划任务来驱动采集、审核吧。 这个还有一点可以说一下,按道理,我们可以仍然开着后台,打开“运行计划任务页面”即可(也就是运行/e/admin/task.php页面),但我认为还是不太好。 我试了一下,一直开着后台,本身也就很好,不太安全撒,另外网页的COOKIE会失效吧,应该过段时间就要重新登录吧。这里,我想了个其他办法,自动刷新这个“计划任务页面”,保持他的COOKIE有效。 好吧,我是在网站的根目录建了个HTML文件,平时在VPS打开这个文件即可,不用打开帝国后台了。 这个HTML文件代码也共享如下:

  http://www.***.com/e/admin/task.php

function abc() {

document.getElementById("MFrm1").src='http://www.***.com/e/admin/task.php';

}

setInterval('abc()',900000);

  里面的900000是指隔这么多微秒就刷新一下这个页面。

  好了,完了,你最后要做的就是始终打开最后这个HTML文件,你的网站就不停地采集、更新、采集、更新。 以上方式是我正在做的一个垃圾站:正在使用的技巧,里面的代码也是正在使用的,哦记得把***.com 改为你自己的域名哦。。。。。。。。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线