文章采集规则(ygbookygbook采集使用教程是怎么配置的?采集配置教程)
优采云 发布时间: 2022-01-04 00:05文章采集规则(ygbookygbook采集使用教程是怎么配置的?采集配置教程)
很多用户不知道ygbook采集是怎么配置的,所以我有一个ygbook采集教程或者ygbook采集配置教程给大家讲解。
ygbook采集方法步骤
第一步-规则导入:登录后台-采集设置-导入规则-打开采集规则txt文件复制粘贴后台规则导入栏中的内容
采集点名随便写。
Step 2-Start 采集: Background-采集 Settings-Batch 采集 New Book按钮打开或者点击每个采集规则后面的采集按钮采集也可以,不同的是批量采集新书按钮可以设置采集的数量,而规则后面的采集按钮点击一次采集 一次。
第三步-更新小说信息和章节目录数:后台-采集设置-批量处理文章信息按钮点击挂起。
第四步-更新列数据块:后台-更*敏*感*词*-数据块-更新块数据按钮点击更新块数据,注意:右上角有PC端和wap移动端。
第五步-清除缓存:后台-缓存管理-清理所有可以清理的东西。
注意:如果前台某个分类下没有显示小说,其中一个可能是采集的小说数量不够。重复步骤 1-5。
ygbook小说源码程序简单测试分析采集小说ygbook过程采集概念分析分析
说说ygbook的采集问题。搜索了半天,ygbook官网也没有消息。研究了很久,发现这个程序很有趣。我们可以将ygbook的数据库理解为三个:
第一个数据库:我们刚开始建网站的时候,网站里没有小说。当然,首页肯定是空的。当我们到后台点击批量采集小说的时候,这个时候程序会去采集规则的源站去抓取小说的URL连接信息存储在第一个数据库中(我们可以把这个ygbook数据库理解为一个等待采集小说信息的“小说网址数据库”)
第二个数据库:然后当我们有一个新的URL库时,我们在后台点击批量处理信息文章。当信息在程序中时,程序会根据URL库中的URL、作者介绍啊小说章节目录以及一些不涉及小说章节内容的简单信息,抓取小说的封面第二个数据库(我们可以把这个ygbook数据库理解为“小说更新库”)
第三库:当第二库有内容,即小说更新库时,前台会检索显示的内容,然后当用户点击查看小说章节时,程序会抓取此时的章节内容也存储在第三个数据库中(我们可以将这个ygbook数据库理解为“章节内容库”)
注意:当第一个数据库“小说网站库”中有数据时,首页会显示小说名称和分类中最新的小说。当前用户点击小说名称时,程序也会进入采集将小说数据存入第二个数据库“小说更新库”,与文章信息的后台批处理相同。
Ygbook 有三个非常好的功能:
1、当我们点击前台小说信息目录页面时,他会自动抓取源站对应的小说最新章节,并更新第二个数据库,即小说更新库,即很棒:
2、是当前用户搜索小说时,我们在网站中没有对应的小说,他会将搜索到的小说名称保存在后台搜索记录中并显示搜索次数和ip result 时间在等待,以便我们及时了解用户需要补的小说。
3、表示ygbook可以自行原创出版小说,但不支持付费观看,有能力的可以下载。
<p>打了半天,大概表达了自己的理解。请注明孟凌坤博客网站和六淘*敏*感*词*制作网站。哈哈 更多问题请留言或看我的其他文章ygbook FAQ