善肯网页TXT采集器1.0 绿色免费版

优采云 发布时间: 2020-08-23 15:46

  善肯网页TXT采集器1.0 绿色免费版

  喜欢看小说的用户好多的都是须要把小说下载到自己的手机里面,但是好多的网站不支持一键下载,可以使用善肯网页TXT采集器,自动采集以及下载!

  

  善肯网页TXT采集器介绍

  喜欢下载到本地渐渐看,但是好多小说网站不支持下载,或者下载有限制【非VIP小说】,也在峰会上面找过一些采集器,但是个人认为不太好用,输入正则表达式后,会下来章节,但是点击下载却并不能把文本下载出来,我做好这个软件后也继续测试过,同样的正则表达式,那些软件确实匹配不出内容,所以下载失败。也有可能是这些软件有些我不知道的规则,但是结果就是并不能完成我想要的下载。甚至不知道是规则的问题还是软件的问题又或则是网站设置缘由……

  善肯网页TXT采集器使用教程

  关于规则设置

  1、输入网址后,可以实时预览(不论有有没规则,有规则就是匹配规则后的内容,没有就是源代码,目前测试,并非所有网页都能获取其内容,具体你们可以自己去实验,能获取源代码的就是可以匹配出内容的)

  2、目录页和内容页分别匹配不同的规则:

  目录页:

  文本名称规则

  作者名称规则

  章节规则(此处需有两个()一处匹配章节路径,一个匹配章节名称)

  内容页:

  内容规则

  3、关于替换:

  通用替换(非正则):所有规则就会手动加上通用替换(有共性的替换规则)

  定制替换(非正则):单个网站的特有替换规则

  正则替换:暂未开发,请求打赏支持开发~~。

  想换行可用内容与\n进行替换,\n是替换数据不是原数据。

  可以依照自己的需求增删,。(原数据和替换数据必填,一个空格都行,否则会抛异常)

  删除:选中一行,按DELETE键删掉

  4、关于规则保存:

  保存都是以文件名来的,不同的名称则为不同的规则,最终保存为xml方式。

  5、关于地址解析

  解析地址1:测试未删,以后会加功能,暂留着

  解析地址2:推荐使用

  6、理论上,只要是目录页指向内容页的方式都可以抓取【能获取源代码的情况下】。具体请你们自己去实验。

  关于文件

  1、commonrule.xml 文件储存的是通用替换规则,

  2、rule文件夹下储存的是以网站为单位的规则。

  如果须要直接拷贝单条规则放在rule文件夹下就可以使用规则了,前提是xml文件格式是对的,

  3、其他

  暂时还没想到大家可能就会出现哪些问题。如果碰到问题欢迎反馈。

  最后附上常用匹配全部内容的表达式:

  (.*?) ([\w\W]*?) ([\s\S]*?)

  PC官方版

  安卓官方手机版

  IOS官方手机版

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线