[原创工具]善肯网页TXT采集器V1.1,可下载、可实时预览、可文本替换

优采云 发布时间: 2020-08-10 10:28

  更新日志:

  修复第一章不能点击的bug。

  新增功能让之提取网页链接的形式愈发灵活。

  版本:1.0

  日期:2018.5.23

  开发缘由:开发之初是为了看小说便捷,个人喜欢下载到本地渐渐看,但是好多小说网站不支持下载,或者下载有限制【非VIP小说】,也在峰会上面找过一些采集器,但是个人认为不太好用,输入正则表达式后,会下来章节,但是点击下载却并不能把文本下载出来,我做好这个软件后也继续测试过,同样的正则表达式,那些软件确实匹配不出内容,所以下载失败。也有可能是这些软件有些我不知道的规则,但是结果就是并不能完成我想要的下载。甚至不知道是规则的问题还是软件的问题又或则是网站设置缘由……

  所以我开发的这个软件就特地加了个预览功能,可以晓得我究竟能不能获取网页数据,我获取后能不能正确匹配出内容。

  软件主要解决的虽然就是这两个大问题。

  能获取的都是免费章节,非VIP章节哈,支持原创作者。

  功能模块介绍:

  1、规则设置:

  ①在规则设置窗口,在网站中随意找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。

  ②规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。

  ③规则设置的时侯,目录页和内容页须要分开预览,也就须要两个链接,一个目录页链接、一个内容页链接。

  ④关于替换,有通用替换和订制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时侯代表换行。

  ⑤编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。

  2、解析与下载

  ①解析请按解析地址2按键,1按键目前任性不想删,后面要开发其他功能,

  ②支持单章节下载和全文下载。

  ③支持添加章节数【有的小说没有章节数的时侯就可以勾上】

  ④支持在线看,但是须要联网,此功能只是辅助,并非专业的看小说软件。

  ⑤下载进度和总需时间显示,内置多线程。

  3、关于软件

  ①其实只要.exe就行,规则全是自己添加,commonrule.xml上面是通用替换规则。网站规则在rule文件夹下。我那边在里面放了两个网站的规则,主要是测试的时侯是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。

  ②软件没免杀,c#开发的,没放病毒。不放心请不要用,我不甩锅。

  ③关于软件上面有个跳转到峰会,我个人测试跳转的时侯被360提示了,也有可能是因为跳转的是360浏览器,不知道大家会不会有这个问题。

  ④xml上面的内容,如果不清楚的话还是不要动它,免得软件辨识失败报错。

  ⑤需要.net framework 4.5或则及以上版本框架支持,如果你笔记本没有的话,需要下载安装,框架不大的。

  4、其他

  暂时没想到,后面想到再说。

  最后,不管怎样,还是打滚求支持,不喜切勿喷。

  这个是第一个版本,所以肯定存在我之前测试没有遇见的bug或则须要优化的问题,欢迎你们温柔的反馈哈。

  理论上只要是目录页到内容页的方式的都可以使用,不限于小说。

  下面上图,图片中软件呈现粉红色是我笔记本主题的缘由,并非软件设置,捂脸:

  

  

  

  

  

  求支持,求支持,求支持!!!!重要的事说三遍!!!

  v1.0的下载链接:

  总的下载链接【含V1.1】:链接: 密码: uff3

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线