Shanken Web TXT Collector 1.0免费版

优采云 发布时间: 2020-08-05 16:04

  

  Shanken TXT Web Collector是一款专业且紧凑的Web文本采集工具. Shanken Web TXT采集器可以帮助用户从某些网站下载新颖文章,通过专业的正则表达式对其进行过滤,并删除不必要的内容,这非常简单实用. 欢迎大家下载并体验jz5u!

  使用说明

  1. 规则设置:

  ①在规则设置窗口中,无需编写任何规则即可在网站上找到文章. 首先单击实时预览以查看是否可以获取网页的源代码. 如果可以得到,请编写规则. 如果无法获得,则无需继续. 上

  ②规则设置使用正则表达式匹配内容. 最好有一定的基础. 如果没有基础,也可以参考给出的示例. 简单学习不需要深入研究正则表达式.

  ③设置规则后,需要分别预览目录页面和内容页面,这还需要两个链接,即目录页面链接和内容页面链接.

  ④关于替换,有常规替换和自定义替换. 目前无需进行正规化,普通替代品就可以了. 应该注意的是,必须输入值,并且空格也是可以接受的. 删除: 选择整行,然后按住删除键. 当内置\ n用作替换数据时,表示换行.

  ⑤编码,目前仅设置了GBK和UFT-8,几乎大多数网站都是这两种编码之一.

  2,分析和下载

  ①要进行分析,请按2按钮解析地址. 按钮1当前功能强大,不希望被删除,稍后将开发其他功能.

  ②支持单章下载和全文下载.

  ③支持添加章节号[某些小说中没有章节号时可以检查]

  ④支持在线观看,但是需要连接到互联网. 此功能仅是辅助工具,不是阅读小说的专业软件.

  ⑤显示下载进度和总时间,内置多线程.

  3. 关于软件

  ①实际上,您只需要.exe,规则全部由您自己添加,commonrule.xml收录常见的替换规则. 网站规则位于规则文件夹下. 我在其中放置了两个网站规则,主要用于测试. 您可以自己添加其他站点规则,或支持开发人员.

  ②该软件未打包,由c#开发,没有病毒. 如果您不担心,请不要使用它,我不会收回它.

  ③关于该软件,跳至论坛. 当我亲自测试跳转时,360提示了我. 这也可能是因为跳转是针对360浏览器进行的. 我想知道您是否会遇到这个问题.

  ④如果您不知道xml中的内容,请不要触摸它,以免软件识别失败和错误.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线