Shanken Web TXT Collector 1.0免费版
优采云 发布时间: 2020-08-05 16:04
Shanken TXT Web Collector是一款专业且紧凑的Web文本采集工具. Shanken Web TXT采集器可以帮助用户从某些网站下载新颖文章,通过专业的正则表达式对其进行过滤,并删除不必要的内容,这非常简单实用. 欢迎大家下载并体验jz5u!
使用说明
1. 规则设置:
①在规则设置窗口中,无需编写任何规则即可在网站上找到文章. 首先单击实时预览以查看是否可以获取网页的源代码. 如果可以得到,请编写规则. 如果无法获得,则无需继续. 上
②规则设置使用正则表达式匹配内容. 最好有一定的基础. 如果没有基础,也可以参考给出的示例. 简单学习不需要深入研究正则表达式.
③设置规则后,需要分别预览目录页面和内容页面,这还需要两个链接,即目录页面链接和内容页面链接.
④关于替换,有常规替换和自定义替换. 目前无需进行正规化,普通替代品就可以了. 应该注意的是,必须输入值,并且空格也是可以接受的. 删除: 选择整行,然后按住删除键. 当内置\ n用作替换数据时,表示换行.
⑤编码,目前仅设置了GBK和UFT-8,几乎大多数网站都是这两种编码之一.
2,分析和下载
①要进行分析,请按2按钮解析地址. 按钮1当前功能强大,不希望被删除,稍后将开发其他功能.
②支持单章下载和全文下载.
③支持添加章节号[某些小说中没有章节号时可以检查]
④支持在线观看,但是需要连接到互联网. 此功能仅是辅助工具,不是阅读小说的专业软件.
⑤显示下载进度和总时间,内置多线程.
3. 关于软件
①实际上,您只需要.exe,规则全部由您自己添加,commonrule.xml收录常见的替换规则. 网站规则位于规则文件夹下. 我在其中放置了两个网站规则,主要用于测试. 您可以自己添加其他站点规则,或支持开发人员.
②该软件未打包,由c#开发,没有病毒. 如果您不担心,请不要使用它,我不会收回它.
③关于该软件,跳至论坛. 当我亲自测试跳转时,360提示了我. 这也可能是因为跳转是针对360浏览器进行的. 我想知道您是否会遇到这个问题.
④如果您不知道xml中的内容,请不要触摸它,以免软件识别失败和错误.