抓取网页生成电子书(小说网站捕捉器的捕捉规则介绍及功能简介-苏州安嘉)
优采云 发布时间: 2021-11-26 10:06抓取网页生成电子书(小说网站捕捉器的捕捉规则介绍及功能简介-苏州安嘉)
小说网站采集器可以根据html网站代码采集和提取各种小说网站的图书内容,并提供txt、ePub、zip格式的控制方法。小说网站捕手不需要你解析各种代码,直接一键获取所有内容。
功能介绍
本app可以根据小说网站的html网页源码分析关键信息抓取规则,最终输出抓取的书籍(支持txt、ePub、zip格式输出)。
这个app可以说好用也好难用,比如简单地从网站中抓取书籍,就可以直接从自带的100多个预设网站中抓取(需要查看使用浏览器搜索要下载的书籍,然后复制链接到入口网址即可),无需解析复杂的源码。对于逻辑思维能力强的用户,可以根据分析小说网站的源码制定网站的捕捉规则,基本可以应付大部分小说网站。
应用功能
自定义规则抓图,可抓大部分小说网站文章,个别网站图书详细分类,支持多书抓图;
自带大量预估网站,没有定义规则的用户可以直接申请,也可以抓取自己需要的小说;
内置源代码浏览器,提供链接分析、关键定位、标签分割等工具;
对于大型小说,任务暂存到数据库后,可以随意中断和恢复任务;
图书提供多种输出方式:章节文件、独立文本文件、压缩包、ePub电子书等;
支持任务导入,即从带有章节页面链接的文本文件和excel文档中导入任务进行抓取;
所有组件都支持提示信息,即光标停止后会显示相关提示。大部分操作支持状态栏提示,使用更方便;
支持添加、修改、导入、导出、排序和删除预设网站;
附带小工具
ePub 电子书创建和分解工具支持从章节存储的书籍中生成ePub 文件,也可以将ePub 文件分解为具有多个章节的文本文件。
应用界面
主界面
任务管理
系统设置 + ePub 小部件
解析代码窗口