抓取网页生成电子书(小说网站捕捉器的捕捉规则介绍及功能简介-苏州安嘉)

优采云 发布时间: 2021-11-26 10:06

  抓取网页生成电子书(小说网站捕捉器的捕捉规则介绍及功能简介-苏州安嘉)

  小说网站采集器可以根据html网站代码采集和提取各种小说网站的图书内容,并提供txt、ePub、zip格式的控制方法。小说网站捕手不需要你解析各种代码,直接一键获取所有内容。

  

  功能介绍

  本app可以根据小说网站的html网页源码分析关键信息抓取规则,最终输出抓取的书籍(支持txt、ePub、zip格式输出)。

  这个app可以说好用也好难用,比如简单地从网站中抓取书籍,就可以直接从自带的100多个预设网站中抓取(需要查看使用浏览器搜索要下载的书籍,然后复制链接到入口网址即可),无需解析复杂的源码。对于逻辑思维能力强的用户,可以根据分析小说网站的源码制定网站的捕捉规则,基本可以应付大部分小说网站。

  应用功能

  自定义规则抓图,可抓大部分小说网站文章,个别网站图书详细分类,支持多书抓图;

  自带大量预估网站,没有定义规则的用户可以直接申请,也可以抓取自己需要的小说;

  内置源代码浏览器,提供链接分析、关键定位、标签分割等工具;

  对于大型小说,任务暂存到数据库后,可以随意中断和恢复任务;

  图书提供多种输出方式:章节文件、独立文本文件、压缩包、ePub电子书等;

  支持任务导入,即从带有章节页面链接的文本文件和excel文档中导入任务进行抓取;

  所有组件都支持提示信息,即光标停止后会显示相关提示。大部分操作支持状态栏提示,使用更方便;

  支持添加、修改、导入、导出、排序和删除预设网站;

  附带小工具

  ePub 电子书创建和分解工具支持从章节存储的书籍中生成ePub 文件,也可以将ePub 文件分解为具有多个章节的文本文件。

  应用界面

  主界面

  任务管理

  系统设置 + ePub 小部件

  解析代码窗口

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线