抓取网页生成电子书(Windows,OSX及Linux的官网转电子书是什么? )

优采云 发布时间: 2021-12-06 18:27

  抓取网页生成电子书(Windows,OSX及Linux的官网转电子书是什么?

)

  口径

  Calibre 可以将指定的多级网页转换为电子书,如pdf、mobi等格式

  Calibre 是一款免费的电子书管理工具,兼容 Windows、OS X 和 Linux。令人欣慰的是,除了GUI,calibre 还提供了很多命令行工具。ebook-convert 命令可以基于用户编写的食谱。该文件(实际上是python代码)抓取指定页面的内容,生成mobi等格式的电子书。爬取行为可以通过编写recipe来定制,以适应不同的网页结构。

  官方网站:

  开源代码:

  使用教程

  抓取网页内容以生成 Kindle 电子书

  在 Mac 上,ebook-convert 脚本命令的位置是 /Applications/calibre.app/Contents/MacOS/ebook-convert。

  注意:calibre.app 需要自行下载

  其他

  现在我只在这里拿了几本书。想抢电子书,可以互相学习,求教;

  下面这个链接是另外一个人采集了很多将网站转成电子书的脚本:

  Calibre 所需的脚本是一个带有 __recipe__ 扩展名的文件。这个文件其实是一个__python__脚本,所以我一般都是先编辑成Python脚本,然后改扩展名

  注意

  我的git库的__.gitignore__只指定了几种可以采集到仓库的文件,如下:

  *

!*.py

!*.recipe

!.gitignore

!*.md

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线