抓取网页生成电子书(Windows,OSX及Linux的官网转电子书是什么? )
优采云 发布时间: 2021-12-06 18:27抓取网页生成电子书(Windows,OSX及Linux的官网转电子书是什么?
)
口径
Calibre 可以将指定的多级网页转换为电子书,如pdf、mobi等格式
Calibre 是一款免费的电子书管理工具,兼容 Windows、OS X 和 Linux。令人欣慰的是,除了GUI,calibre 还提供了很多命令行工具。ebook-convert 命令可以基于用户编写的食谱。该文件(实际上是python代码)抓取指定页面的内容,生成mobi等格式的电子书。爬取行为可以通过编写recipe来定制,以适应不同的网页结构。
官方网站:
开源代码:
使用教程
抓取网页内容以生成 Kindle 电子书
在 Mac 上,ebook-convert 脚本命令的位置是 /Applications/calibre.app/Contents/MacOS/ebook-convert。
注意:calibre.app 需要自行下载
其他
现在我只在这里拿了几本书。想抢电子书,可以互相学习,求教;
下面这个链接是另外一个人采集了很多将网站转成电子书的脚本:
Calibre 所需的脚本是一个带有 __recipe__ 扩展名的文件。这个文件其实是一个__python__脚本,所以我一般都是先编辑成Python脚本,然后改扩展名
注意
我的git库的__.gitignore__只指定了几种可以采集到仓库的文件,如下:
*
!*.py
!*.recipe
!.gitignore
!*.md