抓取网页生成电子书(用Sigil加Calibre,支持Windows,Mac,Linux(组图))
优采云 发布时间: 2022-04-14 04:20抓取网页生成电子书(用Sigil加Calibre,支持Windows,Mac,Linux(组图))
因为看惯了kindle pw,在电脑屏幕上看一大段文章很难专心,感觉很累。
能够为kpw带来好的文章、博客、文档、自组织材料等,真是太高兴了。可以说,制作电子书已经成为刚需,所以谷歌告诉我用Sigil加Calibre,就是用Sigil做一个标准的ePub格式,然后用Calibre转换成你想要的任何格式。
这里是 Sigil,它托管在 Google 代码上,但源代码现在在 github 上,支持 Windows、Mac、Linux。用户指南非常详细。
这是界面,支持多种语言:
图一
不好意思说最近才学git,所以找到了这个ProGit。可惜官方只有epub格式的英文版下载。看了之后,中文只有网页版,所以想自己做一个。以下是如何执行此操作的示例。
ePub格式归根结底就是一个zip格式的压缩包,里面定义了每个文件夹,里面收录了文字、图片等各种素材,如图2
图2
在Text下右击“Add Blank HTML File”,会自动创建一个名为Seciton0001.xhtml的空白文件。然后只需复制您想要的内容,它可以是纯文本或网络格式。见图3
图 3
它实际上是所见即所得(所见即所得),您可以查看它的各种元素。见图4
图 4
然后将要放到每个xhtml文件上的内容一个一个地放上去,可以在格式菜单中进行粗体、斜体等修改。
需要注意的是标题h1、h2、h3等(图4)是用来定义书的章节的,从小到大是收录关系,p定义段落,定义好每一页的标题后,我们就可以为我们的书创建一个目录了,菜单工具->目录->生成目录(如图5),确定目录级别通过level选项来收录,然后OK,会自动生成目录(如图6).
图 4
图 5
图 6
接下来,添加封面,不然会尴尬:菜单工具->生成封面,将准备好的图片添加到素材中。
图 7
最后我们来润色一下书,菜单Tools -> Element Data Editor,添加title、author等参数。
图 8
至此,一本书所需的基本东西都已经完成,保存完毕,并自动生成了一个标准的epub格式文件。
有了它,添加到calibre后,选择把书转换成你需要的任何格式。
图 9
完成。