网页视频抓取软件 格式工厂( 支持的格式markdown一种-plugin-F-port-format)
优采云 发布时间: 2022-03-06 06:08网页视频抓取软件 格式工厂(
支持的格式markdown一种-plugin-F-port-format)
什么是 zignis-plugin-read?
这是一个简单的工具插件。目的是实现一个命令行工具,可以方便的获取网页主体,让我们可以通过多种方式采集整理学习资料,支持多种格式,有一些特色模式,这里也叫为简单起见。它是格式。
支持格式 markdown 纯文本标记语言 pdf 便携文件格式 html 生成html页面文件 png 无损压缩位图图形格式 jpeg 有损压缩图像格式 less epub电子书格式mobi亚马逊电子书格式控制台直接输出markdown到终端,可按需处理
主要参数--version显示版本号--format,-F需要转换的格式--read-only,--ro只渲染html,配合web格式使用--debug调试--port代理,如作为抢掘金 文章 中的图片需要打开 --localhost localhost 端口 --open-browser, --ob 网页格式自动打开浏览器 --rename 获得 文章Rename --dir 获得< @文章存储本地位置
安装
$ npm i -g zignis zignis-plugin-read
# 默认会下载 puppeteer,比较慢,加上这个环境变量就不下了,也可以 `Ctrl+C` 取消下载
# 没有 puppeterr, `html`, `png`, `jpeg` 和 `pdf` 就不能工作了。
$ PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=true npm i -g zignis zignis-plugin-read
# 用法
$ zignis read [URL|本地 markdown] --format=[FORMAT]
# 帮助
$ zignis read [url]
例子
# 获取掘金一篇文章
$ zignis read https://juejin.im/post/5dd6a8106fb9a05a7f75fe74
# 获取掘金一篇文章,转换为 markdown 格式
$ zignis read https://juejin.im/post/5dd6a8106fb9a05a7f75fe74 --format=markdown
# 打开一个空的 markdown 编辑器
$ zignis read --format=web
# 欣赏一下自己项目的 README
$ zignis read README.md
获取文章并转换成微信公众号支持的格式
# 安装
$ npm i -g zignis zignis-plugin-read zignis-plugin-read-extend-format-wechat
# 例子,抓取掘金文章,并使用代理获取文章中图片
$ zignis read https://juejin.im/post/5dd6a8106fb9a05a7f75fe74 --format=wechat --proxy
网站 目前适合网页正文转换
在开发过程中,发现默认的行为总是不尽如人意,需要有针对性的调优。目前对下面的网站只做了基础调优,不保证绝对没有问题。
已知错误
项目地址