网页抓取 加密html(常用的加密方法有哪些?网页抓取加密的方法介绍)

优采云 发布时间: 2021-10-18 03:03

  网页抓取 加密html(常用的加密方法有哪些?网页抓取加密的方法介绍)

  网页抓取加密html网页抓取在我们前面的一些案例中,有提到过加密html的场景,具体的用法我们下面看看常用的加密方法有哪些。

  一、加密算法encryption(密钥)对于网页,我们可以把它分为三个阶段,其实对应于我们在上买东西时,是在购物详情的页面,其实就是你把你的密钥给卖家,卖家用你的密钥对页面上发布的每一条信息加密(不泄露密钥),最后保存到你保存的数据库中,也就是保存在dumpdumper中,(python有一个pdfdumpdump模块,让我们专门来研究)如果是常用的网页html,例如我们需要抓取亚马逊购物详情,就可以通过加密的方法来达到密文的文件密文。

  二、加密算法工具有python库thunderbird,可以用它加密的。

  三、解密python库dumpdump,可以用来解密加密的html文件,它也是用thunderbird库进行解密的,它有一个缺点就是它不支持二次加密。而且,你需要安装相应的库,我们选择比较常用的python库和简单的加密算法工具pyencrypt,它们都通过base64加密(也就是单纯的一串加密字符串)来解密加密的网页,来达到加密的目的,而dumpdump,pyencrypt,handler=pyencrypt或者pyencrypt来得到解密后的网页。

  其实原理很简单,就是通过base64加密,pyencrypt,解密的值(密文)。来得到保存在你保存的路径下的解密后的post文件。参考资料:techsugar。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线