网页抓取 加密html(2019独角兽企业重金招聘Python工程师换行标准(组图))

优采云 发布时间: 2021-11-19 07:18

  网页抓取 加密html(2019独角兽企业重金招聘Python工程师换行标准(组图))

  2019独角兽企业重磅招聘Python工程师标准>>>

  

  某段时间的web编程,想着别人硬写的web右击查看源代码,是不是一目了然?当然,也有人会写脚本到外部js中导入,不过只是增加了查看源码的步骤。我只是想对整个页面html进行加密,但是当我右键单击它时,我看不到代码。可行吗?使用哪种方法?

  一是动态生成html代码,而不是直接输出。只需要js的document.write,动态插入html神器!

  那么接下来就是考虑编码问题了,如果直接document.write("...."); 也是可以的,不过跟不加密没什么区别。但是我还是用这个方法先测试了一下,遇到了一些麻烦。Web 编程经常会遇到多个双引号引起的字符串错误。为了避免这个双引号问题,必须用编码绕过。

  现在比较流行的已知编码有几种,比如json、base64.,那就先试试json吧。

  json编码运行如下:

  

  右键查看源码,可以看到代码至少按照我的思路运行正常,没有出现双引号问题的错误。中文是json编码的,但是大部分的html代码还是可以看到的。加密的效果是 1%。

  然后试试base64

  base64 编码运行如下:

  

  右键查看代码,可以看到html全部加密了,但是还是可以根据数据的长度看到html结构。这仍然是一个单线呼叫。

  更改为下面的链式调用

  

  代码再也看不到原来的结构了。哈哈

  接下来尝试以二进制编码:

  

  接下来尝试以八进制编码:

  

  接下来,尝试使用十进制编码(顺便说一下,添加了无用的符号以增强混乱):

  

  接下来尝试使用十六进制编码(无分隔符):

  

  接下来尝试使用十六进制编码(带分隔符):

  

  然后我想做一个密码输入框,输入正确的密码显示出来。

  

  

  思路是php端加密真实网页des,http传输,网络传输只是一个大的变量字符串

  Des 必须用密码解密才能知道。des加密的优点是可以对数据进行加密并通过网络传输。http虽然是透明的,但是可以对内容进行加密来锁定数据。别人看到的是一堆乱码的html,不知道实际数据。des虽然弱,但是不容易破解

  浏览器访问网页,首先输入密码,解密,成功显示真实网页

  其实还有其他编码和其他压缩编码,我不是很清楚,而且要动态输出html,我用的php必须和js匹配,一方加密,另一方解密。如果不匹配或没有合适的编码,则无法完成。.

  结论:这种加密纯粹是我无聊的研究,但是web服务器输出的html有一层加密。客户端收到后,js动态解码输出。虽然无法通过右键查看代码,但是浏览器开发者工具会显示运行的html代码,一目了然。适合不想被爬虫看到的网站。爬虫爬取的数据都是加密乱码的,除非有爬虫模仿浏览器可以跑js。这个加密的网站爬虫估计很不友好。因为爬虫无法识别,不知道你的网站标题和图片链接的内容,但是经过对突变编码的一些研究,对网页有了更深入的了解和理解。

  超过。

  欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果。

  转载于:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线