网页抓取 加密html(2019独角兽企业重金招聘Python工程师换行标准(组图))
优采云 发布时间: 2021-11-19 07:18网页抓取 加密html(2019独角兽企业重金招聘Python工程师换行标准(组图))
2019独角兽企业重磅招聘Python工程师标准>>>
某段时间的web编程,想着别人硬写的web右击查看源代码,是不是一目了然?当然,也有人会写脚本到外部js中导入,不过只是增加了查看源码的步骤。我只是想对整个页面html进行加密,但是当我右键单击它时,我看不到代码。可行吗?使用哪种方法?
一是动态生成html代码,而不是直接输出。只需要js的document.write,动态插入html神器!
那么接下来就是考虑编码问题了,如果直接document.write("...."); 也是可以的,不过跟不加密没什么区别。但是我还是用这个方法先测试了一下,遇到了一些麻烦。Web 编程经常会遇到多个双引号引起的字符串错误。为了避免这个双引号问题,必须用编码绕过。
现在比较流行的已知编码有几种,比如json、base64.,那就先试试json吧。
json编码运行如下:
右键查看源码,可以看到代码至少按照我的思路运行正常,没有出现双引号问题的错误。中文是json编码的,但是大部分的html代码还是可以看到的。加密的效果是 1%。
然后试试base64
base64 编码运行如下:
右键查看代码,可以看到html全部加密了,但是还是可以根据数据的长度看到html结构。这仍然是一个单线呼叫。
更改为下面的链式调用
代码再也看不到原来的结构了。哈哈
接下来尝试以二进制编码:
接下来尝试以八进制编码:
接下来,尝试使用十进制编码(顺便说一下,添加了无用的符号以增强混乱):
接下来尝试使用十六进制编码(无分隔符):
接下来尝试使用十六进制编码(带分隔符):
然后我想做一个密码输入框,输入正确的密码显示出来。
思路是php端加密真实网页des,http传输,网络传输只是一个大的变量字符串
Des 必须用密码解密才能知道。des加密的优点是可以对数据进行加密并通过网络传输。http虽然是透明的,但是可以对内容进行加密来锁定数据。别人看到的是一堆乱码的html,不知道实际数据。des虽然弱,但是不容易破解
浏览器访问网页,首先输入密码,解密,成功显示真实网页
其实还有其他编码和其他压缩编码,我不是很清楚,而且要动态输出html,我用的php必须和js匹配,一方加密,另一方解密。如果不匹配或没有合适的编码,则无法完成。.
结论:这种加密纯粹是我无聊的研究,但是web服务器输出的html有一层加密。客户端收到后,js动态解码输出。虽然无法通过右键查看代码,但是浏览器开发者工具会显示运行的html代码,一目了然。适合不想被爬虫看到的网站。爬虫爬取的数据都是加密乱码的,除非有爬虫模仿浏览器可以跑js。这个加密的网站爬虫估计很不友好。因为爬虫无法识别,不知道你的网站标题和图片链接的内容,但是经过对突变编码的一些研究,对网页有了更深入的了解和理解。
超过。
欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果。
转载于: