网页抓取 加密html(cookie.x版本,可以从网上搜一下,都有详细的教程)
优采云 发布时间: 2022-01-25 02:03网页抓取 加密html(cookie.x版本,可以从网上搜一下,都有详细的教程)
网页抓取加密html需要用到cookie,常见的是用requests或set-cookie等等,可以从网上搜一下,都有详细的教程。你可以多尝试几种,找一个合适的方法。python2.x版本,可以用cookiejar,或者抓包+set-cookie。python3.x版本,
从网页爬取cookie。
加两个校验呗
你是说网页发布前加个访问验证?
这个我没做过,个人也不太推荐抓包来。用cookie或者set-cookie。其实有一种比较赞的cookie,oauth的cookie:我不太确定是否是oauth对单个邮箱创建的。
你可以搜索ssl,或者直接把代码发你邮箱。我知道我是在虾米和豆瓣的店铺评论的时候用上了一个cookie,打开评论列表后,在那个页面单独打开一个新的网页链接,只输入单个评论,就可以看到对应的分页结果。大体思路是你把你的评论转发到评论列表页面,然后等别人刷新网页就能看到你的评论。这种用的是免费的ssl加密,别人需要花费点钱才能破解,免费版不带验证码,这点我觉得值得提倡,可以抓取一些比较隐私的东西。
我用两个神器:一个神器:抓包神器,被各大网站沦陷,你懂的,你能想到的他们都可以。下载好后打开网页抓包。第二个神器:网页解析神器,极简的网页解析,一边的代码可以处理多个网页。你可以从我的github项目代码中找出他们并快速上手。