c爬虫抓取网页数据(sendcloud的post方法的cookie获取详细原理:返回浏览器所请求)

优采云 发布时间: 2021-09-27 10:03

  c爬虫抓取网页数据(sendcloud的post方法的cookie获取详细原理:返回浏览器所请求)

  c爬虫抓取网页数据太耗时间和空间,

  ajax和html5的发展速度让网页加载变得很快。任何正常功能html5都有类似的做法。

  原因很简单,目前的html5标准是不支持post方法的,包括你可以使用postall方法实现数据的cookie的获取。但是早在2012年,html5刚刚完成标准的构建,就已经加入到html3标准中,新的html5标准已经完全支持post方法进行数据的获取。下面是sendcloud的post方法的cookie获取的详细原理:。

  1)浏览器会先搜索当前页面可能的post方法的实现,并且返回给浏览器。

  2)浏览器进行post网站的请求,判断响应浏览器的请求是否正确,是否有带有cookie以及有没有带data,并且同时搜索cookie中的websecurity内容,再判断是否可以将该网站的cookie与其它网站的cookie相同,例如一个dom一个css选择器。通过判断这几点来匹配标准中的cookie来匹配到一个适合于数据的cookie(post方法的发起者的cookie或者接受方的cookie)。

  3)返回浏览器所请求的标准post方法的cookie一般会带有name字段,例如@appid或者meizu.appid,同时该cookie会带有path字段。tips:cookie一般生存在http的握手时间,在发送之前就已经完成了,直接返回。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线