抓取php网页源码(2016年7月1日作者admin网页有些内容登录才显示 )

优采云 发布时间: 2022-03-07 21:18

  抓取php网页源码(2016年7月1日作者admin网页有些内容登录才显示

)

  发表于 2016 年 7 月 1 日 由 admin

  网页的部分内容是登录后才显示的,登录后页面上已经显示了内容,按F12也可以看到内容。

  但是在网页上右击“查看源代码”,还是找不到内容,怎么回事?

  补充:好像是因为这个原因,php爬虫无法爬取内容。有解决办法吗?

  应该是页面中的一些内容是由js产生的。

  查看源代码是您请求返回的文本,但是缺少 js 动态加载到其中的所有内容。

  查看源代码真的是网页写的源代码;

  F12看到的是网页经过各种处理,通过js或者其他方法生成的代码

  1、源代码由服务器渲染。

  2、F12是服务端渲染的最终代码(Js等,可能是第三方插件:花瓣插件等)。

  要爬取 PHP,它不会通过浏览器。所以自然不能走到Js这一步。

  如果要抓取Js生成的内容,可以分析它的网络请求,看看它请求的接口。

  

  查看源代码时,组装到页面的 Ajax 是不可见的。F12可以看到

  这就涉及到爬虫爬取动态数据的问题。. 你要分析页面的ajax请求。.

  应该是js动态生成的。据说capserjs可以爬,但是不知道怎么爬。有没有大神,请指教。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线