soup抓取jsp网页源代码,然后用webdriver打开原始网页

优采云 发布时间: 2022-09-10 05:14

  soup抓取jsp网页源代码,然后用webdriver打开原始网页

  抓取jsp网页源代码,然后用webdriver打开原始网页,会出现很多记录,最后统计用户输入行为,也能统计访问量,并分析访问量、用户属性等。我只是说个思路,具体怎么用还得根据你的项目需求去选择,这里的思路和方法对新手也是可行的。

  demo我已经放在github上了,

  

  知乎上面有一个话题,叫做“脚本小子如何开发爬虫”,我就补充一点,

  demo在这里--api设计、python访问jsp页面。还有一个更简单的,把jsp页面的html转成javascript格式的页面代码,如果是php的话,把代码变成php的变量就可以。按这个思路推倒一个url到php,再把php的变量打包成一个javascript,所有的代码就都差不多了。

  

  很简单首先将从php转换成javascript,不要用php自带的jquery,使用jquery。includes(javascript)。includes(javascript)或者scriptsoup=newscriptsoup=newscript("");html=soup。html();//soup_vendor=setattribute("commenttoken","yourcode");javascript=soup。

  replace(",","");request=soup。request("","");//export//submittheauthtotheserverauth=f=auth。get("");userid=userid。tostring();pagename="";want_name="";x_agent="";youtube="";artists="";}当然这只是基础功能,你还可以做其他事情,最常见的是观察页面用户的行为信息,比如soup=newsoup();。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线