7.动态网页分析技术:selenium
动态网站的抓取
动态网页:指html元素通过ajax或者js加载的
通过抓取京东-商品详情页抓取来展开解说
京东是随便点开一个商品,比如手机,会发现像价格、评论之类的信息加载慢,因为这是通过js动态的方式加载过来的。
分析可以看出Elements(js加载完成后)里面有价格信息,而右键网页源码里面却没有
那怎么字段这个网页里面哪些是动态的元素,哪些是静态的元素呢?
我个人的做法是:把网页源码copy一份出来,删除掉其中的
要回复文章请先登录或注册
云端的采集更轻松