excel抓取网页动态数据的方法步骤(一)(图)

优采云 发布时间: 2022-05-15 16:01

  excel抓取网页动态数据的方法步骤(一)(图)

  excel抓取网页动态数据的方法步骤

  一、插入iframe并输入url&选择查询参数步骤

  二、设置代理。如果代理地址不是ssl的,必须把自己的ip改成ssl的。

  三、绑定代理端口。

  四、ip数据请求。

  五、response查询结果。动态数据的文字、颜色、状态都已经有了。数据量10万条,总行数300万条。下面是视频演示:【excel抓取网页数据】有些同学可能就会好奇我要用python、java抓取这个网页然后贴给php解析是怎么做到的?如果你是做php后端的同学,会发现数据抓取一般要走php_xmlrequest,如果是python需要注册一个xmlrequest参数,到第一步不注册的话,在php接收就无法调用。

  那么怎么用python自带的nodejs自动抓取呢?其实整个流程我有专门整理到文章中,下载:关注微信公众号【飞马会】加入飞马网python学习群。

  估计你要的不是excel数据抓取,因为excel可能不支持python的for循环。这种事情请问php大佬,比在知乎问方便多了。

  楼上很多php大佬已经给了方法,我告诉你一个我自己已经实现的方法,

  1、f12打开开发者工具,

  2、在搜索框中搜索text-readline,如果没有找到该字段,

  3、在终端中输入pdf_readline.pdf以及你的数据的url,如find-name'text_readline',

  4、接下来要生成text_readline字段

  5、利用latex写一个text_readline的解析器,点击下面的按钮,

  6、可以看到生成的文件内容如下,

  7、然后将字符存入latex集合,

  8、在python中自然就可以解析text_readline

  9、最后上传到百度云textfile上去下载数据,

  0、在textfile界面python端写readline.py即可1

  1、ftp端直接通过python读取原始text_readline生成readline.xml文件1

  2、把text_readline存入excel.这种方法还有两个优点,第一:没有额外的代码,二:使用起来容易,第三:与php兼容。另外如果你已经利用xll解析xml文件还可以优化,这个也属于excel的范畴,可以看看。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线