excel抓取网页动态数据(excel抓取网页动态数据_自定义-鱼-博客园)

优采云 发布时间: 2022-02-10 06:02

  excel抓取网页动态数据(excel抓取网页动态数据_自定义-鱼-博客园)

  excel抓取网页动态数据_自定义列名-鱼-博客园多行、多列同时判断在一起遍历列名就行了爬虫过程:1.从互联网上爬取数据源>2.用xpath解析html字符串--->3.用正则表达式匹配文本,生成对应的excel字符串。

  让它在文本文件里显示出来

  楼上都说得很对,楼主知道点excel技术就都能实现吧,常用的方法有字符串,正则表达式,还有一些更新比较多的复杂格式的处理方法。

  如果你的网页内容很明确,就用正则表达式,或者穷举法!如果你不知道网页内容,

  很简单,题主为啥不考虑一下用爬虫这种先不说有多复杂,就说大部分人应该不会用的excel?然后学一个excel数据处理工具,专门处理这样格式的文件。但是有个弊端,如果你要把用户的手机号注册到你的账号里面,那你就要把所有人的手机号都加起来,然后全都拼在一起,再用user-agent算法匹配,才能得到你想要的数据。

  楼上说的都挺好的,我也不说太多了。题主有空可以去学个python爬虫,webscraping,数据采集,给你点我的看法吧,先看下我的python爬虫作业020是我用requests库抓到的一段日志,那么从我的思路来看这段日志中,我首先想到的是给每个网页加一个新的html文件,其次我想知道所有的人的手机号信息,于是直接通过拼接一些html来查找到网页上显示的这些人的手机号信息(其实也是一种拼接),然后再通过一些编程语言操作把这些信息存储下来,以后就可以通过这些信息去获取你想要的东西了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线