网页表格抓取(1.网页展示的表格如下获取网页表格的后话了)

优采云 发布时间: 2021-10-14 15:31

  网页表格抓取(1.网页展示的表格如下获取网页表格的后话了)

  文章内容

  文章 仅用于学习和交流。使用 python 模块 pandas 获取 Web 表单。

  有时我想在看到它时将表单保存在网页上。有办法吗?答案是肯定的。

  主要有两个步骤,

  一种是读取表格内容,另一种是读取后保存内容。

  我只解释最简单的获取网页表单的方式,即网页是纯粹的表单。

  如果网页中混有其他非表格的数据,则需要定位表格,然后进行表格获取。当然,这是后来的事情。1.网页展示

  网页上显示的表格如下。

  

  2.阅读表格

  运行以下代码。

  怎么样,读出来的代码和网页上的一样吗?既然已经读出,下一步就是保存。

  

  3.保存表格

  这一步添加了一行代码。执行代码后,可以看到多了一个table_.csv文件。

  

  打开保存的table_.csv文件看看

  

  您可以看到保存的文件与您在网页上看到的完全相同。好了,结束工作。

  完整代码

  # read_html,用来读取网页表格

# to_csv,用来保存为csv格式的文档

# 网页需要是纯表格才能用此代码,否则还需要定位到网页表格位置

import pandas as pd

url = 'http://quote.cfi.cn/cache_image/node233.js'

html_data = pd.read_html(url)

for i in html_data:

table_data = pd.DataFrame(i)

table_data.to_csv('table_.csv') # 文件名称

print(table_data)

  不禁感受到python语言的强大。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线