excel自动抓取网页数据(把DataFrame转换成HTML表格的方法,读取Excel中的表格数据)

优采云 发布时间: 2022-01-23 01:23

  excel自动抓取网页数据(把DataFrame转换成HTML表格的方法,读取Excel中的表格数据)

  前言

  说到用 Pandas 导出数据,应该想到 to.xxx 系列函数。

  其中比较常用的是pd.to_csv()和pd.to_excel()。但其实也可以导入成Html网页格式,这里用到的函数是pd.to_html()!

  读取 Excel

  今天我们要将Excel转成html格式,首先需要读取Excel中的表格数据。

  

import pandas as pd

data = pd.read_excel("测试.xlsx")

  查看数据

  

data.head()

  

  让我们学习如何将 DataFrame 转换为 HTML 表格。

  生成 HTML

  to_html()函数只需一行代码就可以直接将DataFrame转换成HTML表格:

  

html_table = data.to_html("测试.html")

  运行上述代码后,工作目录下多了一个test.html文件,用浏览器打开,内容如下

  

  

print(data.to_html())

  通过打印可以看到DataFrame的内部结构自动转换成,,标签嵌入表格中,保留所有内部层次结构。

  

  格式化

  我们也可以自定义修改参数来调整生成的HTML的格式。

  

html_table = data.to_html("测试.html",header = True,index = False,justify="center")

  再次打开新生成的test.html文件,发现格式变了。

  

  如果要对格式做进一步的调整(添加标题、修改颜色等),需要一些HTML知识,可以在生成的测试.html文件中调整文本。

  对于一些可能需要展示页面的小伙伴来说,使用Flask库是很有必要的。

  总结

  Pandas 提供 read_html() 和 to_html() 函数用于读取和写入 html 文件。这两个功能非常有用。一种很容易将复杂的数据结构(例如 DataFrames)转换为 HTML 表格;另一种不需要复杂的爬虫,只需几行代码就可以抓取Table表数据,简直就是神器!

  今天的篇幅很短,主要讲Pandas中的to_html()函数。使用这个功能最大的好处是我们可以在不了解HTML知识的情况下生成表格HTML。

  总结

  这里是文章关于如何使用pandas将Excel转为html格式的介绍。更多相关pandas将Excel转html格式,请在云海天教程前搜索文章或继续浏览以下相关文章希望大家以后多多支持云海天教程!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线