网页表格抓取(Excel,R,Python和BI,作为开始数据分析的基础)
优采云 发布时间: 2021-12-25 13:17网页表格抓取(Excel,R,Python和BI,作为开始数据分析的基础)
数据分析时代已经到来。从国家、政府、公司到个人,大数据和数据分析已经成为大家耳熟能详的趋势。但是你可能没有数据分析和编程方面的专业知识,或者你已经了解了很多数据分析的理论,但你仍然无法实践。在这里,我将比较数据分析师最流行的四种工具,Excel、R、Python 和 BI,作为开始数据分析的基础。
1. Excel
1.1使用场景
1.2 优点
1.3 缺点
2. R
2.1使用场景
R 的功能几乎涵盖了任何需要数据的领域。就我们一般的数据分析或学术数据分析而言,R能做的主要有以下几个方面。
2.2 R 好学吗?
在我看来,R 入门非常简单。10天的强化学习,足以掌握基本用法、基本数据结构、数据导入导出、简单数据可视化。有了这些基础,当你遇到实际问题的时候,就可以找到你需要用到的R包了。通过阅读 R 的帮助文件和互联网上的信息,您可以相对较快地解决特定问题。
3. Python
3.1使用场景
3.2 R 和 Python
R 和 Python 都是需要编程的数据分析工具。不同的是R只用在数据分析领域,而科学计算和数据分析只是Python的应用分支。Python还可以用于开发网页、开发游戏、开发系统后端,以及执行一些运维任务。
目前的趋势是Python在数据分析领域正在追赶R。在某些方面,它已经超越了 R,例如机器学习和文本挖掘。但R在统计领域仍然保持优势。Python在数据分析方面的发展在很多地方模拟了R的一些特性。所以,如果你还是新手,还没有开始学习,我建议你从Python开始。
Python 和 R 都很容易学习。但是如果同时研究两者,就会很混乱,因为它们在很多地方都非常相似。所以建议不要同时学习。等到你掌握了其中一个,然后开始学习另一个。
3.3 选择 R 还是 Python?
如果因为时间有限只能选择其中之一学习,我推荐使用Python。但我仍然建议你看看两者。在某些地方,您可能会听说 Python 在工作中更常用,但解决问题是最重要的。如果你能用R有效解决问题,那就用R吧。其实Python模仿了R的很*敏*感*词*,比如Pandas库中的DataFrames。正在开发的可视化包ggplot模仿了R中非常有名的ggplot2。
双
数据分析中有一句话:文字不如表格,表格不如图表。数据可视化是数据分析的主要方向之一。Excel图表可以满足基本的图形要求,但这只是基础。高级可视化需要编程。除了学习R、Python等编程语言,还可以选择简单易用的BI工具。有关 BI 的介绍,您可以阅读我的另一篇文章,我应该学习哪些数据分析工具才能开始我的数据分析师职业?
商业智能诞生于数据分析,它诞生于一个非常高的起点。目标是缩短从业务数据到业务决策的时间。它是关于如何使用数据来影响决策。
BI 的优势在于其在交互和报告方面的优势。擅长解读历史数据和实时数据。可以大大解放数据分析师的工作,增强整个公司的数据意识,提高数据导入的效率。市场上有许多BI产品。他们的原理是通过连接和钻孔维度来构建仪表板以获得可视化分析。