下面列出的网站内容(复杂网络的研究很多都离不开数据集,你知道吗?)
优采云 发布时间: 2021-10-26 07:10下面列出的网站内容(复杂网络的研究很多都离不开数据集,你知道吗?)
许多复杂网络的研究都离不开数据集。以下是个人在研究过程中在网上采集到的部分数据集网站。它们也方便同事使用。(2018 年 12 月 14 日更新)
1、:data:urls:index
数据集 网站 集合。这个网站网站列出了很多数据集,很全面,很多网站都有详细的数据描述,数据可以直接下载,可以选择其中一些< @网站 采集它。
2、
这是斯坦福大学的大型网络数据集网站,大家应该都不陌生。
3、
这个网站是我个人最喜欢也是最常用的网站。其中有数百个数据集。对数据的分类和描述真的很详细,还给出了数据集的可视化。除了一些基本的统计功能外,所有数据都可以直接下载。
4、
这是另一个个人最喜欢和非常常用的网站。如上,数据分类也相当详细,数据可以在线可视化。您应该能够找到所需的数据。
5、%20DataSet
这是复旦大学建立的网络数据集网站,里面收录了一些常用的数据集和一些相关资源网站。
6、
从事数据挖掘的人应该或多或少都认识Aminer和唐杰,这是Aminer上的一些社交网络数据集。
7、
这个网站中有十几个数据集,包括社交网络、交通网络、合作网络等常用数据集。
8、
这个网站列出了一些数据集和一些复杂的网络大牛网站的*敏*感*词*,大家可以看看。
9、
这是Pajek网站提供的数据集。里面的数据都很经典。早期复杂网络研究中的许多数据集都起源于此。
10、
社交网络数据集收录了一些*敏*感*词*常用的网络社区的数据集网站。从事社交计算的同行可以使用中到大型数据规模。
11、
另一个社交网络数据集,里面的数据集更倾向于物理网络,比如联系人网络、大学好友网络、疾病传播网络。
12、~mejn/netdata/
Daniel Newman教授的个人数据网站,里面的数据集,尤其是科学家合作网络,用的非常多。
以上是个人使用较多的一些复杂的网络数据网站。鉴于他们的理解有限,对这些数据集网站的描述可能不够详细,很多组织都没有列出。请求原谅。当然,如果要使用里面的数据集,一定要记得引用数据集作者的信息。他们采集数据并公开供所有人使用并不容易。如转载本文,还请注明出处^_^。
补充说明:如果你具备以下两个技能,构建复杂的网络数据集就会变得简单:
(1) 文本处理(尤其是正则表达式)。由于大量原创数据收录大量冗余信息,可以使用文本处理提取出你想要的关键信息,并在此基础上构建节点和连接关系.
(2)网络爬虫。有时候在网上找不到自己想要的现成数据,这时候就可以利用网络爬虫对数据进行爬取,构建复杂的网络。
如果您有其他信息,也可以联系我: