推荐用于Web数据自动采集的相关文章及其应用研究
优采云 发布时间: 2020-08-07 20:55可以说Web是目前最大的信息系统. 其数据具有大量,多样,异构和动态变化的特征. 因此,人们越来越难以准确,快速地获取他们所需的数据. 虽然搜索引擎多种多样,但是搜索引擎更多地考虑数据的查全率,但是准确率不足,难以进一步挖掘深度数据. 因此,人们开始研究如何从信息搜索到知识发现在互联网上进一步获取一定范围的数据. 1.1相关概念Web数据自动采集的内涵和扩展非常广泛,目前尚无明确的定义. Web数据自动采集涉及Web数据挖掘,Web信息复兴,信息提取和搜索引擎等概念和技术. Web数据挖掘与这些概念密切相关,但是存在差异. (1)Web数据自动采集和挖掘Web挖掘是一种特殊的数据挖掘. 到目前为止,还没有统一的概念. 我们可以从数据挖掘的概念中学到Web挖掘的定义. 所谓的Web挖掘是指在非结构化的异构Web信息资源(包括概念,模式,规则,法则,约束和可视化...)中发现大量有效,新颖,潜在可用且最终可以理解的知识.