搜索引擎优化论文(,:采用数据挖掘中的层次聚类方法(组图))
优采云 发布时间: 2021-11-05 08:00搜索引擎优化论文(,:采用数据挖掘中的层次聚类方法(组图))
针对当前目录搜索引擎存在的问题,本文提出在数据挖掘中使用层次聚类方法,同时使用特征提取将Web文档划分为嵌套目录。对于新加入数据库的信息,采用蚁群优化算法动态分配到相应的类别中。结合关键词搜索的方式,在分门别类的页面上的关键词搜索将得到极大的提升。
层次聚类和蚁群优化算法在目录搜索引擎中的应用
贾雪峰、徐慧、任昌伟、杜小新、尚艳英
(中国矿业大学(北京)机电一体化与信息工程学院(100083))
E-mail: 摘要:本文针对当前目录搜索引擎存在的问题,提出在数据挖掘中使用层次聚类方法,并使用特征提取将Web文档划分为嵌套目录。对于新加入数据库的信息,采用蚁群优化算法动态分配到相应的类别中。结合关键字搜索方法,在分类良好的页面上进行关键字搜索,将大大提高搜索质量。
关键词:目录搜索引擎、网络挖掘、层次聚类、蚁群优化算法、特征提取
1 简介
搜索引擎作为一种网络信息检索工具,已成为一个新的研究投资热点。它需要运用信息检索、人工智能、计算机网络、数据库、数据挖掘、数字图书馆、自然语言处理、多媒体信息处理等领域的理论和技术,具有综合性和挑战性。由于互联网的飞速发展,越来越多的用户需要使用搜索引擎。搜索引擎带来了巨大的商机,成为现代电子商务发展不可或缺的条件。现在搜索引擎已经引起了全世界计算机科学和信息产业界的高度关注。谷歌、微软、雅虎、IBM等信息产业巨头目前都在大力投资研发,并迅速推动搜索引擎技术的发展。. 在这个过程中,也出现了许多值得关注的问题和研究趋势
并将信息置于预先确定的分类框架中。大部分信息面向网站,提供目录浏览服务和直接检索服务。这类搜索引擎的代表有:雅虎。看起来聪明。打开目录。Go Guide等(3)元搜索引擎:这类搜索引擎没有自己的数据,是将用户的查询请求同时提交给多个搜索引擎,返回结果为反复排除、重新排序等,然后作为自己的结果返回给用户,这类搜索引擎的代表有WebCrawler、InfoMarket等。这类搜索引擎的代表有:雅虎。看起来聪明。打开目录。Go Guide等(3)元搜索引擎:这类搜索引擎没有自己的数据,是将用户的查询请求同时提交给多个搜索引擎,返回结果为反复排除、重新排序等,然后作为自己的结果返回给用户,这类搜索引擎的代表有WebCrawler、InfoMarket等。这类搜索引擎的代表有:雅虎。看起来聪明。打开目录。Go Guide等(3)元搜索引擎:这类搜索引擎没有自己的数据,是将用户的查询请求同时提交给多个搜索引擎,返回结果为反复排除、重新排序等,然后作为自己的结果返回给用户,这类搜索引擎的代表有WebCrawler、InfoMarket等。然后作为自己的结果返回给用户。这类搜索引擎的代表有WebCrawler、InfoMarket等。然后作为自己的结果返回给用户。这类搜索引擎的代表有WebCrawler、InfoMarket等。
目录搜索引擎目前以人工或*敏*感*词*方式采集信息,人工提供目录浏览服务和直接检索服务。这种分类的主要优点是加入了大量的人工智能来提高分类的准确性。但是,另一方面,它耗费大量的人力和时间,无法真正及时地监控在线信息。召回率不是很好。而且,WWW 上的信息量日新月异,不可能单纯依靠用户通过人力资源手动查找或整理所有信息。因此,我们迫切需要提出一种更好的方法来解决目录搜索引擎中文档的分类问题。[3][1]
- 1 -