基于网络爬虫实现高性能搜索引擎排序算法的研究(一)
优采云 发布时间: 2021-08-23 20:03基于网络爬虫实现高性能搜索引擎排序算法的研究(一)
seo搜索引擎优化论文快速撰写,增加原创性。
1):144-153.吴慕思,周丹阳,赵莉.基于网络爬虫实现高性能搜索引擎排序算法的研究[j].电子信息技术学报,2017,30
1):144-153.目录
一、引言
二、主要思想简介
三、总结和探讨[一]引言计算机网络与搜索引擎相结合的设计思想已经是十多年前就被提出来了。随着经济的发展和技术的进步,搜索引擎已经逐渐从互联网的*敏*感*词*行业转变为互联网的主流。然而,目前,搜索引擎的发展似乎遭遇到瓶颈。在传统搜索引擎领域,人工判断关键词的正确率是目前搜索引擎主要的痛点之一。以google为例,他们在最近才推出trendingplans功能,通过标记热词和前500个公开查询热词,筛选最有可能获得网站流量的关键词,提高网站的点击率。
然而这些热词有时候也并不是网站流量最高的,而且还要经过数千次的人工标记和查询。目前,通过机器学习的方法已经可以解决人工判定的问题。具体来说,机器学习可以用来拟合网络中词之间的相似性。举个例子,对于一个车辆网络,目前最常用的两种相似度计算方法是指定词上的相似度度量和指定关键词上的度量,通过度量相似度,可以得到车辆名称与车辆特征之间的关系。
比如说,通过热度可以得到一个人的各方面指标。比如domainawareness:车辆的分类、停车场数目和车主位置,domaincontext:车牌号和车牌码相似度。度量其实也并不是很困难,而且google以往的相似度的度量也不是很复杂。目前有很多流行的机器学习或者深度学习算法可以做到。但是,这些算法的使用成本一般较高,维度较高,如果数据较多,训练就会比较困难。
算法拟合得越好,训练的成本就越高。因此,搜索引擎应该是一个降低成本的目标。近些年来,随着人工智能的发展,现在有了语义网和智能爬虫等利用机器学习的方法来做搜索引擎。然而,这些方法有的不成熟,有的过于复杂。通过利用搜索引擎可以搜索到什么信息,现在还是一个未知之谜。是否有简单、方便的方法可以帮助人们搜索到想要的信息呢?它是否会成为未来搜索引擎的发展方向呢?毕竟,目前的人工智能和深度学习已经开始替代人脑,机器学习可以进行文本、图片、视频等各种任务,很有可能在搜索引擎的各个方面应用机器学习算法。
比如说,搜索图片这种任务,现在已经有了图像检索的算法;搜索车牌号这种任务,可能已经有了车牌号匹配的方法;搜索音频信息可能有网络嗅探等算法。用seo搜索引擎。