搜索引擎优化毕业论文(论文写作指导:现有的移动搜索存在一些问题(一))
优采云 发布时间: 2021-11-03 01:17搜索引擎优化毕业论文(论文写作指导:现有的移动搜索存在一些问题(一))
作文指导:请补充
移动搜索引擎的设计与实现
1、简介
互联网的出现彻底改变了我们的生活,让我们的星球真正成为一个地球村。人与人之间的交流从未如此简单直接。手机已经开始走进千家万户,成为我们生活中的必需品。渐渐地,尤其是在中国,手机用户数量已经远远超过网民数量,而且这个数字还在快速增长,人们更换手机的周期比更新电脑的周期要短得多。所以未来的无线互联网将极大地改变我们的生活。但是,现有的移动搜索存在一些问题:
(1) 现有的互联网搜索模式正在走向手机,并没有针对手机等终端特性量身定制的搜索引擎。
(2)目前的移动搜索引擎都是基于GSM网络,即3G网络。这种网络的特点是上网速度慢,对用户的服务不足。
(3)用户在手机搜索中搜索到的内容会与网络搜索有所不同,比如地图搜索、视频搜索、比价搜索等。
(4)手机搜索,由于手机端屏幕小等原因,所以对返回结果的准确性和精度有要求,用户不忍给他回很多垃圾。
(5)手机搜索需要个性化,因为可以根据手机号等来区分每个人,广告也需要个性化和针对性。
2、系统相关技术
2.1 爬虫模块的设计与实现
在 Web 搜索引擎上出现的第一个实用站点之一,AnswerSpider 程序显示了强大的功能。搜索引擎的作用是检索 Web 的内容。当您在搜索引擎中键入几个关键字时,它会提供符合搜索条件的 Web 链接。搜索引擎通过构建收录 Web 内容索引的大型数据库来实现此功能。
手动检索和分类整个 Web 将是一项艰巨的工作。因此,扫描网站和检索其内容的工作总是留给爬虫程序。当爬虫扫描一个网站时,它还会查看链接到当前网站的其他网页。爬虫会保存这些链接的列表,当它完成对当前站点的扫描后,就会访问那些链接的站点。由于超链接在Web中的广泛使用,我们可以想象这样下去,一个爬虫程序终于可以访问整个Web的几乎所有可访问的网页。但是,几乎每天都有新站点被访问,爬虫不可能访问互联网上的每个站点。
2.2 索引模块的设计与实现
在整个搜索系统中,爬虫模块实现了网页链接的分析和页面信息的处理,并将有用的信息以文件的形式保存在磁盘中。然后第二步是索引模块分析磁盘中的文件并创建索引文件。索引模块的好坏直接关系到整个搜索引擎的效率和准确度。
Answer索引模块的运行机制,Answer索引模块从功能上可以分为三个部分。
论文网
(1)从磁盘系统中读取AnswerSpider保存的格式化文本文件。由于Lucene只能索引文本文件,如果要索引其他类型的文件,必须将它们转换为文本。
(2)分析文本数据,使其更适合做索引。分析数据时,首先将文本数据分成一些大的块或标记,然后对它们进行一些可选的操作。在Answer index中它使用CJKAnalyzer 分析文本文件。
(3) 将分析的数据写入索引。输入数据经过分析处理后,可以将结果写入索引文件。Lucene使用一种叫做倒排索引的数据结构来处理输入数据存储。这个数据结构可以在快速搜索关键词时有效利用磁盘空间,此外,在这部分Answer还对每个网页进行类似Google的PageRank评分,使索引评分更加公平公正。
3、系统设计与实现
3.1 搜索模块功能
搜索模块包括接收用户输入的查询词组,进行搜索,得到相应的匹配结果显示给用户。至此,我们已经有了一个索引网页库和倒排文件。我们需要做的是通过搜索模块实现索引数据和用户查询的互通。
在搜索模块中,Answer 在调用 Lucene 类的基础上增加了 ParseHits 和 ReadHits 两个类。
ReadHits 类:ReadHits 是读取 Hits 类返回的结果的类。在这个类中,会调用 ParseHit 类来解析结果集。ReadHits 类是一个直接与用户界面交互的类。
写论文
ParseHit 类:ParseHit 类是一个类,它再次将用户输入的短语与返回的结果集进行比较和分析。它是一个使搜索结果更准确的类集。例如,查询短语将与返回结果中的网页标题进行匹配。如果与标题的相似度非常接近,则结果的顺序会提前。
3.2 搜索模块运行机制
答 搜索模块的运行机制主要由四部分组成,各部分的任务如下:
(1)在用户界面提供了用户输入框,用于接收用户输入的查询项。
(2)调用QueryParser类解析用户输入的查询项,如解析“A+B”词组等。
(3)创建多个item对象,这样可以在多个key字段中查询。在index模块中,我们使用Field.Keyword()方法来创建网页的URL,Tille等。索引后,这些结果将用于搜索模块。例如:
Term t=new Term("title","杭州师范大学");
查询 query=new TermQuery(t);
Hits hits=searcher..search(query);
(4)再次使用ReadHits类和ParseHit类对结果进行排序,并在用户界面上返回结果。返回结果与当前搜索引擎相同。每个结果显示页面标题和URL链接。
作品
毕业论文采集整理:毕业论文网 毕业论文网