搜索引擎优化毕业论文(论文写作指导：现有的移动搜索存在一些问题（一）)

优采云发布时间: 2021-11-03 01:17

　　作文指导：请补充

　　移动搜索引擎的设计与实现

　　1、简介

　　互联网的出现彻底改变了我们的生活，让我们的星球真正成为一个地球村。人与人之间的交流从未如此简单直接。手机已经开始走进千家万户，成为我们生活中的必需品。渐渐地，尤其是在中国，手机用户数量已经远远超过网民数量，而且这个数字还在快速增长，人们更换手机的周期比更新电脑的周期要短得多。所以未来的无线互联网将极大地改变我们的生活。但是，现有的移动搜索存在一些问题：

　　（1）现有的互联网搜索模式正在走向手机，并没有针对手机等终端特性量身定制的搜索引擎。

　　（2）目前的移动搜索引擎都是基于GSM网络，即3G网络。这种网络的特点是上网速度慢，对用户的服务不足。

　　（3）用户在手机搜索中搜索到的内容会与网络搜索有所不同，比如地图搜索、视频搜索、比价搜索等。

　　（4）手机搜索，由于手机端屏幕小等原因，所以对返回结果的准确性和精度有要求，用户不忍给他回很多垃圾。

　　（5）手机搜索需要个性化，因为可以根据手机号等来区分每个人，广告也需要个性化和针对性。

　　2、系统相关技术

　　2.1 爬虫模块的设计与实现

　　在 Web 搜索引擎上出现的第一个实用站点之一，AnswerSpider 程序显示了强大的功能。搜索引擎的作用是检索 Web 的内容。当您在搜索引擎中键入几个关键字时，它会提供符合搜索条件的 Web 链接。搜索引擎通过构建收录 Web 内容索引的大型数据库来实现此功能。

　　手动检索和分类整个 Web 将是一项艰巨的工作。因此，扫描网站和检索其内容的工作总是留给爬虫程序。当爬虫扫描一个网站时，它还会查看链接到当前网站的其他网页。爬虫会保存这些链接的列表，当它完成对当前站点的扫描后，就会访问那些链接的站点。由于超链接在Web中的广泛使用，我们可以想象这样下去，一个爬虫程序终于可以访问整个Web的几乎所有可访问的网页。但是，几乎每天都有新站点被访问，爬虫不可能访问互联网上的每个站点。

　　2.2 索引模块的设计与实现

　　在整个搜索系统中，爬虫模块实现了网页链接的分析和页面信息的处理，并将有用的信息以文件的形式保存在磁盘中。然后第二步是索引模块分析磁盘中的文件并创建索引文件。索引模块的好坏直接关系到整个搜索引擎的效率和准确度。

　　Answer索引模块的运行机制，Answer索引模块从功能上可以分为三个部分。

　　论文网

　　（1）从磁盘系统中读取AnswerSpider保存的格式化文本文件。由于Lucene只能索引文本文件，如果要索引其他类型的文件，必须将它们转换为文本。

　　（2）分析文本数据，使其更适合做索引。分析数据时，首先将文本数据分成一些大的块或标记，然后对它们进行一些可选的操作。在Answer index中它使用CJKAnalyzer 分析文本文件。

　　（3）将分析的数据写入索引。输入数据经过分析处理后，可以将结果写入索引文件。Lucene使用一种叫做倒排索引的数据结构来处理输入数据存储。这个数据结构可以在快速搜索关键词时有效利用磁盘空间，此外，在这部分Answer还对每个网页进行类似Google的PageRank评分，使索引评分更加公平公正。

　　3、系统设计与实现

　　3.1 搜索模块功能

　　搜索模块包括接收用户输入的查询词组，进行搜索，得到相应的匹配结果显示给用户。至此，我们已经有了一个索引网页库和倒排文件。我们需要做的是通过搜索模块实现索引数据和用户查询的互通。

　　在搜索模块中，Answer 在调用 Lucene 类的基础上增加了 ParseHits 和 ReadHits 两个类。

　　ReadHits 类：ReadHits 是读取 Hits 类返回的结果的类。在这个类中，会调用 ParseHit 类来解析结果集。ReadHits 类是一个直接与用户界面交互的类。

　　写论文

　　ParseHit 类：ParseHit 类是一个类，它再次将用户输入的短语与返回的结果集进行比较和分析。它是一个使搜索结果更准确的类集。例如，查询短语将与返回结果中的网页标题进行匹配。如果与标题的相似度非常接近，则结果的顺序会提前。

　　3.2 搜索模块运行机制

　　答搜索模块的运行机制主要由四部分组成，各部分的任务如下：

　　（1）在用户界面提供了用户输入框，用于接收用户输入的查询项。

　　（2）调用QueryParser类解析用户输入的查询项，如解析“A+B”词组等。

　　（3）创建多个item对象，这样可以在多个key字段中查询。在index模块中，我们使用Field.Keyword()方法来创建网页的URL，Tille等。索引后，这些结果将用于搜索模块。例如：

　　Term t=new Term("title","杭州师范大学");

　　查询 query=new TermQuery(t);

　　Hits hits=searcher..search(query);

　　（4）再次使用ReadHits类和ParseHit类对结果进行排序，并在用户界面上返回结果。返回结果与当前搜索引擎相同。每个结果显示页面标题和URL链接。

　　作品

　　毕业论文采集整理：毕业论文网毕业论文网

0

2021-11-03

搜索引擎优化毕业论文

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

搜索引擎优化毕业论文(论文写作指导：现有的移动搜索存在一些问题（一）)

0 个评论

发起人

AI时代内容工厂

搜索引擎优化毕业论文(论文写作指导：现有的移动搜索存在一些问题（一）)

0 个评论

发起人

相关问题