搜索引擎优化毕业论文(面向美食的垂直搜索引擎能够帮用户筛选互联网中的与美食无关)

优采云 发布时间: 2021-11-30 02:05

  搜索引擎优化毕业论文(面向美食的垂直搜索引擎能够帮用户筛选互联网中的与美食无关)

  [摘要] 近年来随着互联网技术的发展,网络上的信息越来越复杂,信息量也越来越大。面对互联网上海量的数据,从中找到自己想要的信息已经变得很困难。为了解决互联网用户信息检索的迫切需求,搜索引擎应运而生。我们常用的搜索引擎如谷歌、百度等都称为通用搜索引擎。用户可以通过输入关键词在网上查找关键词的信息。但是,一般搜索引擎的搜索结果缺乏针对性。搜索结果很多,但有用的信息很少。为了给用户提供更好更高效的检索体验,垂直搜索引擎应运而生。垂直搜索引擎是为有特定需求的用户执行搜索功能的搜索引擎。它的查询效率更高,查询效果更好。垂直搜索引擎是专门针对某个领域的搜索引擎。查询结果是该字段中收录搜索关键字的所有信息。为搜索用户节省了在一般搜索引擎中筛选不相关信息所浪费的大量时间。如今,互联网上有各种各样的垂直搜索引擎。其中,音乐、图片、新闻、购物等垂直搜索引擎较多,食品类垂直搜索引擎较少。但是现在随着人们生活水平的提高,越来越多的人不知道每天吃什么、去哪里吃、如何吃健康。一个面向美食的垂直搜索引擎可以帮助人们解决这些问题。面向食品的垂直搜索引擎可以帮助用户过滤互联网上与食品无关的信息。即使用户输入一个似乎与食物无关的词,他也可以检索到与食物相关的各种推荐、食谱和餐馆。还有其他信息,比如搜索“冬天”,你会发现各种与冬天有关的食物信息。本文将介绍一个食品行业垂直搜索引擎的研究和实现的全过程。包括网络数据的获取和获取数据的处理,指标的研究,最后是垂直搜索引擎系统的设计与实现。在数据的获取和处理中,Heritrix 将被用来制作网络爬虫来从互联网上爬取数据。Heritrix是一款纯Java开发的开源网络爬虫。用户可以使用它从互联网上获取他们想要的资源。1]。然后使用正则表达式和HTMLParser提取网页内容,使用ICTCLAS和IKAnalyzer研究中文分词,进而研究处理去重、词频统计、排序等数据。在索引创建方面,需要研究Lucene和Solr,Solr是Lucene在Lucene基础上的进一步封装,可以提高索引的效率。在最后的系统创建部分,将使用Spring+Struts+Hibernate框架。数据库方面,将使用开源关系型数据库MySQL。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线