搜索引擎的基本原理是什么?如何做好网页内容
优采云 发布时间: 2021-06-28 23:32
搜索引擎的基本原理是什么?如何做好网页内容
一、了解搜索引擎的基本原理
当大多数人使用搜索引擎时,他们将其用作童话故事中的魔镜。每当他们想到一个问题时,他们只需在搜索框中输入一个完整的问题甚至一个段落。背景描述清晰明了,怕搜索引擎看不懂。
但结果恰恰相反。很多时候,你想要的内容根本找不到,或者你可能找到了,但是因为超过50页,根本看不到。
搜索引擎的工作不是回答,而是匹配。并且这个匹配不是和整个互联网的网页内容匹配,而是和对应引擎的索引匹配。
如果搜索引擎临时查找并匹配互联网上的所有网页,那么需要搜索许多网页。当搜索引擎得到结果并返回给你时,估计你已经不耐烦了很久了。
所以,搜索引擎在你搜索之前已经做好了准备。这个准备就是提前建立索引。
搜索引擎运行爬虫,去互联网采集webpage内容。从几个页面开始,这些页*敏*感*词*有到其他页面的链接。爬虫跟随这些链接然后去采集其他页面内容,采集的内容会存储在搜索引擎自己的服务器上,对内容进行处理并建立相应的索引。
当您在搜索框中输入需要查询的内容时,搜索引擎不会临时搜索和匹配互联网上的所有网页,而是在自己的索引库中搜索匹配,并匹配索引。也找到了对应的网页。
搜索引擎会根据很多因素对每个匹配的页面进行评分,例如:关键词在网页上出现的次数,关键词是否出现在网页标题中,网页地址是否收录关键词 , 该网页收录没有关键词和网站权限的同义词。
基于这些因素,搜索引擎会对每个网页的综合排名进行打分,最后按顺序显示在屏幕上。所以如果你想检索你需要的内容,关键不是你输入搜索框有多详细,而是你是否能找到关键词并匹配到索引。
二、一些有用的搜索技巧
比如搜索:高校专题网站:这次你的搜索结果将限制在知乎网页。
例如搜索:university special plan filetype:pdf 可以得到大学特殊计划相关的pdf文件。
此时你得到的所有内容标题中都会有这个关键词。
使用双引号""可以精确匹配关键词,搜索结果不会拆分关键词。如果你想搜索一本关于“一句话前万句”的书,只需输入“一句话前一万句”即可。
比如你想搜索《2001:太空漫游》这本书而不是电影,可以在搜索栏中搜索:2001:太空漫游+书
(输入搜索框时不要使用引号)
"3..9":代表数字范围3~9
"1024 * 2048":获取计算结果。
"y=x^2-1":绘制函数图像。