所有搜索引擎最核心的是外部链接的技术和关键词密度
优采云 发布时间: 2021-07-27 00:08所有搜索引擎最核心的是外部链接的技术和关键词密度
第 3 步:识别文本内容
通过分析过滤后的文字内容判断网页的核心内容
点击百度就会知道新闻页面,发帖,MP3图片帮助进阶空间|更多 将百度设为首页 企业推广|搜索风云榜|关于百度|关于Baidu2007百度*敏*感*词*京ICP证030173号
搜索引擎程序通过对上述文字的分析,发现以下信息: 共95个字符;其中56个是汉字。 “百度”出现4次,共8个汉字,占16个字。 8÷56≈0.14≈14% 16÷95≈0.16≈16% 判断结论:本页面与关键词“百度”密切相关
第 4 步:执行加权和评分技术
假设关键词重复1次得1分,百度首页的得分为“4”。当然,搜索引擎真正的计算过程是很负责的,涉及计算的参数有上百个。雅虎! 'S工程师告诉我:“所有搜索引擎的核心是外链技术和关键词密度技术”
第五步:保存到排名数据库
经过上面的分析,一个页面就可以存入排名数据库(也叫索引数据库)。百度主页可能会放入一个名为“百度”的小型数据库中。未来用户搜索“百度”时,会打开“百度”小数据库,然后按照分数排列,以HTML格式展示给用户
搜索引擎的处理过程:就像采摘的草药经过处理后放入相应的抽屉。 --- 结束 ---。