简述什么是搜索引擎优化(关于搜索引擎百度分词的经验,你了解多少?(一))

优采云 发布时间: 2022-02-10 06:30

  简述什么是搜索引擎优化(关于搜索引擎百度分词的经验,你了解多少?(一))

  为了让大家更好的了解如何选择关键词,阿坝特地做了一些分词测试,总结了一些搜索引擎百度分词的经验分享给大家。希望能帮助站长对搜索引擎分词技术有更深入的了解,做自己的网站,获得更好的排名。

  一、搜索引擎中文分词技术

  简单来说,搜索引擎的中文分词技术就是将汉字序列分割成有意义的词组。

  分词示例:I/is/a/student

  二、简述搜索引擎分词技术

  1.基于字符串匹配的分词方法

  按照一定的策略,将待分析的汉字字符串与极端词库中的词条进行匹配。

  常见的分词方法:

  前向最大匹配法(从左到右)

  分词测试示例:I/have/opinion/disagree

  逆最大匹配法(从右到左方向)

  分词测试示例:I/have/opinion/disagreement

  根据大量测试数据的统计结果,简单使用前向最大匹配的错误率为1/169,而简单使用反向

  最大匹配的错误率为 1/245。反向匹配的分割精度略高于正向匹配。

  2.统计分词方法

  相邻单词同时出现的次数越多,形成单词的可能性就越大。系统用于自动识别生词。

  3.基于理解的分词

  句法和语义分析与分词同时进行,句法信息和语义信息用于处理歧义。

  

  三、百度搜索引擎分词技术分析

  1.最大分词长度

  分词测试查询:当然

  

  分词技术总结:小于等于3个汉字不切

  分词测试查询:电影下载

  

  分词技术总结:大于等于4个汉字的词会被分词

  2.分词匹配算法

  分词测试查询:查询:“工地指南”

  前锋最大匹配:站点/方向/指南

  反应最灵敏的匹配:工作/地点/指南

  

  百度采用前向最大匹配算法

  分词测试查询:*敏*感*词*定军山

  正最大匹配:*敏*感*词*/安丁/君/单

  百度分词结果:*敏*感*词*/安/丁军山

  分词结论:百度识别人名、影视、剧名等特殊词,切换到词库分词时首选。

  

  分词测试查询:何润东西南北(“何润东”、“东西南北”两个词)

  正最大匹配:何润东/西/南北

  

  分词技术总结:第一,使用专用词典,使用最大正匹配分词,切出一些结果;

  关于搜索引擎的分词技术,阿坝这次先写这个。然而,搜索引擎的分词技术远不止于此。分词中的一些疑难问题,如歧义识别、生词识别、拼写检查错误提示、拼音提示、相关搜索提示等,以后有机会为大家一一介绍。.

  如果您有兴趣进一步了解这方面的知识,可以来我们的交流*敏*感*词*流。

  中国站长资源网超级群——(500人)群号:47788123(群分享中有很多SEO资源,网站操作资源供群友下载!)

  建群目的:帮助站长解决问题,新手老手一视同仁,能教就教!可以的话帮忙!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线