2014年中国互联网络发展状况统计报告(下)
优采云 发布时间: 2021-06-25 07:052014年中国互联网络发展状况统计报告(下)
1 简介
2014年1月16日,中国互联网络信息中心(CNNIC)在北京发布了第33次《中国互联网络发展状况统计报告》,显示截至2013年12月,中国网民规模达到6. 180亿。互联网普及率为45.8%。这比2012年底增加了3.7个百分点。互联网的发展和普及,给人们的生活和工作带来了快速的变化。中国互联网普及率逐渐饱和,互联网发展的主题也从“量”转向“质”。想要找到自己需要的东西,不再局限于看书,只需要一台上网电脑,百度或者谷歌。这是最基本的搜索引擎应用程序。但是,很多研究发现,一般用户只会关注搜索结果中的前几条信息并点击查看,并没有耐心一一查看后续的搜索结果。因此,他们关注搜索引擎排名。也称为网站,是建设中的重大决策之一。在此背景下,搜索引擎优化技术也得到了快速发展,并逐渐形成了一个行业。页面优化的各大网站,如何在百度或谷歌中排名靠前,以及谷歌百度反搜索作弊算法层出不穷。搜索优化与反搜索作弊之战正在如火如荼地进行。
2搜索引擎技术
2.1搜索引擎概述
搜索引擎是一个计算机应用软件系统,更准确地说是一个网络应用软件系统。以一定的策略采集和发现网络上的信息,并使用特定的计算机程序,然后组织和处理信息,为用户提供检索服务。
2.1.1百度搜索引擎
百度是当之无愧的国内搜索引擎老大。致力于为人们提供“简单可靠”的信息获取方式。百度于2000年1月由李彦宏和徐勇在北京中关村创立。 “百度”一词源于中国宋代诗人辛七集的“清宇案·元溪”,象征着百度对中文信息检索技术的执着追求。或许百度在技术和历史使用时间上不如谷歌,但百度在中国大陆的市场份额远大于谷歌。
2.1.2Google 搜索引擎
Google 是目前世界上最大的多语言搜索引擎。它是由谷歌创始人拉里·佩奇和谢尔盖·布林在斯坦福大学学生宿舍共同开发的。由于其简单实用,迅速开始在全球传播,并成为全球领先的搜索引擎。 Google Cash 的算法急于模仿。
2.1.3 百度和谷歌的区别
谷歌和百度都是非常强大的搜索引擎,也是中国网民最常用的两个搜索引擎。一般公司网站做的搜索引擎优化工作,会专门迎合这两个搜索引擎的口味。达到增加网页收录的体积和排名的目的。但是,谷歌和百度都有自己的一套标准和自己的网页收录习惯。下表列出了谷歌搜索引擎和百度搜索引擎的区别。从表1可以看出,百度和谷歌对搜索引擎优化技术的重视程度不同,计算方法也不同。如何更好地将网站排名高于网站definition和关键词 除了网页内容的选择、页面内容的及时更新、外部链接的选择之外,还有一个观察大的算法-scale搜索网站,也需要及时调整各自的网站搜索引擎策略。
2.2搜索引擎工作原理
提高网站的搜索引擎友好度是搜索引擎优化的主要任务之一。因此,搜索引擎优化和搜索引擎工作流之间存在着必然的联系。搜索引擎的主要工作可以分为三个步骤:抓取网页→建立索引库→在索引库中排序,如图1所示。
表 1 百度搜索引擎与谷歌搜索引擎对比
图1 搜索引擎工作原理图
2.2.1 从网上抓取网页
搜索引擎使用数据采集procedures 来抓取互联网页面的内容。我们称这些数据采集procedures 为蜘蛛程序或机器人程序。搜索引擎蜘蛛从数据库中已知网页的网址开始,通过网址抓取页面,然后跟踪网页上的链接,按照特定的策略遍历网站中的网页。当通过链接发现新的链接时,蜘蛛会将新的 URL 记录到数据库中等待爬取。跟踪网页链接是搜索引擎蜘蛛发现新网址最基本的方法,因此必要的反向链接也是搜索引擎优化最基本的操作方法之一。当然,搜索引擎在抓取页面的过程中能否获得越来越多有价值的信息,将直接影响到搜索引擎的效率和排序结果的质量。因此,搜索引擎在抓取页面时,除了存储原创页面外,还会附加该页面的一些页面信息(如最新修改时间、大小、URL、抓取时间等)。
2.2.2创建索引数据库
从互联网上抓取网页只是搜索引擎工作的第一步,因为抓取到的网页并不是直接匹配和比较,而是为用户提供查询服务。还需要通过程序对抓取到的网页文件进行分解分析,并以表格的形式存入数据库中。这个过程就是索引。当用户使用搜索引擎进行查询时,他们只使用一个词、词组或很短的句子进行搜索。因此,搜索引擎首先对存储的原创页面进行索引,过滤掉标签信息,然后提取网页的正文内容,然后通过正文的分析建立关键词索引,从而得到相应的页面和关键词的关系,最后重新组织关键词,让关键词返回到对应的页面。整个过程就是索引数据库的生成过程。
2.2.3在索引库中搜索排序
搜索是用户获取信息的一种方式,也是搜索引擎最基本的功能。用户在搜索引擎界面输入关键词后,搜索引擎程序会将输入的关键词与之前建立的索引库进行匹配,找到与关键词或用户输入的短句匹配的网页。除了之前建立的索引库,网页和关键词列表都已经建立了索引,所以你只需要根据现有的相关性对它们进行排序即可。相关性越高,排名越高。最后,相关页面的列表会显示在结果页面上。这些页面组织了搜索结果的链接地址和页面内容的摘要,并返回给用户。
2.3搜索引擎分类
搜索引擎按其工作方式可分为全文搜索引擎、目录搜索引擎和元搜索引擎三种。
全搜索引擎是指搜索引擎蜘蛛通过互联网上的URL抓取页面,然后对页面进行分析,建立关键词与页面的对应关系,最终形成索引数据库。用户输入关键词 以搜索与之关联的 URL 和摘要内容。全搜索引擎的优点在于信息量大,召回率高,但缺点也很明显,准确率低,反馈页面收录大量无关内容。这样的搜索引擎通常是谷歌和百度。严格来说,目录搜索引擎不是搜索引擎。它只是按目录分类的网站 链接列表。用户无需输入关键词字样,只需要根据目录搜索所需信息即可。分类目录的模型一般是树状结构,从根节点向下一层一层列出,底部的叶节点是指向相关内容的网页链接。与全搜索引擎相比,目录搜索引擎的准确率更高,但由于是人工处理,耗费大量人力财力。这也使得目录搜索引擎不适合*敏*感*词*搜索。同时,搜索内容也跟不上时代。此类搜索引擎的典型代表是 Yahoo!还有DMOZ(openDirectory)等等。元搜索引擎是一种依赖于其他搜索引擎的搜索引擎。用户发出查询请求后,元搜索引擎不会自行进行任何处理,而是同时在其他搜索引擎上进行搜索,然后根据各个搜索引擎的返回结果进行组合,最后将它们以一系列权重呈现给用户。元搜索引擎的特点是能够分散处理负载,扩大搜索范围,使得搜索响应时间比全文搜索引擎短,同时保证搜索内容是最新的与目录搜索引擎相比。缺点是不能充分利用搜索引擎的功能,用户需要做更多的决策和筛选。此类搜索引擎通常包括 Dogpile、Vivisimo 等。
3网站Construction 搜索引擎优化技术与实现
搜索引擎不会真正搜索互联网。它使用特定的程序,即搜索蜘蛛程序,访问页面的超链接,然后对页面进行爬行。通常搜索蜘蛛会抓取互联网上数千甚至数十亿个网页,并最终建立索引数据库;由于搜索引擎无法真正理解网页上的内容,索引程序将抓取到的页面数据进行预处理,供排名程序调用;当用户需要查找信息时,只需输入关键词或短句,排名程序会自动调用索引数据库,经过匹配程序,计算相关性,然后根据级别显示搜索结果页面匹配关键词 相关性。 21世纪是信息时代。互联网的发展让企业和企业在这个无形的市场中看到了巨大的商机。为了更好地推广自己的产品和服务,网站建筑已经成为大家打开互联网市场大门的金钥匙。 在网站的建设过程中,一些公司从网站的早期规划到技术实现都没有从搜索引擎优化的角度进行设计。做完之后还是要花很多钱请专业的搜索引擎优化公司做网站Optimization,所以搜索引擎优化的最佳时机应该是网站规划时。搜索引擎优化是为网站健康提出的一项技术。要求网站的基本元素符合搜索引擎搜索原则,合理优化网站,更加人性化,更容易被搜索引擎收录和优先排序。搜索引擎优化策略的基本思路是:通过搜索引擎优化,一套基于搜索引擎的营销思路,合理设计网站功能、结构、布局、内容等关键元素,提供网站生态自我营销解决方案,最大化网站的功能和表达。
3.1关键词
关键词 充当用户和网页之间的中介。通过百度或谷歌等搜索引擎查找信息,用户必须先输入信息的关键词。众所周知,计算搜索只能通过特定的程序来实现。它只是机械地查找并显示用户输入的收录关键词的网页,并没有进行所谓的过滤。因此,网页构建时关键词的选择和关键词的位置和关键词的密度都很重要。
3.1.1关键词的选择
互联网的发展进入了一个新阶段。人们习惯于从互联网上搜索他们需要的信息。然而,海量的数据使得人们很难在短时间内找到自己需要的信息。快速准确地搜索您需要的信息。总结是文章的中心思想,关键词是文章的核心。可见关键词的重要性不言而喻。目前的搜索引擎大多采用问答的方式进行搜索,需要用户提供相关的关键词,所以搜索引擎优化的核心内容在于对关键词的优化。 关键词的选择如图2所示:
图2关键词的选择
3.1.2关键词location
在优化页面时,关键词的位置也很重要。一般关键词应该通过content属性出现在网站URL、网站title标题标签、meta标签、meta标签中。 关键词,页面内容(尤其是关键词出现在内容的第一段和最后一段),关键词出现在H1和H2标签中,图片文件名出现在ALT属性中关键词。因为蜘蛛爬行程序关注关键词在某个位置,所以关键词的放置应该是自然的,在应该出现的地方放置一两次就足够了。
3.1.3关键词密度
所谓关键词密度是指网页正文中出现的次数与正文中其他文字的比值。一般用百分比来表示关键词密度的大小。一般来说,关键词密度是3%~8%比较合适。当然关键词在一个页面上不要出现太多次,否则会被搜索引擎视为作弊。
3.2网页设计策划
3.2.1代码优化
代码优化是对网页中的HTML源代码进行必要的调整。在页面布局中尽量少用传统的Table布局。由于Table布局会生成大量代码,不利于网络蜘蛛的抓取,尤其是当网络蜘蛛抓取嵌套表格时,会跳过嵌套的内容,或者有时会放弃整个页面。页面布局采用Div+Css排版,页面代码精简,有利于网络蜘蛛在页面上爬行爬行,同时提高了爬行速度,让网络蜘蛛在页面上爬取一个完整的页面最短时间,提升收录质量。
3.2.2URL 静态化
使用URL静态,与动态网页(如ASP、JSP、ASPX后缀网页)相比,HTML后缀对搜索引擎更加友好。同时,URL静态有两个优点:静态URL地址比动态地址更简洁,网络蜘蛛对静态URL的适应性更强,方便搜索引擎收录;减少了服务器的负担,静态的URL页面不需要是动态的。页面与数据库交互,无需服务器端解释执行。
3.2.3图片优化
在网页*敏*感*词*中,为了增强页面的视觉效果,图片或其他多媒体元素的使用也是必不可少的。与文本页面相比,图片页面占用的内存要大很多,这会降低网页打开的速度。到目前为止,还没有搜索引擎能够读取图片的文本内容。提高搜索引擎识别度的唯一方法是使用图片名称,设置alt属性值,并在图片中添加文本内容的简要说明。同时,为了加快页面显示速度,图片压缩和大图切割技术同样重要。
3.2.4网站结构
对于网站来说,什么样的结构让网络蜘蛛爬行更有优势,也就是网站采用扁平结构。所谓扁平化结构,就是网站垂直结构更简单,让用户可以通过相对较少的点击次数到达想要访问的页面。 网站不能为追求过分的美感、创意等提升网站的等级,这对网络蜘蛛的爬行是不利的,因为网络蜘蛛在爬取网络数据时利用了各个网页之间的层次关系对于爬虫来说,层级结构越大,随着网站的更新,网络蜘蛛爬虫难度越大,所以良好的扁平化结构对于搜索引擎优化非常重要。
3.3网站content
网站原创的内容是最好的。不要使用多次转发的内容。一个经常更新的网站,内容多为原创,即使不做太多优化,网站也能有不错的排名。网络蜘蛛会经常在网站 上获取收录 的信息。如果网站不经常更新,网络蜘蛛的访问次数会逐渐减少。内容独立性,与其他页面至少有 30% 的不同也很重要。不同页面的内容不能太相似。对于差异很小的页面,网络蜘蛛只会收录其中一个页面。页面内容不宜过长,注意分段。每个页面最好1000-2000字,注意合理切分,比如有的页面显示技术文章的内容,有的页面显示产品介绍等内容。定期更新。最好每天定时更新,这样网络蜘蛛每天都会来你的网站收录新信息,不定期、不频繁的更新网站,网络蜘蛛访问的次数会逐渐减少和更新内容,这可以每天添加一条技术文章,或者一条新闻等等。内容围绕页面关键词。发布与网站话题相关的文章内容时,内容要围绕关键词,并尽量出现三到四次关键词。
链接到3.4网站
网络蜘蛛的爬取数据是以网页之间的链接为爬取路径。根据链接方向,一般分为:导入链接和导出链接。
3.4.1导入链接
所谓导入链接,是指其他网站网址链接到自己的网站。影响网站排名的因素很大一部分来自于尽可能获取相关的网站外部链接,这是由搜索引擎决定的。由思维方式决定,其实每一个导入的链接都相当于在你的网站上进行了一次外部网站投票。导入的链接越多,票数越多,网站内容的相关性就越高,因此在搜索引擎中占据主要地位。主要观点如下:(1)高PR值网站导入链接的PR值全称PageRank,是Google用来标记网页排名的一种方法。PR值有11 个级别,从 0 到 10。值越大,Google 对某个网页的肯定程度越高,该网页越受欢迎。
(2)内容相关页面的导入链,例如在介绍某产品的网站content页面,在内容页面上添加产品关键词出现的超链接,链接指向需要优化的@.k14@.
(3)import链接锚文本收录页面关键词如other网站友情链接a href=URL某产品,友情链接写某产品,但不写产品公司名称。搜索engine 是利用了人的固定思维,比如网站的100个链接都是针对某个产品写的,那么它会认为指向的网站是针对该产品的,就像在日常生活中一样,每个人都被称为小王,那么这个人一定是小王。选择链接的网站必须有高权重,比如高PR值,这样搜索引擎才会给高分。
(4)anchor 文本存在于网页内容中,例如某个产品的 href="#anchorNAME"。
(5)import 链接存在3个多月,导入链接需要3个多月,请勿短时间删除导入链接。
(6)导入链接所在页面的导出链接不到100个。一个网站上肯定有很多友情链接。如果网站上友情链接太多,对网站Big 没有帮助。
(不同IP地址的7)import链接意味着你要选择不同的网站,不同的网站不能放在同一个服务器上,因为同一个服务器的IP是一样的。
(8)Anchor 文字多样化(如产品介绍、产品特点和产品发展趋势等)
3.4.2导出链接
所谓导出链接是指网页中其他网站页面的链接。搜索引擎在分析当前网页时,也会根据当前网页的超链接对导出的链接进行分析。当网页内容相关时,有利于当前网页的搜索排名。这也是一些网站相互交换友情链接的原因。因此,对于搜索引擎来说,适当、有效、相关的导出链接是非常必要的。导出链接怎么做?
(1)网站单链接,这个主要适用于一些高权重的网站,可以做单链接。
(2)友情链接交换,适合网站同级别,或者网站内容类似,一定的友情链接也是必不可少的。
(3)forums、博客等,选择知名度高的论坛或博客,同时选择帖子生成的静态页面。
(4)加网站等目录,找一些免费的网站导航,因为只是单向链接,所以效果很好。
(5)软文,软文是有效的,尤其是软文质量高,不仅增加了站外链接,还有效的推广了网站。
(6)买文字链接,买一些靠卖链接赚钱的网站,但买的不光看PageRank高,还要注意是否和这个页面的内容有关。
当然,不好的导出链接,比如未管理的链接和模糊的付费广告链接会降低网站的可信度,所以有必要定期确认导出链接网页的可访问性。同时,必须充分注意导出链接页面与这个网站页面的相关性。对于搜索蜘蛛来说,两个网页是否相关由关键词判断。搜索引擎会分析网页中的所有文本,包括标题,甚至分析图片等非文本格式的文件,并根据其属性赋予权重,最终判断页面的关键词及其密度。如果导出链接网站关键词的目标与本页关键词相同或相似,则更相关。因为经得起时间考验的导出链接是最好的。
4 总结
搜索引擎优化是在线营销的主要方法之一。搜索引擎优化技术的实现贯穿网站的规划、建设和维护*敏*感*词*。当然,任何搜索引擎优化都不是一劳永逸的。随着百度、谷歌等搜索引擎算法的更新,网站也必须持续维护,以保持排名的稳定性。