php 搜索引擎优化(真正的静态化和伪静态仍是有本质的区别的。)
优采云 发布时间: 2022-04-06 16:04php 搜索引擎优化(真正的静态化和伪静态仍是有本质的区别的。)
真静态和伪静态还是有本质区别的。处理一个浏览用户的纯htm和一个调用多个数据的php,CPU使用率明显低于前者。记得我说过html下载是经常读写到硬盘的。他说好像读数据库不需要读写磁盘。此外,还有很多缓存分散的php也放在了硬盘上。这些读取不需要磁盘操作吗?? 有趣的。读取单个htm+图片flash等附件就可以达到的目的,何必去读取数据库和php缓存文件,然后重新整合数据输出再+图片flash等附件这么麻烦? cms首页不需要太多的交互。论坛集不应该在这里使用。相反,更应该考虑的是:美!兼容的!直观的信息!表现!而且稳定!伪静态检查——Apache和IIS伪静态设置方法具体伪静态实现可以去百度或者谷歌根据所用语言写的网站搜索实现方法。网络
SEO动态页面
我们经常看到地址栏中有一些网址很长,并且带有“?”。此类链接通常为动态链接,对应的页面为动态页面。
从技术上讲,动态页*敏*感*词*有以下特征:
1.动态页面采用ASP、PHP、JSP、、Perl或CGI等编程语言制作;
2、动态页面实际上并不是一个独立存在于服务器上的网页文件,服务器只有在用户请求时才返回一个完整的网页;
3、动态页面的内容存在于数据库中,根据用户发出的不同请求,提供个性化的网页内容;
4、动态页面内容不存在于页面上,而是存在于数据库中,大大减少了网站维护的工作量;
5、网站使用动态网页技术可以实现更*敏*感*词*,如用户注册、用户登录、在线调查、用户管理、订单管理等;静态页面无法实现这些功能。
从 SEO 的角度来看,动态页面有以下缺点:
1、由于动态页面的生成是基于数据库的内容,无法保证网页内容主题的永恒性。这就形成了搜索引擎的阅读困难,即搜索引擎无法捕捉到一个永恒的主题,因此无法进入搜索引擎的缓存(cache)。
2. 动态 URL 通常收录“?” 参数多,使得搜索引擎在目前的技术条件下难以判断和识别。
3.动态连接,存在信任问题,无论是用户还是搜索引擎都不能确定这个页面会一直存在。
搜索引擎对静态连接更友好。因此,对动态 URL 进行 URL 重写优化使其静态化是一项非常重要的 SEO 技能。为什么整个网站有 100,000 个 SEO 是动态的?目前,此类合理简洁的 URL 都是通过 URL-rewrite 技术处理的。数据库
动态和静态页面的 SEO 优缺点
网页的url地址可以分为动态的和静态的。动态页面实际上并不存在于服务器中。根据用户发送的请求提供相应的内容,对服务器操作压力较小。静态页面的地址是真实的。路径不收录?&% 等变量符号对搜索引擎更友好,更容易获得信任。为了追求动态页面和静态页面的优点,避免缺点,产生了“伪静态”,它是在动态页面的基础上重写的url。该技术在url地址中插入传输参数来迷惑蜘蛛。编程
那么看似有益无害的伪静态页面是不是最好的呢?比较动态页面和静态页面的优缺点。json
动态页面浏览器
在服务器端运行的程序组件和网页属于动态网页。页面根据用户要求返回。交互性很好,但存在很大的安全隐患。动态网站页面的信息必须从数据库中读取,每次打开一个页面形成一个读取命令,如果人数过多,会增加服务器的工作量,从而影响运行网站 的速度。动态网站的变量连接很容易形成死循环。使蜘蛛深入其中,因此对搜索引擎不友好。缓存
静态页面
静态页面实际存在于服务器中,无需编译即可直接加载到用户浏览器中显示。省略了脚本计算和读取数据库,提高了访问速度。优缺点并存,因为存储的静态页面占用了服务器的空间和内存。可以想象,如果一个论坛有 100,000 个帖子,那么每个帖子的大小是 100K。如果所有页面都作为静态页面存在于服务器中,那么它们将占用10G大小,不包括存储和计算中形成的空间浪费。,因此消耗空间资源至关重要。
伪静态页面
那么伪静态页面能否结合动态页面和静态页面的优势,既可以解决搜索引擎友好的问题,也可以解决静态页面占用空间资源大的问题。事实上,浏览器访问伪静态页面。是有规律的判断,而区分的过程是由cpu完成的,导致cpu使用率超载,影响网站的正常服务是伪静态的最大缺点。
由此可见,每种形式都有自己的优势和劣势,如何合理使用各种形式,完全取决于站长对网站规模的规划和类型的定位。
伪静态也有2个优点:1)防止黑客的一些恶意攻击。一些大的网站使用不同的技术来开发不同功能的页面。并且更改扩展名使得黑客无法确认此页面使用的是什么技术,因此无法启动。2) 方便访客。访问者不是程序员,他们不了解.jsp、.php.aspx 是什么,他们只知道URL。所以统一去掉扩展名,或者统一用html、htm替换扩展名,有利于用户的使用。用户可以通过输入 URL 了解您当前在 网站 的位置以及如何访问页面。
如何为 seo 优化动态网页
动态生成的网页:
对于那些动态生成的页面,我们实际的访问者可以用肉眼看到它。但是对于大多数搜索引擎蜘蛛程序来说往往是看不见的,这就是为什么动态网页很难被搜索引擎的 SPIDER 检索到的原因。因此,如果你想让你的动态网页出现在搜索引擎的搜索结果中,你只需要保证你的网站内容对搜索引擎可见,即搜索引擎的蜘蛛程序可以看到你的网站 内容就够了。
所谓动态网页,通常是指由ASP、PHP、ColdFusion、CGI等程序动态生成的页面,网页中的大部分内容来自与网站相连的数据库。该页面在网络空间中不存在,只有在收到用户的访问请求后才生成并传输到用户的浏览器。而且由于访问者可以实时获得他们想要的数据,动态网页往往会留下深刻的印象。此外,动态网页还具有易于维护和更新的优点。例如,对于新产品或价格调整。网站管理员只需要对数据库进行简单的修改,根本不需要修改每个单独的静态页面。
从用户的角度来看,我们可以看到动态网页确实很棒。但如果从搜索引擎的角度来看,结论就不同了。
动态页面的问题:
问题是这些动态网页实际上并不存在于网络空间中,它们只有在用户在变量字段中输入值后才会生成。而且众所周知,搜索引擎的Spider再聪明,也只是一个搜索程序,不能像真人一样选择变量和输入值。查询也可以编程到主页上的链接中,使链接成为对预定义 网站 目录的查询。用户可以在搜索表单中输入查询条件进行查询。一般来说,动态脚本需要一定的信息来返回页面内容,最常见的如 Cookie 数据、SessionID 或环境变量。但是搜索引擎的蜘蛛程序不可能知道要使用您的搜索功能,或者要问什么问题。正因为如此,Spider 检索 < @网站 通常必须在动态站点之前停止。此外,动态页面的 URL 中还收录问号 (?) 和百分号 (%)。还有一些符号,例如 & 、 % 、 + 和 $ ,这些符号经常出现在动态页面的 URL 中。此类 URL 称为“环境变量”(查询字符串)。但是,大多数 SPIDER 无法解码符号“?”之后的字符。显然,由于 URL 实际上并不存在,因此他们什么也得不到。所以,如果你的整个 网站 或 网站 页面的大部分是动态生成的,为了让 SPIDER 轻松读取你的 网站 上的内容,你需要对 @网站 进行某些更改. 还有一些搜索引擎经常拒绝检索静态页面的网址(即
为什么搜索引擎不读取符号“?”后面的内容:
搜索引擎的 SPIDER 不会读取 cgi-bin 目录中的网页或收录字符“?”的 URL。原因是如果在 CGI 中提供了“无限”数量的 URL,那么由于检索这些“无限”网页,SPIDER 经常会陷入无限循环。这些被称为蜘蛛陷阱。数据库程序也可以为 SPIDER 创建类似的情况。所以为了避免可能出现的陷阱,Spider 不会读取“?”之后的字符。在带有符号“?”的 URL 中。如果爬虫被你的服务器困住了,不仅对爬虫本身不利,而且爬虫对你的网站页面的重复访问请求也会导致你的服务器系统完全瘫痪。
动态链接的静态化
动态链接的静态化:
与动态页面的连接是动态生成的。动态脚本在返回页面内容之前需要一些信息,例如 cookie 数据、会话 ID 或字符串。动态页面基于由脚本语言动态生成的数据库驱动页面。动态的网站里面有模板,内容一般存放在数据库中。当您要浏览页面时,模板调用数据库中的内容,并将参数添加到 URL。这个复合 URL 告诉模板要加载什么。查看者通过使用键入到表单中或在主页上的链接中预编码的查询字符串来发现动态 网站 中的信息。
蜘蛛不知道如何使用查询功能。如果蜘蛛向服务器提交一个没有查询字符串的不完整请求,服务器会询问信息的完整地址,蜘蛛无法理解,因此可能陷入死循环。搜索引擎很难处理动态的网站。因为无法提供生成页面所需的信息,就会陷入动态页面服务器,无法自拔。蜘蛛和服务器会陷入死循环,导致服务器瘫痪。因此,动态网页的内容对于大多数搜索引擎蜘蛛来说是不可见的,大多数蜘蛛都厌恶动态页面。识别出此类 URL 后,它们将远离。不会检索它。所以,
搜索引擎很难检索此类复合 URL,因为搜索引擎不知道定义内容的参数。参数越多,检索就越困难。为此,有必要克服这个不完整的地址问题。有两种解决方案:
搜索引擎友好的动态页面,修改网址,参数越少越好,最好使页面静态。
伪静态页面生成方法示例:
在文章列表中,将文章的链接如/blog/articleInfo.do?userName=zy&&blogId=1&&articleId=1转换成如blog/a/0101002526B90C548A833416.html这样的URL,这样蜘蛛就可以再爬进去看到对应的内容,因为文章列表中的每一个文章都是不同的静态URL。
静态和伪静态的比较:
没有。1、速度,对于速度来说,静态页面比伪静态要好,因为静态页面是服务器上实际存在的页面。当用户向服务器发出请求时,可以直接调用。但是,伪静态实际上是一个动态页面。它只是用一种技术或手段来代替“?”之类的一些符号。在带有蜘蛛可以识别的字母的动态页面中。因此,当需要将这样的静态页面发送到服务器时,额外的功能就是转换功能。如果同时请求太多,会增加服务器的负载。
没有。2、容量,就容量而言,因为静态页面实际存在于服务器中,它们会占用一定的空间。如果文件太多,会占用大量空间。但是伪静态可以避免这种情况,因为伪静态就是把动态的url转换成静态的,在服务器上实际上是不存在的。
3、 搜索引擎友好部分。对于静态 URL 页面,它们实际上存在于服务器上。搜索引擎收录之后,URL不会改变,用户访问也不会出现问题。但是,如果是伪静态页面,服务器的伪静态组件没有问题,这个URL也没有问题。如果伪静态组件有问题,那么搜索引擎收录的URL就会出错。如果错误太多,会让搜索引擎讨厌你网站,所以在尝试伪静态页面时,伪静态组件一定不能出错。
内容来自: