网站搜索引擎优化策略(动态网站的搜索引擎优化策略(spidertraps)的脚本错误)
优采云 发布时间: 2021-10-02 15:13网站搜索引擎优化策略(动态网站的搜索引擎优化策略(spidertraps)的脚本错误)
动态网站搜索引擎优化策略
摘要:动态网站丰富了网站的功能,但对于搜索引擎来说,情况就不同了。动态页面是在用户“输入内容”或“选择”时动态生成的,但搜索引擎的“搜索机器人”无法“输入”和“选择”。此外,搜索引擎应避免“蜘蛛陷阱”中的脚本错误。
一、动态的出现和优势网站
互联网刚出现的时候,网站的内容以Html静态页面的形式存储在服务器上,访问者访问的页面就是这些实际存在的静态页面。随着技术的发展,特别是数据库和脚本技术PERL、ASP、PHP和jsp的发展,越来越多的站点开始采用动态页面发布方式。比如我们在Google.COM上搜索某个内容时,搜索结果页面文件“本身”在GOOGLE服务器上并不存在,而是在我们输入搜索内容时通过调用后台数据库实时生成的,即, 这些结果页面是动态的。
静态页面站点只涉及文件传输问题,而动态站点要复杂得多。用户和网站之间有很多互动。网站不再只是内容的发布,而是一种“应用”(Application),是软件产业向互联网的扩展。逻辑应用层和数据层,数据库负责站点数据的存储和管理,而ASP、PHP、JSP等则负责处理站点逻辑应用,除了增加了很多交互功能外,更重要的是网站的维护、更新、升级都方便很多,可以说没有动态网站技术,
二、搜索引擎抓取动态网站页面时面临的问题
从用户的角度来看,动态网站很好,丰富了网站的功能,但对于搜索引擎来说,情况就不一样了。(关于搜索引擎和分类目录的区别,以及搜索引擎的工作原理,请“了解搜索引擎”)
根本问题在于“投入”和“选择”。动态页面是在用户“输入内容”或“选择”时动态生成的,但搜索引擎的“搜索机器人”无法“输入”和“选择”。例如,我们想在当当书店网站上查看冯英健的《网络营销基础与实践》一书。介绍页面是动态生成的,URL地址为:
这里,“?”后面的product_id参数值 需要我们输入。“搜索机器人”可以通过链接找到页面,但是无法在“?”后输入product_id参数值,因此无法抓取页面文件。
此外,对于带有“?”的页面 通过链接到达,搜索引擎技术上可以抓取,但一般情况下,搜索引擎选择不抓取。这是为了避免一种“蜘蛛陷阱”。“”的脚本错误,这种错误会让搜索机器人无限循环爬行,无法退出,浪费时间。
三、动态网站搜索引擎策略
动态网站 为被搜索引擎抓取,您可以使用内容发布系统软件将动态站点转换为静态页面。这种方式更适合页面发布后变化不大的网站,比如一些新闻网站(比如新浪新闻中心:)。
一般动态网站可以通过以下方式被搜索引擎抓取:
首先,我们需要让动态页面的URL地址不带“?”,这样动态页面看起来就像一个“静态页面”。看看下面的页面。这显然是一个动态页面,但 URL 地址看起来像一个“静态页面”。针对不同的动态技术,可以使用以下技术来实现: