js抓取网页内容(为了更好的让百度识别PC版对应的移动页面代码如下)

优采云 发布时间: 2021-10-07 21:21

  js抓取网页内容(为了更好的让百度识别PC版对应的移动页面代码如下)

  对于大多数网站来说,为了让网页打开速度更快,用户体验更好,应该启用Webkit内核。代码如下。

  2、 当网站没有对应的手机版页面或百度无法识别适配时,百度会自动将PC版转码为手机版,会损失部分广告收入,需要添加到页面以下代码禁止百度转码。

  3、为了更好的让百度识别PC版对应的手机页面,需要添加如下Meta语句:

  http://3g.sina.com.cn/">

http://sina.cn/">

  更多说明参见:开放适配服务站长信息百度站长平台

  4、如果你的页面有地理属性,可以添加如下代码:

  5、360 搜索(好搜)设计了一套类似于 Facebook 的开放图谱协议的 Meta 标签,用于搜索格式的展示。详细内容参考:Smart summary_360搜索帮助

  标准化标签模板支持短视频、电影、小说、新闻、商品、论坛帖子、博客等内容类型数据。

  例如,对于我们的信息页面,我们计划添加以下 Meta:

  注意:添加后,您需要在360站长平台主动注册才能提交您的页面。

  关注

  一个普通的链接是这样写的:

  黄页88网

  现在添加nofollow标签,如下:

  黄页88网

  这告诉搜索引擎蜘蛛不要点击这个链接。当你不想减肥到一个链接,但又必须在内容中显示该链接时,可以使用此方法来阻止它。

  常见的例子有:“关于我们”、“联系我们”等。几乎所有网站底部都有这些链接,需要Nofollow标签。

  这些页面带来的SEO价值不高,与当前页面的相关性一般不大。为了避免浪费搜索蜘蛛的爬行,需要通过Nofollow标签进行拦截。

  知道原理后,我们也可以屏蔽所有其他的链接,比如天超中的唯一记录链接:

   http://www.miitbeian.gov.cn" rel="nofollow" target="_blank">京ICP备XXX号

  还有“登录”、“注册”,甚至“首页”都可以根据需要进行屏蔽,从而引导蜘蛛抓取收录更重要、更有希望的内容。

  iframe 标签

  搜索引擎的蜘蛛不会识别iframe中调用的图片、文本、网址等内容,因为这些内容不属于页面,而是在访问时临时调用。百度SEO建议也说:“frame/frameset/iframe”等标签会导致百度蜘蛛抓取困难。

  使用这个,我们可以将网站中需要用户查看但不需要被搜索引擎抓取的内容展示出来。

  比如网站顶部的一些topbar导航栏,常用于注册、登录等,可以写成一个iframe框架。

  还有一些赞助广告,如果不需要SEO效果,可以放在单独的iframe中,在页面引用即可。

  但是也不好用太多,可能会被认为是作弊,而且iframe明显不利于页面加载速度。

  CSS 和 JS 最好将 CSS 和 JS 放在单独的外部文件中,这样可以减少代码量,使内容更加简洁,便于搜索引擎识别。

  当然,有时为了减少 CSS 和 JS 请求的数量,一些大的 网站 会直接在内容页面中输出 CSS 和 JS。一般网站 不这样做。

  虽然搜索引擎现在可以识别 JS 中的内容,但一般来说,JS 文件中的内容不会影响页面的 SEO。利用这一点,你可以将必须​​显示但与页面主题内容无关的内容放入JS并写回页面,从而避免降低页面的密度关键词或传递链接权重。document.write("XXX") CSS 样式命名

  搜索引擎越来越智能,通过你的css样式很容易识别页面内容。

  合理有序的CSS命名规则不仅可以提高代码质量,而且更符合搜索引擎规范。

  例如:

  标题:标题

  顶部导航:顶部栏

  登录:登录栏

  标志:标志

  侧边栏:侧边栏

  广告:横幅

  导航:导航

  子导航:subNav

  菜单:菜单

  子菜单:子菜单

  搜索:搜索

  滚动:滚动

  主页面:main

  内容:内容

  标签页:tab

  文章列表:列表

  提示:味精/提示

  栏目标题:标题

  加入:加入

  指南:指南

  服务:服务

  热点:热

  新闻:新闻

  下载:下载

  注册:注册

  状态:状态

  按钮:btn/按钮

  投票:投票

  广告:广告

  合伙人:合伙人

  友情链接:friendLink/links

  页脚:页脚

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线