抓取网页flash视频(4.供给网站的非Flash版本分化及抓取(图))
优采云 发布时间: 2021-10-27 20:03抓取网页flash视频(4.供给网站的非Flash版本分化及抓取(图))
4.提供一个非 Flash 版本的 网站。换句话说,即使 Googlebot 已成功将您的 Flash 文件索引到搜索数据库中,由于上述通知,Google 也可能无法识别文本、内容和链接。
. 用谷歌的话来说,Googlebot 没有眼睛,它一直无法“看到”视觉媒体的内容。
2. 仅在需要时才操作 Flash。如果您不确定该怎么做,YouTube 就是一个很好的例子。为了让网站更好地被Googlebot区分和抓取,谷歌今天向网站管理者和设计师提出了一些建议。
3.操作sIFR工艺。另外,一些上网速度较慢或使用非标准浏览器的读者也可以浏览您的网站内容,因为他们可能会跳过Flash内容。这些不仅使 网站 与 Googlebot 更加和谐,您的 网站 内容也更容易被更多读者(包括视障人士)获取,因为他们通常使用屏幕阅读器。另外,因为有时候一些文字内容会被制作成图片,成为Flash的一部分,但是Googlebot目前没有相关的算法来读取这些图片,所以这些文字内容(主要是重要的关键词)会被Googlebot漏掉。更糟糕的是,其他搜索引擎爬虫在识别 Flash 方面甚至比 Googlebot 还要糟糕。
为了防止这种场景闪现,谷歌提出了一些非常有用的建议,让网站在操作Flash的时候,仍然可以将其搜索引擎禾木鱼的损失降到最低:
1. 最重要的原则:始终将相同的内容返回给 Googlebot 和 网站 读者,否则您的 网站 可能会被视为作弊。和图片的内容差不多。当我们在网页中插入图片或Flash*敏*感*词*时,应尽量用文字简明扼要地写出它们的重要内容,这样即使Googlebot忽略了它们,我们也能从您的文字描述中了解它们。他们的*敏*感*词*内容。即使对于 JS 代码,Googlebot 也只有初步的区分能力。
当然,残酷地说,无法像抓取和拆分文本一样处理Flash是Google的错,因为工艺不够。除了视频,Flash*敏*感*词*也是网站的常见内容之一。这样,网站的重要内容和导航系统还是基于HTML的,不会浏览Flash的读者也可以浏览你的网站。
当然,谷歌的爬虫的有效性越来越强,但直到现在,它还没有像人类一样被编译成可以很好地识别视频或Flash*敏*感*词*中的内容。Googlebot 可以读取 Flash 文件中的文本和链接,但无法识别 Flash 的结构和元素关系。
让我们首先看看 Googlebot 如何处理 Flash。例如在网站的首页操作Flash*敏*感*词*作为欢迎页面时,请务必提供Flash*敏*感*词*外的HTML链接,并指向网站的非Flash版本,让读者不用安装Flash。插件,你也可以轻松浏览你的网站内容。仅作为多媒体手段操作Flash,网站(页面)的重要内容和导航系统仍以文字为主。但目前的搜索技术只能达到这个水平,所以我们只能在设计或更新网站的时候利用Google的主动权,这样才会有利于网站的收录和排名。
信息网址: