解决方案:分布式内容管理概念解析
优采云 发布时间: 2022-12-19 05:34解决方案:分布式内容管理概念解析
在没有标准化的内容管理系统的情况下,很难在多个国家或地区创建和发布内容复杂的可跟踪项目
仅在美国,博主的数量预计在 2020 年后将达到 3170 万
想象一下 Internet 上博客的数量。互联网上流动的海量信息要求我们对源源不断流动的媒体内容进行日常存储、编码、分布式网络存储和数据交换。没有内容管理系统,内容管理的任务几乎不可能完成。
在分布式系统中交互的内容和团队需要与在集中式系统中交互的内容和团队有根本的不同。
考虑到 Drupal 作为企业 cms 的流行框架,在本博客中,我们将探讨如何以现代方式管理分布式内容管理系统。
理解概念
分布式内容管理系统对于不同的人来说可能很难理解,因为它在不同的情况下意味着不同的事情。
为了更好地理解分布式内容管理系统,让我们通过一份同样以不同地区语言出版的全国性日报的例子来理解。
内容的分布式管理或分布式内容的管理
内容的分布式管理对内容创建过程中涉及的工作流采用分散的方法。
分布式内容管理围绕着处理来自各种来源的现有内容,输入(来自其他 网站/sources),输出(到其他 网站)或两者。
通过启用内容的分布式管理,组织可以消除因用户在多个地方输入内容而导致的错误。与第一个概念不同,分布式内容管理的目标通常围绕效率和控制。
举个国家媒体的例子
让我们称它为媒体之家吧 - OneIndia News
OneIndia News 有 6 个区域 网站。与许多媒体组织一样,网站 频道分为多个类别(假设为 5 个类别),每个类别收录许多小节。
一些区域 网站 根据需要可能只有 2 到 4 个类别,但其他区域可能有 10 个以上。
每个类别都有自己的编辑团队。
区域 网站 现在有许多不同的编辑在每个类别和频道上工作。添加必要的内容类型分类和工作流程 - 您可以看到网络有多么复杂!
分布式内容的管理以效率和控制为中心。
在这种规模下,我们很可能要处理一个媒体机构的多个 网站,所有这些 网站 都有内容要求。这已经成为分布式内容管理的完美用例(指的是一个印度新闻)!
用例 1:发布个人 网站 工作流程
对于 One India News 的负责人 网站 来说,一个具有明确角色和分布式内容制作的中央编辑团队就足够了。
考虑工作内容批准流程是任何具有分布式管理的组织的内容策略的关键部分。
每条新闻都需要由不同的人添加和编辑。在实时站点上编辑新闻可能会导致意外发布。
这可能是同时发布多个 文章,将最终副本发送给不同的人(不使用它们),或者在不同的子域上发布 文章。cms需要一个具有强大的内容暂存和发布功能的虚拟工作环境,这样您就不需要编辑器来登录目标站点。
发布工作流程不仅针对区域媒体,而且针对负责区域 网站 的每个部门和团队,这里的想法是在管理整个组织职责的同时赋予编辑权力。
在 网站 主页上发布的内容可能比在幽默或其他渠道上发布的内容需要更多的监督。
用例 2:共享内容 - 在分布式 Web 平台上集中内容
当内容进一步分发到工作流程中时,复制和粘贴成为效率较低的选择。
分布式系统必须具有发布-订阅(publisher-subscriber)特性,以保证信息在不同系统之间得到快速处理。集中式系统必须允许在将请求推送到子系统的同时编辑和处理数据。这需要异步完成,因此需要非常快速地填充编辑器的结果
用例 3:从 Distributed网站 开始共享内容
当我们使用分布式 网站 作为内容创建的起点时,会出现另一个有趣的用例。One India 与所有媒体机构一样,维护着一个重点日程表,例如节日和新闻事件。
在结构良好的分布式内容模型中,使用合适的 cms(例如 Drupal),允许访问者过滤事件(受众、部门、程序)的相同元数据可以轻松地将这些事件联合到各种其他 网站 .
不幸的是,对于子团队之外的每个具有适当权限的人,并不总是给予相同级别的考虑。
通常被授权管理自己内容的内容管理者可能没有相同的访问权限,或者,在获得许可的情况下,他们发现自己需要将内容输入到一个完全不同的网站系统中,以便将其发布到自己的网站。为什么会这样?
通过扩展允许 网站 从焦点日历接收事件的相同技术,在 Drupal 中,我们可以让内容管理系统从它们通常管理的相同 网站 将事件发布到日历。(当然,相同的内容审批和发布工作流程被认为是适用的。)
集中式内容管理与分布式内容管理的区别
集中式内容管理
分布式内容管理
一切都经过一系列
负责各自领域的小型独立工作组
遵守中心规则和程序以确保遵守规则
负责监督内容质量的机构
超级管理员 - 负责规则和执行
每个组可能有一个或多个主要批准人。工作组处理流程和规则
优点 - 没有混乱的过程控制
优点 - 责任和工作量是分散的
缺点 - 可能导致瓶颈
缺点 - 不同的团队对规则的理解不同
用例 4:多渠道品牌内容
来自单一来源的内容联合还为媒体公司提供了跨多种媒体推广其品牌的机会。许多公司选择聘请像路透社这样的独立一体化新闻提供商,而不是为每个新闻提供商整合一个类别。
这非常有道理——当这些组织系统与它们自己的 cms 结合时,它们可以提供许多引人注目的结果,例如更快的结果和更快的新闻发布。
通过以编程方式从内容存储库中摄取内容,组织可以消除新闻延迟和永久观众流失的风险。
用例 5:向经过验证的受众交付内容
多年来,为了分散内容,媒体机构现在允许用户向 网站 添加故事。
如何访问、验证和识别用户是公司分布式内容管理策略中的另一个关键考虑因素。
一种常见的方法是将客户编辑内容分隔到不同的区域“门户”——这些门户 网站 要求编辑创建一个帐户并登录以查看其国家/地区的信息。
为了克服验证这些帐户的挑战,公司经常在 Drupal 网站 上与身份提供者 (IdP) 集成,例如 SAML 2.0 单点登录、简单配置和活动支持。
在分布式内容管理的另一端,需要一个系统将一致的、受控的内容发布到 网站 并且不能在多个站点之间变化。
Drupal 允许将分布式内容管理策略应用于大量内容以促进高效的工作流程。具体来说,该系统允许不同的内容和编辑器成为同一系统的一部分,而无需大量重复。
最后,Drupal架构的模块化设计允许独立和分布式实现,使系统可以部署在各种应用程序中。要与我们联系,请发送电子邮件至@OpenSenseLabs。
解决方案:爬行、抓取问题对未来SEO优化也许不用再操心
SEO 很少写有关 Bing 或 Yahoo! 的文章。原因很明显:他们糟糕的市场份额不值得一提。
尽管微软一直致力于搜索并投入了大量的资金和时间,但迄今为止,必应在搜索市场上始终是陪衬。更不用说雅虎了!在收购了除 Google 和 Bing 之外的所有搜索引擎后,Yahoo! 居然废除了自己的武功,将自己多年来所积累和掌握的搜索技术全部舍弃。雅虎!网站 搜索功能改用Bing的技术——让人不禁疑惑:你确定这不是谷歌的*敏*感*词*?最重要的对手之一就这样消失了?
不过,Bing 一直对 SEO 非常友好,Bing 的工程师也给了 SEO 行业很多建设性的建议。比如关于外链的建设,我觉得最精彩的一句话是某位Bing工程师说的,大意是最好的外链就是那些你根本不知道存在的外链。
Bing 大幅提高了 URL 提交限制
1月底,Bing站长博客发文称,Bing站长工具的URL提交工具升级,大大提高了站长可以提交的URL数量上限,从原来的每天10个到每月 50。,增加了1000倍,现在每天可以提交10000个,没有月度限制。唯一的限制是网站需要在必应站长工具中注册验证180天以上:
帖子里还说了一段很有意思的话。如果以后搜索引擎往这个方向发展,SEO们以后可能就不用担心页面抓取爬行的问题了:
我们相信,启用此更改将引发搜索引擎(例如 Bing)在网络上检索和通知新内容和更新内容的方式发生根本性转变。与 Bing 经常监控 RSS 和类似提要或频繁抓取网站以检查新页面、发现内容更改和/或新出站链接不同,网站将直接通知 Bing 有关其网站上相关 URL 的更改。这意味着最终搜索引擎可以降低网站的抓取频率以检测变化并刷新索引内容
翻译成大意:
我们相信这一变化将导致搜索引擎发现和抓取新内容(无论是新内容还是更新内容)的方式发生根本性变化。网站管理员将能够直接将 网站 上的 URL 更改通知 Bing,而无需 Bing 通过监视 RSS 或频繁抓取来发现新页面。这实际上意味着搜索引擎在发现和更新索引内容时可以降低爬取网站的频率。
内容索引不再依赖抓取?
一直以来,我认为SEO有三大难点:内容、内链结构、外链建设。其中网站内链结构是为了解决搜索引擎有效抓取和抓取的问题。一定要全面快速,避免爬取不必要的内容,合理分配权重。网站越大,越难完美解决这个问题。做过大网站的SEO一定深有体会,无论你怎么调整网站结构,都不可能做到页面100%收录。
Bing 的这篇文章告诉 SEO,他们将来可能不必担心抓取。如果有新页面或者旧页面更新了,直接提交URL即可(通过站长工具或API),无需依赖Bing蜘蛛抓取和抓取。事实上,Bing 蜘蛛会大大减少抓取,但不会延迟索引新内容。
SearchEngineLand 随后对 Bing 搜索工程师的采访证实,减少抓取确实是 Bing 的目标。他们希望在未来几年内,Bing 不再依赖爬行来发现新内容。Bing认为爬取网站的方式效率低下,浪费资源,所以站长直接提交内容比较好。Bing 表示,提交 URL 是页面爬虫的“强”信号,如果您希望您的内容被快速索引,请使用提交工具。
事实上,要抓取一个大的 网站 页面,可能需要数周甚至更长的时间。然后网站上有新的页面,或者旧页面的内容更新了,也需要抓取,可能会有几周的延迟。提交 URL 是一种更快的方法。
其实百度早就在做类似的事情了。在百度资源平台提交内容是快速抓取新页面的好方法。小时级别 收录 确实可以在几小时内 收录,有时在几分钟内 收录。不过百度资源平台提交好像不支持老更新的页面。
对 SEO 行业的潜在影响
如果未来谷歌跟进并采用这种方式,可能会对SEO行业产生不小的影响。搜索引擎发现、抓取和索引新内容的方式变得更简单直接,SEO调整网站结构的必要性和难度将大大降低。
然而,存在潜在的问题。例如,黑帽 SEO 显然不会放过这个机会。以前通过爬取来抓取垃圾内容越来越难,因为从一个页面爬到另一个页面是一个识别和过滤的过程。大量主动提交垃圾页面成为可能后,搜索引擎应该怎么办?
再比如,搜索引擎通过减少抓取来节省资源,但是旧的和未更新的页面被重新抓取的次数会大大减少。这样会不会导致链接关系计算不准确、不及时?顺便说一句,我不知道为什么人们总是说链接对排名不再重要,但它们仍然非常重要。
SEO的基本方法在过去的十年里并没有太大的改变,但是SEO仍然是一个不断变化的行业。