php网页抓取乱码(黑客行为称为“乱码黑客”行为的操作效果)

优采云 发布时间: 2021-10-06 19:08

  php网页抓取乱码(黑客行为称为“乱码黑客”行为的操作效果)

  本指南专门针对将收录大量关键字的乱码网页添加到您的 网站 中的黑客行为。我们称这种黑客为“乱码黑客”。我们专门为 (cms) 用户推出了本指南;但即使您没有使用内容管理系统,本指南也会对您有所帮助。

  注意:不确定您的 网站 是否已被入侵?请阅读我们的指南,了解如何首先检查您的 网站 是否已被入侵。

  我们希望确保本指南对您真的有帮助。请提供反馈以帮助我们改进!识别此类黑客的目录

  乱码黑客会自动在你的网站上创建许多网页,上面堆满了关键字的无意义句子。这些页面不是由您创建的,但它们的 URL 可能会吸引用户点击。黑客的目的是让被黑的网页出现在谷歌搜索结果中。然后,如果用户尝试访问这些页面,他们将被重定向到不相关的页面(例如*敏*感*词*网站)。当用户访问这些不相关的网页时,黑客就会获得收益。以下是一些您可能会在 网站 上看到的受乱码黑客影响的文件类型示例:

  有时,这些页面所在文件夹的名称由随机字符组成,并且使用不同的语言:

  首先,请检查 Search Console 中的安全问题工具,看看 Google 是否在您的 网站 上发现了上述任何被黑页面。有时,您也可以通过打开 Google 搜索窗口并输入 site:your site url(使用您的 网站 根级 URL)来找到此类网页。搜索结果页将显示 Google 为您的 网站 编入索引的网页,包括被黑的网页。您可以翻阅几页搜索结果,看看是否可以找到任何不寻常的 URL。如果您在 Google 搜索结果中没有看到任何被黑内容,请使用其他搜索引擎搜索相同的搜索词。此操作的效果如下例所示。

  

  请注意,上面的搜索结果收录许多不是由 网站 的所有者创建的页面。如果您仔细查看描述,您将看到此 hack 创建的乱码示例。

  通常,当您点击被黑网页的链接时,您要么被重定向到其他网站,要么看到一个充满乱码内容的网页。但是,您可能还会看到该页面不存在的消息(例如 404 错误)。不要被愚弄!当网页仍然被黑客入侵时,黑客会试图说服您该网页已消失或已修复。为此,他们将隐藏真实内容。您可以在谷歌爬虫中输入您的网站 URL,查看是否存在隐藏真实内容的问题。Google 抓取工具可让您查看可能隐藏的内容。

  如果您看到上述问题,则说明您的网站可能受到了此类黑客攻击。

  解决黑客问题

  在开始之前,请为要删除的任何文件创建一个脱机副本,以防将来需要恢复它们。在开始清理过程之前,最好备份整个 网站。为此,您可以离线保存服务器上的所有文件,或搜索最适合您的特定内容管理系统的备份选项。

  检查 .htaccess 文件(共 2 步)

  乱码黑客将使用 .htaccess 文件重定向您的 网站 访问者。

  第1步

  在 网站 上找到您的 .htaccess 文件。如果您不确定在哪里可以找到此文件,并且您使用的是 WordPress、Joomla 或 Drupal 等内容管理系统,请在搜索中搜索“.htaccess 文件的位置”和您的内容管理系统的名称引擎。您可能会看到多个 .htaccess 文件,具体取决于您的 网站。然后,列出所有 .htaccess 文件的位置。

  注意:.htaccess 通常是一个“隐藏文件”。请确保在搜索此类文件时启用显示隐藏文件选项。

  第2步

  将所有 .htaccess 文件替换为相应 .htaccess 文件的未破解版本或默认版本。您通常可以通过搜索“默认 .htaccess 文件”和内容管理系统的名称来找到 .htaccess 文件的默认版本。对于带有多个 .htaccess 文件的 网站,请找到每个文件的未破解版本并替换它。

  如果没有默认的 .htaccess 文件,并且您从未在 网站 上配置过任何 .htaccess 文件,那么您在 网站 上找到的 .htaccess 文件可能是恶意文件。为安全起见,请离线保存 .htaccess 文件的副本,然后从 网站 中删除相应的 .htaccess 文件。

  查找并删除其他恶意文件(共 5 个步骤)

  识别恶意文件可能很棘手,可能需要几个小时才能完成。检查文件时请不要担心。如果您还没有备份 网站 上的文件,这是个好时机。您可以在 Google 搜索中搜索“备份网站”和您的内容管理系统的名称,以查找有关如何备份 网站 的说明。

  第1步

  如果您使用内容管理系统,请重新安装该内容管理系统默认分发中收录的所有核心(默认)文件,以及您可能添加的任何内容(例如主题、模块、插件)。这有助于确保这些文件不收录被黑内容。您可以在 Google 搜索中搜索“重新安装”和您的内容管理系统的名称,以查找有关重新安装过程的说明。如果您有任何插件、模块、扩展或主题,请确保您也重新安装它们。

  重新安装这些核心文件可能会导致您所做的任何自定义丢失。确保在重新安装之前创建数据库和所有文件的备份。

  第2步

  现在,您需要查找剩余的任何其他恶意或受损文件。这是此过程中最困难和最耗时的部分,但在您完成此部分后,您马上就完成了!

  这种黑客通常会留下两种类型的文件:.txt 文件和 .php 文件。.txt 文件充当模板文件,而 .php 文件决定了您的 网站 上加载了什么样的无意义内容。首先,查找 .txt 文件。根据您连接到 网站 的方式,您应该会看到某种文件搜索功能。搜索“.txt”以查找所有扩展名为 .txt 的文件。这些文件中的大多数是合法的文本文件,例如许可协议、自述文件等。您要查找的是一组特定的 .txt 文件,其中收录用于创建垃圾邮件模板的 HTML 代码。以下是您可能会在这些恶意 .txt 文件中找到的不同代码的代码片段。

  黑客使用关键字替换方法来创建垃圾邮件页面。您很可能会在整个被黑文件中看到一些可以替换的常用词。

  

{keyword}

  此外,这些文件中的大多数都收录某种代码,可以将垃圾邮件链接和垃圾邮件文本置于可见网页之外。

  

Cheap prescription drugs

  请删除这些 .txt 文件。如果这些文件在同一个文件夹中,您可以删除整个文件夹。

  第 3 步

  查找恶意 PHP 文件会稍微困难一些。您的 网站 上可能存在一个或多个恶意 PHP 文件。这些文件可能收录在同一个子目录中,也可能分布在整个 网站 中。

  不要因为您认为需要打开和查看每个 PHP 文件而感到压力太大。首先,创建您要调查的可疑 PHP 文件列表。以下方法可用于确定哪些 PHP 文件可疑:

  第四步

  创建可疑 PHP 文件列表后,您可以检查这些文件是正常文件还是恶意文件。如果你不熟悉PHP文件,这个过程会消耗更多的时间,所以你不妨查阅一些PHP文件。但即使您不熟悉编码,您仍然可以通过一些基本模式找到恶意文件。

  首先,扫描您发现的可疑文件,找到收录看似凌乱的字母和数字组合的大块文本。大文本块的前面通常是PHP函数的组合(例如base64_decode、rot13、eval、strrev、gzinflate)。以下是此类代码块的示例。有时,所有这些代码都被填充到一长串文本中,使其看起来比实际大小要小。

  

base64_decode(strrev("hMXZpRXaslmYhJXZuxWd2BSZ0l2cgknbhByZul2czVmckRWYgknYgM3ajFGd0FGIlJXd0VnZgk

nbhBSbvJnZgUGdpNHIyV3b5BSZyV3YlNHIvRHI0V2Zy9mZgQ3Ju9GRg4SZ0l2cgIXdvlHI4lmZg4WYjBSdvlHIsU2chVmcnBydv

JGblBiZvBCdpJGIhBCZuFGIl1Wa0BCa0l2dgQXdCBiLkJXYoBSZiBibhNGIlR2bjBycphGdgcmbpRXYjNXdmJ2blRGI5xWZ0Fmb

1RncvZmbVBiLn5WauVGcwFGagM3J0FGa3BCZuFGdzJXZk5Wdg8GdgU3b5BicvZGI0xWdjlmZmlGZgQXagU2ah1GIvRHIzlGa0B

SZrlGbgUGZvNGIlRWaoByb0BSZrlGbgMnclt2YhhEIuUGZvNGIlxmYhRWYlJnb1BychByZulGZhJXZ1F3ch1GIlR2bjBCZlRXY

jNXdmJ2bgMXdvl2YpxWYtBiZvBSZjVWawBSYgMXagMXaoRFIskGS"));

  有时,这种类型的代码并不凌乱,看起来像一个普通的脚本。如果您不确定代码是否恶意,请访问我们的;在这个论坛里,一群有经验的网站站长可以帮你查看相关文件。

  第 5 步

  现在您知道哪些文件是可疑的,您可以通过将它们保存在您的计算机上来创建备份或创建本地副本,使它们不是恶意文件,然后删除这些可疑文件。

  检查您的 网站 是否已被清理

  删除被黑的文件后,请检查您的努力是否得到了回报。还记得你之前发现的那些乱码吗?使用“Google 抓取工具”再次检查这些页面,看看它们是否仍然存在。如果他们在“Google crawler”中的结果是“not found”,那么您的 网站 可能处于良好状态!

  您也可以按照“被黑网站”疑难解答工具中的步骤检查网站上是否还有被黑内容。

  如何防止再次入侵?

  修复网站上的漏洞是修复网站的最后一个关键步骤。最近的一项研究发现,20% 的被黑 网站 会在 1 天内再次被黑。了解 网站 是如何被黑的非常有用。请参阅我们的指南,了解垃圾邮件发送者使用的最常见的 网站 黑客方法,以开始调查问题。但是,如果您无法查明 网站 是如何被入侵的,您可以按照下面的清单来减少 网站 上的漏洞数量。

  其他资源

  如果您仍然无法修复 网站,还有一些其他资源可以帮助您。

  这些工具可以扫描您的网站,可能会发现有问题的内容。除 VirusTotal 外,Google 不会运行或支持其他工具。

  Virus Total、Sucuri Site Check、Quttera:这些工具(以及许多其他工具)可能能够扫描您的 网站 以找出有问题的内容。但请注意,这些扫描工具并不能保证能找到所有类型的问题内容。

  以下是 Google 提供的其他可以帮助您的资源:

  没有找到您认为可能有用的工具?请留下反馈并告诉我们。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线