解决方案:Linux 下的 7 大系统监视工具,网络监控神器谁更好用
优采云 发布时间: 2022-11-23 00:20解决方案:Linux 下的 7 大系统监视工具,网络监控神器谁更好用
在网络和服务器管理领域,可见性就是一切。如果你不了解你的网络和服务器每天都在“阴谋”什么,灾难迟早会发生。
幸运的是,市场上有很多工具(免费和开源)可以点亮我们的在线环境,让我们远离黑暗。
对于普通用户来说,免费比收费好,所以今天决定把我的开源工具分享到箱底,希望它们能为你的网络保驾护航。这7款免费工具可以满足用户从网络到服务器监控的各种需求,甚至还有交换机、路由器的备份。
仙人掌
以前,如果要监控网络链路的流量负载,一般会使用MRTG这个工具。在 1990 年代,Tobi Oetiker 抓住机会编写了一个基于投票数据库的简单绘图工具。该工具对于监控路由器流量非常有用。它是 MRTG。经过一段时间的发展,仙人掌出现了。它扛起了MRTG的大旗,将交通监控能力提升到一个新的水平。
Cacti是一个LAMP应用程序,可以为各种类型的数据绘制一个完整的图形框架。在其最新版本中,Cacti 在采集
数据方面几乎无可匹敌,从数据中心冷却装置回流温度到过滤器体积再到 FLEXlm 许可证的应用。如果一个设备或服务可以返回数字数据,它就可以与 Cacti 集成。对于如何使用SNMP协议监控设备(Linux和Windows服务器、路由器、交换机等),Cacti已经有了模板,其他软硬件的模板也在完善中。
尽管 Cacti 默认以 SNMP 协议设备为目标,但仍然可以使用本机 Perl 或 PHP 脚本。Cacti 的图形框架可以巧妙地将采集
到的数据分离出来,绘制成离散的实例图,方便重组现有数据并反馈给监视器。此外,您还可以通过点击和拖动来观察图表中的特定时间点和区域。
只要数据可以监控,Cacti 就可以跟踪
只要使用PHP网络天气图插件,您就可以制作属于自己的实时网络地图,实时掌握网络设备的链路利用率。当您的鼠标悬停在网络链接的描述上时,将显示完整图像。听说Cacti可以用在很多地方,比如在墙上挂一个42英寸的液晶显示器,让员工对网络使用情况和连接状态一目了然。
Cacti 绝对是一款功能强大且用途广泛的绘图和趋势分析工具。除了追踪一切,它还拥有几乎无限的定制能力,所以能否充分发挥 Cacti 的潜力取决于你。
LinuxC++进阶开发地址:C/C++Linux服务器开发/后台架构师-学习视频
Benchmark腾讯T9C++ Linux服务器开发架构师路线
【文章福利】:小编整理了一些个人认为比较好的学习书籍和视频资料分享到群档。如果需要,可以自己添加!~点击994289133加入(需自取)
Nagios
Nagios 是一个成熟的网络监控工具,已经存在多年,并且在不断发展。Nagios,用C语言编写,只要配合监控套件使用,就可以满足大部分网络和系统监控人员的需求。Nagios 后端是可靠的,并且具有流畅直观的 Web GUI。
和Cacti一样,Nagios背后有一个活跃的社区,它可以使用的插件资源也相当丰富。使用WebInject,您可以完成对服务器、网络服务和连接的实时监控。笔者主要使用Nagios来监控服务器磁盘空间、RAM、CPU和FLEXlm许可证利用率、服务器温度、WAN和网络连接延迟等。另外,它确保Web服务器不仅回答HTTP查询,还返回预期的页面。
没有通知提醒的网络和服务器监控无疑是不完整的。Nagios有邮件/短信通知引擎,还可以升级获得智能通知能力(在合适的时间通知合适的人)。如果使用得当,绝对是超级大杀器。此外,作者还集成了Nagios和Jabber(即时通讯服务器),拥有即时通讯、邮件和短信三种解决方案,再也不怕错过通知了。用户还可以使用时尚的 Web GUI 快速暂停通知或发现问题,同时它还可以记录管理员留下的注释。
Nagios对初学者来说有点难,但复杂的配置也是它的力量源泉
如果以上还不够你,Nagios还有一个映射功能,可以将被监控的设备按照它们在网络中的位置逻辑地呈现在监视器上,并用颜色编码标记出存在的问题。
然而,Nagios 也有缺点。配置起来太复杂了,至少对于初学者来说,是相当耗时的。但是,如果掌握了标准的Linux/Unix配置文档,一切都会感觉很简单。和其他工具一样,Nagios也有很*敏*感*词*,但是要想用好这些功能,就必须具备相应的能力。
在这里我想说的是,不要因为 Nagios 的复杂性而气馁,玩转它可以节省的时间简直是无限的。另外,Nagios 上的预警系统绝对值得一用,花点时间学学吧。
" />
冰加
Icinga 最初是 Nagios 的一个分支,但最近被重写为 Icinga 2。目前,这两个版本都在持续开发中,Icinga 1.x 直接向后兼容 Nagios 的插件和配置。Icinga 2是通过减法得到的,它还可以提供分布式监控和多线程框架,这是Nagios或Icinga 1所不具备的。你可以从Nagios迁移到Icinga 1,再迁移到Icinga 2。
与 Nagios 一样,Icinga 几乎适用于任何设备,并且最适合与 SNMP、自定义插件和扩展一起使用。
Icinga 提供了一个全局监控和警报框架,但在 Web UI 上与 Nagios 不同
Icinga 有多种 Web UI。Icinga 和 Nagios 之间的主要区别在于配置。用户可以通过Web UI 来完成,省去了麻烦的配置文件。对于那些在命令行之外管理配置的人来说,这是一个很大的福音。
Icinga 集成到多个图形和监控套件中,例如 PNP4Nagios、inGraph 和 Graphite,可视化性能非常可靠。此外,Icinga 还具有扩展的报告功能。
内迪
如果你在网络中搜索设备时需要远程登录交换机查询MAC地址,或者你想知道某个设备在哪里,那么NeDi绝对是一个不错的选择。
NeDi 是一个 LAMP 应用程序,可筛选网络交换机上的 MAC 地址和 APR 映射表,在本地数据库中对每个发现的设备进行分类。虽然此工具并不为人所知,但对于设备始终处于移动状态的公司网络而言,它确实非常方便。
您可以直接登录NeDi的Web界面,通过MAC地址、IP地址或DNS域名搜索任何设备的交换机、交换机端口或无线AP。NeDi会从它遇到的网络设备中采集
尽可能多的信息,并记录序列号、硬件和软件版本号、当前温度、模块配置等。您甚至可以使用NeDi标记被盗或丢失的MAC地址设备。如果这些设备重新出现在网络上,NeDi 会自动通知用户。
NeDi 将始终漫游网络并对设备进行编目
发现设备是一项计划任务,而配置则更为直接。它带有一个配置文件,用户可以根据自己的需要进行自定义,包括使用正则表达式或网络边界定义来跳过某个设备。如果您使用的是 MPLS 网络或由传统边界分隔的网络,您甚至可以直接查询设备的*敏*感*词*列表。NeDi通常使用CDP协议或链路层发现协议。当它在网络中穿行时,会顺便发现新的交换机和路由器,然后连接到这些设备上采集
信息。初始设置完成后,运行发现任务变得相当快。
事实上,NeDi和Cacti已经实现了一定程度的融合。如果你为 Cacti 提供可用的加速,你也可以直接调用 Cacti 的图形框架。
Ntop
Ntop项目,也就是传说中的Ntopng,已经发展了十年。它是一流的网络流量监控工具,具有简单流畅的 Web GUI。它是用 C 语言编写的,完全独立,你只需要运行 configure,你就可以监控特定网络接口上的单个进程,就这么简单。
Ntop 提供易于理解的图形和表格来显示当前和过去的网络流量,包括协议、来源、目的地和特定事务的历史记录,甚至两端的主机。此外,您会发现广泛的网络利用率图表、实时地图和趋势,以及用于各种附加组件(如 NetFlow 和 sFlow)的插件框架。甚至还有 Nbox,一个专门嵌入到 Ntop 中的硬件监视器。
Ntop 甚至使用轻量级的 Lua API 框架来支持通过脚本语言进行扩展。Ntop 还可以将主机数据存储在 RRD 文件中,以支持持久化数据采集
。
Ntop 是一个数据包嗅探工具
Ntop最方便的使用是现场流量检查。当你发现你的一个Cacti PHP Weathermaps突然显示一组红色的网络链接时,这意味着这些链接的使用率超过了85%,但原因不明。只需切换到监控网段的Ntopng程序,就可以查看每分钟的top traffic consumers报告,并立即知道哪个主机正在消耗流量。
这种可见性是无价的,而且很容易获得。本质上,您可以在交换机级别配置的任何端口上运行 Ntopng 以监视任何端口或 VLAN。
扎比克斯
Zabbix 是一款全面的网络和系统监控工具,将多项功能集成到一个基于 Web 的控制台中。它可以配置为监视和采集
来自各种服务器和网络设备的数据,为每个目标提供服务和性能监视。
" />
Zabbix可以在监控系统上运行代理,也可以使用SNMP或其他监控方式(如远程检查开放服务SMTP和HTTP),实现无代理运行。它支持 VMware 和其他虚拟化管理程序,并生成有关管理程序性能和活动的深入数据。此外,Zabbix 还可以监控 Java 应用服务器、Web 服务和数据库等。
用户可以手动或通过自动发现过程添加主机。一组广泛的默认模板,适用于最常见的用例,例如 Linux、FreeBSD 和 Windows 服务器。众所周知的服务,如 SMTP 和 HTTP,以及 ICMP 和 IPMI 设备也可用于详细的硬件监控。此外,用 Perl、Python 或几乎任何语言编写的自定义检查都可以集成到 Zabbix 中。
在监控服务器和网络时,Zabbix 使用了一个庞大的工具集
Zabbix 还提供可自定义的仪表板和 Web GUI 以突出显示最关键的组件。通知和升级可以作为自定义操作添加到主机或主机组。您还可以配置操作以触发远程命令,这些命令在观察到满足特定条件的事件时自动在受监视的主机上运行脚本。
Zabbix以图形化的方式展示网络数据吞吐量、CPU使用率等性能数据,用户也可以通过自定义的展示方式采集
这些数据。此外,Zabbix 支持自定义地图、屏幕和幻灯片来显示受监控设备的当前状态。
Zabbix 起初使用起来可能很复杂,但仔细使用模板和自动发现可以减轻集成的麻烦。此外,除了可安装的工具包之外,Zabbix 还可以充当多个流行的管理程序的虚拟设备。
观景台
Observium 是一种网络和主机*敏*感*词*,它使用通用的 SNMP 登录凭据扫描系统的一系列位置并监控系统。作为一个 LAMP 应用,Observium 的设置和配置相对容易,只需安装常见的 Apache、PHP、MySQL、数据库创建和 Apache 配置等。一旦安装,它就会成为自己的服务器,有自己的专用 URL,而不是被更大的 Web 树的一部分。
然后您可以登录到 GUI 并开始添加主机和网络、自动发现范围、SNMP 数据等。下一步是让 Observium 遍历整个网络并从每个系统采集
数据。Observium 还可以通过 CDP、LLDP 或 FDP 发现网络设备,并且可以将主机代理部署到 Linux 系统以帮助完成数据采集
。
Observium 将系统网络监控与性能趋势分析相结合
所有这些数据都显示在一个易于使用的用户界面中,该界面提供大量统计数据、图表和图形,包括 ping 和 SNMP 响应时间,以及 IP 输出、分段、数据包计数等。根据设备的不同,这些数据可用于每个端口,也包括模块化设备。
对于服务器,Observium 将显示 CPU、RAM、存储、交换、温度和事件日志状态。您还可以为包括 Apache、MySQL、BIND、Memcached 和 Postfix 在内的服务集成数据采集
和性能图表。
Observium 是一款出色的 VM 工具,因此它也迅速成为监控服务器和网络状态信息的首选工具,为各种规模的网络带来自动发现和绘图功能。
DIY
IT 管理员通常认为他们不能越界,无论我们处理的是自定义应用程序还是“不受支持的”硬件,我们中的许多人都认为如果监控工具不能立即处理,它就不会处理. 但事实并非如此,只要稍加努力,没有什么是不能监控的,不能登记的,我们可以让它们更加可见。
一个典型的例子是带有数据库后端的自定义应用程序,例如网上商店或内部财务应用程序。管理层希望用漂亮的图形和图表来描述数据使用情况。例如,如果您已经在使用 Cacti,有几种方法可以构建这种图形,例如构建简单的 Perl 或 PHP 脚本以在数据库上运行查询函数并将数据传输到 Cacti,或者使用私有 MIB(管理信息库) 调用 SNMP 数据库服务器。这是可以做到的,而且非常容易做到。
如果是不支持的硬件,只要使用SNMP,很容易得到你需要的数据,但可能要费点功夫。只要你有正确的 MIB 来查询,你就可以使用这些信息来编写或修改插件来采集
这些数据。在许多情况下,您甚至可以使用标准 SNMP 将您的云服务集成到此监控中,当然还可以通过云提供商提供的 API。仅仅因为您拥有云服务并不意味着您应该将所有监控移交给云提供商。因为他们可能不像您那样了解您的应用程序和服务堆栈。
启动和运行这些工具对于普通技术人员来说应该不难,因为通常有特定于 Linux 的软件包可供下载。在某些情况下,它们也可以预先配置为虚拟服务器。配置和调整这些工具可能需要一些时间,但一开始并不难。无论如何,这些工具绝对值得一试。
无论您最终使用哪种工具,至少您都获得了一个 24/7 全天候监控的好工具。虽然有些工具有点难用,但相信我,前期投入的时间永远不会白费。此外,请记住在另一台服务器上运行一小组监控工具,以密切关注主监控服务器。
总结
好的,现在,你在Linux中使用其他工具进行系统监控吗?哪一个?请在评论中与我们分享。
欢迎在留言区留下你的意见,共同讨论改进。
解决方案:智能云站群是如何进行推广展现的?
智慧云站群是如何推广展示的?理解这个问题,我们可以看看智能云站群的推广形式,自动更新的原理,软文采集机制。
智能站群系统,最多可一键生成、批量管理3000个各城市分站。每个城市分站可以有一个独立的域名。每个子站点都是一个完整的站点,可以有自己的子站点域名、站点主页面、产品、公司介绍等。
" />
(2000元阿里云代金券免费领取,支付可当*敏*感*词*使用。云热门产品限时还有10折优惠,云服务器仅需69元/年,点此购买现在:/aliyun)
智能云站群以什么形式展现?
独立显示站点。里面的所有链接都可以显示在子站的子页面上,除了一些需要数据录入的动态链接,如会员注册、留言板等,可以重定向回主站进行操作。
智能云站群自动更新会不会消耗主站流量?
" />
云站群同步数据时,分站服务器会抓取整个源站的数据,而不是只抓几个页面,所以不建议频繁手动同步。如果是配额空间,每个月都限流量,那么流量可能不够用。
软文采集采用什么机制?
软文采集分为自动采集和手动采集。自动采集是指定时任务根据产品属性采集并发布每日采集对应的软文数量。手动采集是指点击智能采集实时抓取内容,然后编辑发布。
由于目前新闻采集源有限的问题,部分集关键词信息无法获取相关新闻文章信息。本版块建议各客户添加自己的软文采集来源。我司审核通过后,即可按设置进行操作。采集
。