[语音记录]金融云业务网络智能搜集与综合分析实战
优采云 发布时间: 2020-08-06 18:20大家好,让我先自我介绍. 我是云山网络公司的吴玉华. 今天,我想与您分享有关金融云业务网络的采集,分析和分发的实用故事. 在开始讨论之前,我想与您讨论一个问题: 为什么我们需要采集虚拟网络流量.
▌为什么要谈论虚拟网络采集
云山网络从2008年开始做SDN. 它已经探索了十年. 在云计算和云网络中,我们已经进行了研究和实践. 在此期间,我们看到了两个明显的网络变化. 第一: 网络流量模式的变化. 过去,该网络是具有南北向流量的烟囱架构. 现在,它已成为东西向交通. 据统计,数据中心网络中约80%的流量是东西向流量. 可以看出,东西方交通已成为主要交通方式.
第二个: 网络与企业脱节. 为什么这么说并不是说网络不再能够满足业务需求,而是网络与业务之间的关系越来越远. 那是什么意思?例如,在旧的传统网络中,我们可以从网络中提取流量,然后通过协议可以大致了解应用程序. 但是现在,由于存在一个底层网络和一个覆盖网络,因此我们遵循旧方法,并从提取的流量中看到了VXLAN封装和数据包. 即使解开封装,里面也有重复的IP.
因此,实际上很难发现当今云网络中运行的服务类型,因此该网络逐渐被*敏*感*词*. 在这种发展趋势下,日常网络使用以及运维将面临哪些挑战?接下来,我将分享两个典型示例.
每天发生的事件: 业务部门报告业务应用程序响应速度慢,并且网络存在问题,但是网络部门认为网络没有问题. 当然,业务部门不会批准它. 在那之后,有无休止的辩论,但是问题仍然没有解决之道,那么问题出在哪里?
让我们看一下网络的横截面. 对于网络部门来说,他们的视野是在底层网络中. 他们看到了交换机和链接,但是业务专注于虚拟机中的应用程序,因此这里存在一个很大的管理盲点,包括OVS,VGW,VFW和VLB. 这些都是非常重要的网络节点. 如果看不到内部网络状态,如何找到问题根源?或确定报告是否是网络问题. 此事件提醒我们,这是清楚了解虚拟网络中正在发生的事情的关键.
第二个例子发生在一家著名的证券公司. 众所周知,证券行业具有一系列安全要求,例如证券和证券监管. 因此,安全部门对网络部门提出了一个要求: 核心业务系统中关键业务组件的网络流量被导出以进行安全分析,数据审核等.
接下来,为了满足这一需求,网络部门制定了一个计划,通过流表来镜像虚拟网络. 但是,在POC过程中,结果并不理想. 流镜像与流表混合在一起,编排非常复杂. 此外,在迁移虚拟机时,无法自动更新镜像策略,无法实施最终解决方案,需求也就消失了.
后来,发生了更严重的事情. 该公司发生了事故,导致用户信息泄漏. 这种事件可谓是证券业的重大失败. 此时,安全部门必须负责. 同时,网络部门不满意. 安全部门的需求,网络部门和安全部门都负责整个事件.
结合以上两个示例,不难看出在云网络中,业务网络的采集,分析和分发已成为云网络构建的标准配置,如果要采集虚拟网络流量,所有的采集方法和解决方案都必须安全可靠,而且不影响生产.
▌计划和价值
如何解决上述问题,是云山DeepFlow数据中心虚拟网络流量采集分析平台(以下简称DeepFlow)所能做的. 这张照片是最左边的采集部分. 我们知道目前的业务范围非常广泛. 它可能涉及私有云和公共云. 云杉DeepFlow同时涵盖了这些环境. 通过部署DeepFlow,您可以帮助您查看所有业务. 对于所有VPC网络状态,管理员等效于站在高处从多个维度查看云网络的全景,这更便于管理. 同时,您也可以关注业务,例如右上角的图,转到某个VPC网络,观察数据中有多少个网络组件,并根据每个点查看相应的网络信息. 和线.
我们还对采集技术的安全性和可靠性进行了许多优化. 首先,DeepFlow采集器支持500个节点以覆盖大多数数据中心.
第二个是高性能,单个采集点支持10G流量采集. 安全可靠. 特殊阈值用于控制CPU,内存和网络资源的消耗,因此不会影响生产网络. 当发生迁移时,我们的策略也可以及时更新,而不会中断采集到的流量.
简而言之,Spruce DeepFlow采集的虚拟网络流量使我们能够查看虚拟网络上正在发生的事情,涵盖管理盲点. 一旦发生故障,我们可以快速定位,同时,我们可以快速推断出问题的根本原因,并提高操作和维护效率. 其次,采集虚拟网络流量后,您不仅可以自己对其进行分析,还可以将其分发给第三方工具,以帮助数据审核满足安全合规性要求. 第三,从运营商的角度来看整个云网络.
▌应用实践
我想再告诉您两个DeepFlow数据中心虚拟网络流量采集,分析和分发的示例. 首先是故障定位事件. 使用DeepFlow回溯分析功能可以轻松找到问题的根本原因. 怎么做?将事件发生时的虚拟网络流量与正常时间的虚拟网络流量进行比较,结果发现存在明显的异常网络指示,大量网络数据包,非常大的网络延迟等. 导致异常现象的原因是谁?
通过Spruce DeepFlow的细粒度采集功能,发现数据库将大量流量发送到某个IP地址. 看到这种现象后,立即采取回测措施. 回测意味着这种异常现象是过去偶然发生的. 它是经常发生还是定期发生?经过这一系列步骤之后,我们最终得出结论,为什么数据库不断发送数据,实际上是因为最近已安装了新的数据库备份系统,但是当配置了该策略时,时间参数是错误的,通常是一天时间备份,由于时间错误,导致每小时备份一次,因此数据库连续发送出去,数据库信息不断备份,占用了实际的生产资源,最终导致运行缓慢的现象业务.
在其他情况下,我看到了一些有趣的问题. 有时,负载平衡配置不正确,这会导致背面的资源不平衡. 服务器可能有很多虚拟机流量,而其他服务器则是免费的. 或将数据设置为由特定服务器处理,但是由于负载平衡配置错误,固定流量将被散列.
在讨论第二个示例之前,请回顾一下安全部门刚才向网络部门提出的要求,以导出虚拟机的流量以进行安全审核和分析. 实际上,此问题可以在部署DeepFlow之后轻松地采集虚拟网络流量,并将其同时分发到两个后端分析工具资源池. 为什么我们两个?实际上,它可以用作备份,因为数据对于安全,审计和分析部门非常重要.
▌摘要
DeepFlow拥有专利的虚拟流采集技术具有*敏*感*词*,零干扰,无依赖性,过载保护和预处理的优点. 支持VMware和OpenStack平台,没有版本依赖性. 一个控制器可以管理500个采集点,而无需在生产网络的虚拟交换机上进行其他策略配置. 它支持数据包的重复数据删除,过滤和截断等操作,并支持用户配置采集器的资源使用情况,以确保生产环境的稳定性.
云山网络已经对SDN云网络进行了相应的研究和应用,并在过去十年中得到了资本和客户的认可. 目前,Spruce Network的融资额超过1亿美元,并且有许多成功的财富500强客户案例. 它已部署在金融,电信,电力和教育行业的近100家企业中,其中包括平安科技,工业数字金融,甜橙金融,中国移动,国家电网,苏州国家科学数据中心以及其他基准客户. 成为企业云数据中心网络稳定高效运行的典范.
! !福利! !下载“金融云业务网络的智能采集和集成分析”的语音PPT,可以通过在微信背景中回复“语音PPT”获得.
◆◆◆
相关阅读