• 1
  • 2
  • 3
  • 4
  • 5

产品中心/ Product Center

联系我们 / Contact

地址:上海市沪太路799号交大新慧谷科技园1号楼201室
电话:021-52370586  
邮编:200072
E-mail:sales@morning-good.com

产品展示 / Product display
电网智能全链路监控系统
  • 点击数:55
  • 产品类别: 产品中心 网络协议分析平台
  • 产品描述: 必要性分析 在国家电网公司信息化建设大力推进下,信息化建设步伐大大加快,二级部署已接运系统超过百套,业务覆盖了规划、建设、检修、运行、营销以及人力资源、财务、物资等专业,为了对这些业务系统进行性能管理,先后建立了包括应用性能管理系统、I6000性能监测模块等业务性能监控及分析系统,通过这些系统的建设,已经初步实现了业务系统性能的监控和管理,但随着业务性能管理工作的深入开展,当前在用工具的覆盖面只针对业务系统内部进行分析,对于承载业务系统的网络的性能难以有效监控,同时当业务发生故障时,也难以开展有
  • 必要性分析

    在国家电网公司信息化建设大力推进下,信息化建设步伐大大加快,二级部署已接运系统超过百套,业务覆盖了规划、建设、检修、运行、营销以及人力资源、财务、物资等专业,为了对这些业务系统进行性能管理,先后建立了包括应用性能管理系统、I6000性能监测模块等业务性能监控及分析系统,通过这些系统的建设,已经初步实现了业务系统性能的监控和管理,但随着业务性能管理工作的深入开展,当前在用工具的覆盖面只针对业务系统内部进行分析,对于承载业务系统的网络的性能难以有效监控,同时当业务发生故障时,也难以开展有效的网络及业务关联分析,为运维工作带来了较大困扰。

    为了解决上述问题,深化业务系统的深入管理工作,有必要建设网络应用监控分析平台,自动化的采集不同业务系统及网络的关键业务交易以及网络运行指标数据,基于IP数据快速的监控、告警、分析、解决问题,为信息系统运维提供可靠的数据支撑及工具基础。

    面临问题分析

    1. 性能数据管理覆盖范围不全面

    在用的性能管理工具,主要是I6000系统以及应用性能管理系统,管理范围为代码性能、URL性能等基于应用层的性能指标,缺乏重传、吞吐、零窗等网络层的指标,监控体系覆盖不全面,存在关键指标缺失。

    2. 缺乏有效的全网流量数据展示手段

    缺乏全网流量展示分析手段,难以掌握流量运行状态,流量组成以及流量访问逻辑等信息,对信息系统运维管理人员来说,业务流量处于无监控的人工管理状态,难以做到流量数据组成及关系的有效分析。

    3. 调控云缺乏调控依据

    基于云的调控平台的失陷极大化的实现了计算机网络资源的调控。当出现资源不时,随时增加所需资源。传统监控手段基于设备本身,而非基于用户感受。可能出现用户体验差,但无设备CPU和内存依旧正常,导致业务质量严重下降的问题。同时,当瓶颈出现时分不清楚是网络资源还是计算资源下降,使得资源的增加没有客观依据

    4. 缺乏有效的业务模型分析手段

    随着信息化运维工作的逐渐深入,基于真实业务流量数据的流量模型分析会逐渐成为指导业务运维、升级及扩容的一项重要工作,而目前缺乏有效的模型分析手段,无法对业务数据进行有效模型分析,难以实现业务数据的TOP N分析、关联分析用户特征分析等模型分析工作。

    5. 缺乏有效的网络及应用关联分析排查能力

    运维工作中,网络管理以及应用管理是分组进行管理的,当应用出现故障时,如果故障是由于网络传输过程出错引起,应用组人员无法分析出原因,而需要经过长时间的沟通,由网络组人员进行分析,缺乏有效的分析工具对网络及应用进行关联分析。

    6. 缺乏有效的数据追溯手段

    由于网络流量信息没有有效的工具进行存储和分析,当发生故障后,故障现场难以进行流量回放,无法进行追溯,使部分故障难以定位,无法得到有效的解决。


    解决方案需求分析

    1. 业务可视化:业务可视化是进行业务主动运维的基础,通过业务可视化,可快速感知每笔业务流通过链路、网络、主机、应用的详细路径与过程,从而实现从用户到后端IT系统的端到端性能感知与故障诊断。

    2. 主动运维:通过将所有KPI的基线化,生成周期型KPI基线,通过关联分析与基线预警,提供业务质量下降的提前感知,并关联分析到网络、应用、业务的各层KPI特征的变化,从而预先感知性能瓶颈与故障的节点与层级,实现IT系统的主动运维。

    3. 故障诊断鉴责:当复杂故障出现时,可实施分析并存储故障时间的原始数据与分析KPI,通过内外诊断鉴责判断故障产生的机构与方向,再通过网路、主机、应用、业务的四层KPI的快速分析,诊断定位出故障产生的节点与层级,从而实现端到端的故障诊断与定位。并且通过各级原始数据的回溯分析,快速查找故障产生的原因,为故障信息的取证提供原始的数据证据。

    运维数据输出:实时输出各个过程节点与子系统的全量数据,这些高质量的运维数据既可提供给调控云平台进行统一的业务分析,提升运维效率与IT投资的评估,也可作为运维大数据为业务运维提供参考。

    用户要求

    监控范围包括:主站一区、二区网闸节点,三区关键业务数据流,流量拓扑图如下

     


    需要采集的数据流(红色圆圈为采集点示意),首先发送给流量汇聚设备TAP,聚合后统一发送给网络应用监控分析平台,数据流包括

    1、一区业务与三区业务交互流量;

    2、二区业务与三区业务交互流量;

    3、Open3000系统三区相关业务交互;

    4、电量E5100系统三区相关业务交互;

    5、调控机器人系统三区相关业务交互;

    6、接至四区信息交换机(办公网),包括发送至调控云的相关的数据;

    7、I区纵向传输平台通过调度数据网转发或接收省调数据。

    解决方案

    工具的整体应用架构,采用分层方式设计,分为,数据采集层、数据处理层、数据汇聚层、业务展示层以及外部接口,

    系统通过数据采集层内的驱动进行镜像流量的数据采集,交由数据处理层进行处理,在数据处理层,数据由实时处理引擎,回溯处理引擎以及数据仓库进行处理,其中数据仓库负责数据的处理,回溯处理引擎负责数据的回溯查询,实时处理引擎负责数据的实时处理。在数据汇聚层,系统由分布式探针及智能分析引擎组成,实现数据的聚合,数据的基线计算以及数据的动态告警,在业务访问层,系统提供了各类应用的管理配置界面,在构建系统的同时,系统提供了足够的外部接口,可以外连大数据分析工具,为整体业务数据分析提供数据基础。

上海晨吉电子科技有限公司

Copyright © 2020-2021,www.xxxxx.com, All rights reserved   

版权所有 © 上海晨吉电子科技有限公司 未经许可 严禁复制