Link 搜索 Menu Expand Document

完全监控(TM)


数象云完全监控(Total Monitoring,即TM)是数象云提供的系统级的完整监控解决方案,让客户可以获得传统网络性能监控,基础设施性能监控,应用性能监控,日志事件监控等”一揽子”监控功能。

与传统监控不同,用户只需在被监控系统中安装数象云采集器,选择所需的监控场景,数象云就可完成全面智能的监控帮助客户轻松开启专业监控。

tm.png

如果说服务性能监控是从外部观测企业服务系统,完全监控则是从内部对企业业务系统,包括其基础设施与网络,进行细微的监测,这些监测数据可以:

  • 帮助企业客户了解自身业务系统运行细节,查看当前状态与历史变化,甚至对将来可能性进行预测。
  • 提前发现潜在问题或在问题发生后能及时发现并定位问题根源,数象云亦可在发生问题时进行智能根因分析,为客户提供建议解决方案,帮助消除或降低企业平均故障时间(MTTF)。
  • 帮助企业发现系统瓶颈点,进行系统优化和决策。
  • 帮助企业改进或优化业务流程。完全监控提供开放的API接口,企业可以通过监控数据自动化、智能化的驱动业务流程,让监控不再是业务之外的环节。

需要指出的是,数象云服务性能监控与完全监控是完全独立但又相互互补的两个不同功能服务。

  • 服务性能监控帮助企业了解其外部可见的状态和指标,如发现系统出现的可能影响外部客户的潜在风险和问题。但如果需要定位问题或理解服务行为时,则往往需要使用完全监控所提供的数据来进行分析和处理。
  • 完全监控可以让企业人员(尤其是开发、运维人员)可随时了解内部业务系统的详细状态,通过发现的细微异常帮助提前预防服务的外部行为出现异常,从而做到防范于未然,将故障消除在发生之前。

完全监控需要覆盖以下监控能力

  • 基础设施的监控。基础设施是指为保障资源使用和应用运行而部署的各种硬件及相关系统,以及作为最底层支撑的操作系统或其它作业管理系统。
  • 资源使用监控。资源是一种对应用运行所需环境的抽象,比如计算资源,存储资源,网络资源等。
  • 应用组件及系统监控。应用组件或系统是为用户或其它应用组件、系统提供服务的软件模块。它使用由基础设施提供的各种资源来完成相关服务。

在每种监控细分能力中,我们需要收集完整的各种不同类型信息,如

  • 性能指标信息
  • 事件异常信息
  • 运行、安全日志
  • 请求交互追踪信息