2月25日,基调听云虎年首场线上直播正式开播,本次直播以《让业务系统不再深不可测》为主题,通过对可观测体系的整体介绍以及DIALOG方案详解,更直观的展现基调听云可观测能力,帮助企业了解可观测性作用于系统、业务以及用户体验等方面的价值。
IT架构变迁对系统及监控的影响
随着IT架构在经历数据中心时代、分布式时代,到如今云原生时代的变迁,带来了诸多变化:应用的数量和容器的数量越来越多的情况下,系统复杂程度也随之不断加深;多云混合云场景下,整个容器的创建速度、生命周期以及整体规模,都已经远远超过原有数据中心时代靠人或者靠固定模式所能管理的边界;在资源仍然有限的今天,不断增加的系统复杂性和故障排查的难度加大,正在窃取企业的创新的时间,降低企业的用户体验。而对企业来讲,数字化转型使得企业或者企业的客户都非常依赖于体系化的it系统来实现高速的增长,此时用户体验和应用可用性比以往任何时候都重要。以上种种都对企业在云原生时代下的复杂系统管理以及监控运营提出了非常高的要求。
如下图案例所示,我们可直观感受到复杂系统下对于系统性能的要求,无论从深度还是广度来说,都呈现了极为繁杂的调用关系。
因此,在整个IT演变过程中创新了多种监控方式,传统监控能解决的是在一定范围内,通过收集监控数据,告知系统的状态(运行、停止、有问题等),通过数据聚合、异常检测和根因分析推导系统性能下降的原因。但因为数据割裂、监控范围受限等原因,在系统出现故障时,无法快速找到故障原因,因此我们需要借助可观测性来深入挖掘。
究竟何为可观测性?
In control theory, observability is a measure of how well internal states of a system can be inferred from knowledge of its external outputs.-- Wikipedia Observability
根据维基百科对可观测性的定义,我们可以理解为可观测性是一种方法,通过检查系统的外部输出来衡量系统内部状态的能力。是一个关于解决"未知的已知"和"未知的未知(意外)"问题域的能力模型。可以让你在系统不可用时,快速了解问题的现状及影响,并能够深入探索、跟踪问题的根因。
综上所述,我们可以了解,监控是根据某些领域模型去推导出问题出现在哪里,而可观测性是通过探索发现系统不可用的原因。因此,监控是为了提升系统可观测性的手段。而可观测性是系统的核心能力,用以提升系统性能。
实现可观测性三大支柱
实现可观测性有三大支柱:Metrics、Logging、Tracing,在三大支柱支撑下,通过不同的工具融合去实现可观测性。
传统意义上三大支柱是割裂的,在海量负载的系统下,每一个应用、每一个服务会产生各样的指标及日志,而存储这些又需要特定的工具,一来二去存储的成本就会变高。当出现故障时,从离散的日志文件中寻找跟故障强相关的信息是一个耗时耗力的过程,而结果往往缺差强人意,因此通过催生以Tracing为核心将所有数据进行关联,才可以实现深度可观测性,创造更大价值。
基调听云通过对300+技术栈进行适配扩展,将追踪、日志、指标、行为、业务、OpenTelemetry等多源数据、统一采集、处理和分析模型,构建基调听云可观测中台,纳入现有技术实践成果,对其进行融合分析,通过OneTrace模型展示整个生态下的调用结构,结合独有的AI能力实现根因诊断、异常监测、智能告警,最终建立基于业务分析的可视化模型,更深入的帮助用户实现业务可能性。基于基调听云可观测性平台,构建5大场景可观测,并且在每个领域中建立相应能力,形成完整的可观测体系。
DIALOG作为贯通全栈IT与业务的智能可观测性平台解决方案,分别涵盖六个层面的能力升级:一是全栈数据采集,二是多维多源智能分析,三是以应用和业务为中心,四是可观测数据的纵横融合打通,五是全方位可观测,六是助力业务增长。可简单概括为“融汇,融通,融智”三大核心优势。通过DIALOG,企业在用户体验至上的时代能够深入感知用户,感知业务波动情况,从而实现系统的优化,降本增效,最终基于基调听云可观测平台数据驱动力辅助企业智慧决策,决胜数字时代!