演进实录|不同阶段的企业如何搭建监控体系?

网友投稿 265 2022-10-10

演进实录|不同阶段的企业如何搭建监控体系?

作者|涯海审核&校对:白玙编辑&排版:雯燕 在陪伴众多企业共同经历业务上云与云上原生之后,我们可以看到每个企业的运维监控体系搭建过程都十分艰辛。这是由于企业业务发展迅速,对 IT 的要求也愈发严苛且复杂。这不仅仅体现在运维团队架构与工作流程上,也体现在工具选型与平台搭建上。尽管不同阶段不同规模的企业需要面对各种各样现实问题,但仍然有些最佳实践有迹可循,今天我们好好聊一下工具选型与平台搭建思路与实践关键点。

工具选型与平台搭建必然趋势

要特别说明的是,监控平台不是随便下载一个开源监控工具就可以,它需要根据监控的业务特点进行整合与二次开发,以达到与实际业务情况相吻合。经过大量实践后,我们发现企业普遍存在的监控体系需求与发展方向:

自动识别与采集

云原生带来了跨技术栈与高动态的技术架构。因此面向复杂多变的被监控环境,采集器尽可能做到对环境的自动识别,对指标的自主采集成为一切的开始。数据都无法采集,如何监控?

数据管理能力不断强化

云、容器和微服务的出现使被监控的对象数量增加了几个数量级。当业务飞速发展,面对几亿甚至十亿级别时序数据,我们该如何管理?

数据看板体系成为刚需

随着数据量爆发式增长,传统的线图、直方图、散点图等数据展示方法很难让运维人员找到数据背后的异常或隐藏瓶颈。如何针对不同业务或者不同监控对象,找到更合适的数据看板以及展现形式,成为了每个运维人员的必修课。

中台枢纽作用

随着技术飞速发展,监控系统在整体运维系统的中台枢纽作用越来越明显,运维监控从传统的流程驱动转变为数据驱动。如何更便捷的与其它众多运维子系统对接整合,也是运维团队在监控体系搭建之初需要考虑的问题。

企业监控体系演进历程

结合上述特点,我们讲企业监控体系的演进历程归纳为以下阶段。

推广期:服务器数量 50~100 台之间

这个阶段由于服务器数量较少、业务规模较小,因此,运维团队对监控的需求也相对简单。能够实现基本的通知问题、快速定位与解决问题即可。此时的平台搭建主要是让研发、运维等同学能够逐渐熟悉产品使用,并通过体验和反馈,确认是否满足企业 IT 运维以及业务特征需求,这其中几个关键特点包括: (1)部署简单,有成熟的文档与服务体系,上手易用;(2)稳定运行,SLA 保障;(3)告警体系的通知形式不用太丰富,但确保相对及时、可用;(4)低成本费用或免费。 基于以上需求,很多初创企业可能会选择 Nagios,Cacti,Zabbix,Ganglia 等开源工具。热门的开源监控产品文档相对完整,可快速上手且有大量企业实践可供参考。但这里存在问题就在于开源产品的性能、使用场景无法满足随着业务场景的发展以及业务量增长,进而出现各种各样的问题。与此同时,高可用成为致命问题,毕竟开源社区不会时刻有志愿者帮我们排查故障。

爆发期:服务器数量 200~1000 台之间

成熟期:服务器数量 1000 台以上

由于业务持续增长,对服务器的需求越来越大,当服务器超过 1000 台以后,意味着核心系统需要全部接入,并构建新的稳定性保障体系,包括监控大盘、告警通知、应急值班等。才能确保整个业务与技术大盘的稳定。这其中,需要关注: (1)监控延时与告警滞后 当业务规模越老越大,由于组件或服务的耦合关系,很可能由于局部的细小故障导致整个业务系统的瘫痪。因此,及时发现问题成为了一切的大前提。但假如还在选择时开源产品,这时可能就有不小的麻烦。以 Zabbix 举例,当规模达到一定量后,有时候会出现监控数据不能及时显示,告警延时等问题。我们确实可以通过各种优化方式进行调整。但业务出现问题而造成的损失并不能挽回。 (2)监控系统自身的 SLA 当收集运维数据飞速增长,监控系统自身的高可用也成为了重要关注点。毕竟,失去了监控系统意味着对整个技术与业务的运行状态失去了控制。

更具性价比的解决方案:应用实时监控服务 ARMS

按流量计费,用多少算多少

超大流量,按节点计费更划算

一些 ToC 类型的业务流量非常大,并且对问题可追溯的时间跨度要求高,需要长周期存储。此时,可以选择 ARMS 专家版按节点计费模式,链路存储 30 天,指标存储 90天,一价全包,费用封顶,更适合大流量核心应用接入。专家版还可享受 容器服务 ACK 或 EDAS 用户半价优惠,购买预付费流量包最低可至 1.308 元/(探针*天),详见 ARMS 产品价格说明。

常见问题

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Linux基础命令与常用命令精讲(一)
下一篇:java实现简单的五子棋游戏
相关文章

 发表评论

暂时没有评论,来抢沙发吧~