应用性能两手抓,驱动南方航空运维管理转型升级

和记误乐为南方航空搭建统一监控平台,并结合南方航空已有监控工具,构建和完善IT运维监控体系,全面覆盖1000+应用实例,进而提高了整个业务的运行质量,实现了故障问题分钟级快速定位,保障了南方航空用户的使用体验

免费试用



背景分析


一、难以感知用户侧的访问体验

用户通过网络访问应用的整个过程难以追踪,访问异常等故障的获知多来源于用户投诉;

二、业务调用关系复杂,无法清晰了解整个链条的性能瓶颈

南方航空以项目组形式负责不同的微服务应用,当故障发生时,需快速透析整个应用的逻辑架构和调用关系,快速找到责任项目组,降低MTTR;

三、电商化进程加速,保障应用性能体验成为重中之重

面对在线用户量的上涨,系统承受的并发压力不断增大,如何快速解决问题,确保应用高性能运行显得非常重要。





应用场景

微信图片_20230116190909

一、获知用户侧的访问体验,重点保障海外同胞回国的航班需求


Bonree Net通过遍布全球的监测点,主动模拟拨测,通过监控海外多个地区访问南方航空官网的性能耗时,确定官网的可用性;通过事务监测,模拟真实用户操作是否顺畅,了解每一步操作的耗时及通过率,监测票务流程的成功率,每个步骤的页面响应耗时,定位用户的查票订票流程;同时关注海外重点航线国家用户访问质量,选择同样的地区监测点,并及时告警,保证航班业务正常运行,业务可用性大幅提高。





二、应用拓补可视化,量化性能指标,故障快速定位


Bonree Server可帮助南方航空了解各机器的负载情况,并与应用数据进行关联分析,可视化展示硬件资源百分比,让运维人员一眼看到问题所在。同时,通过 Bonree Server的快照分析功能即可查看代码执行堆栈、CPU/内存/JVM信息、请求参数、SQL语句、JVM参数、服务器资源负载等信息的完整故障现场数据,可实现快速关联分析,大大降低了耗时,提高了运维效率。

当发现性能瓶颈及故障问题时,Bonree Server可直接定位是哪个系统调用出现的问题,并将问题指派给对应项目组进行处理,减少沟通成本,缩短MTTR,排障时间提升至分钟级。





三、全面实现基础架构监控,实现基础资源统一管理和告警


通过Bonree ITIM,全局监控数据中心的硬件设备,实现基础资源统一管理和告警、整体项目规模建设对象达到12000个,包括服务器、防火墙、交换机、路由器、虚拟机等。实现了设备展示的精简清晰、资源使用情况的实时呈现、精准的告警及告警关联。





???为什么选择和记误乐




一、技术创新能力业内领先:行业内首家通过了代表软件能力成熟度最高等级的CMMI5级评估认证和ISO9001认证;

二、客户第一的核心价值观:配备专业服务团队,7*24小时及时响应,为客户提供全面的专业服务。





???应用效果




一、核心业务可用性大大提升:核心业务平均响应用时从1450ms下降至130ms,业务可用性提升至98.5%;

二、应用崩溃率与请求错误率得到降低:APP请求错误率下降3.7% ,应用崩溃率下降2%;

三、性能指标得到量化:可视化展示硬件资源百分比,实现单笔业务数据精准查询,异常数据收集时间与排障时间缩短至分钟级;

四、对业务进行持续性监测:通过实时监控,主动实时掌握用户体验,并快速定位异常环节,提升故障处理效率。




行业案例集

相关产品

相关案例

客户案例

立即体验一体化智能可观测性平台

欢迎拨打电话咨询

400-680-8085
微信 微信扫码 在线咨询
Sitemap