一、难以感知用户侧的访问体验
用户通过网络访问应用的整个过程难以追踪,访问异常等故障的获知多来源于用户投诉;
二、业务调用关系复杂,无法清晰了解整个链条的性能瓶颈
南方航空以项目组形式负责不同的微服务应用,当故障发生时,需快速透析整个应用的逻辑架构和调用关系,快速找到责任项目组,降低MTTR;
三、电商化进程加速,保障应用性能体验成为重中之重
面对在线用户量的上涨,系统承受的并发压力不断增大,如何快速解决问题,确保应用高性能运行显得非常重要。
一、获知用户侧的访问体验,重点保障海外同胞回国的航班需求
Bonree Net通过遍布全球的监测点,主动模拟拨测,通过监控海外多个地区访问南方航空官网的性能耗时,确定官网的可用性;通过事务监测,模拟真实用户操作是否顺畅,了解每一步操作的耗时及通过率,监测票务流程的成功率,每个步骤的页面响应耗时,定位用户的查票订票流程;同时关注海外重点航线国家用户访问质量,选择同样的地区监测点,并及时告警,保证航班业务正常运行,业务可用性大幅提高。
二、应用拓补可视化,量化性能指标,故障快速定位
Bonree Server可帮助南方航空了解各机器的负载情况,并与应用数据进行关联分析,可视化展示硬件资源百分比,让运维人员一眼看到问题所在。同时,通过 Bonree Server的快照分析功能即可查看代码执行堆栈、CPU/内存/JVM信息、请求参数、SQL语句、JVM参数、服务器资源负载等信息的完整故障现场数据,可实现快速关联分析,大大降低了耗时,提高了运维效率。
当发现性能瓶颈及故障问题时,Bonree Server可直接定位是哪个系统调用出现的问题,并将问题指派给对应项目组进行处理,减少沟通成本,缩短MTTR,排障时间提升至分钟级。
三、全面实现基础架构监控,实现基础资源统一管理和告警
通过Bonree ITIM,全局监控数据中心的硬件设备,实现基础资源统一管理和告警、整体项目规模建设对象达到12000个,包括服务器、防火墙、交换机、路由器、虚拟机等。实现了设备展示的精简清晰、资源使用情况的实时呈现、精准的告警及告警关联。
???为什么选择和记误乐
一、技术创新能力业内领先:行业内首家通过了代表软件能力成熟度最高等级的CMMI5级评估认证和ISO9001认证;
二、客户第一的核心价值观:配备专业服务团队,7*24小时及时响应,为客户提供全面的专业服务。
???应用效果
一、核心业务可用性大大提升:核心业务平均响应用时从1450ms下降至130ms,业务可用性提升至98.5%;
二、应用崩溃率与请求错误率得到降低:APP请求错误率下降3.7% ,应用崩溃率下降2%;
三、性能指标得到量化:可视化展示硬件资源百分比,实现单笔业务数据精准查询,异常数据收集时间与排障时间缩短至分钟级;
四、对业务进行持续性监测:通过实时监控,主动实时掌握用户体验,并快速定位异常环节,提升故障处理效率。