当IT运营在互联网巨变中左突右奔的挣扎时,AIOps可是一股清流洗净铅华?若你身在其中,一定能感受到IT运营面临的巨大变化和挑战。
随着数字化进程的加快,企业越来越将应用程序视为其业务的关键组件,监控应用程序以及用户体验对于IT和业务领导者而言变得至关重要;同时,随着云、微服务、容器等技术的普及,应用程序体系结构变得更加模块化、分布式化和动态化,使监控应用程序的运行状况和性能的监控变得更加复杂。IT运营为顺应这些发展和变化,必须加强对应用程序性能的监控分析和自动化的能力,从而提高IT运营的敏捷性。AIOps已然成了辅助企业IT运营的不二法宝,其期望采用AI技术来建立数据之间相关性以及进行预测性分析,自动识别海量数据中的模式,通过AIOps算法和技术能够从收集的数据中获得更深刻的洞察力。
揭开AIOps的神秘面纱 看起来很美
AIOps技术平台是结合大数据和机器学习或深度学习功能的软件系统,以增强和部分取代广泛的IT运营流程和任务,包括可用性和性能监控,事件关联和分析,IT服务管理和自动化,它们的核心功能是从各种资源中跨域提取并存储数据,提供对数据的访问,并在数据提取点和存储点启用数据分析。
AIOps通过将监控和分析与自动化流程紧密结合,收集大量数据并进行内聚性分析,在数据本身中寻找模式、异常和因果关系,促进IT运营自动化并提高灵活性,最大限度地减少特定领域团队和数据之间的孤岛。基于海量的数据和优秀的算法,机器学习做出的判断更加高效和准确,全面了解数字业务的用户体验,持续获取洞察,从而更智能高效的支持数字化业务。
AIOps强大的能力对IT运营团队来说有着天然的吸引力,好像一旦拥有就能横扫眼前的一切问题和困扰。但当理想照进现实,我们发现,如果没有坚实的数据基础,AIOps将成为空中楼阁,可望而不可及。
巧妇难为无米之炊,AIOps无法一蹴而就
AIOps作为IT运营当下的最美好目标,未来势必加速智能化运维在企业中的应用。但现实是AIOps目前在绝大多数企业和专业服务产商都还只处于初期设想阶段,实际应用仍然非常基础,主要落地场景还是集中在较容易实现的基线预测及智能预警,AIOps仍任重道远:
首先,企业要实现AIOps前提是必须建立起全面获取IT数据的能力,但现在看来很多企业还并未建立起完善的数据收集和监控体系,AIOps实现所依赖的数据集仍然极为有限,数据源主要包括但不限于日志,指标和事件等。
IT特定领域的监控主要包括数字体验监控、应用性能监控、网络监控、IT基础设施监控(如下图),他们是AIOps的基础数据源,负责将系统全栈数据源源不断的输送给AIOps平台,共同为AIOps提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps则是无源之水,理想丰满,现实骨感。
其次,即使一些企业率先看到了大数据采集的价值,但现状却是不同域的IT监控工具被部署为孤立的解决方案,可满足IT运营中的特定团队需求,但彼此形成数据孤岛,固有的企业文化和组织架构制约数据融合,无法形成汇聚之力。如何打开通过AIOps的道道闸门,打破数据孤岛,建立数据资产的统一管理仓库,是很多企业需要进一步去思考和解决的问题。
另外,AIOps综合了多领域领先的技术和理念,目前很多企业都没有储备或发展大数据分析、AI方面的专业人才,特别是当结果表明需要在代码级别进行干预以防止中断或从中断中恢复时,能够解释这些平台产生的结果并加以分析的人才,显得尤为重要。
所以,我们需要一边怀揣着梦想,一边把最基本的事情先做好。AIOps不是一个跳跃式发展的过程,而是一个长期演进的系统。以终为始,有先见之明的企业在筹划AIOps时选择IT数据服务商都特别关注服务商的三大能力,即:
一.采集数据以及大数据处理的能力:为企业建立全面的IT数据仓库;
二.机器学习和智能算法的能力:实现IT运营自动化,获得洞察力;
三.融合不同数据平台的能力:打破数据孤岛,实现数据融合。
所谓不积跬步无以至千里,要想一步步实现AIOps,就从构建坚实的数据资产开始吧,那是通向AIOps的必经之路。
和记误乐作为中国APM技术领导者,10余年来一直在IT大数据方面深耕,以“数据为本,赋能商业”为公司理念,为企业提供APM、NPM、DEM等跨域数据采集,为企业建立可视化的全业务链性能管理体系,保障全部层级问题被快速发现和定位,帮助企业全面掌握应用性能对业务的影响,提升IT系统对数字化业务的支撑效率及质量,降低损失,提升用户体验。“让每一家企业都能享受IT运营数据的价值”为愿景,为企业实现智能运营提供最强大脑!