系统优化与进阶之道:大规模复杂场景下的技术创新实录
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

关于AIOps实践的建议

AIOps的概念归根结底是对运维规则的智能化发现与实施,即将人工经验总结的过程变为自动学习及输出实施的过程,其目标是利用大数据、人工智能及周边技术实现对运维效率、质量、成本等方面的优化和提升。

AIOps是运维领域发展的必然方向,凡是具有上述需求的企业,包括互联网企业以及数字化转型中的生产制造企业等,都可以考虑尝试AIOps。FreeWheel运维团队向AIOps演进是源自于自身的需求,实践过程中虽然踩过不少坑,但也确实解决了很多问题。对于决心实践AIOps的团队或企业,FreeWheel基于自己切身的经历给出了一些建议:

1.标准化是基础。比如报警的标准化和规范化,就是AIOps的重要基础,否则后续的工作代价就很大。最好能有架构师团队从架构决策层面整体把控技术平台的选型、走向以及相关的标准规范,并通过强有力的治理(Governance)来统一协调,推进项目,做好平衡。

2.技术选型很关键。实施AIOps,既可以选用相对成熟的商业化工具,也可以考虑自主研发,关键是结合企业自身的业务特点和能力,注意投入产出比和时效性。

3.找准切入点。如FreeWheel选择监控体系层面切入,因为数据最丰富、痛点最突出、价值最彰显。同时FreeWheel也选择在业务层面、基础设施层面的一些点状问题(如IVT、SD-WAN)上探索实践。这些切入点的选择需要结合企业的特定情况,争取达成好的示范效应,同时培养团队,夯实技术支撑体系,为后续的进一步推广应用打下基础。

4.人员从业经验很重要。在团队方面,人员的素质和经历很重要,只有在实践中切实踩过坑,解决过实际问题,才能对技术、流程、进度有深入理解和切身体会。

希望正在看文章的你也能从FreeWheel的经历中吸取经验,结合自己的实际情况将运维工作做得更好。