如何让知识图谱告诉你“故障根因”

摘要:NAIE利用知识图谱打造了一个有知识能推理的“在线运维专家系统”。

AI的时代潮流,为我们带来了众多的新名词:深度学习、神经网络、知识图谱....

你是否都对它们耳熟能详?是否都清楚它们有哪些应用?

华为网络人工智能引擎(NAIE)致力实现网络的“自优”、“自愈”和“自维护”。其中一个关键环节就是出现网络故障时系统能够自动分析定位故障根因,自动采取相应的恢复手段、维护策略,NAIE利用知识图谱打造了一个有知识能推理的“在线运维专家系统”。

本系统除了能对接机器数据实现机机自动化接口,处理网管系统采集上报的故障数据自动实现故障识别和根因定位,还能通过人机交互接口智能化的响应网络运维人员的查询,反馈精准的故障辅助信息,如故障设备的型号、故障的处理步骤等详情信息,反馈结果以一目了然的可视化图谱呈现,从而让网络运维人员真正全面掌控故障,放心的交给系统去自动处理。

“在线运维专家系统”涵盖了利用知识图谱通过适当的知识表示结构描述故障事件、对象及相互关系,通过图谱生成技术实现故障数据与表示结构的自动对接,通过静态知识的自动获取、融合支撑语义理解与人机交互等一系列关键技术。

为了让大家更好的理解知识图谱在“故障根因”里的应用,我们特地邀请到了华为产品管理专家、知识图谱TIG主任——刘瑞宏,为大家答疑解惑。

Q:你认为知识图谱有哪些高价值应用场景?

A:可以从网络复杂度高、耗时长、人工开销大,处理效率低,业务影响范围大等各种维度来综合选择高价值场景。在网络自动驾驶的“规、建、维、优、营、省”等各个环节中,网络维护环节就是一个知识图谱的高价值应用场景,因为网络维护既需要深入的网络领域基础知识和故障维护经验知识,也需要故障发生时系统产生的反映故障现象、位置、状态等信息的各种机器数据,只有将故障知识与机器数据有效结合,才能辅助定位故障、推理根因。

Q:知识推理的技术形态有哪些?

A:在故障根因自动推理的过程中,基于专家规则的推理是最常使用也是目前最有效的一种方式,难点在于推理规则的表示形式要能够反映故障的传导关系和网络机制,而规则的作用对象应该基于网络对象类和事件类本体,不应该针对具体的机器数据实例,从而保障每一条规则都是原子规则,每一条规则都可以被复用。

除此之外,基于描述逻辑的推理、基于分布式表示的表示学习推理、本体推理、复合推理等都是重要的技术手段。

Q:你认为知识库应该存储哪些内容?

A:网络故障知识的组织结构,也就是schema是知识库存储的关键核心,除此之外,对接机器数据的适配规则,承载专家经验的推理规则,描述故障的静态知识、语义知识,反映故障现场的机器数据、如拓扑、告警、性能指标、各种日志等,都是知识库需要存储的关键内容。

Q:你认为哪些知识图谱自动化构建技术是关键?

A:schema构建虽然存在一些自底向上的自动建模技术方法,但在专业领域很难适用,知识建模的过程就是搭建一个认知网络体系的过程,是给系统灌输知识的关键基础和前提条件。知识建模就像交小孩认识汉字,是需要一个字一个字的认知基本知识的。当建立起知识的基本结构认知体系后,就可以在知识自动抽取、知识融合、知识查询、知识库检验等多个环节采取针对性的自动化技术。

如果你对本话题感兴趣,欢迎莅临“华为2020全联接”,与专家面对面沟通交流。

 

点击关注,第一时间了解华为云新鲜技术~