CN115865649B - 一种智能运维管理控制方法、系统和存储介质 - Google Patents

一种智能运维管理控制方法、系统和存储介质 Download PDF

Info

Publication number
CN115865649B
CN115865649B CN202310173201.0A CN202310173201A CN115865649B CN 115865649 B CN115865649 B CN 115865649B CN 202310173201 A CN202310173201 A CN 202310173201A CN 115865649 B CN115865649 B CN 115865649B
Authority
CN
China
Prior art keywords
abnormal
data
information
module
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310173201.0A
Other languages
English (en)
Other versions
CN115865649A (zh
Inventor
�田�浩
张旭
张宇峰
尹海文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Networks Technology Co ltd
Original Assignee
Networks Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Networks Technology Co ltd filed Critical Networks Technology Co ltd
Priority to CN202310173201.0A priority Critical patent/CN115865649B/zh
Publication of CN115865649A publication Critical patent/CN115865649A/zh
Application granted granted Critical
Publication of CN115865649B publication Critical patent/CN115865649B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请实施例提供了一种智能运维管理控制方法、系统和存储介质。属于大数据和系统智慧管理技术领域。该方法包括:实时监测各运行模块的信息并获取运行告警信息集,并识别提取异常事件、指标、日志进行并获得异常事件集数据和异常日志聚类数据,再结合性能指标因子判断系统运维监测状态,若状态异常则进行告警源分析获得模块告警指数,并根因检定并获取异常检定数据,经过异常运行指标阈值对比得到偏离度最大的运行模块并进行状态校正;从而获取异常事件和日志数据判断系统状态,并获得模块告警指数和异常检定数据,并通过对比识别出偏离度较大的模块并进行校正,实现通过大数据对IT系统的模块运行状态进行异常偏离识别和检定技术。

Description

一种智能运维管理控制方法、系统和存储介质
技术领域
本申请涉及大数据和系统智慧管理技术领域,具体而言,涉及一种智能运维管理控制方法、系统和存储介质。
背景技术
IT系统的运行维护场景复杂,数据量宏大,且关联模块较多,涉及硬件监控、资产管理、云资源运行、平台资源支撑、能耗检测、健康监测等模块,但如何通过处理技术在系统全局运营视角解读、识别、处理和分析IT运维状态,并将监测的事件和日志等多维数据进行处理,根据一定算法实现包括精准告警、异常检测、根因定位等场景处理技术,是目前系统运维难以实现的技术。
针对上述问题,目前亟待有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种智能运维管理控制方法、系统和存储介质,可以通过监测模块告警信息获取异常事件和日志数据判断系统状态,并根据异常监测的数据信息获得模块告警指数和异常检定数据,再根据各运行模块的异常检定数据进行阈值对比,识别出偏离度较大的模块并进行校正,实现通过大数据对IT系统的模块运行状态进行异常偏离识别和检定技术。
本申请实施例还提供了一种智能运维管理控制方法,包括以下步骤:
实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,包括:
实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据,包括:
将所述运行告警信息集通过系统监测运维平台预设的信息识别监测模型进行告警类型识别并提取分类,获得异常告警事件、异常性能指标以及异常日志;
对所述运行告警信息集中分类提取的所述异常告警事件、异常性能指标以及异常日志进行聚类处理,获得运行异常监测模型树;
根据所述运行异常监测模型树提取异常事件数据和异常日志数据并分别进行合并聚类处理,获得异常事件集数据和异常日志聚类数据。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态,包括:
根据所述预设时间段内监测获取的所述资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息在所述系统监测运维平台进行性能指标分析,获得性能指标因子;
根据所述异常事件集数据和异常日志聚类数据并结合所述性能指标因子进行处理,获得系统运维监测数据;
根据所述系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数,包括:
若系统运维监测状态异常,则通过所述运行异常监测模型树提取所述各运行模块对应的异常事件数据和异常日志数据;
根据所述各运行模块对应的异常性能指标与所述性能指标因子进行加权处理,获得各运行模块的异常性能因子;
根据所述各运行模块的异常事件数据、异常日志数据和异常性能因子结合所述异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据,包括:
根据所述各运行模块的模块告警指数结合系统运维监测数据通过预设的异常根因检定模型进行检定处理,获取各运行模块对应的异常检定数据;
所述异常根因检定模型的检定程序公式为:
Figure SMS_1
其中,
Figure SMS_2
为第k个运行模块的异常检定数据,
Figure SMS_3
为所有运行模块的模块告警指数集合,
Figure SMS_4
为第k个运行模块的模块告警指数,
Figure SMS_5
为系统运维监测数据,
Figure SMS_6
为预设特征系数。
可选地,在本申请实施例所述的智能运维管理控制方法中,所述根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正,包括:
根据所述各运行模块获得的对应所述异常检定数据与预设的异常运行阈值进行阈值对比;
获取阈值对比结果中阈值对比偏离度较大的一个或多个异常检定数据,并获得所述异常检定数据对应的运行模块;
将获得的所述一个或多个运行模块定为较大偏离运行模块;
对所述较大偏离运行模块按照预设修正方案进行运行状态校正。
第二方面,本申请实施例提供了一种智能运维管理控制系统,该系统包括:存储器及处理器,所述存储器中包括智能运维管理控制方法的程序,所述智能运维管理控制方法的程序被所述处理器执行时实现以下步骤:
实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正。
可选地,在本申请实施例所述的智能运维管理控制系统中,所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,包括:
实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集。
第三方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质中包括智能运维管理控制方法程序,所述智能运维管理控制方法程序被处理器执行时,实现如上述任一项所述的智能运维管理控制方法的步骤。
由上可知,本申请实施例提供的一种智能运维管理控制方法、系统和存储介质。该方法包括:实时监测各运行模块的监测信息并获取运行告警信息集,并识别提取异常告警事件、异常性能指标以及异常日志进行事件合并和日志聚类获得异常事件集数据和异常日志聚类数据,再结合性能指标因子判断系统运维监测状态,若状态异常则根据各运行模块的异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析获得模块告警指数,再结合系统运维监测数据进行异常根因检定并获取异常检定数据,经过异常运行指标阈值对比得到偏离度最大的运行模块并进行运行状态校正;从而根据监测模块告警信息获取异常事件和日志数据判断系统状态,并根据异常监测的数据信息获得模块告警指数和异常检定数据,后对比获得偏离度较大的模块并进行校正,实现通过大数据对IT系统的模块运行状态进行异常偏离识别和检定技术。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种智能运维管理控制方法的流程图;
图2为本申请实施例提供的一种智能运维管理控制方法的获取运行告警信息集的流程图;
图3为本申请实施例提供的一种智能运维管理控制方法的获取异常事件集数据和异常日志聚类数据的流程图;
图4为本申请实施例提供的智能运维管理控制系统的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种智能运维管理控制方法的流程图。该智能运维管理控制方法用于终端设备中,例如手机、电脑等。该智能运维管理控制方法,包括以下步骤:
S101、实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
S102、根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
S103、根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
S104、若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
S105、根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
S106、根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正。
需要说明的是,为实现通过大数据技术对IT系统的模块运行状态进行状态监测并获得各运行模块的异常偏离度的识别和检定技术,对系统进行实时监测,获得系统各运行模块的监测信息,并获取预设时间段内的监测信息捕捉到的各类告警信息集,再对运行告警信息集进行识别并提取异常告警事件、异常性能指标以及异常日志的告警类别分类,再通过对异常监测事件、指标和日志进行聚合得到的运行异常监测模型树提取异常事件集数据和异常日志聚类数据,再结合性能指标因子处理获得系统运维监测数据判断系统运维监测状态,若监测状态异常则根据各运行模块的异常事件数据、异常日志数据和异常性能因子进行各模块告警源分析,获得各运行模块对应的模块告警指数,再结合系统运维监测数据对各运行模块进行异常根因检定处理获取对应的异常检定数据,最后与预设的异常运行指标阈值进行阈值对比获得异常运行偏离度较大的运行模块并进行运行状态校正,从而通过监测模块告警信息获取异常事件、异常指标和日志数据判断系统状态,并通过模块告警指数和异常检定数据,后对比获得偏离度较大的模块并进行校正。
请参照图2,图2是本申请一些实施例中的智能运维管理控制方法的获取运行告警信息集的流程图。根据本发明实施例,所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,具体为:
S201、实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
S202、根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
S203、根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集。
需要说明的是,为检测各系统模块的运行异常状况,需监测系统各运行模块的告警信息,采集各运行模块包括资源监测模块、能耗监测模块、健康监测模块、寿命监测模块、资产监管监督模块的监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息,再对各运行模块的预设时间段内各类监测信息中提取运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息,再将各运行模块的告警信息进行集合,合成运行告警信息集,经过告警信息集的收集建立可明确预设时间段内系统的宏观告警信息流总汇,便于进一步进行处理。
请参照图3,图3是本申请一些实施例中的智能运维管理控制方法的获取异常事件集数据和异常日志聚类数据的流程图。根据本发明实施例,所述根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据,具体为:
S301、将所述运行告警信息集通过系统监测运维平台预设的信息识别监测模型进行告警类型识别并提取分类,获得异常告警事件、异常性能指标以及异常日志;
S302、对所述运行告警信息集中分类提取的所述异常告警事件、异常性能指标以及异常日志进行聚类处理,获得运行异常监测模型树;
S303、根据所述运行异常监测模型树提取异常事件数据和异常日志数据并分别进行合并聚类处理,获得异常事件集数据和异常日志聚类数据。
需要说明的是,在获得了系统各运行模块的告警信息后,为方便对各类告警信息进行分类别处理获得有类型针对性的告警数据,对告警信息进行类型识别并提取异常告警事件、异常性能指标和异常日志,即对各运行模块中的告警信息类型进行分类,分为事件、指标和日志,如能耗监测模块的能耗超限信息进行识别分类,分类获得能耗断供事件、能耗链异常指标和能耗超限记录日志,信息分类识别的信息识别监测模型是通过系统监测运维平台获取的预设模型,再对运行告警信息集中各运行模块所提取的异常告警事件、异常性能指标以及异常日志进行聚类处理获得运行异常监测模型树,运行异常监测模型树是反映系统宏观下各运行模块异常的事件、指标、日志的监测信息的数据链、数据流的分枝分类模型,通过大量数据的训练使得到的预设的运行异常监测模型树可对对象信息进行规则分枝和数据展示,通过该模型树可提取系统中宏观的异常事件数据和异常日志数据,再分别对上述数据进行聚类处理,获得异常事件集数据和异常日志聚类数据,该异常事件集数据和异常日志聚类数据反映出系统总运行模块中存在的异常运行状态的事件和日志的集成数据,是对系统运行正常状况的集成数据映射,其中,异常事件集数据为
Figure SMS_7
,异常日志聚类数据为
Figure SMS_8
,其中
Figure SMS_9
为第i个运行模块的异常事件数据,
Figure SMS_10
为第i个运行模块的异常日志数据。
根据本发明实施例,所述根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态,具体为:
根据所述预设时间段内监测获取的所述资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息在所述系统监测运维平台进行性能指标分析,获得性能指标因子;
根据所述异常事件集数据和异常日志聚类数据并结合所述性能指标因子进行处理,获得系统运维监测数据;
根据所述系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态。
需要说明的是,在获得了系统各运行模块的异常事件和日志的集成数据后,为评估出在异常状况出现下的系统运维状态,得到可衡量出系统总运维的反映数据,即系统运维监测数据,先根据预设时间段内的各运行模块的信息包括资源分布信息、能耗信息、健康监测信等通过系统监测运维平台进行性能指标分析计算,获得性能指标因子,该性能指标因子是映射系统动态运行性能的指标参量因子,再通过该因子结合异常事件集数据和异常日志聚类数据进行处理,获得系统运维监测数据,再将系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态,该系统运维状况阈值是通过系统监测运维平台进行获取,若系统运维监测数据与系统运维状况阈值的阈值对比结果符合预设阈值要求,则说明系统运维监测状况正常,否则,若阈值对比结果不符合要求,则系统运维监测状况异常,其中,系统运维状况阈值的阈值对比要求不小于85%;
其中,所述性能指标因子的计算公式为:
Figure SMS_11
所述系统运维监测数据的计算公式为:
Figure SMS_12
其中,
Figure SMS_13
为系统运维监测数据,
Figure SMS_14
为性能指标因子,
Figure SMS_15
为异常事件集数据,
Figure SMS_16
为异常日志聚类数据,
Figure SMS_17
分别为资源分布信息、能耗信息、健康监测信息、时寿监测信息、资产监管信息,
Figure SMS_18
为系统健康指数,
Figure SMS_19
为预设特征系数(特征系数通过系统监测运维平台进行查询获得)。
根据本发明实施例,所述若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数,具体为:
若系统运维监测状态异常,则通过所述运行异常监测模型树提取所述各运行模块对应的异常事件数据和异常日志数据;
根据所述各运行模块对应的异常性能指标与所述性能指标因子进行加权处理,获得各运行模块的异常性能因子;
根据所述各运行模块的异常事件数据、异常日志数据和异常性能因子结合所述异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数。
需要说明的是,若监测结果表明系统运维监测状况异常,则需对异常状况的主要诱因的运行模块进行根因分析,即寻找系统各运行模块中的影响度较大的告警源模块,并获得各运行模块的对应告警指数,以反映各运行模块的异常告警度状态,通过运行异常监测模型树提取各运行模块对应的异常事件数据和异常日志数据,再根据各运行模块对应的异常性能指标与前述得到性能指标因子进行加权处理获得各运行模块的异常性能因子,再根据各运行模块的异常事件数据、异常日志数据和异常性能因子结合异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数,即通过告警源分析计算获得各运行模块的模块告警指数,获得各运行模块对系统的告警影响的参量指数;
其中,所述异常性能因子的计算公式为:
Figure SMS_20
所述模块告警指数的计算公式为:
Figure SMS_21
其中,
Figure SMS_22
为第k个运行模块的模块告警指数,
Figure SMS_23
为第k个运行模块的异常事件数据,
Figure SMS_24
为第k个运行模块的异常日志数据,
Figure SMS_25
为第k个运行模块的异常性能因子,
Figure SMS_26
为第k个运行模块的异常性能指标,
Figure SMS_27
为预设特征系数。
根据本发明实施例,所述根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据,具体为:
根据所述各运行模块的模块告警指数结合系统运维监测数据通过预设的异常根因检定模型进行检定处理,获取各运行模块对应的异常检定数据;
所述异常根因检定模型的检定程序公式为:
Figure SMS_28
其中,
Figure SMS_29
为第k个运行模块的异常检定数据,
Figure SMS_30
为所有运行模块的模块告警指数集合,
Figure SMS_31
为第k个运行模块的模块告警指数,
Figure SMS_32
为系统运维监测数据,
Figure SMS_33
为预设特征系数。
需要说明的是,在获取各运行模块的模块告警指数后,再根据预设的异常根源检定模型进行检定处理,以评估各运行模块的异常度情况,即通过各运行模块的异常检定数据映射出各运行模块的异常度衡量参量,也亦反映出各运行模块的异常程度对系统的影响程度,其中预设的异常根因检定模型是通过平台进行获得的预设模型。
根据本发明实施例,所述根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正,具体为:
根据所述各运行模块获得的对应所述异常检定数据与预设的异常运行阈值进行阈值对比;
获取阈值对比结果中阈值对比偏离度较大的一个或多个异常检定数据,并获得所述异常检定数据对应的运行模块;
将获得的所述一个或多个运行模块定为较大偏离运行模块;
对所述较大偏离运行模块按照预设修正方案进行运行状态校正。
需要说明的是,在获得了各运行模块的异常检定数据后,根据该数据与预设的异常运行阈值进行阈值对比,根据阈值对比的阈值偏离度,即阈值对比结果与预设阈值要求的偏离值,作为各运行模块的阈值对比偏离度,如某运行模块的异常检定数据与预设异常运行阈值的阈值对比结果为符合对比阈值的73%,而要求的预设阈值对比结果为不小于90%,则该运行模块的阈值对比偏离度为90-73=17,依此方法获得各运行模块的阈值对比偏离度,将最大偏离度或较大的几个偏离度对应的运行模块作为较大偏离运行模块,后对这一个或多个运行模块按照预设修正方案进行运行状态校正,加大偏离度运行模块的数量设定根据实际要求进行预设。
如图4所示,本发明还公开了一种智能运维管理控制系统4,包括存储器41和处理器42,所述存储器中包括智能运维管理控制方法程序,所述智能运维管理控制方法程序被所述处理器执行时实现如下步骤:
实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正。
需要说明的是,为实现通过大数据技术对IT系统的模块运行状态进行状态监测并获得各运行模块的异常偏离度的识别和检定技术,对系统进行实时监测,获得系统各运行模块的监测信息,并获取预设时间段内的监测信息捕捉到的各类告警信息集,再对运行告警信息集进行识别并提取异常告警事件、异常性能指标以及异常日志的告警类别分类,再通过对异常监测事件、指标和日志进行聚合得到的运行异常监测模型树提取异常事件集数据和异常日志聚类数据,再结合性能指标因子处理获得系统运维监测数据判断系统运维监测状态,若监测状态异常则根据各运行模块的异常事件数据、异常日志数据和异常性能因子进行各模块告警源分析,获得各运行模块对应的模块告警指数,再结合系统运维监测数据对各运行模块进行异常根因检定处理获取对应的异常检定数据,最后与预设的异常运行指标阈值进行阈值对比获得异常运行偏离度较大的运行模块并进行运行状态校正,从而通过监测模块告警信息获取异常事件、异常指标和日志数据判断系统状态,并通过模块告警指数和异常检定数据,后对比获得偏离度较大的模块并进行校正。
根据本发明实施例,所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,具体为:
实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集。
需要说明的是,为检测各系统模块的运行异常状况,需监测系统各运行模块的告警信息,采集各运行模块包括资源监测模块、能耗监测模块、健康监测模块、寿命监测模块、资产监管监督模块的监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息,再对各运行模块的预设时间段内各类监测信息中提取运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息,再将各运行模块的告警信息进行集合,合成运行告警信息集,经过告警信息集的收集建立可明确预设时间段内系统的宏观告警信息流总汇,便于进一步进行处理。
根据本发明实施例,所述根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据,具体为:
将所述运行告警信息集通过系统监测运维平台预设的信息识别监测模型进行告警类型识别并提取分类,获得异常告警事件、异常性能指标以及异常日志;
对所述运行告警信息集中分类提取的所述异常告警事件、异常性能指标以及异常日志进行聚类处理,获得运行异常监测模型树;
根据所述运行异常监测模型树提取异常事件数据和异常日志数据并分别进行合并聚类处理,获得异常事件集数据和异常日志聚类数据。
需要说明的是,在获得了系统各运行模块的告警信息后,为方便对各类告警信息进行分类别处理获得有类型针对性的告警数据,对告警信息进行类型识别并提取异常告警事件、异常性能指标和异常日志,即对各运行模块中的告警信息类型进行分类,分为事件、指标和日志,如能耗监测模块的能耗超限信息进行识别分类,分类获得能耗断供事件、能耗链异常指标和能耗超限记录日志,信息分类识别的信息识别监测模型是通过系统监测运维平台获取的预设模型,再对运行告警信息集中各运行模块所提取的异常告警事件、异常性能指标以及异常日志进行聚类处理获得运行异常监测模型树,运行异常监测模型树是反映系统宏观下各运行模块异常的事件、指标、日志的监测信息的数据链、数据流的分枝分类模型,通过大量数据的训练使得到的预设的运行异常监测模型树可对对象信息进行规则分枝和数据展示,通过该模型树可提取系统中宏观的异常事件数据和异常日志数据,再分别对上述数据进行聚类处理,获得异常事件集数据和异常日志聚类数据,该异常事件集数据和异常日志聚类数据反映出系统总运行模块中存在的异常运行状态的事件和日志的集成数据,是对系统运行正常状况的集成数据映射,其中,异常事件集数据为
Figure SMS_34
,异常日志聚类数据为
Figure SMS_35
,其中
Figure SMS_36
为第i个运行模块的异常事件数据,
Figure SMS_37
为第i个运行模块的异常日志数据。
根据本发明实施例,所述根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态,具体为:
根据所述预设时间段内监测获取的所述资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息在所述系统监测运维平台进行性能指标分析,获得性能指标因子;
根据所述异常事件集数据和异常日志聚类数据并结合所述性能指标因子进行处理,获得系统运维监测数据;
根据所述系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态。
需要说明的是,在获得了系统各运行模块的异常事件和日志的集成数据后,为评估出在异常状况出现下的系统运维状态,得到可衡量出系统总运维的反映数据,即系统运维监测数据,先根据预设时间段内的各运行模块的信息包括资源分布信息、能耗信息、健康监测信等通过系统监测运维平台进行性能指标分析计算,获得性能指标因子,该性能指标因子是映射系统动态运行性能的指标参量因子,再通过该因子结合异常事件集数据和异常日志聚类数据进行处理,获得系统运维监测数据,再将系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态,该系统运维状况阈值是通过系统监测运维平台进行获取,若系统运维监测数据与系统运维状况阈值的阈值对比结果符合预设阈值要求,则说明系统运维监测状况正常,否则,若阈值对比结果不符合要求,则系统运维监测状况异常,其中,系统运维状况阈值的阈值对比要求不小于85%;
其中,所述性能指标因子的计算公式为:
Figure SMS_38
所述系统运维监测数据的计算公式为:
Figure SMS_39
其中,
Figure SMS_40
为系统运维监测数据,
Figure SMS_41
为性能指标因子,
Figure SMS_42
为异常事件集数据,
Figure SMS_43
为异常日志聚类数据,
Figure SMS_44
分别为资源分布信息、能耗信息、健康监测信息、时寿监测信息、资产监管信息,
Figure SMS_45
为系统健康指数,
Figure SMS_46
为预设特征系数(特征系数通过系统监测运维平台进行查询获得)。
根据本发明实施例,所述若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数,具体为:
若系统运维监测状态异常,则通过所述运行异常监测模型树提取所述各运行模块对应的异常事件数据和异常日志数据;
根据所述各运行模块对应的异常性能指标与所述性能指标因子进行加权处理,获得各运行模块的异常性能因子;
根据所述各运行模块的异常事件数据、异常日志数据和异常性能因子结合所述异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数。
需要说明的是,若监测结果表明系统运维监测状况异常,则需对异常状况的主要诱因的运行模块进行根因分析,即寻找系统各运行模块中的影响度较大的告警源模块,并获得各运行模块的对应告警指数,以反映各运行模块的异常告警度状态,通过运行异常监测模型树提取各运行模块对应的异常事件数据和异常日志数据,再根据各运行模块对应的异常性能指标与前述得到性能指标因子进行加权处理获得各运行模块的异常性能因子,再根据各运行模块的异常事件数据、异常日志数据和异常性能因子结合异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数,即通过告警源分析计算获得各运行模块的模块告警指数,获得各运行模块对系统的告警影响的参量指数;
其中,所述异常性能因子的计算公式为:
Figure SMS_47
所述模块告警指数的计算公式为:
Figure SMS_48
其中,
Figure SMS_49
为第k个运行模块的模块告警指数,
Figure SMS_50
为第k个运行模块的异常事件数据,
Figure SMS_51
为第k个运行模块的异常日志数据,
Figure SMS_52
为第k个运行模块的异常性能因子,
Figure SMS_53
为第k个运行模块的异常性能指标,
Figure SMS_54
为预设特征系数。
根据本发明实施例,所述根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据,具体为:
根据所述各运行模块的模块告警指数结合系统运维监测数据通过预设的异常根因检定模型进行检定处理,获取各运行模块对应的异常检定数据;
所述异常根因检定模型的检定程序公式为:
Figure SMS_55
其中,
Figure SMS_56
为第k个运行模块的异常检定数据,
Figure SMS_57
为所有运行模块的模块告警指数集合,
Figure SMS_58
为第k个运行模块的模块告警指数,
Figure SMS_59
为系统运维监测数据,
Figure SMS_60
为预设特征系数。
需要说明的是,在获取各运行模块的模块告警指数后,再根据预设的异常根源检定模型进行检定处理,以评估各运行模块的异常度情况,即通过各运行模块的异常检定数据映射出各运行模块的异常度衡量参量,也亦反映出各运行模块的异常程度对系统的影响程度,其中预设的异常根因检定模型是通过平台进行获得的预设模型。
根据本发明实施例,所述根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正,具体为:
根据所述各运行模块获得的对应所述异常检定数据与预设的异常运行阈值进行阈值对比;
获取阈值对比结果中阈值对比偏离度较大的一个或多个异常检定数据,并获得所述异常检定数据对应的运行模块;
将获得的所述一个或多个运行模块定为较大偏离运行模块;
对所述较大偏离运行模块按照预设修正方案进行运行状态校正。
需要说明的是,在获得了各运行模块的异常检定数据后,根据该数据与预设的异常运行阈值进行阈值对比,根据阈值对比的阈值偏离度,即阈值对比结果与预设阈值要求的偏离值,作为各运行模块的阈值对比偏离度,如某运行模块的异常检定数据与预设异常运行阈值的阈值对比结果为符合对比阈值的73%,而要求的预设阈值对比结果为不小于90%,则该运行模块的阈值对比偏离度为90-73=17,依此方法获得各运行模块的阈值对比偏离度,将最大偏离度或较大的几个偏离度对应的运行模块作为较大偏离运行模块,后对这一个或多个运行模块按照预设修正方案进行运行状态校正,加大偏离度运行模块的数量设定根据实际要求进行预设。
本发明第三方面提供了一种可读存储介质,所述可读存储介质中包括智能运维管理控制方法程序,所述智能运维管理控制方法程序被处理器执行时,实现如上述任一项所述的智能运维管理控制方法的步骤。
本发明公开的一种智能运维管理控制方法、系统和存储介质,通过实时监测各运行模块的监测信息并获取运行告警信息集,并识别提取异常告警事件、异常性能指标以及异常日志进行事件合并和日志聚类获得异常事件集数据和异常日志聚类数据,再结合性能指标因子判断系统运维监测状态,若状态异常则根据各运行模块的异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析获得模块告警指数,再结合系统运维监测数据进行异常根因检定并获取异常检定数据,经过异常运行指标阈值对比得到偏离度最大的运行模块并进行运行状态校正;从而根据监测模块告警信息获取异常事件和日志数据判断系统状态,并根据异常监测的数据信息获得模块告警指数和异常检定数据,后对比获得偏离度较大的模块并进行校正,实现通过大数据对IT系统的模块运行状态进行异常偏离识别和检定技术。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (5)

1.一种智能运维管理控制方法,其特征在于,包括以下步骤:
实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正;
所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,包括:
实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集;
所述根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据,包括:
将所述运行告警信息集通过系统监测运维平台预设的信息识别监测模型进行告警类型识别并提取分类,获得异常告警事件、异常性能指标以及异常日志;
对所述运行告警信息集中分类提取的所述异常告警事件、异常性能指标以及异常日志进行聚类处理,获得运行异常监测模型树;
根据所述运行异常监测模型树提取异常事件数据和异常日志数据并分别进行合并聚类处理,获得异常事件集数据和异常日志聚类数据;
所述根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态,包括:
根据所述预设时间段内监测获取的所述资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息在所述系统监测运维平台进行性能指标分析,获得性能指标因子;
根据所述异常事件集数据和异常日志聚类数据并结合所述性能指标因子进行处理,获得系统运维监测数据;
根据所述系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态;
其中,所述性能指标因子的计算公式为:
Figure QLYQS_1
所述系统运维监测数据的计算公式为:
Figure QLYQS_2
其中,
Figure QLYQS_3
为系统运维监测数据,
Figure QLYQS_4
为性能指标因子,
Figure QLYQS_5
为异常事件集数据,
Figure QLYQS_6
为异常日志聚类数据,
Figure QLYQS_7
分别为资源分布信息、能耗信息、健康监测信息、时寿监测信息、资产监管信息,
Figure QLYQS_8
为系统健康指数,
Figure QLYQS_9
为预设特征系数;
所述若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数,包括:
若系统运维监测状态异常,则通过所述运行异常监测模型树提取所述各运行模块对应的异常事件数据和异常日志数据;
根据所述各运行模块对应的异常性能指标与所述性能指标因子进行加权处理,获得各运行模块的异常性能因子;
根据所述各运行模块的异常事件数据、异常日志数据和异常性能因子结合所述异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数;
其中,所述异常性能因子的计算公式为:
Figure QLYQS_10
所述模块告警指数的计算公式为:
Figure QLYQS_11
其中,
Figure QLYQS_12
为第k个运行模块的模块告警指数,
Figure QLYQS_13
为第k个运行模块的异常事件数据,
Figure QLYQS_14
为第k个运行模块的异常日志数据,
Figure QLYQS_15
为第k个运行模块的异常性能因子,
Figure QLYQS_16
为第k个运行模块的异常性能指标,
Figure QLYQS_17
为预设特征系数。
2.根据权利要求1所述的智能运维管理控制方法,其特征在于,所述根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据,包括:
根据所述各运行模块的模块告警指数结合系统运维监测数据通过预设的异常根因检定模型进行检定处理,获取各运行模块对应的异常检定数据;
所述异常根因检定模型的检定程序公式为:
Figure QLYQS_18
其中,
Figure QLYQS_19
为第k个运行模块的异常检定数据,
Figure QLYQS_20
为所有运行模块的模块告警指数集合,
Figure QLYQS_21
为第k个运行模块的模块告警指数,
Figure QLYQS_22
为系统运维监测数据,
Figure QLYQS_23
为预设特征系数。
3.根据权利要求2所述的智能运维管理控制方法,其特征在于,所述根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正,包括:
根据所述各运行模块获得的对应所述异常检定数据与预设的异常运行阈值进行阈值对比;
获取阈值对比结果中阈值对比偏离度较大的一个或多个异常检定数据,并获得所述异常检定数据对应的运行模块;
将获得的所述一个或多个运行模块定为较大偏离运行模块;
对所述较大偏离运行模块按照预设修正方案进行运行状态校正。
4.一种智能运维管理控制系统,其特征在于,该系统包括:存储器及处理器,所述存储器中包括智能运维管理控制方法的程序,所述智能运维管理控制方法的程序被所述处理器执行时实现以下步骤:
实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集;
根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据;
根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态;
若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数;
根据所述模块告警指数结合系统运维监测数据对所述各运行模块进行异常根因检定,并获取各运行模块的异常检定数据;
根据所述各运行模块的异常检定数据与预设的异常运行指标阈值进行阈值对比,获取异常运行偏离度较大的运行模块,并进行运行状态校正;
所述实时监测系统各运行模块的监测信息并获取预设时间段内的运行告警信息集,包括:
实时监测系统各运行模块的运行状态并采集监测信息,包括资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息;
根据监测信息提取预设时间段内所述各运行模块的运行告警信息,包括资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息;
根据所述资源断链信息、能耗超限信息、亚健康告警信息、到寿提示信息、资产异常信息以及故障警示信息合成运行告警信息集;
所述根据所述运行告警信息集识别并提取异常告警事件、异常性能指标以及异常日志,并进行事件合并和日志聚类分别获得异常事件集数据和异常日志聚类数据,包括:
将所述运行告警信息集通过系统监测运维平台预设的信息识别监测模型进行告警类型识别并提取分类,获得异常告警事件、异常性能指标以及异常日志;
对所述运行告警信息集中分类提取的所述异常告警事件、异常性能指标以及异常日志进行聚类处理,获得运行异常监测模型树;
根据所述运行异常监测模型树提取异常事件数据和异常日志数据并分别进行合并聚类处理,获得异常事件集数据和异常日志聚类数据;
所述根据所述异常事件集数据和异常日志聚类数据并结合性能指标因子判断系统运维监测状态,包括:
根据所述预设时间段内监测获取的所述资源分布信息、能耗信息、健康监测信息、时寿监测信息以及资产监管信息在所述系统监测运维平台进行性能指标分析,获得性能指标因子;
根据所述异常事件集数据和异常日志聚类数据并结合所述性能指标因子进行处理,获得系统运维监测数据;
根据所述系统运维监测数据与预设的系统运维状况阈值进行阈值对比,根据阈值对比结果判断系统运维状态;
其中,所述性能指标因子的计算公式为:
Figure QLYQS_24
所述系统运维监测数据的计算公式为:
Figure QLYQS_25
其中,
Figure QLYQS_26
为系统运维监测数据,
Figure QLYQS_27
为性能指标因子,
Figure QLYQS_28
为异常事件集数据,
Figure QLYQS_29
为异常日志聚类数据,
Figure QLYQS_30
分别为资源分布信息、能耗信息、健康监测信息、时寿监测信息、资产监管信息,
Figure QLYQS_31
为系统健康指数,
Figure QLYQS_32
为预设特征系数;
所述若所述系统运维监测状态异常,则根据各运行模块的对应所述异常告警事件、异常性能指标以及异常日志集的数据信息进行告警源分析,获得所述各运行模块对应的模块告警指数,包括:
若系统运维监测状态异常,则通过所述运行异常监测模型树提取所述各运行模块对应的异常事件数据和异常日志数据;
根据所述各运行模块对应的异常性能指标与所述性能指标因子进行加权处理,获得各运行模块的异常性能因子;
根据所述各运行模块的异常事件数据、异常日志数据和异常性能因子结合所述异常事件集数据和异常日志聚类数据进行模块告警源分析,获得各运行模块对应的模块告警指数;
其中,所述异常性能因子的计算公式为:
Figure QLYQS_33
所述模块告警指数的计算公式为:
Figure QLYQS_34
其中,
Figure QLYQS_35
为第k个运行模块的模块告警指数,
Figure QLYQS_36
为第k个运行模块的异常事件数据,
Figure QLYQS_37
为第k个运行模块的异常日志数据,
Figure QLYQS_38
为第k个运行模块的异常性能因子,
Figure QLYQS_39
为第k个运行模块的异常性能指标,
Figure QLYQS_40
为预设特征系数。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括智能运维管理控制方法程序,所述智能运维管理控制方法程序被处理器执行时,实现如权利要求1至3中任一项所述的智能运维管理控制方法的步骤。
CN202310173201.0A 2023-02-28 2023-02-28 一种智能运维管理控制方法、系统和存储介质 Active CN115865649B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310173201.0A CN115865649B (zh) 2023-02-28 2023-02-28 一种智能运维管理控制方法、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310173201.0A CN115865649B (zh) 2023-02-28 2023-02-28 一种智能运维管理控制方法、系统和存储介质

Publications (2)

Publication Number Publication Date
CN115865649A CN115865649A (zh) 2023-03-28
CN115865649B true CN115865649B (zh) 2023-05-12

Family

ID=85659215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310173201.0A Active CN115865649B (zh) 2023-02-28 2023-02-28 一种智能运维管理控制方法、系统和存储介质

Country Status (1)

Country Link
CN (1) CN115865649B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116471174B (zh) * 2023-05-05 2024-02-09 北京优特捷信息技术有限公司 一种日志数据监测系统、方法、装置和存储介质
CN116502925B (zh) * 2023-06-28 2024-01-23 深圳普菲特信息科技股份有限公司 基于大数据的数字工厂设备巡检评估方法、系统和介质
CN117034127B (zh) * 2023-10-10 2023-12-08 广东电网有限责任公司 一种基于大数据的电网设备监测预警方法、系统和介质
CN117742303B (zh) * 2024-02-07 2024-05-14 珠海市运泰利电子有限公司 一种生产自动化设备检测方法、系统和介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114647558A (zh) * 2022-02-24 2022-06-21 京东科技信息技术有限公司 一种日志异常检测的方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106371986A (zh) * 2016-09-08 2017-02-01 上海新炬网络技术有限公司 一种日志处理运维监控系统
WO2019051042A1 (en) * 2017-09-08 2019-03-14 Striim, Inc. APPARATUS AND METHOD FOR REAL-TIME ANALYSIS, PREDICTION AND ABORIGINAL DATA BASE TRANSACTION LOG ACTIVITY REPORT
CN109656793A (zh) * 2018-11-22 2019-04-19 安徽继远软件有限公司 一种基于多源异构数据融合的信息系统性能立体监测方法
CN110708204B (zh) * 2019-11-18 2023-03-31 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN113360358B (zh) * 2021-06-25 2022-05-27 杭州优云软件有限公司 一种自适应计算it智能运维健康指数的方法及系统
CN115442212A (zh) * 2022-08-24 2022-12-06 浪潮云信息技术股份公司 一种基于云计算的智能监控分析方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114647558A (zh) * 2022-02-24 2022-06-21 京东科技信息技术有限公司 一种日志异常检测的方法和装置

Also Published As

Publication number Publication date
CN115865649A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN115865649B (zh) 一种智能运维管理控制方法、系统和存储介质
CN111177714B (zh) 异常行为检测方法、装置、计算机设备和存储介质
CN116304766B (zh) 基于多传感器的开关柜状态快速评估方法
CN111027615B (zh) 基于机器学习的中间件故障预警方法和系统
CN115809183A (zh) 基于知识图谱的信创终端故障发现及处置的方法
CN113360722B (zh) 一种基于多维数据图谱的故障根因定位方法及系统
CN113949652B (zh) 基于人工智能的用户异常行为检测方法、装置及相关设备
CN111506635A (zh) 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法
CN112418687B (zh) 基于用电特征的用户用电异常识别方法、装置和存储介质
CN113591393A (zh) 智能变电站的故障诊断方法、装置、设备和存储介质
CN115358155A (zh) 一种电力大数据异常预警方法、装置、设备及可读存储介质
CN112612680A (zh) 一种消息告警方法、系统、计算机设备及存储介质
CN115796708B (zh) 一种工程建设用的大数据智能质检方法、系统和介质
CN117439916A (zh) 一种网络安全测试评估系统及方法
CN116862081A (zh) 一种污染治理设备运维方法及系统
CN115660262A (zh) 一种基于数据库应用的工程智慧质检方法、系统及介质
CN116881958A (zh) 电网大数据安全防护方法、系统、电子设备及存储介质
CN114356900A (zh) 一种电力数据异常检测方法、装置、设备及介质
CN113220799A (zh) 一种大数据预警管理系统
CN117851195A (zh) 一种基于数据分析的电脑主机运行风险监测管控系统
CN117093943A (zh) 一种用电量监测预警方法及装置
CN111060755A (zh) 一种电磁干扰诊断方法和装置
CN116714469A (zh) 充电桩健康监测方法、装置、终端及存储介质
CN113962508A (zh) 用电对象的识别方法及识别装置、电子设备
CN112737120A (zh) 区域电网控制报告的生成方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An intelligent operation and maintenance management control method, system, and storage medium

Granted publication date: 20230512

Pledgee: China Postal Savings Bank Co.,Ltd. Guangzhou Tianhe Branch

Pledgor: Networks Technology Co.,Ltd.

Registration number: Y2024980009515