CN111027589B - 一种多分制目标检测算法评价系统及方法 - Google Patents
一种多分制目标检测算法评价系统及方法 Download PDFInfo
- Publication number
- CN111027589B CN111027589B CN201911081589.1A CN201911081589A CN111027589B CN 111027589 B CN111027589 B CN 111027589B CN 201911081589 A CN201911081589 A CN 201911081589A CN 111027589 B CN111027589 B CN 111027589B
- Authority
- CN
- China
- Prior art keywords
- scene
- score
- free
- target
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
多分制目标检测算法评价系统,包括算法输入模块,用于输入待测算法;测试集准备模块,根据待测算法选择具有被测目标种类的测试集;综合评分模块用于图像质量评分、图像分辨率评分、目标质量评分、目标大小评分加权得到总体综合评分;应用场景评分模块用于对场景图像分辨率评分、场景目标质量评分、场景目标大小评分加权得到应用场景评分;自由评分模块,根据用户测试需求自定义参数生成对应测试集以完成针对性的测评。同时公开一种多分制目标检测算法评价方法。能给出总体综合评分、应用场景评分、综合自由评分,不仅能客观反映出算法的好坏,还能反映出算法的好坏领域,而且能给算法设计者明确的优化方向,使算法优化更有针对性和目的性。
Description
技术领域
本发明涉及图像处理与目标检测技术,尤其与一种多分制目标检测算法评价系统及方法相关。
背景技术
目标检测技术是近年来计算机视觉领域中备受关注的方向,主要涉及计算机视觉、图像处理、人工智能、模式识别等学科,被广泛地应用于靶场测量、目标监控、视频压缩、车辆跟踪和航空航天等方面。
目前,在对目标检测算法的测评中,通常用准确率和召回率来描述一种算法的好坏,而mAP(mean Average Precision)及F-Score作为一个兼顾考虑以上两种指标,并被广泛应用。然而,传统的mAP或F-Score计算方法并不能定量反映出算法在哪些领域的擅长之处或弱点,也不能为算法设计者提供优化点,且通常存在评价片面、针对性不够强不够全面,也不能够根据应用场景进行倾向性评价。因此,需要开发多分制的评价系统,结合多种评分参数及多种评价类型,提供更加全面的评价功能。
发明内容
本发明主要针对相关现有技术的不足,提供一种多分制目标检测算法评价系统及方法,能给出总体综合评分、应用场景评分、综合自由评分,不仅能客观反映出算法的好坏,还能反映出算法的好坏领域,而且能给算法设计者明确的优化方向,使算法优化更有针对性和目的性。
为了实现上述目的,本发明采用以下技术:
一种多分制目标检测算法评价系统,其特征在于,包括:
算法输入模块,用于输入待测算法;
测试集准备模块,用于根据待测算法选择具有被测目标种类的测试集;
综合评分模块,用于根据图像质量、图像分辨率、目标质量、目标大小将测试集分别划分为四类具有多个不同等级的数据集,其中,在根据图像质量将测试集划分前,先对测试集进行加噪处理;通过对各不同类的数据集分别计算mAP以分别获得总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分,并将各总体评分进行平均加权得到总体综合评分;
应用场景评分模块,用于对测试集进行加噪处理并根据图像质量将测试集划分为不同等级的数据集,以等级最好的两个数据集中的一个数据集计算mAP以获得场景图像质量评分,并根据预设的图像分辨率参数、目标质量参数、目标大小参数分别从测试集中分别生成对应的场景数据集,以不同的场景数据集分别计算mAP以分别获得场景图像分辨率评分、场景目标质量评分、场景目标大小评分,并将各场景评分进行平均加权得到应用场景评分;
自由评分模块,用于根据预设的自由测试场景及对应预设的自由场景参数从测试集中生成对应的自由数据集,其中,预设的自由测试场景包括自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中至少一种;并通过自由数据集计算mAP 以获得对应自由测试场景的自由评分,且在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;在只获得一种自由评分时,以该种自由评分作为综合自由评分。
一种多分制目标检测算法评价方法,其特征在于,包括步骤:
根据输入的待测算法选择具有被测目标种类的测试集;
响应于用户的输入选择,执行综合评分方法、应用场景评分方法、自由评分方法中至少一种评分方法;其中:
综合评分方法,包括步骤:
根据图像质量、图像分辨率、目标质量、目标大小将测试集分别划分为四类具有多个不同等级的数据集,其中,在根据图像质量将测试集划分前,先对测试集进行加噪处理;
通过对各不同类的数据集分别计算mAP以分别获得总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分;
将各总体评分进行平均加权得到总体综合评分;
应用场景评分方法,包括步骤:
对测试集进行加噪处理并根据图像质量将测试集划分为不同等级的数据集,以等级最好的两个数据集中的一个数据集计算mAP以获得场景图像质量评分;
根据预设的图像分辨率参数、目标质量参数、目标大小参数分别从测试集中分别生成对应的场景数据集;
以不同的场景数据集分别计算mAP以分别获得场景图像分辨率评分、场景目标质量评分、场景目标大小评分;
将各场景评分进行平均加权得到应用场景评分;
自由评分方法,包括步骤:
根据预设的自由测试场景及对应预设的自由场景参数从测试集中生成对应的自由数据集,其中,预设的自由测试场景包括自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中至少一种;
通过自由数据集计算mAP 以获得对应自由测试场景的自由评分;
在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;在只获得一种自由评分时,以该种自由评分作为综合自由评分。
本发明有益效果在于:
1、传统评分方法是对一批测试集直接进行目标检测,得到预测标签,并采用mAP或FnScore的方法得到预测标签与真实标签之间的评分,由于测试集没做任务限定,因此不能定量反映出算法在哪些领域的擅长之处或弱点,也不能与算法设计者提供优化点;相比于传统方法,本发明的方法/系统,能根据评价需求给出总体综合评分、应用场景评分、综合自由评分,具体到综合图像质量评分、综合图像分辨率评分、综合图像目标质量评分、综合图像目标大小评分;以及应用场景图像质量评分、场景图像分辨率评分、场景图像目标质量评分、应用场景图像目标大小评分,还可以进行自由的评分,不仅能客观反映出算法的好坏,还能反映出算法的好坏领域,而且能给算法设计者明确的优化方向,使算法优化更有针对性和目的性;
2、总体综合评分可以客观反映待测算法的总体综合评分,具体的,在本发明的总体综合评分中同时结合了图像质量、图像分辨率、目标质量、目标大小进行综合总评,其中,图像质量和目标质量评分中采用了归一化权重处理方式,目标质量和目标大小采用平均权重处理方式,总评采用平均权重处理方式,更加全面的考虑及结合了不同图像属性的因素,利于对待测算法进行更全面、有效、准确的测评。
3、通过应用场景评分,可以实现专家/用户参数的设置,针对性的评价待测算法在特定应用场景时的效果;
4、通过自由评分,可以根据某些算法对某些特定场景项目进行单独测评,比如只对算法进行目标大小的评分,或分辨率大小评分,又或以上两项或其他项目进行评分,使用者可按照自己的想法,自由评分。
附图说明
图1为本申请实施例的评价系统结构框图。
图2为本申请实施例的综合评分模块结构框图。
图3为本申请实施例的应用场景评分模块结构框图。
图4为本申请实施例的自由评分模块结构框图。
图5为本申请实施例的评价方法步骤流程图。
图6为本申请实施例的综合评分法步骤流程图。
图7为本申请实施例的应用场景评分法步骤流程图。
图8为本申请实施例的自由评分法步骤流程图。
具体实施方式
下面结合附图,详细说明本申请的系统及方法的实施手段/方式,并附实例。
具体的,作为本申请的实施例,评价系统的整体结构框架如图1所示:
系统包括算法输入模块、测试集准备模块、综合评分模块、应用场景评分模块、自由评分模块,以及输出模块。
算法输入模块连接测试集准备模块,测试集准备模块分别连接综合评分模块、应用场景评分模块、自由评分模块,综合评分模块、应用场景评分模块、自由评分模块分别连接输出模块。
具体的:
算法输入模块,作为发起端,用于供用户输入待测算法,并将待测算法向后级模块传输。
测试集准备模块,用于根据待测算法选择具有被测目标种类的测试集。
输出模块,用于输出评价结果并予以显示和/或输出包含评价结果的可打印文档。
评价结果包括有总体综合评分、应用场景评分、综合自由评分,根据用户的操作需求,输出至少一种,也可以输出多种或者全部。
下面对三大评分模块做详细的说明:
(1)综合评分模块,用于根据图像质量、图像分辨率、目标质量、目标大小将测试集分别划分为四类具有多个不同等级的数据集,其中,在根据图像质量将测试集划分前,先对测试集进行加噪处理;通过对各不同类的数据集分别计算mAP以分别获得总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分,并将各总体评分进行平均加权得到总体综合评分。
具体的,如图2所示,综合评分模块包括:
4个数据集生成单元:总体图像质量数据集生成单元、总体图像分辨率数据集生成单元、总体目标质量数据集生成单元、总体目标大小数据集生成单元;
5个评分单元:总体图像质量评分单元、总体图像分辨率评分单元、总体目标质量评分单元、总体目标大小评分单元,以及总体综合评分单元;
1个归一化权重生成单元,为总体图像质量评分单元和总体目标质量评分单元提供归一化权重。具体的是:对不同等级mAP评分设定不同等级的同程度分;根据不同等级取得同程度分时分别对应需要的mAP分数,计算各等级对应的权重;对各等级对应的权重进行归一化处理,获得各等级对应的归一化权重。
如图2所示,其中的数据集生成单元分别连接对应的评分单元,各分类评分单元分别连接至总体综合评分单元。归一化权重生成单元,分别连接总体图像质量评分单元和总体目标质量评分单元。
总体图像质量评分:
首先总体图像质量数据集生成单元,对测试集进行加噪处理,主要是对测试集的图像加入不同程度的高斯噪声、椒盐噪声或其他噪声,和/或,进行不同程度的平滑处理,扩大测试集图像数量,并区分出不同程度噪声等级的图集。并采用SSIM、MS-SSIM、IW-SSIM、FSIM、MDSI中一种或多种结合作为图像质量指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集。
然后,总体图像质量评分单元通过总体图像质量数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体图像质量评分。
总体图像分辨率评分:
首先,总体图像分辨率数据集生成单元,根据图像分辨率大小将测试集划分为多个不同等级的数据集。
然后,总体图像分辨率评分单元,通过总体图像分辨率数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体图像分辨率评分。
总体目标质量评分:
首先,总体目标质量数据集生成单元,根据目标质量好差将测试集划分为多个不同等级的数据集。
然后,总体目标质量评分单元,通过总体目标质量数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体目标质量评分。
总体目标大小评分:
首先,总体目标大小数据集生成单元,根据目标大小将测试集划分为多个不同等级的数据集。
然后,总体目标大小评分单元,通过总体目标数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体目标大小评分。
总体综合评分:
由总体综合评分单元,对总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分进行平均加权处理获得总体综合评分。
(3)应用场景评分模块,用于对测试集进行加噪处理并根据图像质量将测试集划分为不同等级的数据集,以等级最好的两个数据集中的一个数据集计算mAP以获得场景图像质量评分,并根据预设的图像分辨率参数、目标质量参数、目标大小参数分别从测试集中分别生成对应的场景数据集,以不同的场景数据集分别计算mAP以分别获得场景图像分辨率评分、场景目标质量评分、场景目标大小评分,并将各场景评分进行平均加权得到应用场景评分。
具体的,如图3所示,应用场景评分模块包括:
1个预设单元:场景预设单元,用于响应于用户的输入以完成分辨率参数、目标质量参数、目标大小参数的预设;
4个数据集生成单元:场景图像质量数据集生成单元、场景图像分辨率数据集生成单元、场景目标质量数据集生成单元、场景目标大小数据集生成单元;
5个评分单元:场景图像质量评分单元、场景图像分辨率评分单元、场景目标质量评分单元、场景目标大小评分单元,以及场景综合评分单元。
如图3所示,场景预设单元连接场景图像分辨率数据集生成单元、场景目标质量数据集生成单元、场景目标大小数据集生成单元,用于将用户输入的对应参数,提供给对应的数据生成单元。场景图像质量数据集生成单元连接场景图像质量评分单元,场景图像分辨率数据集生成单元连接场景图像分辨率评分单元,场景目标质量数据集生成单元连接场景目标质量评分单元,场景目标大小数据集生成单元连接场景目标大小评分单元。场景综合评分单元分别连接场景图像质量评分单元、场景图像分辨率评分单元、场景目标质量评分单元、场景目标大小评分单元。
场景图像质量评分:
首先,场景图像质量数据集生成单元,对测试集进行加噪处理,并根据图像质量评价指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集,将其中等级最好的两个数据集中的一个数据集作为场景图像质量数据集。
然后,场景图像质量评分单元,通过场景图像质量数据集生成单元生成的场景图像质量数据集对待测算法进行测试,计算mAP以获得场景图像质量评分。
场景图像分辨率评分:
首先,用户通过场景预设单元输入图像分辨率参数,场景预设单元响应于用户的输入以完成分辨率参数的预设。
然后,场景图像分辨率数据集生成单元,根据预设的分辨率参数从测试集中生成与该预设的分辨率参数对应的场景图像分辨率数据集。
再后,场景图像分辨率评分单元,通过场景图像分辨率数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景图像分辨率评分。
场景目标质量评分:
首先,用户通过场景预设单元输入目标质量参数,场景预设单元响应于用户的输入以完成目标质量参数的预设。
然后,场景目标质量数据集生成单元,根据预设的目标质量参数从测试集中生成与该预设的目标质量参数对应的场景目标质量数据集。
再后,场景目标质量评分单元,通过场景目标质量数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景目标质量评分。
场景目标大小评分:
首先,用户通过场景预设单元输入目标大小参数,场景预设单元响应于用户的输入以完成目标大小参数的预设。
然后,场景目标大小数据集生成单元,根据预设的目标大小参数从测试集中生成与该预设的目标大小参数对应的场景目标大小数据集。
再后,场景目标大小评分单元,通过场景目标大小数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景目标大小评分。
场景综合评分:
场景综合评分单元,对场景图像质量评分、场景图像分辨率评分、场景目标质量评分、场景目标大小评分进行平均加权处理获得应用场景评分。
(3)自由评分模块,用于根据预设的自由测试场景及对应预设的自由场景参数从测试集中生成对应的自由数据集,其中,预设的自由测试场景包括自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中至少一种;并通过自由数据集计算mAP 以获得对应自由测试场景的自由评分,且在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;在只获得一种自由评分时,以该种自由评分作为综合自由评分。
如图4所示,自由评分模块包括依次连接的自由场景预设单元、自由场景数据集生成单元、自由评分单元。
在需要进行自由评分时:
首先,用户根据自己的需求输入图像质量参数、图像分辨率参数、目标质量参数、目标大小参数中至少一种自由场景参数,自由场景预设单元响应到用户的输入,对应选择出自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中与用户输入的自由场景参数对应的场景作为自由测试场景。
然后,自由场景数据集生成单元,根据自由测试场景及自由场景参数从测试集中生成对应的自由数据集。
再后,自由评分单元,通过自由数据集对待测算法进行测试,计算mAP以获得对应自由测试场景的自由评分。其中:
在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;
在只获得一种自由评分时,以该种自由评分作为综合自由评分。
如图5所示,本申请实施例的评价方法步骤流程图。
一种多分制目标检测算法评价方法,包括步骤:
(1)根据输入的待测算法选择具有被测目标种类的测试集。
(2)响应于用户的输入选择,执行综合评分方法、应用场景评分方法、自由评分方法中至少一种评分方法。
具体的,综合评分方法的详细步骤如图6所示:
(1)根据图像质量、图像分辨率、目标质量、目标大小将测试集分别划分为四类具有多个不同等级的数据集,其中,在根据图像质量将测试集划分前,先对测试集进行加噪处理。
(2)通过对各不同类的数据集分别计算mAP以分别获得总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分。
(3)将各总体评分进行平均加权得到总体综合评分。
具体的,应用场景评分方法的详细步骤如图7所示:
(1)对测试集进行加噪处理并根据图像质量将测试集划分为不同等级的数据集,以等级最好的两个数据集中的一个数据集计算mAP以获得场景图像质量评分。
(2)根据预设的图像分辨率参数、目标质量参数、目标大小参数分别从测试集中分别生成对应的场景数据集。
(3)以不同的场景数据集分别计算mAP以分别获得场景图像分辨率评分、场景目标质量评分、场景目标大小评分。
(4)将各场景评分进行平均加权得到应用场景评分。
具体的,自由评分方法的详细步骤如图8所示:
(1)根据预设的自由测试场景及对应预设的自由场景参数从测试集中生成对应的自由数据集,其中,预设的自由测试场景包括自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中至少一种。
(2)通过自由数据集计算mAP 以获得对应自由测试场景的自由评分:
(2-1)在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;
(2-2)在只获得一种自由评分时,以该种自由评分作为综合自由评分。
下面进一步举例说明本申请的系统及方法。
通过输入模块,输入待测算法。
测试集准备模块,在总体测试集中,选择具有被测目标种类的原测试集,命名为测试集TG。
根据用户的测试/测评需求,选择综合评分、应用场景评分、自由评分中至少一种进行测评。选择综合评分,无需用户设定参数。选择应用场景评分,用户需要通过场景预设单元输入对应场景测评需要的分辨率参数、目标质量参数、目标大小参数。选择自由评分,用户可以自定义输入需要测试的属性,以及需要测评的参数限定,如需要输入图像质量参数、图像分辨率参数、目标质量参数、目标大小参数中至少一种,自由场景预设单元根据输入有值且值不为零的对应参数,确定需要测评的应用场景,若用户只输入了一种参数,则只确定一种对应的场景,只完成对应场景参数下的测评。
一、若选择需要进行综合评分,则综合评分模块运作,开始进行以下功能/步骤:
(1)总体图像质量评分:
对TG测试集进行加噪处理,分别提取5种质量等级的5个测试集T1~T5。
计算T1与P1的mAP1, 计算T2与P2的mAP2,同理得到mAP3、 mAP4、 mAP5,因此,得出5个等级的评分,并利用归一化权重,最终加权得到质量评分S1。
其中,归一化权重的具体获得方式,可以参考如下实例操作:
当1~5级mAP评分(同程度分)分别为0.2、0.4、0.6、0.8、1时,评价算法效果相当;权重,因此,对同程度分(0.2、0.4、0.6、0.8、1)取倒数,就推算出权重为(5,2.5,1.66666667,1.25,1)。
当1-5级mAP评分分别为1、1、1、1、1时,得到质量总评分应为1,而不是5。 因此,需要归一化权重,方法: ,由此,权重w = (5,2.5,1.66666667,1.25,1)/11.41666667=(0.4379562, 0.2189781,0.1459854, 0.10948905, 0.08759124)。
最后,对各等级的mAP*w取加和,得最终评分S,公式,其中,n为5,分别对应不同等级。
试验:当mAP为(0.2, 0.4, 0.6, 0.8, 1)时,各自评分应为0.08759124(程度分相同),加和为0.4379562。
结果:代入权重归一化公式得到总评分为0.4379562,正确。0.4379562为一般效果分,若想要更高分,则得加强对强噪声图像的训练。
试验2:当mAP为(0.7, 0.7, 0.7, 0.7, 0.7)时,总评分应为0.7;
结果:代入权重归一化公式得到总评分为0.7,正确。
(2)总体图像分辨率评分
在TG测试集中按分辨率大、中、小分为3类,再分别对此3类进行评分计算mAP,并最终平均加权得到分辨率评分S2。
(3)总体目标质量评分
选择TG试集,在总体测试结果中选择此测试集的结果。按目标质量好与差,分为2个集合,再分别对此2类进行评分计算mAP,并最终通过归一化权重进行加权得到分辨率评分S3。
这里的归一化权重的获得方式,如前述的总体图像质量评分中的操作方式。设置目标质量好的mAP同程度分为1分,质量差的mAP同程度分为0.5分,则权重为(1/1,1/0.5),再进行归一化,相除:(1/1,1/0.5)/(1/1+1/0.5),即权重分别为(0.33333,0.6666666)。
(4)总体目标大小评分
选择TG试集,在总体测试结果中选择此测试集的结果。按目标大、中、小,分为3个集合,再分别对此3类进行评分计算mAP,并最终平均加权得到分辨率评分S4。
(5)总体综合评分
按照以上图像不同性质对算法进行评分得到S1~S4,最终对其平均加权得到总分S总。
二、若选择需要进行应用场景评分,除应用场景图像质量评分采用等级最高的两个数据集中的一个数据集进行测评,其他评分只用对专家/用户参数中设置的应用环境参数下的测试集进行评分。例如,系统跟原测试集的图集属性情况,安装分辨率大中小或者多余三级的情况进行分辨率分类,同时根据目前质量好与差分为至少2级以上,根据目标大小分为多级。用户根据需要测试的应用场景情况,选择对应的分辨率、目标质量、目标大小等级,以对应出需要的分辨率范围、目标质量范围、目标大小调。
例如用户将参数设置为:分辨率等级2,目标质量等级2,目标大小等级2,就是选择了这些等级对应的分辨率范围、目标质量范围、目标大小范围。分别计算以上参数下的评分,再加上质量评分,输入为具有专家参数性质的图片,输出为各情况下的评分,最终加权得到总评分。
(1)场景图像质量评分
对TG测试集进行加噪处理,分别提取5种质量等级的5个测试集T1~T5。
若各测试集的质量等级排序为:T1<T2<T3<T4<T5。分别采用T4或T5进行测试,计算T4与P4的mAP4,或,计算T5与P5的mAP5,得出的评分,作为场景图像质量评分S1。
(2)场景图像分辨率评分
用户根据自己的需求,输入分辨率为中的参数,在具体实例中,设分辨率等级2,根据分辨率等级2对应生成属于分辨率等级2的场景图像分辨率测试集,并计算mAP评分,获得场景图像分辨率评分S2。
(3)场景目标质量评分
只对根据用户输入的目标质量参数,例如设为目标质量等级2,则生成目标质量为2对应的目标质量范围的测试集,并进行测试,计算mAP评分,获得场景目标质量评分S3。
(4)场景目标大小评分
只对根据用户输入的目标大小参数,例如设目标大小等级为2,则生成目标大小等级为2对应的目标大小范围的测试集,进行测试,计算mAP评分,获得场景目标大小评分S4。
(5)应用场景评分
按照以上图像不同性质对算法进行评分得到S1~S4,最终对其平均加权得到总分S总。
三、某些算法想对某些特定场景项目进行单独测试,比如只对算法进行目标大小的评分,或分辨率大小评分,又或以上两项或其他项目进行评分。使用者可按照自己的想法,进行自由评分。系统根据用户输入的参数进行对应自由测试场景/测试集的生成。比如输入为具有小目标的图片,输出为小目标评分。
(1)数据准备
用户在自由场景预设单元中输入自己想要的评分场景,具体通过输入对应的参数,由自由场景预设单元对应生成自由数据集。
(2)自由评分
对测试集进行测试,并进行自由评分,得到一项或多项评分结果,以供算法模型的优化。若为多项,则采用平均加强获得总体自由评分。
以上述实例及场景参数作为评价系统/方法,采用yolov3_tiny版对kitti数据集进行训练,并对测试集进行目标检测对比如下(其中,实例中,应用场景评分,采用T4等级计算应用场景图像质量评分,采用分辨率等级2、目标质量等级2、目标大小登记2的参数计算其他评分):
通过本系统可以同时进行总体综合评分、应用场景评分、自由评分。如上表所列的实例结果,则可以:
通过总体综合评分与传统评分对比:可发现此待测算法对无噪声图像上表现很好,但对加噪图像目标检测敏感,对大分辨率敏感,对小目标敏感,对遮挡敏感,应加强以上方面属性的图像的训练;
通过应用场景评分与传统评分对比:可发现此待测算法在特定应用场景(即预设分辨率等级、目标质量等级、目标大小等级各自对应的测试集/测试图集)上表现不错,还需要加强对应用场景的噪声图像的训练;
自由评分属于特定的测评,不参与比对。
通过本发明提供的系统/方法,能给出总体综合评分、应用场景评分、综合自由评分,不仅能客观反映出算法的好坏,还能反映出算法的好坏领域,而且能给算法设计者明确的优化方向,使算法优化更有针对性和目的性。
Claims (6)
1.一种多分制目标检测算法评价系统,其特征在于,包括:
算法输入模块,用于输入待测算法;
测试集准备模块,用于根据待测算法选择具有被测目标种类的测试集;
综合评分模块,包括:
总体图像质量数据集生成单元,用于对测试集进行加噪处理,并根据图像质量评价指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集;
总体图像分辨率数据集生成单元,用于根据图像分辨率大小将测试集划分为多个不同等级的数据集;
总体目标质量数据集生成单元,用于根据目标质量好差将测试集划分为多个不同等级的数据集;
总体目标大小数据集生成单元,用于根据目标大小将测试集划分为多个不同等级的数据集;
总体图像质量评分单元,用于通过总体图像质量数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体图像质量评分;
总体图像分辨率评分单元,用于通过总体图像分辨率数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体图像分辨率评分;
总体目标质量评分单元,用于通过总体目标质量数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体目标质量评分;
总体目标大小评分单元,用于通过总体目标数据集生成单元生成的数据集分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体目标大小评分;
总体综合评分单元,用于对总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分进行平均加权处理获得总体综合评分;
应用场景评分模块,包括:
场景图像质量数据集生成单元,用于对测试集进行加噪处理,并根据图像质量评价指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集,将其中等级最好的两个数据集中的一个数据集作为场景图像质量数据集;
场景图像分辨率数据集生成单元,用于根据预设的分辨率参数从测试集中生成与该预设的分辨率参数对应的场景图像分辨率数据集;
场景目标质量数据集生成单元,用于根据预设的目标质量参数从测试集中生成与该预设的目标质量参数对应的场景目标质量数据集;
场景目标大小数据集生成单元,用于根据预设的目标大小参数从测试集中生成与该预设的目标大小参数对应的场景目标大小数据集;
场景图像质量评分单元,用于通过场景图像质量数据集生成单元生成的场景图像质量数据集对待测算法进行测试,计算mAP以获得场景图像质量评分;
场景图像分辨率评分单元,用于通过场景图像分辨率数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景图像分辨率评分;
场景目标质量评分单元,用于通过场景目标质量数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景目标质量评分;
场景目标大小评分单元,用于通过场景目标大小数据集生成单元生成的数据集对待测算法进行测试,计算mAP以获得场景目标大小评分;
场景综合评分单元,用于对场景图像质量评分、场景图像分辨率评分、场景目标质量评分、场景目标大小评分进行平均加权处理获得应用场景评分;
自由评分模块,包括:
自由场景预设单元,用于响应于用户输入的图像质量参数、图像分辨率参数、目标质量参数、目标大小参数中至少一种自由场景参数,对应选择出自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中与自由场景参数对应的场景作为自由测试场景;
自由场景数据集生成单元,根据自由测试场景及自由场景参数从测试集中生成对应的自由数据集;
自由评分单元,用于通过自由数据集对待测算法进行测试,计算mAP以获得对应自由测试场景的自由评分,并在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;在只获得一种自由评分时,以该种自由评分作为综合自由评分。
2.根据权利要求1所述的多分制目标检测算法评价系统,其特征在于,综合评分模块还包括归一化权重生成单元,用于对不同等级mAP评分设定不同等级的同程度分;根据不同等级取得同程度分时分别对应需要的mAP分数,计算各等级对应的权重;对各等级对应的权重进行归一化处理,获得各等级对应的归一化权重。
3.根据权利要求1所述的多分制目标检测算法评价系统,其特征在于,应用场景评分模块还包括场景预设单元,用于响应于用户的输入以完成分辨率参数、目标质量参数、目标大小参数的预设。
4.根据权利要求1所述的多分制目标检测算法评价系统,其特征在于,还包括:输出模块,用于输出评价结果并予以显示和/或输出包含评价结果的可打印文档。
5.根据权利要求4所述的多分制目标检测算法评价系统,其特征在于,评价结果为总体综合评分、应用场景评分、综合自由评分中至少一种。
6.一种多分制目标检测算法评价方法,其特征在于,包括步骤:
根据输入的待测算法选择具有被测目标种类的测试集;
响应于用户的输入选择,执行综合评分方法、应用场景评分方法、自由评分方法中至少一种评分方法;其中:
所述综合评分方法,包括步骤:
对测试集进行加噪处理,并根据图像质量评价指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集,并分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体图像质量评分;
根据图像分辨率大小将测试集划分为多个不同等级的数据集,并分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体图像分辨率评分;
根据目标质量好差将测试集划分为多个不同等级的数据集,并分别对待测算法进行测试,分别计算mAP,利用归一化权重对各等级对应的mAP评分进行加权处理获得总体目标质量评分;
根据目标大小将测试集划分为多个不同等级的数据集,并分别对待测算法进行测试,分别计算mAP,利用平均权重对各等级对应的mAP评分进行加权处理获得总体目标大小评分;
对总体图像质量评分、总体图像分辨率评分、总体目标质量评分、总体目标大小评分进行平均加权处理获得总体综合评分;
所述应用场景评分方法,包括步骤:
对测试集进行加噪处理,并根据图像质量评价指标获得测试集每张图像的距离指标,根据距离指标将测试集划分为多个质量等级的数据集,将其中等级最好的两个数据集中的一个数据集作为场景图像质量数据集;通过场景图像质量数据集对待测算法进行测试,计算mAP以获得场景图像质量评分;
根据预设的分辨率参数从测试集中生成与该预设的分辨率参数对应的场景图像分辨率数据集;通过场景图像分辨率数据集对待测算法进行测试,计算mAP以获得场景图像分辨率评分;
根据预设的目标质量参数从测试集中生成与该预设的目标质量参数对应的场景目标质量数据集;通过场景目标质量数据集对待测算法进行测试,计算mAP以获得场景目标质量评分;
根据预设的目标大小参数从测试集中生成与该预设的目标大小参数对应的场景目标大小数据集;通过场景目标大小数据集对待测算法进行测试,计算mAP以获得场景目标大小评分;
对场景图像质量评分、场景图像分辨率评分、场景目标质量评分、场景目标大小评分进行平均加权处理获得应用场景评分;
所述自由评分方法,包括步骤:
响应于用户输入的图像质量参数、图像分辨率参数、目标质量参数、目标大小参数中至少一种自由场景参数,对应选择出自由图像质量场景、自由图像分辨率场景、自由目标质量场景、自由目标大小场景中与自由场景参数对应的场景作为自由测试场景;
根据自由测试场景及自由场景参数从测试集中生成对应的自由数据集;
通过自由数据集对待测算法进行测试,计算mAP以获得对应自由测试场景的自由评分,并在获得两种以上自由评分时,将各自由评分进行平均加权得到综合自由评分;在只获得一种自由评分时,以该种自由评分作为综合自由评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911081589.1A CN111027589B (zh) | 2019-11-07 | 2019-11-07 | 一种多分制目标检测算法评价系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911081589.1A CN111027589B (zh) | 2019-11-07 | 2019-11-07 | 一种多分制目标检测算法评价系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111027589A CN111027589A (zh) | 2020-04-17 |
CN111027589B true CN111027589B (zh) | 2023-04-18 |
Family
ID=70201163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911081589.1A Active CN111027589B (zh) | 2019-11-07 | 2019-11-07 | 一种多分制目标检测算法评价系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027589B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112631948A (zh) * | 2021-01-18 | 2021-04-09 | 北京格物仿真科技发展有限公司 | 一种评估智能算法等级的方法 |
CN113010435A (zh) * | 2021-04-08 | 2021-06-22 | 开易(北京)科技有限公司 | 一种算法模型的筛选方法、装置及测试平台 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038455A (zh) * | 2006-03-17 | 2007-09-19 | 株式会社理光 | 图像形成方法与图像形成设备 |
CN101115131A (zh) * | 2006-07-28 | 2008-01-30 | 南京理工大学 | 基于像素空间相关性的图像融合效果实时评价方法及装置 |
CN101489130A (zh) * | 2009-01-21 | 2009-07-22 | 西安交通大学 | 基于图像边缘差异统计特性的全参考型图像质量评价方法 |
CN104867138A (zh) * | 2015-05-07 | 2015-08-26 | 天津大学 | 基于pca和ga-elm的立体图像质量客观评价方法 |
CN105787930A (zh) * | 2016-02-17 | 2016-07-20 | 上海文广科技(集团)有限公司 | 基于锐利度的针对虚化图像的显著性检测方法及系统 |
WO2016123815A1 (zh) * | 2015-02-03 | 2016-08-11 | 深圳大学 | 基于pet/ct图像质量客观算法的评价方法及系统 |
CN105956159A (zh) * | 2016-05-13 | 2016-09-21 | 浙江科技学院 | 一种评价图像质量客观方法综合效率的算法 |
CN106126872A (zh) * | 2015-11-02 | 2016-11-16 | 广州地铁集团有限公司 | 基于轨道交通模块化管理的运营安全评估方法 |
CN110070142A (zh) * | 2019-04-29 | 2019-07-30 | 上海大学 | 一种基于yolo神经网络的海上船只目标检测方法 |
JP2019185239A (ja) * | 2018-04-05 | 2019-10-24 | オムロン株式会社 | 物体認識処理装置及び方法、並びに、物体ピッキング装置及び方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8571325B1 (en) * | 2011-03-31 | 2013-10-29 | Raytheon Company | Detection of targets from hyperspectral imagery |
CN102522756B (zh) * | 2011-12-14 | 2014-09-10 | 华南理工大学 | 一种避免电压越限风险的电网感性无功补偿方法 |
GB2530012A (en) * | 2014-08-05 | 2016-03-16 | Illumina Cambridge Ltd | Methods and systems for data analysis and compression |
KR102336448B1 (ko) * | 2015-06-10 | 2021-12-07 | 삼성전자주식회사 | 사진 추출 전자 장치 및 방법 |
CN109559310B (zh) * | 2018-11-30 | 2020-11-24 | 国网智能科技股份有限公司 | 基于显著性检测的输变电巡检图像质量评价方法及系统 |
CN110033446B (zh) * | 2019-04-10 | 2022-12-06 | 西安电子科技大学 | 基于孪生网络的增强图像质量评价方法 |
-
2019
- 2019-11-07 CN CN201911081589.1A patent/CN111027589B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101038455A (zh) * | 2006-03-17 | 2007-09-19 | 株式会社理光 | 图像形成方法与图像形成设备 |
CN101115131A (zh) * | 2006-07-28 | 2008-01-30 | 南京理工大学 | 基于像素空间相关性的图像融合效果实时评价方法及装置 |
CN101489130A (zh) * | 2009-01-21 | 2009-07-22 | 西安交通大学 | 基于图像边缘差异统计特性的全参考型图像质量评价方法 |
WO2016123815A1 (zh) * | 2015-02-03 | 2016-08-11 | 深圳大学 | 基于pet/ct图像质量客观算法的评价方法及系统 |
CN104867138A (zh) * | 2015-05-07 | 2015-08-26 | 天津大学 | 基于pca和ga-elm的立体图像质量客观评价方法 |
CN106126872A (zh) * | 2015-11-02 | 2016-11-16 | 广州地铁集团有限公司 | 基于轨道交通模块化管理的运营安全评估方法 |
CN105787930A (zh) * | 2016-02-17 | 2016-07-20 | 上海文广科技(集团)有限公司 | 基于锐利度的针对虚化图像的显著性检测方法及系统 |
CN105956159A (zh) * | 2016-05-13 | 2016-09-21 | 浙江科技学院 | 一种评价图像质量客观方法综合效率的算法 |
JP2019185239A (ja) * | 2018-04-05 | 2019-10-24 | オムロン株式会社 | 物体認識処理装置及び方法、並びに、物体ピッキング装置及び方法 |
CN110070142A (zh) * | 2019-04-29 | 2019-07-30 | 上海大学 | 一种基于yolo神经网络的海上船只目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111027589A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108090902B (zh) | 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法 | |
CN105913456B (zh) | 基于区域分割的视频显著性检测方法 | |
Liu et al. | Blind stereoscopic image quality assessment based on hierarchical learning | |
CN109801232A (zh) | 一种基于深度学习的单幅图像去雾方法 | |
CN110956613B (zh) | 基于图像质量的目标检测算法性能归一化评价方法及系统 | |
CN111027589B (zh) | 一种多分制目标检测算法评价系统及方法 | |
CN113191359B (zh) | 基于支持与查询样本的小样本目标检测方法与系统 | |
CN108960142B (zh) | 基于全局特征损失函数的行人再识别方法 | |
Xu et al. | Quality assessment of stereoscopic 360-degree images from multi-viewports | |
Luan et al. | A Siamese network utilizing image structural differences for cross-category defect detection | |
Zheng et al. | Benchmarking unsupervised anomaly detection and localization | |
CN117011563A (zh) | 基于半监督联邦学习的道路损害巡检跨域检测方法及系统 | |
CN117036897A (zh) | 一种基于Meta RCNN的少样本目标检测方法 | |
CN111124896B (zh) | 一种主次峰值比计算算法的蜕变测试系统 | |
CN105491370B (zh) | 基于图的协同低高级特征的视频显著性检测方法 | |
CN113298007B (zh) | 一种小样本sar图像目标识别方法 | |
CN114913337A (zh) | 一种基于三元级联感知的伪装目标框检测方法 | |
CN110991485B (zh) | 一种目标检测算法的性能评估方法及系统 | |
CN114519520B (zh) | 模型评估方法、装置及存储介质 | |
CN117542121A (zh) | 基于计算机视觉的智能化训练考核系统及方法 | |
CN116597246A (zh) | 模型训练方法、目标检测方法、电子设备及存储介质 | |
Sugawara et al. | PUAD: Frustratingly Simple Method for Robust Anomaly Detection | |
CN110969599B (zh) | 基于图像属性的目标检测算法性能总体测评方法及系统 | |
Su et al. | No-reference Point Cloud Geometry Quality Assessment Based on Pairwise Rank Learning | |
CN113689067B (zh) | 一种图像保障信息评估系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |