CN111325276A - 图像分类方法及装置、电子设备、计算机可读存储介质 - Google Patents
图像分类方法及装置、电子设备、计算机可读存储介质 Download PDFInfo
- Publication number
- CN111325276A CN111325276A CN202010112567.3A CN202010112567A CN111325276A CN 111325276 A CN111325276 A CN 111325276A CN 202010112567 A CN202010112567 A CN 202010112567A CN 111325276 A CN111325276 A CN 111325276A
- Authority
- CN
- China
- Prior art keywords
- reference image
- similarity
- classified
- image
- image feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 73
- 238000005259 measurement Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000007635 classification algorithm Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 244000141359 Malus pumila Species 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像分类方法,所述方法包括:提取待分类图像的待分类图像特征,并确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;获取参考图像特征库中每两个参考图像特征之间的关联关系;根据待分类图像特征、初始相似度和参考图像特征库中每两个参考图像特征之间的关联关系,确定待分类图像特征与每个参考图像特征之间的目标相似度;从参考图像特征库中选取与待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将目标参考图像特征对应的类别确定为所述待分类图像的类别。本申请实施例同时公开了一种图像分类装置、电子设备以及计算机可读存储介质。
Description
技术领域
本申请涉及图像处理领域,尤其涉及一种图像分类方法及装置、电子设备、计算机可读存储介质。
背景技术
对图像进行细粒度的分类,其目的是对粗粒度的大类别进行更加细致的子类划分,例如,区分不同种类的狗。细粒度图像类别的精度相比于通用的图像分类更加细致,类间差异更加细微,往往只能借助于微小的局部差异才能区分出不同的类别。
目前,细粒度图像分类方法引入目标区域识别来提高细粒度图像分类的效果;但是,细粒度图像分类依赖目标区域的定位,目标区域的定位精度决定了细粒度分类的效果,容易导致分类不够准确的问题。
发明内容
本申请实施例提供了一种图像分类方法及装置、电子设备、计算机可读存储介质,以提高图像分类的准确度。
本申请实施例提供一种图像分类方法,所述方法包括:
提取待分类图像的待分类图像特征,并确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;
获取所述参考图像特征库中每两个参考图像特征之间的关联关系;
根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定所述待分类图像特征与每个参考图像特征之间的目标相似度;
从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将所述目标参考图像特征对应的类别确定为所述待分类图像的类别。
本申请实施例还提供一种图像分类装置,所述图像分类装置包括:特征提取单元,初始相似度确定单元,获取单元,目标相似度确定单元,和类别确定单元;其中,
所述特征提取单元,配置为提取待分类图像的待分类图像特征;
所述初始相似度确定单元,配置为确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;
所述获取单元,配置为获取所述参考图像特征库中每两个参考图像特征之间的关联关系;
所述目标相似度确定单元,配置为根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定所述待分类图像特征与每个参考图像特征之间的目标相似度;
所述类别确定单元,配置为从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将所述目标参考图像特征对应的类别确定为所述待分类图像的类别。
本申请实施例还提供一种电子设备,所述电子设备包括处理器、存储器和通信总线;
所述通信总线,配置为实现所述处理器和所述存储器之间的连接通信;
所述处理器,配置为运行所述存储器中存储的图像分类方法的程序,以实现上述任一项所述图像分类方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现上述图像分类方法的步骤。
本申请实施例提供的图像分类方法及装置、电子设备和计算机存储介质,通过提取待分类图像的待分类图像特征,并确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;获取所述参考图像特征库中每两个参考图像特征之间的关联关系;根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定所述待分类图像特征与每个参考图像特征之间的目标相似度;从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将所述目标参考图像特征对应的类别确定为所述待分类图像的类别。这样,可以从参考图像特征库中选择出与待分类图像相似度较高的参考图像特征,并将选择出的参考图像特征对应的类别作为待分类图像的类别。能够避免目标区域定位不准确导致分类不够准确的问题,在分类的基础上进一步提高细粒度图像分类的效果。
附图说明
图1为本申请实施例提供的一种图像分类方法的流程示意图1;
图2为本申请实施例提供的一种图像分类方法的流程示意图2;
图3为本申请实施例提供的一种图像分类方法的流程示意图3;
图4(a)为本申请实施例提供的一种图像分类方法的流程示意图4;
图4(b)为本申请实施例提供的一种图像分类方法的场景架构示意图;
图5(a)为本申请实施例提供的一种扩展查询方法的流程示意图;
图5(b)为本申请实施例提供的一种扩展查询方法的场景架构示意图;
图6为本申请实施例提供的一种图像分类装置的结构组成示意图;
图7为本申请实施例提供的一种电子设备的硬件结构组成示意图。
具体实施方式
为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
细粒度图像分类无论在工业界还是学术界都有着广泛的研究需求与应用场景。与之相关的研究课题主要包括识别不同种类的鸟、狗、花、车、飞机等。在实际生活中,识别不同的子类别又存在着巨大的应用需求。例如,在生态保护中,有效识别不同种类的生物,是进行生态研究的重要前提。如果能够借助于计算机视觉的技术,实现低成本的细粒度图像识别,那么无论对于学术界,还是工业界而言,都有着非常重要的意义。
图像细粒度分类属于图像分类的一个分支,由于图像类别都属于同一个大的类别;因此图像的子类别之间的直接差异性比较小,但是不同子类别图像存在背景和外形的多样性差异,从而导致子类别之间仍然有很多的差异性。
目前的图像细粒度分类方法大致可以分为以下几个分支:基于现有分类网络微调的方法、基于细粒度特征学习的方法、基于目标块检测与分类结合的方法以及基于视觉注意力机制的方法。其中,基于现有分类网络微调的方法通常使用现有的分类网络(例如分类器MobileNet,Xception等)针对图像数据集进行初步训练得到一个训练好的分类模型,然后继续在细粒度数据集上针对细粒度类别进行微调,使得分类模型能够更适用于区分子类别。基于细粒度特征学习的方法能够将两个网络获取的信息结合,从而适用于细粒度图像分类;其中,一个网络用来获取图像中目标对象的位置信息,一个网络用于提取目标对象的抽象特征。基于目标块检测与分类结合的细粒度分类方法借鉴了目标检测的思想,先在图像中检测出目标对象所在的位置,然后再检测出目标对象中有区分性区域的位置,然后通过分类算法对具有区分性的目标区域进行细粒度分类,分类算法可以是传统的支持向量机(SupportVectorMachines,SVM)分类器或者通用的分类网络。最后,基于注意力机制的细粒度分类算法相比于通用的分类算法添加了注意力机制使得模型更加关注于目标区域的信息表达。
由此可见,上述相关技术方案主要集中于将当前通用分类模型与目标区域相结合的手段提高细粒度分类的效果,但是,目标区域的定位精度决定了细粒度分类的最终效果;并且,不加入目标区域检测模块的通用分类算对于细粒度类别效果不够精确。
为解决上述相关技术中存在的问题,本申请实施例提供一种图像分类方法,该图像分类方法的执行主体可以是本申请实施例提供的图像分类装置,或者集成了该图像分类装置的电子设备,这里的图像分类装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、个人计算器、服务器或者工业计算器等。
实施例一
请参考图1,图1为本申请实施例提供的数据传输方法的流程示意图,如图1所示,所述图像分类方法包括以下步骤:
步骤110、提取待分类图像的待分类图像特征,并确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度。
本申请实施例所涉及的待分类图像可以是用户输入的任意一个图像,也可以是其他装置传输给图像分类装置的任意一个图像。本申请实施例这里对待分类图像的来源不进行限定。
进一步地,图像分类装置在获取到待分类图像之后,对该待分类图像进行处理,提取待分类图像的图像特征,得到待分类图像特征。这里,图像分类装置可以提取待分类图像的尺度不变特征变换(Scale-invariant feature transform,SIFT)信息、以及待分类图像的方向梯度直方图(Histogram ofOriented Gradient,HOG)信息来得到待分类图像特征,图像分类装置还可以通过SVM提取待分类图像特征,或者基于卷积神经网络(Convolutional Neural Networks,CNN)来得到待分类图像特征;本申请实施例这里对提取待分类图像特征的方法不做限定。
另外,本申请实施例所涉及的参考图像特征库,可以是指图像分类装置预先构建的具有多种子类别的图像特征库。参考图像特征库中包括多个参考图像特征,并且每个参考图像特征具有其对应的类别标注。
进一步地,图像分类装置在获取了待分类图像特征后,可以确定待分类图像特征与参考图像特征之间的目标相似度,进而从参考图像特征库中选取出目标相似度满足一定条件的参考图像特征,最后基于选取出的参考图像特征对应的类别,确定待分类图像的类别。
为了能够准确地获取待分类图像特征与参考图像特征之间的目标相似度,本申请实施例可以先为待分类图像特征和每个参考图像特征配置初始相似度,进而对该初始相似度进行优化调整,得到最优的目标相似度。如此,能够提高图像分类的准确性。
步骤120、获取参考图像特征库中每两个参考图像特征之间的关联关系。
具体地,图像分类装置可以获取参考图像特征库中每个参考图像特征与参考图像特征库中其余的每个参考图像之间的关联关系,也就是说,获取参考图像特征库中两两参考图像之间的关联关系。
这里,本申请实施例所提及的每两个参考图像特征之间的关联关系可以通过量化的数值来表征。数值越大,则表示两个参考图像特征之间的关联度越高。
具体地,图像分类装置可以通过计算参考图像特征库中每两个参考图像之间的欧式距离、汉明距离或者余弦相似度来得到每两个参考图像之间的关联关系。
需要说明的是,步骤120可以在步骤110之后执行,也可以在步骤110之前执行,还可以与步骤110同时执行,本申请实施例这里对步骤120以及步骤110的执行顺序进行限定。
步骤130、根据待分类图像特征、初始相似度和参考图像特征库中每两个参考图像特征之间的关联关系,确定待分类图像特征与每个参考图像特征之间的目标相似度。
在本申请提供的实施例中,图像分类装置可以基于待分类图像特征,参考图像特征库中来那个两参考图像特征之间的关联关系,对初始相似度进行优化调整,得到待分类图像特征与参考图像特征库中每个参考图像特征之间的目标相似度。
步骤140、从参考图像特征库中选取与待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将目标参考图像特征对应的类别确定为待分类图像的类别。
这里,图像分类装置从参考图像特征库中,选取出满足第一条件的一个或者多个参考图像特征作为目标参考图像特征。可以理解为,图像分类装置能够根据相似度从参考图像特征中选择出与待分类图像特征相似的部分图像。进一步地,图像分类装置可以获取目标参考图像特征对应的类别,将参考图像特征对应的类别作为待分类图像特征。
具体地,目标参考图像特征为一个时,则将该目标参考图像特征对应的类别作为待分类图像特征的类别,当目标参考图像特征为多个时,待分类图像特征的类别可以为任一个目标参考图像特征的类别。
在本申请提供的实施例中,还可以在原有参考图像特征库之外,添加少量未知类别的参考图像,根据步骤110至步骤140中的方法确定该位置类别的参考图像的类别。因此,本申请提供的实施例对参考图像特征库中参考图像特征的数量要求不高。
由此可见,本申请实施例提供的图像分类方法,可以从参考图像特征库中选择出与待分类图像相似度较高的参考图像特征,并将选择出的参考图像特征对应的类别作为待分类图像的类别。能够避免目标区域定位不准确导致分类不够准确的问题,在分类的基础上进一步提高细粒度图像分类的效果。
实施例二
基于前述实施例,本申请实施例提供的图像分类方法中,在步骤110之前,图像分类装置还可以执行以下步骤:
步骤101、获取多个参考图像;其中,参考图像包括多种不同子类别的图像;
步骤102、提取每个参考图像的参考图像特征,得到参考图像特征库。
可以理解为,图像分类装置可以预先获取多个参考图像,并对多个参考图像进行处理,提取所述多个参考图像中每个参考图像的参考图像特征,以构建参考图像特征库。这里,参考图可以是选取的包含多种子类别的图像,这里的多种子类别的图像可以涵盖所有粗粒度类别下的细粒度子类别;例如,多种子类别的图像可以包括不同品种的鸟类,不同品种的狗,以及不同品种的苹果等。
在本申请提供的实施例中,图像分类装置可以采用不同类型的特征提取方法来提取参考图像特征。这里,特征提取方法可以是传统的特征提取方法,例如提取图像中的SIFT信息和HOG信息得到图像特征,也可以是SVM特征提取方法,或者基于CNN的特征提取方法。
这里,基于CNN的特征提取方法能够通过机器学习动态调整CNN网络模型参数,因此基于CNN的特征提取方法更加具有类间区分度。
需要说明的是,参考图像特征库中每个参考图像特征都具有其所属的类别标注。另外,在本申请提供的实施例中,构建参考图像特征库的过程是离线生成的,即参考图像特征库是预先构建好的,因此在确定待分类图像类别的阶段直接使用参考图像特征库,无需再去提取参考图像的图像特征,因此能够降低时间成本,以及,提高图像分类效率。
实施例三
基于前述实施例,本申请实施例提供的图像分类方法,可以通过不同的方式确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度。
在一种可能的实施方式中,确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度,可以通过以下步骤实现:
步骤110a、计算待分类图像特征与参考图像特征库中每个参考图像特征之间的关联关系;
步骤110b、将待分类图像特征分别与每个参考图像特征之间的关联关系,确定为待分类图像特征与每个参考图像特征之间的初始相似度。
具体地,图像分类装置可以通过计算待分类图像特征和参考图像特征之间的欧氏距离、汉明距离或者余弦相似度得待分类图像特征和每一个参考图像特征之间的关联关系。
这里,将计算得到的待分类图像特征和每一个参考图像特征之间的关联关系作为初始相似度,能够减少后续基于初始相似度来确定目标相似度的迭代次数,提高图像分类的速度。
在另一种可能的实施方式中,确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度,还可以通过以下步骤实现:
步骤110c、生成N维随机向量;N为参考图像特征库中参考图像特征的总数;
步骤110d、将N维随机向量中的元素确定为待分类图像与参考图像集合中每个参考图像之间的初始相似度。
也就是说,图像分类装置可以将待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度设置为任意向量,这样,可以减少图像处理过程中的计算量,降低运算复杂度。
实施例四
基于前述实施例,本申请实施例提供的图像分类方法,步骤130可以包括步骤1301-步骤1303。请参考图2,图2为本申请实施例提供的图像分类方法流程示意图2,具体地,步骤130包括以下步骤:
步骤1301、根据参考图像特征库中每两个参考图像特征之间的关联关系,构建参考图像特征库的邻接矩阵;
在本申请提供的实施例中,图像分类装置可以构建参考图像特征库的无向图;这里,无向图的顶点为参考图像特征库中每个参考图像特征,无向图的边为参考图像特征库中每两个参考图像特征之间关联关系。其中,无向图的边,可以构建形成参考图像特征库的邻接矩阵,且邻接矩阵为对称矩阵。
具体地,参考图像特征库为X,包括N个参考图像特征(x1,x2,…,xN)。在计算得到参考图像特征库X中每两个元素(例如xh和xk)之间的相似度ahk之后,其中,h和k为大于零且小于等于N的整数;图像分类装置可以根据每两个参考图像特征之间的相似度ahk,得到邻接矩阵因此A是对称矩阵,也是正定矩阵。
步骤1302、对邻接矩阵进行归一化处理,得到度量矩阵;度量矩阵用于表征参考图像特征库中每两个参考图像特征之间的关联程度。
在本申请提供的实施例中,为了方便对数据进行处理,可以对邻接矩阵进行归一化,得到度量矩阵。度量矩阵中的每个元素,能够表征参考图像特征库中每两个参考图像特征之间的关联程度。
在一种可行的实施方式中,图像分类装置可以基于步骤1302中构建的无向图的邻接矩阵,得到该无向图的度矩阵;并根据度矩阵与邻接矩阵得到度量矩阵。
具体地,将邻接矩阵A中每一列或者每一行的元素相加,得到N个数,将这N个数放到矩阵对角线上,且矩阵的其他元素都为零,由此组成一个N阶对角矩阵,记为度矩阵D。
进一步地,度量矩阵S可以根据公式(1)得到:
其中,A为步骤1301构建的参考图像特征库邻接矩阵;D为A的度矩阵。这样,通过公式(1)可以得到参考图像特征库中每两个参考图像特征归一化后的关联关系;如此,基于度量矩阵确定待分类图像特征和参考图像特征之间的目标相似度,可以消除其他数据量对相似度计算的影响,以此提高后续图像分类的准确性。
步骤1303、根据待分类图像特征、初始相似度和度量矩阵,确定待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度。
具体地,图像分类装置可以基于待分类图像特征和度量矩阵,对初始相似度逐步进行优化调整,从而得到目标相似度。目标相似度能够准确反映待分类图像和参考图像特征库中每个参考图像特征的最终的相似度。
在本申请提供的图像分类方法,步骤1303可以包括步骤1303a-步骤1303c,请参考图3,图3为本申请实施例提供的图像分类方法流程示意图3,具体地,步骤1303具体可以包括以下步骤:
步骤1303a、根据待分类图像特征、初始相似度和度量矩阵,计算得到待分类像与参考图像集合中每个参考图像之间的第i相似度;其中,i为大于等于1的整数;
在本申请提供的实施例中,采用向量y表示待分类图像特征。采用向量f0表示待分类图像与参考图像特征库中每个参考图像特征之间的初始相似度;具体地,其中表示待分类图像特征与参考图像特征库中第j个参考图像特征之间的初始相似度。j为大于等于1小于等于N的整数。
具体地,图像分类装置可以根据公式(2)得到第i相似度;
fi=α×S×fi-1+(1-α)×y (2);
其中,α为大于0且小于1的数,用于表示概率。fi-1为i-1次迭代计算得到的待分类图像特征与参考图像特征的相似度。步骤1303a可以理解为,图像分类装置在步骤1301构建的无向图中进行随机“漫步操作”,其中,具有α的概率跳转至邻接矩阵相邻顶点中,1-α的概率跳转至待分类图像特征。如此,得到第i相似度。
进一步地,当i=T时,相似度可以通过公式(3)表示:
其中,T为任意迭代次数。如此,通过公式(3)可以看出,图像分类装置可以基于待分类图像特征y、初始相似度f0和度量矩阵S,迭代计算得到每一次待分类像与参考图像集合中每个参考图像之间的相似度。
步骤1303b、若第i相似度满足收敛条件,则将第i相似度确定为目标相似度;其中,收敛条件用于表征相邻两个相似度的差值小于预设阈值。
步骤1303c、若第i相似度不满足收敛条件,则基于待分类图像特征、第i相似度和度量矩阵,计算得到待分类像与参考图像集合中每个参考图像之间的第i+1相似度,直到第i+N相似度满足收敛条件,并将第i+N相似度确定为目标相似度。
基于上述步骤1303a,在迭代计算得到每一个相似度后,需要判断当前计算得到相似度是否满足收敛条件,也就是说,判断待分类图像特征与每个参考图像特征之间的相似度是否趋于稳定。若当前相似度满足收敛条件,则停止迭代,将当前计算得到的相似度,作为目标相似度。若当前相似度不满足收敛条件,则根据当前相似度计算下一次待分类像与参考图像集合中每个参考图像之间的相似度,直到满足收敛条件为止。
在本申请提供的实施例中,图像分类装置可以设置不同的收敛条件来判断待分类图像特征与每个参考图像特征之间的相似度是否趋于稳定。
在一种可能的实现方式中,图像分类装置可以判断当前相似度与上一次计算的相似度之间的差值,若差值小于预设阈值,则说明待分类图像特征与每个参考图像特征之间的相似度趋于稳定;因此,将当计算得到的相似度作为目标相似度。
在另一种可能的实现方式中,图像分类装置还可以通过判断当前计算的相似度f*是否满足公式(4),来判断当前计算的相似度是否收敛:
f*=(1-α)×(I-αS)-1×y (4);
其中,I为单位矩阵。
公式(4)可以通过下面公式(5)证明:
其中,公式(5)中的参数与上文中的含义相同,在此不再赘述。
这里,可以将公式(5)中的参数代入到公式(3)中,可以证明当前计算的相似度的收敛公式(4)。
基于上述步骤的实现,可知本申请实施例提供的图像分类方法可以先为待分类图像特征和每个参考图像特征配置初始相似度,进而对该初始相似度进行优化调整,得到最优的目标相似度。如此,能够提高图像分类的准确性。并且本申请实施例提供的图像分类方法,不需要构建目标区域,算法模型简单,在一定程度上降低图像分类过程的计算量。
实施例五
基于前述实施例,本申请实施例提供的图像分类方法,可以通过设置不同的第一条件,来获取目标参考图像特征。
在一种可能的实现方式中,第一条件包括大于相似度阈值;
那么,步骤140从参考图像特征库中选取与待分类图像的目标相似度满足第一条件的目标参考图像,具体为:
从参考图像特征库中选取与待分类图像特征的目标相似度大于相似度阈值的参考图像特征,作为目标参考图像特征。
示例性的,相似度阈值可以为数值范围(0.98,1]。只要待分类图像和某一参考图像特征之间的目标相似度处于该数值范围内,则认为该参考图像特征满足第一条件,将该参考图像特征作为目标参考图像特征。
在另一种可能的实现方式中,第一条件包括目标相似度为参考图像特征对应的目标相似度的最大值;
对应的,步骤140从参考图像特征库中选取与待分类图像特征的目标相似度满足第一条件的目标参考图像,包括:
从参考图像特征库中选取与待分类图像的目标相似度为最大值的参考图像特征,作为目标参考图像特征。
可以理解为,图像分类装置可以根据目标相似度,从参考图像特征库中选取出目标相似度为最大值的部分参考图像特征,作为目标参考图像特征。例如,图像分类装置可以将目标相似度按照从大到小进行排序,选择出排序第一的参考图像特征作为目标参考图像特征,同样地,图像分类装置也可以选择出排序前M个参考图像特征作为目标参考图像特征;这里,M为大于1的整数。
由此可见,本申请实施例提供的图像分类方法,可以从参考图像特征库中选择出与待分类图像相似度较高的参考图像特征,并将选择出的参考图像特征对应的类别作为待分类图像的类别。能够避免目标区域定位不准确导致分类不够准确的问题,在分类的基础上进一步提高细粒度图像分类的效果。
实施例六
基于上述实施例,本申请提供的实施例可以理解为是将拓展查询方法应用于细粒度图像分类任务中,通过扩展查询方法从参考图像数据库中查找与待分类图像最相似的一张或者多张参考图像,进而根据最相似的参考图像间接确定上述待分类图像的类别。具体地,参考图4(a)所示的图像分类方法流程示意图,以及图4(b)所示的图像分类方法场景架构示意图,基于扩展查询的图像分类方法包括以下步骤:
步骤a、获取参考图像集合K,K=(k1,k2,…,kN)。
如图4(b)所示,参考图像集合K中可以包括多种不同子类别的图像;例如,不同种类的狗的图像。
在本申请提供的实施例中,参考图像集合预先存储在存储装置中的图像。在进行图像分类之前,图像采集装置可以从存储装置中获取参考图像集合。
步骤b、提取每个参考图像ki的参考图像特征xi,其中,i为大于等于1且小于等于N的整数。
这里,图像分类装置可以基于CNN或者传统特征提取方法获取每个参考图像的参考图像特征xi。
步骤c、基于每个参考图像特征xi,构建参考图像特征库X:(x1,x2,…,xN)。
步骤d、获取待分类图像。
这里,如图4(b)所示,待分类图像可以图像采集装置(例如摄像头)采集到的图像。
步骤e、提取待分类图像的待分类图像特征y。
这里,图像分类装置的处理器对待分类图像进行特征提取,得到待分类图像特征y。
步骤f、根据待分类图像特征y,对参考图像特征库X进行扩展查询,得到目标参考图像特征。
步骤g、基于目标参考图像特征,确定待分类图像特征的类别。
下面,详细介绍步骤f中的扩展查询方法,请一并参考图5(a)所示的扩展查询方法流程示意图以及图5(b)所示的扩展查询场景架构示意图。
步骤f1、计算参考图像特征库X中每两个元素之间的关联关系,得到邻接矩阵A。
具体地,图像分类装置计算参考图像特征库X:(x1,x2,…,xN)中每两个元素(例如xh和xk)之间的相似度ahk,其中,h和k为大于零且小于等于N的整数;图像分类装置可以根据每两个参考图像特征之间的相似度ahk,得到邻接矩阵
步骤f2、对邻接矩阵A进行归一化,得到度量矩阵S。
具体地,归一化邻接矩阵A的过程如下:构建参考图像特征库的无向图,其中A为图的节点之间的邻接矩阵。将邻接矩阵A中每一列或者每一行的元素相加,得到N个数,将这N个数放到矩阵对角线上,且矩阵的其他元素都为零,由此组成一个N阶对角矩阵,记为度矩阵D。
具体地,初始相似度可以是计算得到的分类图像特征分别与每个参考图像特征之间的关联关系关联关系,也可以是任意向量。
步骤f4、根据待分类图像特征、初始相似度和度量矩阵,计算得到待分类像与参考图像集合中每个参考图像之间的第i相似度。
具体通过以下公式得到第i相似度:
fi=α×S×fi-1+(1-α)×y;
可以理解为,在构建的无向图中进行随机漫步,有α的概率跳转到邻接矩阵中相邻的顶点中,有1-α的概率跳转到待分类图像特征y。
步骤f5、判断第i相似度是否满足收敛条件f*=(1-α)×(I-αS)-1×y;
若不满足收敛条件,设置i=i+1,并返回执行步骤f4。
若满足收敛条件,执行步骤f6。
步骤f6、将当前第i相似度作为目标相似度。
由此可见,本申请实施例提供的图像分类方法,可以从参考图像特征库中选择出与待分类图像相似度较高的参考图像特征,并将选择出的参考图像特征对应的类别作为待分类图像的类别。能够避免目标区域定位不准确导致分类不够准确的问题,在分类的基础上进一步提高细粒度图像分类的效果。
实施例七
基于前述实施例,本申请实施例提供一种图像分类装置,如图6所示,所述图像分类装置包括:
特征提取单元61,初始相似度确定单元62,获取单元63,目标相似度确定单元64,和类别确定单元65;其中,
特征提取单元61,配置为提取待分类图像的待分类图像特征;
初始相似度确定单元62,配置为确定待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;
获取单元63,配置为获取所述参考图像特征库中每两个参考图像特征之间的关联关系;
目标相似度确定单元64,配置为根据待分类图像特征、初始相似度和参考图像特征库中每两个参考图像特征之间的关联关系,确定待分类图像特征与每个参考图像特征之间的目标相似度;
类别确定单元65,配置为从参考图像特征库中选取与待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将目标参考图像特征对应的类别确定为待分类图像的类别。
在本申请提供的实施例中,初始相似度确定单元62,具体配置为计算待分类图像特征与所述参考图像特征库中每个参考图像特征之间的关联关系;将所述待分类图像特征分别与每个参考图像特征之间的关联关系,确定为所述待分类图像特征与每个参考图像特征之间的初始相似度。
在本申请提供的实施例中,初始相似度确定单元62,具体配置为生成N维随机向量;所述N为参考图像特征库中参考图像特征的总数;将所述N维随机向量中的元素确定为所述待分类图像与参考图像集合中每个参考图像之间的初始相似度。
在本申请提供的实施例中,目标相似度确定单元64,配置为根据所述参考图像特征库中每两个参考图像特征之间的关联关系,构建参考图像特征库的邻接矩阵;对邻接矩阵进行归一化处理,得到度量矩阵;度量矩阵用于表征所述参考图像特征库中每两个参考图像特征之间的关联程度;根据待分类图像特征、初始相似度和度量矩阵,确定待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度。
在本申请提供的实施例中,目标相似度确定单元64,具体配置为根据待分类图像特征、初始相似度和度量矩阵,计算得到待分类像与所述参考图像集合中每个参考图像之间的第i相似度;其中,i为大于等于1的整数;
若第i相似度满足收敛条件,则将所述第i相似度确定为所述目标相似度;其中,所述收敛条件用于表征相邻两个相似度的差值小于预设阈值;
若第i相似度不满足收敛条件,则基于所述待分类图像特征、所述第i相似度和所述度量矩阵,计算得到待分类像与所述参考图像集合中每个参考图像之间的第i+1相似度,直到第i+N相似度满足所述收敛条件,并将所述第i+N相似度确定为所述目标相似度。
在本申请提供的实施例中,第一条件包括大于相似度阈值;
对应的,类别确定单元65,配置为从所述参考图像特征库中选取与所述待分类图像特征的目标相似度大于相似度阈值的参考图像特征,作为所述目标参考图像特征。
在本申请提供的实施例中,第一条件包括目标相似度为参考图像特征对应的目标相似度的最大值;
对应的,类别确定单元65,配置为从所述参考图像特征库中选取与所述待分类图像的目标相似度为最大值的参考图像特征,作为所述目标参考图像特征。
在本申请提供的实施例中,特征提取单元61,还配置为获取多个参考图像;其中,所述参考图像包括多种不同子类别的图像;提取每个参考图像的参考图像特征,得到所述参考图像特征库。
由此可见,本申请实施例提供的图像分类方法,可以从参考图像特征库中选择出与待分类图像相似度较高的参考图像特征,并将选择出的参考图像特征对应的类别作为待分类图像的类别。能够避免目标区域定位不准确导致分类不够准确的问题,在分类的基础上进一步提高细粒度图像分类的效果。
实施例八
基于上述图像分类装置中各单元的实现,为了实现本申请实施例提供的图像分类方法,本申请实施例还提供了一种电子设备,如图7所示,所述电子设备70包括:处理器71和配置为存储能够在处理器上运行的计算机程序的存储器72,
其中,所述处理器71配置为运行所述计算机程序时,执行前述实施例中的方法步骤。
当然,实际应用时,如图7所示,该电子设备70中的各个组件通过总线系统73耦合在一起。可理解,总线系统73用于实现这些组件之间的连接通信。总线系统73除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7将各种总线都标为总线系统73。
在示例性实施例中,本申请实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器72,上述计算机程序可由电子设备70的处理器71执行,以完成前述方法所述步骤。计算机可读存储介质可以是磁性随机存取存储器(FRAM,ferromagneticrandom access memory)、只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,ErasableProgrammable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,ElectricallyErasable Programmable Read-Only Memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory)等存储器。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (18)
1.一种图像分类方法,所述方法包括:
提取待分类图像的待分类图像特征,并确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;
获取所述参考图像特征库中每两个参考图像特征之间的关联关系;
根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定所述待分类图像特征与每个参考图像特征之间的目标相似度;
从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将所述目标参考图像特征对应的类别确定为所述待分类图像的类别。
2.根据权利要求1所述的方法,其中,所述确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度,包括:
计算待分类图像特征与所述参考图像特征库中每个参考图像特征之间的关联关系;
将所述待分类图像特征分别与每个参考图像特征之间的关联关系,确定为所述待分类图像特征与每个参考图像特征之间的初始相似度。
3.根据权利要求1所述的方法,其中,所述确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度,包括:
生成N维随机向量;所述N为参考图像特征库中参考图像特征的总数;
将所述N维随机向量中的元素确定为所述待分类图像与参考图像集合中每个参考图像之间的初始相似度。
4.根据权利要求1-3任一项所述的方法,其中,所述根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度,包括:
根据所述参考图像特征库中每两个参考图像特征之间的关联关系,构建所述参考图像特征库的邻接矩阵;
对所述邻接矩阵进行归一化处理,得到度量矩阵;所述度量矩阵用于表征所述参考图像特征库中每两个参考图像特征之间的关联程度;
根据所述待分类图像特征、所述初始相似度和所述度量矩阵,确定所述待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度。
5.根据权利要求4所述的方法,其中,所述根据所述待分类图像特征、所述初始相似度和所述度量矩阵,确定所述待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度,包括:
根据所述待分类图像特征、所述初始相似度和所述度量矩阵,计算得到所述待分类像与所述参考图像集合中每个参考图像之间的第i相似度;其中,i为大于等于1的整数;
若第i相似度满足收敛条件,则将所述第i相似度确定为所述目标相似度;其中,所述收敛条件用于表征相邻两个相似度的差值小于预设阈值;
若第i相似度不满足收敛条件,则基于所述待分类图像特征、所述第i相似度和所述度量矩阵,计算得到待分类像与所述参考图像集合中每个参考图像之间的第i+1相似度,直到第i+N相似度满足所述收敛条件,并将所述第i+N相似度确定为所述目标相似度。
6.根据权利要求1所述的方法,其中,所述第一条件包括大于相似度阈值;
所述从所述参考图像特征库中选取与所述待分类图像的目标相似度满足第一条件的目标参考图像,包括:
从所述参考图像特征库中选取与所述待分类图像特征的目标相似度大于相似度阈值的参考图像特征,作为所述目标参考图像特征。
7.根据权利要求1所述的方法,其中,所述第一条件包括目标相似度为参考图像特征对应的目标相似度的最大值;
所述从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像,包括:
从所述参考图像特征库中选取与所述待分类图像的目标相似度为最大值的参考图像特征,作为所述目标参考图像特征。
8.根据权利要求1所述的方法,其中,所述提取待分类图像的待分类图像特征,并确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度之前,还包括:
获取多个参考图像;其中,所述参考图像包括多种不同子类别的图像;
提取每个参考图像的参考图像特征,得到所述参考图像特征库。
9.一种图像分类装置,所述图像分类装置包括:特征提取单元,初始相似度确定单元,获取单元,目标相似度确定单元,和类别确定单元;其中,
所述特征提取单元,配置为提取待分类图像的待分类图像特征;
所述初始相似度确定单元,配置为确定所述待分类图像特征与参考图像特征库中每个参考图像特征之间的初始相似度;
所述获取单元,配置为获取所述参考图像特征库中每两个参考图像特征之间的关联关系;
所述目标相似度确定单元,配置为根据所述待分类图像特征、所述初始相似度和所述每两个参考图像特征之间的关联关系,确定所述待分类图像特征与每个参考图像特征之间的目标相似度;
所述类别确定单元,配置为从所述参考图像特征库中选取与所述待分类图像特征的目标相似度满足第一条件的目标参考图像特征,并将所述目标参考图像特征对应的类别确定为所述待分类图像的类别。
10.根据权利要求9所述的图像分类装置,其中,所述初始相似度确定单元,具体配置为计算待分类图像特征与所述参考图像特征库中每个参考图像特征之间的关联关系;将所述待分类图像特征分别与每个参考图像特征之间的关联关系,确定为所述待分类图像特征与每个参考图像特征之间的初始相似度。
11.根据权利要求9所述的图像分类装置,其中,所述初始相似度确定单元,具体配置为生成N维随机向量;所述N为参考图像特征库中参考图像特征的总数;将所述N维随机向量中的元素确定为所述待分类图像与参考图像集合中每个参考图像之间的初始相似度。
12.根据权利要求9-11任一项所述的图像分类装置,其中,
所述目标相似度确定单元,配置为根据所述参考图像特征库中每两个参考图像特征之间的关联关系,构建所述参考图像特征库的邻接矩阵;对所述邻接矩阵进行归一化处理,得到度量矩阵;所述度量矩阵用于表征所述参考图像特征库中每两个参考图像特征之间的关联程度;根据所述待分类图像特征、所述初始相似度和所述度量矩阵,确定所述待分类图像与参考图像特征库中每个参考图像特征之间的目标相似度。
13.根据权利要求12所述的图像分类装置,其中,
所述目标相似度确定单元,具体配置为根据所述待分类图像特征、所述初始相似度和所述度量矩阵,计算得到所述待分类像与所述参考图像集合中每个参考图像之间的第i相似度;其中,i为大于等于1的整数;
若第i相似度满足收敛条件,则将所述第i相似度确定为所述目标相似度;其中,所述收敛条件用于表征相邻两个相似度的差值小于预设阈值;
若第i相似度不满足收敛条件,则基于所述待分类图像特征、所述第i相似度和所述度量矩阵,计算得到待分类像与所述参考图像集合中每个参考图像之间的第i+1相似度,直到第i+N相似度满足所述收敛条件,并将所述第i+N相似度确定为所述目标相似度。
14.根据权利要求9所述的图像分类装置,其中,所述第一条件包括大于相似度阈值;
所述类别确定单元,配置为从所述参考图像特征库中选取与所述待分类图像特征的目标相似度大于相似度阈值的参考图像特征,作为所述目标参考图像特征。
15.根据权利要求9所述的图像分类装置,其中,所述第一条件包括目标相似度为参考图像特征对应的目标相似度的最大值;
所述类别确定单元,配置为从所述参考图像特征库中选取与所述待分类图像的目标相似度为最大值的参考图像特征,作为所述目标参考图像特征。
16.根据权利要求9所述的图像分类装置,其中,
所述特征提取单元,还配置为获取多个参考图像;其中,所述参考图像包括多种不同子类别的图像;提取每个参考图像的参考图像特征,得到所述参考图像特征库。
17.一种电子设备,所述电子设备包括处理器、存储器和通信总线;
所述通信总线,配置为实现所述处理器和所述存储器之间的连接通信;
所述处理器,配置为运行所述存储器中存储的图像分类方法的程序,以实现权利要求1-8任一项所述图像分类方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现权利要求1至8任一项所述图像分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010112567.3A CN111325276A (zh) | 2020-02-24 | 2020-02-24 | 图像分类方法及装置、电子设备、计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010112567.3A CN111325276A (zh) | 2020-02-24 | 2020-02-24 | 图像分类方法及装置、电子设备、计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111325276A true CN111325276A (zh) | 2020-06-23 |
Family
ID=71172863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010112567.3A Pending CN111325276A (zh) | 2020-02-24 | 2020-02-24 | 图像分类方法及装置、电子设备、计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325276A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116028A (zh) * | 2020-09-29 | 2020-12-22 | 联想(北京)有限公司 | 模型决策解释实现方法、装置及计算机设备 |
CN112307934A (zh) * | 2020-10-27 | 2021-02-02 | 深圳市商汤科技有限公司 | 图像检测方法及相关模型的训练方法、装置、设备、介质 |
CN112668635A (zh) * | 2020-12-25 | 2021-04-16 | 浙江大华技术股份有限公司 | 图像归档方法、装置、设备及计算机存储介质 |
CN117251715A (zh) * | 2023-11-17 | 2023-12-19 | 华芯程(杭州)科技有限公司 | 版图量测区域筛选方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013087711A2 (en) * | 2011-12-13 | 2013-06-20 | Ats Group (Ip Holdings) Limited | Method and system for sensor classification |
CN108304882A (zh) * | 2018-02-07 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种图像分类方法、装置及服务器、用户终端、存储介质 |
CN108614894A (zh) * | 2018-05-10 | 2018-10-02 | 西南交通大学 | 一种基于最大生成树的人脸识别数据库构成方法 |
US20180373925A1 (en) * | 2017-06-22 | 2018-12-27 | Koninklijke Philips N.V. | Subject identification systems and methods |
CN109325518A (zh) * | 2018-08-20 | 2019-02-12 | Oppo广东移动通信有限公司 | 图像的分类方法、装置、电子设备和计算机可读存储介质 |
CN110276406A (zh) * | 2019-06-26 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 表情分类方法、装置、计算机设备及存储介质 |
CN110781957A (zh) * | 2019-10-24 | 2020-02-11 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
-
2020
- 2020-02-24 CN CN202010112567.3A patent/CN111325276A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013087711A2 (en) * | 2011-12-13 | 2013-06-20 | Ats Group (Ip Holdings) Limited | Method and system for sensor classification |
US20180373925A1 (en) * | 2017-06-22 | 2018-12-27 | Koninklijke Philips N.V. | Subject identification systems and methods |
CN108304882A (zh) * | 2018-02-07 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种图像分类方法、装置及服务器、用户终端、存储介质 |
CN108614894A (zh) * | 2018-05-10 | 2018-10-02 | 西南交通大学 | 一种基于最大生成树的人脸识别数据库构成方法 |
CN109325518A (zh) * | 2018-08-20 | 2019-02-12 | Oppo广东移动通信有限公司 | 图像的分类方法、装置、电子设备和计算机可读存储介质 |
CN110276406A (zh) * | 2019-06-26 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 表情分类方法、装置、计算机设备及存储介质 |
CN110781957A (zh) * | 2019-10-24 | 2020-02-11 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
李青彦等: "基于构造空间金字塔度量矩阵的图像分类算法" * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116028A (zh) * | 2020-09-29 | 2020-12-22 | 联想(北京)有限公司 | 模型决策解释实现方法、装置及计算机设备 |
CN112116028B (zh) * | 2020-09-29 | 2024-04-26 | 联想(北京)有限公司 | 模型决策解释实现方法、装置及计算机设备 |
CN112307934A (zh) * | 2020-10-27 | 2021-02-02 | 深圳市商汤科技有限公司 | 图像检测方法及相关模型的训练方法、装置、设备、介质 |
CN112307934B (zh) * | 2020-10-27 | 2021-11-09 | 深圳市商汤科技有限公司 | 图像检测方法及相关模型的训练方法、装置、设备、介质 |
TWI754515B (zh) * | 2020-10-27 | 2022-02-01 | 大陸商深圳市商湯科技有限公司 | 圖像檢測及相關模型訓練方法、設備及電腦可讀儲存介質 |
WO2022088411A1 (zh) * | 2020-10-27 | 2022-05-05 | 深圳市商汤科技有限公司 | 图像检测及相关模型训练方法、装置、设备、介质及程序 |
CN112668635A (zh) * | 2020-12-25 | 2021-04-16 | 浙江大华技术股份有限公司 | 图像归档方法、装置、设备及计算机存储介质 |
CN117251715A (zh) * | 2023-11-17 | 2023-12-19 | 华芯程(杭州)科技有限公司 | 版图量测区域筛选方法、装置、电子设备及存储介质 |
CN117251715B (zh) * | 2023-11-17 | 2024-03-19 | 华芯程(杭州)科技有限公司 | 版图量测区域筛选方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325276A (zh) | 图像分类方法及装置、电子设备、计算机可读存储介质 | |
CN110175615B (zh) | 模型训练方法、域自适应的视觉位置识别方法及装置 | |
Lee et al. | Place recognition using straight lines for vision-based SLAM | |
CN111340097B (zh) | 图像细粒度分类方法、装置、存储介质及设备 | |
CN114358205B (zh) | 模型训练方法、模型训练装置、终端设备及存储介质 | |
Wu et al. | Improving pedestrian detection with selective gradient self-similarity feature | |
CN114092873B (zh) | 一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统 | |
WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
CN112560787A (zh) | 一种行人重识别匹配边界阈值设置方法、装置及相关组件 | |
Gorokhovatskyi et al. | Application a Committee of Kohonen Neural Networks to Training of Image Classifier Based on Description of Descriptors Set | |
CN113255828B (zh) | 特征检索方法、装置、设备及计算机存储介质 | |
Gao et al. | An improved XGBoost based on weighted column subsampling for object classification | |
CN111753583A (zh) | 一种识别方法及装置 | |
CN117893839B (zh) | 一种基于图注意力机制的多标记分类方法及系统 | |
Jiang et al. | Weakly-supervised vehicle detection and classification by convolutional neural network | |
CN115984671A (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 | |
Campos et al. | Global localization with non-quantized local image features | |
Farfan-Escobedo et al. | Towards accurate building recognition using convolutional neural networks | |
Nie et al. | Using an improved SIFT algorithm and fuzzy closed-loop control strategy for object recognition in cluttered scenes | |
Sanin et al. | K-tangent spaces on Riemannian manifolds for improved pedestrian detection | |
CN112766423B (zh) | 人脸识别模型的训练方法、装置、计算机设备及存储介质 | |
Patsei et al. | Multi-class object classification model based on error-correcting output codes | |
CN112906724B (zh) | 一种图像处理装置、方法、介质及系统 | |
Weng et al. | Random VLAD based deep hashing for efficient image retrieval | |
CN114842251A (zh) | 图像分类模型的训练及图像处理方法、装置和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |