CN105989594A - 一种图像区域检测方法及装置 - Google Patents
一种图像区域检测方法及装置 Download PDFInfo
- Publication number
- CN105989594A CN105989594A CN201510075465.8A CN201510075465A CN105989594A CN 105989594 A CN105989594 A CN 105989594A CN 201510075465 A CN201510075465 A CN 201510075465A CN 105989594 A CN105989594 A CN 105989594A
- Authority
- CN
- China
- Prior art keywords
- image
- cluster
- pixel
- probability
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 88
- 210000000746 body region Anatomy 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 230000010365 information processing Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 230000004456 color vision Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种图像区域检测方法和装置。所述方法可以包括:计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;对所述混合特征向量进行聚类,获取聚类后的聚簇;根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;基于所述像素概率对所述待处理图像进行检测,获取目标区域。利用本申请中各个实施例,可以有效应对实际图像场景中各种复杂的情况,实现对商品图像中主体区域进行准确、有效的分离,提高提取精确度。
Description
技术邻域
本申请属于计算机信息处理邻域,尤其涉及一种图像区域检测方法及装置。
背景技术
随着互联网消费时代的发展,例如一淘、淘宝以及天猫商城等提供在线商品搜索和在线购物的网站在商品信息展示时通常会提供大量有关商品的图像,以便于消费者进行直观的选择。商品图像作为在线搜索和购物的网站中承载较多,是非常重要信息,对于商品成交有着极大的影响。
在网上商品信息展示中,通常商品图像可以较好的体现商品的直观特性,商品中的主体区域(或者称为前景区域,比如风衣、休闲裤、皮鞋、手机、沙发凳)通常为商品图像中信息量最大、最主要的部分。例如,在商品展示、投放广告时,通常需要考虑在一幅图像当中,商品主体是否居中、是否在图像所展示的画面中占据符合规定的比例、主体区域相对于背景是否突出等。而实际的应用中绝大部分商品图像由卖家商户自行拍摄上传在网站展示窗口,卖家商户往往不具备专业的拍摄和图像编辑能力,不能很好的突出展示商品特征。因此一些应用场景中商务平台服务方通常需要对卖家商户提供的图像进行分析,获取商品主体,调整商品的展示角度、背景搭配、摆放位置、主体商品大小等,使其具有最佳展示效果的图像,以便于消费者能够更准确获取其感兴趣的商品,或者被商户的商品吸引。因此,商务平台服务方或者终端应用的用户通常需要精准且高效的从商品图像中将商品主体区域和背景区域分离出来。
目前常用的商品主体区域与背景区域分离技术主要包括采用学术界中基于颜色量化特征的图像显著性区域检测技术。这类技术通常由于仅仅依赖于颜色特征进行处理,仅能对简单的商品图像进行处理。而淘宝、天猫等平台型电商网站中的商品图像可以由卖家上传,图像的质量参差不齐,复杂度也非常高。例如在主体和背景颜色相似的情况下,在使用颜色建模的时候很容易将两者混在一起,难以区分,无法有效提取主体区域。同样,在背景复杂度较高即非主体区域的颜色分布复杂时,使用基于颜色特征的方法往往会将背景和前景建模为过多的区块,导致也无法精确的分离前景和背景。
目前现有技术中商品图像主体识别技术在面临主体和背景区域颜色相近或者背景区域复杂度高等复杂图像时不能精确、有效的进行主体区域的检测、分离。现有技术中尤其是复杂图像区域检测时亟需一种更加高效、精确的检测方法。
发明内容
本申请目的在于提供一种图像区域检测方法及装置,能有效应对实际图像场景中各种复杂的情况,实现对复杂图像中主体区域进行准确、有效的分离,提高提取精确度。
本申请提供的一种图像区域检测方法和装置是这样实现的:
一种图像区域检测方法,所述方法包括:
计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;
对所述混合特征向量进行聚类,获取聚类后的聚簇;
根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;
基于所述像素概率对所述待处理图像进行检测,获取目标区域。
一种图像区域检测装置,所述装置包括:
特征计算模块,用于计算得出待处理图像像素点的颜色特征和梯度特征,并构建所述待处理图像的混合特征向量;
聚类模块,用于对所述混合特征向量进行聚类,获取聚类后的聚簇;
聚簇概率模块,用于根据预定规则计算所述聚簇的聚簇概率;
像素概率模块,用于基于所述聚簇概率计算所述聚簇中像素点的像素概率;
检测模块,用于基于所述像素概率对所述待处理图像进行检测,获取目标区域。
一种图像区域检测装置,所述装置被设置成,包括:
第一处理单元,用于获取用户/客户端的待处理图像,计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;
第二处理单元,用于对所述混合特征向量进行聚类,获取聚类后的聚簇;还用于根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;
输出单元,用于基于所述像素概率对所述待处理图像进行获取目标区域,并将所述获取的目标区域存储或者展示于指定位置。
本申请提供的一种图像区域检测方法及装置,采用为图像中的每个像素点构建其特有的混合特征向量。所述混合特征向量中除了可以包括像素点的颜色特征外还包括梯度特征,在计算像素点时同时考虑了像素点周围的信息,可以更加准确的建立像素点的特征值,使得混合特征空间时前景和背景区域相近的两个点的混合特征向量的距离比仅仅使用颜色特征的距离大大增加,可以有效的区分前景和背景相近的区域,提高目前区域检测的精准度。同样的,在复杂背景图像中,本申请所述的混合特征向量可以很好的结合颜色特征和梯度特征将前景的像素点和背景的像素点描述到两个不同的聚簇中,在欧式距离计算时可以很容易将两者分离。本申请中对混合特征进行聚类,计算聚类后聚簇属于主体区域的聚簇概率,基于所述聚簇概率计算聚簇中每个像素属于主体区域的像素概率,以本申请所述的计算出来的显著度作为属于主体区域的概率,可以有效、精确的检测待处理图像中的主体区域。本申请以所述聚簇与其他聚簇距离和与总和的比值作为聚簇的显著度,用于表述聚簇属于主体区域的概率,更加符合实际用户感知图像中商品主体的情况,使得处理结果更加精确、有效。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本邻域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种图像区域检测方法一种实施例的流程示意图;
图2是本申请所述待处理图像边界点邻域窗口提取的示意图;
图3是利用本申请所述的一种图像区域检测方法进行主体区域提取的示意图;
图4是利用本申请所述的一种图像区域检测方法进行主体区域提取的示意图;
图5是本申请所述一种图像区域检测装置的模块结构示意图;
图6是本申请所述一种特征计算模块一种实施例的模块结构示意图;
图7是本申请所述一种颜色特征模块一种实施例的模块结构示意图;
图8是本申请所述一种像素概率计算模块一种实施例的模块结构示意图。
具体实施方式
为了使本技术邻域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本邻域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
卖家商户上传的商品图像中可以包括一个或者多个主体,例如为了节约商品展示的窗口资源,卖家商户可以将多个图像合并在一张图像中后上传作为某商品的图像。本申请所述的一种图像区域检测方法可以适用于包括一个或者多个商品主体的图像,在所述图像包括多个主体时,可以将待处理图像划分为多个子图,每个子图可以包括单个主体,然后对每个所述子图采用本申请所述的主体区域提取方法进行处理。具体的所述将包括多个主体的待处理图像进行划分的方法可以采用专利号为CN102567952A,名称为《一种图像分割方法及系统》中所述的图像分割方法。经过上述方法处理后,可以将包括多个主体的商品图像分割成多个包括单个主体的子图。
下面以包括单个主体的商品图像或者以经过上述图像分割后的子图为例对本申请所述的图像处理方法进行详细的描述。图1是本申请所述一种图像区域检测方法一个实施例的方法流程图,如图1所述,所述方法可以包括:
S1:计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量。
如前所述,本实施例中所述的待处理图像可以为包括一个主体的单独一张商品图像,也可以为经过图像分割出来后的包括单个主体的一个子图。在获取所述待处理图像后,可以基于包括颜色和梯度的特征值构建待处理图像像素点的混合特征,形成混合特征向量。在实际图像信息处理时,通常可以使用局部特征的方式进行每个像素点的特征提取,例如对于某个像素点P来说,可以选取一个邻域窗口W(p),所述的邻域窗口W(p)可以为一个以P点为中心的N*N的正方形区域。所述的N的取值可以根据图像信息处理的精度或者速度等要求进行合理选择,例如可以根据图像尺寸或包括像素点的多少取值为3、5、7、9等奇数。本实施例中所述N可以取值为5,可以在每次计算像素点的混合特征中的颜色特征或者梯度特征时取以P点为中心的5*5的正方形邻域窗口区域。
本实施例中所述构建的待处理图像的混合特征可以包括像素点的颜色特征和梯度特征,可以对所述颜色特征和梯度特征等进行预定格式的组合,形成高维度的混合特征向量。具体的实现过程中,所述计算得出待处理图像像素点的颜色特征的处理过程可以包括:
S101:如果所述待处理图像不为Lab格式的数据,将所述待处理图像的数据格式转化为Lab格式;
S102:以待处理像素为中心提取所述待处理图像中邻域窗口W(p)的像素点,将所述邻域窗口W(p)中像素点的L、a、b三个通道分别分为K个分组,形成3*K维的颜色特征向量;
S103:将所述邻域窗口W(p)中每个像素点在所述L、a、b三个通道的颜色值累加到所述颜色特征向量所对应的维中,形成所述邻域窗口中待处理像素点的颜色特征。
在待处理图像颜色特征提取时通常可以包括将L、a、b三个通道分别均匀的量化为K个分组,尽可能的保证每个通道的每个分组的长度相等。
通常所述待处理图像可以为RGB通道颜色模型的图像信息,所述Lab通道的颜色模型通常指基于人对颜色的感觉建立的并且与光线及设备无关的颜色模型,更加符合人的视觉感知。因而本实施例中采用从Lab空间检测出的图像中的主体区域,更加符合人的感知结果,使得主体区域提取的处理结果更加准确。
本实施例中可以将所述待处理图像从RGB通道转化为Lab通道。通常所述的RGB通道包括三个变量的三维颜色向量(R,G,B),如下所示:
R:红色,0~255的整数,变化值为256;
G:绿色,0~255的整数,变化值为256;
B:蓝色,0~255的整数,变化值为256。
所述的Lab通道可以包括如下所示的三个变量:
L:亮度,0~100的整数,变化值100;
A:从绿色至红色,-128~127的整数,变化值256;
B:从蓝色至黄色,-128~127的整数,变化值256。
在所述将待处理图像从RGB通道转化为Lab通道时,可以采用给定的算法进行转化,也可以采用例如Photoshop等软件工具进行转化,在此不做详细论述。然后可以以预先设置的邻域窗口W(p)提取所述Lab通道的待处理图像中的像素点,将所述邻域窗口W(p)中像素点的L、a、b三个通道分别均匀的量化为K个bin(分组)。进一步的可以将L、a、b三个通道量化后的像素点的值拼接在一起可以形成一个3*K维的颜色特征向量,例如所述形成的3*K维的颜色特征向量可以表示为{L1,L2,…LK,a1,a2,…aK,b1,b2,…bK}。本实施例中所述的K的取值可以自定义设置,用来表示对待处理图像颜色空间的一个描述。本申请中如果所述K的取值偏大,那么所述待处理图像在颜色空间会被划分得较细,颜色特征表述的更为准确,相应的计算时间增加;相反若K值取值较小,那么对所述待处理图像在颜色空间的整体划分度较低,颜色特征向量维数较小,可以提高数据处理速度。经过多次实验,本申请提供一种K的取值范围,具体的所述K的取值可以为:6≤K≤16,在上述取值范围内可以保证颜色特征向量可以准确、有效、合适的表述待处理图像的颜色特征。在本实施例中所述K的取值可以取值为6,即可以构建所述邻域窗口中待处理像素点的18维的混合特征向量。最后可以根据所述邻域窗口W(p)中每个像素点在L、a、b三个通道的颜色值,将其累加到该颜色特征向量相对应的维中。例如在5*5一共25个像素点的邻域窗口中,所述25个像素点的Lab颜色值共同构建一个18维的颜色特征向量。具体的,所述25个像素点中每个像素点都会有一组Lab颜色值,以L通道为例,假设第一像素点的L通道的值为10,可以将其映射到所述L通道总共划分的6个bin(分组)中相对应的一个分组中,例如划分到L1中。第二像素点的L通道值为98,则可以将其划分到L6中。依次类推,将所述邻域窗口W(p)中的25个像素点全部遍历一遍,将相应bin(分组)中的颜色值累加可以得到一个所述邻域窗口W(p)中待处理像素点总的L、a、b颜色特征的分布向量。
计算完成当前邻域窗口中待处理像素点的颜色特征向量后,可以按照一定方向一次移位一个像素点,然后按照上述方式再次提取邻域窗口的像素点,计算新的邻域窗口中待处理像素点的颜色特征向量。依次计算得出所述待处理图像中所有像素点的颜色特征向量,获取所述待处理图像像素点的颜色特征。
需要说明的是,本申请中所述的邻域窗口中的待处理像素点通常为所述设置的正方形邻域窗口的中心点。对于所述待处理图像中的非边界点像素点,可以一次提取一个正方形的邻域窗口。对于边界点或者靠近边界点不能满足正方形邻域窗口提取的像素点,则仍然按照所述邻域窗口预先设置的提取规格,即可以以所述边界点像素点或者靠近边界的像素点为中心、以所述邻域窗口实际在所述待处理图像中覆盖的像素点进行计算。图2是本申请所述待处理图像边界点邻域窗口提取的示意图。如图2中所示,例如设置的邻域窗口提取规则为5*5的正方形区域,对于某边界点的非角点来说,以所述边界点的像素点P1为邻域窗口中心提取到的像素点规格为5*3,相应的,对于所述待处理图像的角点P2,则提取到的像素点的规格为3*3。
本申请中所述的混合特征可以包括待处理图像的梯度特征。本实施例中可以采用HoG特征进行梯度特征提取,形成待处理图像中每个像素点M维的梯度特征。通常所述的梯度的含义可以包括图像中每个像素点与邻近像素点的差异,在构建为梯度特征后可以用于检测颜色不明显的区域。本实施例中可以将待处理图像从RGB颜色通道转化为灰度图,这样简化梯度特征的复杂性。具体的在实现方式上可以采用HoG特征进行梯度特征提取,获取预先设置的邻域窗口W(p)中像素点的梯度方向和梯度值,然后可以将所述邻域窗口W(p)中包括所有像素点梯度方向的总梯度方向值分割为M个bin(分组),例如将180度的总梯度方向分割为12个bin(分组),那么每个bin代表的是一个15度的范围。最后可以根据所述邻域窗口W(p)中每个像素点的梯度值,使用线性插值的方法累加到对应的bin(分组)中,形成邻域窗口中待处理像素点的一个M维的梯度特征向量,例如本实施例中的12维的梯度特征向量,可以表示为{g1,g2,…g12}。例如若待处理像素点的邻域窗口W(p)中某一点的梯度方向为44度,梯度值为10,那么该梯度方向为44度所属的bin(分组)为g3,与前述颜色特征计算方式类似,可以将44度的梯度值10累加值所属的分组g3中。遍历所述邻域窗口所有像素点的梯度方向和梯度值,计算得到所述邻域窗口待处理像素点的梯度特征。同样计算一个邻域窗口后可以移位一个像素点,继续计算下一个待处理像素点的梯度特征。依次计算完成所述待处理图像所有像素点的梯度特征,具体的可以参照上述颜色特征的计算方式,在此不做赘述。
在计算得出所述待处理图像像素点的颜色特征和梯度特征后,可以构建所述待处理图像的混合特征向量。具体的所述构建待处理图像的混合特征向量可以包括将所述待处理图像每个像素点的K维颜色特征和M维梯度特征进行拼接组合,形成对于像素点的(K+M)维的混合特征向量。例如本实施例中可以将18维的颜色特征与12维的梯度特征的值按序拼接组合,前面18维数据为颜色特征,后面12维数据为梯度特征,可以表示为{L1,L2,…L6,a1,a2,…a6,b1,b2,…b6,g1,g2,…g12}。当然,如果所述待处理图像的大小为[W,H],其中W为所述待处理图像的宽度,H为所述待处理图像的高度,单位均为像素点,那么通过上述方法可以构建所述待处理图像W*H个(K+M)维的混合特征向量。
在本申请中计算像素点的颜色特征和梯度特征时考虑计算到了每个待处理像素点周围像素点的信息,可以更加准确的建立像素点的特征值,使得混合特征空间时前景和背景区域相近的两个点的混合特征向量的距离比仅仅使用颜色特征的距离大大增加,可以有效的区分前景和背景相近的区域,提高主体区域检测的精准度。
S2:对所述混合特征向量进行聚类,获取聚类后的聚簇。
前述中所述待处理图像尺寸为[W,H]的商品图像会产生W*H个(K+M)维的混合特征向量。本申请中为了提高计算效率,可以对这些特征向量进行聚类。本实施例中所采用的聚类算法采可以为Kmeans聚类算法。所述的Kmeans聚类算法具体的操作过程主要可以包括:
S201:从所述W*H个(K+M)维的混合特征向量中随机选取L个混合特征向量作为初始聚类中心。在具体的实施例中,所述L的取值范围可以经过试验选取合适的值,通常所述L取值太大会导致计算时间较长,L太小则无法将特征空间划分得比较精细。
S202:遍历所有W*K个混合特征向量,分别计算每一个混合特征向量与当前聚类中心之间的距离。本实施例中所述的距离采用的为欧式距离,例如两个混合特征向量分别为p和q,其中q为随机选取的当前聚类中心,那么所述混合特征向量与所述当前聚类中心q之间的欧式距离D(p,q)可以为:
D(p,q)=||(p1-q1)2+(p2-q2)2……+(p(K+M)-q(K+M))2||
S203:对于每个混合特征向量,计算其与所述选取的L个初始聚类中心的距离,所述混合特征向量属于与所述L个初始聚类中心距离最小的聚簇。经过一轮计算分类后可以将混合特征向量合理的划分到距离最近的所述L个初始聚类中心的聚簇中。
S204:更新每个聚簇的聚类中心。将待处理图像中每个像素点划分到对应的聚簇后,可以更新每个聚簇的聚类中心。本实施例中具体的更新计算方法可以包括计算所述每个聚簇中所有混合特征向量在每一维上的平均值,然后将所述计算得到的每一维的平均值作为该聚簇新的聚类中心。
上述所述的S201~S204为一次聚类的过程,本申请中可以反复聚类计算上述为每个像素点划分聚簇和更新聚簇中心的步骤,直到所述聚簇的聚类中心不再进行较大幅度的移动(该移动的幅度阈值可以根据需求进行设置)或者所述聚类计算的次数达到预置计算要求为止。具体例如在本实施例中,可以设置所述混合特征向量聚类次数为1000次,或者,新的聚簇的聚类中心与该聚簇上一次的聚类中心之间的欧式距离小于0.5,如表示为上一次的聚类中心为Old_C,新的聚类中心为New_C,那么聚类计算的停止条件可以设置为D(Old_C,New_C)<0.5。
本实施例中将混合特征向量进行聚类,形成L个聚簇,可以将所述待处理图像中的大量像素点的混合特征计算量缩小至L个聚簇的计算,可以提高后续图像区域检测的进一步计算速率,提高整体图像信息处理效率。
S3:根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率。
经过上述步骤处理后,所述待处理图像在本申请所述的(K+M)维的混合特征向量空间中聚类成了L个聚簇,其中所述L个聚簇中每个聚簇内的像素点在所述特征空间上是相近的。本申请中可以以每个所述聚簇为单元计算每个聚簇属于主体区域的聚簇概率,然后进一步的基于所述聚簇的聚簇概率计算所述聚簇中所有像素点属于所述主体区域的像素概率。本实施例中可以采用每个聚簇在整个所述待处理图像中的显著度来描述所述每个聚簇属于主体区域的概率。具体的所述根据预定规则计算所述聚簇的聚簇概率可以包括:
计算所述L个聚簇中每个聚簇Ci与其他聚簇的距离和D(Ci),以所述聚簇和D(Ci)与所有聚簇的所述距离和的总和的比值作为所述聚簇Ci的聚簇概率。
本实施例中假设经过聚类后得到的所述L个聚簇的聚簇中心分别为C1、C2、…、CL,本实施例聚簇的显著度可以采用由与其他所有聚簇的距离之和与总和的比值表示。那么对于任意聚簇Ci来说,1≤i≤L,本实施例提供一种计算所述聚簇中每个聚簇与其他聚簇的距离和的方法,具体的该聚簇的Ci与其他聚簇的距离和D(Ci)可以采用下式公式(1)计算得出:
上式中,L为聚簇的个数,如本实施例中设置的120,||ci,cj||为当前聚簇Ci的聚簇中心的混合特征向量与其他聚簇的聚簇中心混合特征向量的欧氏距离。一般的,所述两个聚簇之间混合特征向量差距越大,两个聚簇中心之间的欧氏距离越大。若某个聚簇与其他聚簇的欧式距离整体上都较大,可以表示该聚簇与其他聚簇的区别显著性越高,则越有可能接近待处理图像的主体区域,相应的计算得到的与其他聚簇的距离之和D(Ci)值也越大。在本实施中计算所述距离和的方法中加入了因子Wj,所述Wj可以为根据当前聚簇Ci所包括的像素点设置的权重。本实施例中一般的,所述聚簇中包括的像素点的个数越多,那么其对应显著度值的贡献也越大。因此,所述Wj可以根据聚簇中所包括的像素点进行设置。例如可以设置为聚簇所包括的像素点个数,或者当前聚簇所包括的像素点个数与所述待处理图像总像素点个数的比值等,具体的可以根据需求进行设置。这样,在计算所述聚簇的距离和时加入所述聚簇的权重Wj,将所述聚簇中所包括的像素点个数计算在内,在一些应用场景中更加符合实际图像主体区域的特性,在该类应用场景中可以使提取主图区域的计算结果更加准确。
在得到每个聚簇在所述待处理图像中的显著度后,可以进一步根据所述显著度计算每个聚簇属于所述主体区域的聚簇概率。本实施例中可以以所述聚簇和D(Ci)与所有聚簇的所述距离和的总和的比值作为所述聚簇Ci属于所述主体区域的聚簇概率,具体的可以采用下式(2)计算得出:
上述中∑1≤j≤LD(cj)为计算得出的所有聚簇的聚簇和的总和,可以采用当前聚簇的距离和与所述总和的比值作为所述当前聚簇属于所述主体区域的聚簇概率。由于聚类后的聚簇中混合特征向量值较为接近,在本申请的一种实施例中可以认为该聚簇中像素点属于主体区域的像素概率等价于该聚簇属于主体区域的聚簇概率,这样可以根据所述聚簇的概率得到每个像素点的一个概率值。因此,本申请的一种实施例中,所述基于所述聚簇概率计算所述聚簇中像素点的像素概率可以包括:
S301:所述聚簇中像素点的像素概率可以为该像素点所属聚簇的聚簇概率。
在本申请其他实施例中,聚簇中的像素点可能分布于所述待处理图像的分散的其他区域中,本申请为使提取的主体区域具有的紧凑特性,提取的主体区域更加准确,可以再次计算每个聚簇中每个像素点属于主体区域的像素概率。在此,本申请可以设置第二邻域窗口W(p)’,可以参照上述计算颜色特征的方式以像素点P为中心提取所述第二邻域窗口W(p)’的像素点,所述第二邻域窗口W(p)’中的某个像素点q的概率为该像素点q所属聚簇的聚簇概率,在此以P(q)表示,则另一种实施例中所述基于所述聚簇的概率计算所述聚簇中像素点属于所述主体区域的概率可以包括:
S302:以待求像素点p为中心提取第一邻域窗口W(p)’的像素点,采用下式计算所述待求像素点p属于所述主体区域的像素概率Sal(p):
上式中,P(q)为所述第一邻域窗W(p)’内的像素点q所属的聚簇属于主体区域的聚簇概率,t为待求像素点p所属的聚簇中像素点的个数,σ为设置的一个平滑参数,可以表示当前计算的像素点p的结果受到周围像素点影响的大小。若σ取值较大,可以表示像素点p的计算结果容易受周围像素点的影响,反之不容易受到周围像素点的影响。该σ值可以根据经验或者结果的预估进行合理设置,一般来说,对于网站产品销售的图像来说,σ可以取值偏小,例如本实施例中具体的可以取值为0.17。若在自然场景下的图像(通常为非商品图像),所述σ的取值可以偏大,例如可以取值为0.25。
上述中所述的第一邻域窗口W(p)’的设置可以与前述颜色特征提取时设置的邻域窗口相同,例如可以设置为5*5的正方形邻域窗口。这样,在计算所述待处理图像中像素点的像素概率时可以以待求像素点为中心所述第一邻域窗口W(p)’如5*5的像素点进行计算,遍历所述第一邻域窗口W(p)’中所有像素点的概率可以计算得到该待求像素点p属于所述主体区域的像素概率。
通过上述S302所述的像素点属于主体区域概率计算方法,可以计算得到所述待处理图像中每个像素点属于主体区域的像素概率,并且该概率值采用了所述第一邻域窗口W(p)’中像素点的概率值进行平滑计算得出,可以提高最终的提取结果的准确性。
S4:基于所述像素概率对所述待处理图像进行检测,获取目标区域。
在计算完成所述待处理图像每个像素属于所述主体区域的像素概率后,可以进行主体区域与背景区域的分离,提取获取所述待处理图像中的目标区域。本申请中所述的目标区域可以为所述待处理图像中的主体区域(前景区域),在其他的实施例中,所述目标区域也可以为背景区域,即可以检测获取待处理图像的背景区域、本申请一种实施方式中,所述基于所述像素概率对所述待处理图像进行检测获取目标区域具体的可以包括:
S401:将所述待处理图像中像素点的像素概率值符合判断阈值PV要求的像素点作为所述待处理图像的目标区域。
具体的例如在检测主体区域的实施过程中,例如可以预先设置像素点概率的判定阈值PV如0.85,然后可以将所述待处理图像中所述像素点的像素概率的值大于0.85的像素点提取出来,作为所述待处理图像的主体区域。本申请所述预定判断阈值取值过小会导致提取较多的非主体区域的像素点,取值过大则会降低提取到的主体区域图像的完整性,本实施例提供一种所述判断阈值的取值范围,具体的所述预定判断阈值PV的取值范围可以为:0.8≤PV≤0.95。上述S401中所述像素点的像素概率优选的方式为采用所述第一邻域窗口W(p)’中像素点的概率值进行平滑计算得出的概率值。
当然,在检测背景区域的实施例中,可以设置满足判断为背景区域的判断阈值PV的值,具体的可以根据实际场景应用进行确定。
本申请还提供另一种优选的实施例,在所述另一种实施例中,所述基于所述像素点的像素概率对所述待处理图像进行检测获取目标具体的可以包括:
S4021:将所述待处理图像中像素点属于主体区域的概率值大于第一阈值PF的像素点作为种子像素点;
S4022:以所述种子像素点为中心计算与周围第二邻域窗口中像素点的欧式距离;
S4023:将所述欧式距离小于第二阈值的像素点作为新的种子像素点;
S2044:遍历所有所述种子像素点与周围所述第二邻域窗口中像素点的欧式距离并做出判断,将所述计算得出的种子像素点作为所述待处理图像的目标区域。
本实施例中,所述像素点属于主体区域的像素概率优选的可以为所述像素点所属聚簇的聚簇概率。另外,所述的第一阈值PF和第二阈值以及所述第三邻域窗口可以根据实际数据处理需求进行设置,例如所述第一阀PF值同样可以设置为0.85或者选取为聚簇概率中值较高的值,所述第二阈值可以设置为0.5。如上述预定判断阈值,本申请所述第一阈值PF取值过小会导致提取较多的非主体区域的像素点,取值过大则会降低提取到的主体区域图像的完整性,本实施例提供一种所述第一阈值PF的取值范围,具体的所述第一阈值PF的取值范围可以为:0.8≤PF≤0.95。本实施例中所述的第三邻域窗口一般的为以种子像素点为中心的3*3的八邻近窗口,然后可以根据本申请所述的例如30维的特征混合特征向量进行欧式距离计算。如果所述距离满足第二阈值要求,可以将所述种子周围满足第二阈值要求的像素点作为新的种子像素点,可以认为符合所述第二阈值要求的新的种子像素点同样属于主体区域。当然,在处理过程中,可以设置将不满足所述第三邻域窗口的像素点作为背景区域。需要说明的,本申请中所述的主体区域通常是连通的,在其他的应用场景中,可以将没有经过第二阈值判断过的像素点设置为背景区域。本实施例中可以根据概率值较大的像素点作为种子像素点,然后不断的遍历周围的邻近点并做出判断,最终得到主体区域。
当然,本申请所述基于所述像素点的像素概率后,获取目标区域的方式可以包括但不限于本申请所述的实施例,其他的基于本申请所述的方法无需创造性劳动的其他处理方法仍在本申请所述的申请范围内,例如利用测地线距离算法进行主体区域与背景区域分离提取得到的主体区域。
本申请提供的一种图像区域检测方法,构建了包括像素点颜色特征和梯度特征的混合特征向量,可以更加准确的建立像素点的特征值,可以有效的区分前景和背景相近的区域,提高主体区域提取的精准度。同样的,在复杂背景图像中,本申请所述的混合特征向量可以很好的结合颜色特征和梯度特征将前景的像素点和背景的像素点描述到两个不同的聚簇中,在欧式距离计算时可以很容易将两者分离。本申请中对混合特征进行聚类,获得聚簇后以所述聚簇与其他聚簇距离和与总和的比值作为聚簇的显著度,用于表述聚簇属于主体区域的概率,更加符合实际用户感知图像中商品主体的情况,使得处理结果更加精确、有效。在实际的应用中,利用本申请所述主体区域提取方法提取待处理图像主体区域的准确率达到了89.62%,召回率达到了88.83%,解决了现有技术中面临复杂度高的图像时主体区域提取准确率低的问题。
图3、图4分别是利用本申请所述的一种图像区域检测方法进行主体区域提取的示意图,图3、图4从左到右分别是待处理图像、现有算法提取结果和本发明提取结果。如图3所示,选取的是一张前景和背景区域颜色非常相近的图像,从图3中可以看到现有算法在处理这样的图像时无法对该服装中间高亮的部分进行检测,因为此处的颜色非常靠近背景的白色。而本申请的(K+M)维的混合特征向量可以有效的区分出来相似的前景和背景区域。图4选取的是背景复杂的情况,从图4中可以看到现有算法在面对复杂性较高的图像上难以精确提取主体,本申请所述方法采用聚类获取聚簇计算像素点属于主体区域的像素概率,可以有效解决背景上不仅在颜色同时结构上复杂度很高的图像主体提取问题,大大提高检测精度。
基于本申请所述的一种图像区域检测方法,本申请还提供一种图像区域检测装置。图5是本申请所述一种图像区域检测装置的模块结构示意图,如图5所示,所述装置可以包括:
特征计算模块101,可以用于计算得出待处理图像像素点的颜色特征和梯度特征,并构建所述待处理图像的混合特征向量;
聚类模块102,可以用于对所述混合特征向量进行聚类,获取聚类后的聚簇;
聚簇概率模块103,可以用于根据预定规则计算所述聚簇的聚簇概率;
像素概率模块104,可以用于基于所述聚簇的概率计算所述聚簇中像素点的像素概率;
检测模块105,可以用于基于所述像素概率对所述待处理图像进行检测,获取目标区域。
在具体的实施过程中,所述的特征计算模块101可以分成多个子模块分别进行相应过程的处理。图6是本申请所述一种特征计算模块101一种实施例的模块结构示意图,如图6所示,所述特征计算模块101可以被设置成包括:
颜色特征模块1011,可以用于计算所述待处理图像像素点的颜色特征;
梯度特征模块1012,可以用于计算所述待处理图像像素点的梯度特征;
混合特征模块1013,可以用于将所述颜色特征和梯度特征结合,形成待处理图像的混合特征向量。
图7是本申请所述一种特征计算模块1011一种实施例的模块结构示意图,如图7所示,所述颜色特征模块1011可以包括:
Lab转化模块111,可以用于将所述待处理图像转化为Lab格式的数据;
颜色特征向量模块112,可以用于以待处理像素为中心提取所述待处理图像中邻域窗口的像素点,将所述邻域窗口中像素点的L、a、b三个通道分别分为K个分组,形成3*K维的颜色特征向量;
特征计算模块113,可以用于将所述邻域窗口中每个像素点在所述L、a、b三个通道的颜色值累加到所述颜色特征向量所对应的维中,形成所述邻域窗口中待处理像素点的颜色特征。
经过上述模块处理,可以得到待处理图像的颜色特征。本申请为所述的装置提供一种K的取值范围,具体的所述K的取值可以为:6≤K≤16,在上述取值范围内可以保证本申请装置提取的颜色特征向量准确、有效、合适的表述待处理图像的颜色特征。
上述所述装置中聚簇概率模块103计算所述聚簇属于主体区域的概率,具体的可以包括:
距离和计算模块,可以用于计算所述聚簇中每个聚簇与其他聚簇的距离和;
聚簇概率计算模块,可以用于根据所述聚簇和与所有聚簇的所述距离和的总和计算所述聚簇的聚簇概率。
本申请所述一种图像区域检测装置的一种优选实施例中,所述距离计算模块计算所述聚簇中每个聚簇与其他聚簇的距离和具体的可以包括:
采用下式计算所述聚簇中每个聚簇与其他聚簇的距离和D(Ci):
上式中,L为聚簇的个数,||ci,cj||为当前聚簇Ci的聚簇中心的混合特征向量与其他聚簇的聚簇中心混合特征向量的欧氏距离,Wj为根据当前聚簇Ci所包括的像素点设置的权重。
图8是本申请所述一种像素概率模块104一种实施例的模块结构示意图,如图8所示,所述像素概率模块104可以包括下述中的至少一种:
第一概率模块1041,可以用于将像素点所属聚簇的聚簇概率作为该像素点的像素概率;
第二概率模块1042,可以用于以待求像素点p为中心提取第一邻域窗口W(p)’的像素点,采用下式计算所述待求像素点p的像素概率Sal(p):
上式中,P(q)为所述第一邻域窗W(p)’内的像素点q所属的聚簇属于主体区域的概率,t为待求像素点p所属的聚簇中像素点的个数,σ为设置的一个平滑参数。
所述提取模块105可以采取预先设置的不同的提取方式提取待处理图像的主体区域。具体的可以包括下述中的至少一种模块:
第一提取模块,可以用于将所述待处理图像中像素点的像素概率值符合判断阈值PV要求的像素点作为所述待处理图像的目标区域;
第二提取模块,可以用于将所述待处理图像中像素点属于主体区域的概率值大于第一阈值的PF像素点作为种子像素点;还可以用于以所述种子像素点为中心计算与周围第二邻域窗口中像素点的欧式距离;还可以用于将所述欧式距离小于第二阈值的像素点作为新的种子像素点;还可以用于遍历所有所述种子像素点与周围所述第二邻域窗口中像素点的欧式距离并做出判断,将所述计算得出的种子像素点作为所述待处理图像的目标区域。
上述所述的一种图像区域检测装置中,所述判断阈值PV的取值范围可以为:0.8≤PV≤0.95;
和/或,
所述第一阈值PF的取值范围可以为:0.8≤PF≤0.95。
本实施例提供的判断阈值PV或者第一阈值PF的取值范围,可以有效保证主体区域提取的正确、有效性,提高图像尤其所述复杂性较高的图像区域检测的准确性。
利用本申请所述的一种图像区域检测装置,可以在平台型电商网站中用于分离复杂多变的商品图像中的主体区域和背景区域,能有效应对实际图像场景中各种复杂的情况,实现对复杂图像中主体区域进行准确、有效的分离,提高图像检测精确度。
本申请所述的一种图像区域检测装置可以使用于多种终端设备中,例如用户移动客户端的抠图应用,或者专门用于图像主体或者背景区域提取的客户端或者服务器。通常,所述图像检测装置在进行图像检测,获取目标区域后,可以将所述获取的目标区域的图像进行保存或者显示给用户进行进一步处理。本申请提供一种图像区域检测装置,可以适用于处理用户或者客户端的图像,进行图像检测,获取目标区域。具体的,所述装置可以被设置成,包括:
第一处理单元,可以用于获取用户/客户端的待处理图像,计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;
第二处理单元,可以用于对所述混合特征向量进行聚类,获取聚类后的聚簇;还可以用于根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;
输出单元,可以用于基于所述像素概率对所述待处理图像进行获取目标区域,并将所述获取的目标区域存储或者展示于指定位置。
本实施例提供的图像去检测装置,可以在客户端或者服务器中有效、精确的提取待处理图片的目标区域,可以提高客户端图片处理用户体验或者客户端/服务器图像信息处理的精确度。
尽管本申请内容中提到不同图像格式转换、聚类方法、给定公式的计算等之类的描述,但是,本申请并不局限于必须是完全标准的格式转换、聚类方法或者本申请提供的固定公式的情况。本申请中各个实施例所涉及的上述描述仅是本申请中的一些实施例中的应用,在某些标准、方法的基础上略加修改后的处理方法也可以实行上述本申请各实施例的方案。当然,要符合本申请上述各实施例的中所述的处理方法步骤的其他无需创造性的变形,仍然可以实现相同的申请,在此不再赘述。
上述实施例阐明的单元或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现。
本邻域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本邻域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本邻域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。
Claims (19)
1.一种图像区域检测方法,其特征在于,所述方法包括:
计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;
对所述混合特征向量进行聚类,获取聚类后的聚簇;
根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;
基于所述像素概率对所述待处理图像进行检测,获取目标区域。
2.如权利要求1所述的一种图像区域检测方法,其特征在于,所述计算得出待处理图像像素点的颜色特征包括:
如果所述待处理图像不为Lab格式的数据,将所述待处理图像的数据格式转化为Lab格式;
以待处理像素为中心提取所述待处理图像中邻域窗口的像素点,将所述邻域窗口中像素点的L、a、b三个通道分别分为K个分组,形成3*K维的颜色特征向量;
将所述邻域窗口中每个像素点在所述L、a、b三个通道的颜色值累加到所述颜色特征向量所对应的维中,形成所述邻域窗口中待处理像素点的颜色特征。
3.如权利要求2所述的一种图像区域检测方法,其特征在于,所述K的取值为:6≤K≤16。
4.如权利要求1所述的一种图像区域检测方法,其特征在于,所述按照预定规则计算所述聚簇的聚簇概率包括:
计算所述聚簇中每个聚簇与其他聚簇的距离和,以所述聚簇和与所有聚簇的所述距离和的总和的比值作为所述聚簇的聚簇概率。
5.如权利要求4所述的一种图像区域检测方法,其特征在于,所述计算所述聚簇中每个聚簇与其他聚簇的距离和包括:
采用下式计算所述聚簇中每个聚簇与其他聚簇的距离和D(Ci):
上式中,L为聚簇的个数,||ci,cj||为当前聚簇Ci的聚簇中心的混合特征向量与其他聚簇的聚簇中心混合特征向量的欧氏距离,Wj为根据当前聚簇Ci所包括的像素点设置的权重。
6.如权利要求1所述的一种图像区域检测方法,其特征在于,所述基于所述聚簇概率计算所述聚簇中像素点的像素概率包括:
所述聚簇中像素点的像素概率为该像素点所属聚簇的聚簇概率。
7.如权利要求1所述的一种图像区域检测方法,其特征在于,所述基于所述聚簇概率计算所述聚簇中像素点的像素概率包括:
以待求像素点p为中心提取第一邻域窗口W(p)’的像素点,采用下式计算所述待求像素点p的像素概率Sal(p):
上式中,P(q)为所述第一邻域窗W(p)’内的像素点q所属聚簇的聚簇概率,t为待求像素点p所属的聚簇中像素点的个数,σ为设置的平滑参数。
8.如权利要求1所述的一种图像区域检测方法,其特征在于,所述基于所述像素概率对所述待处理图像进行检测获取目标区域包括:
将所述待处理图像中像素点的像素概率值符合判断阈值PV要求的像素点作为所述待处理图像的目标区域;
或者,
将所述待处理图像中像素的概率值大于第一阈值PF的像素点作为种子像素点;
以所述种子像素点为中心计算与周围第二邻域窗口中像素点的欧式距离;
将所述欧式距离小于第二阈值的像素点作为新的种子像素点;
遍历所有所述种子像素点与周围所述第二邻域窗口中像素点的欧式距离并做出判断,将所述计算得出的种子像素点作为所述待处理图像的目标区域。
9.如权利要求8所述的一种图像区域检测方法,其特征在于,所述判断阈值PV的取值范围为:0.8≤PV≤0.95;
或者,
所述第一阈值PF的取值范围为:0.8≤PF≤0.95。
10.一种图像区域检测装置,其特征在于,所述装置包括:
特征计算模块,用于计算得出待处理图像像素点的颜色特征和梯度特征,并构建所述待处理图像的混合特征向量;
聚类模块,用于对所述混合特征向量进行聚类,获取聚类后的聚簇;
聚簇概率模块,用于根据预定规则计算所述聚簇的聚簇概率;
像素概率模块,用于基于所述聚簇概率计算所述聚簇中像素点的像素概率;
检测模块,用于基于所述像素概率对所述待处理图像进行检测,获取目标区域。
11.如权利要求10所述的一种图像区域检测装置,其特征在于,所述特征计算模块包括:
颜色特征模块,用于计算所述待处理图像像素点的颜色特征;
梯度特征模块,用于计算所述待处理图像像素点的梯度特征;
混合特征模块,用于将所述颜色特征和梯度特征结合,形成待处理图像的混合特征向量。
12.如权利要求11所述的一种图像区域检测装置,其特征在于,所述颜色特征模块包括:
Lab转化模块,用于将所述待处理图像转化为Lab格式的数据;
颜色特征向量模块,用于以待处理像素为中心提取所述待处理图像中邻域窗口的像素点,将所述邻域窗口中像素点的L、a、b三个通道分别分为K个分组,形成3*K维的颜色特征向量;
特征计算模块,用于将所述邻域窗口中每个像素点在所述L、a、b三个通道的颜色值累加到所述颜色特征向量所对应的维中,形成所述邻域窗口中待处理像素点的颜色特征。
13.如权利要求12所述的一种图像区域检测装置,其特征在于,所述颜色特征向量模块中K的取值范围为:6≤K≤16。
14.如权利要求10所述的一种图像区域检测装置,其特征在于,所述聚簇概率模块包括:
距离和计算模块,用于计算所述聚簇中每个聚簇与其他聚簇的距离和;
聚簇概率计算模块,用于根据所述聚簇和与所有聚簇的所述距离和的总和计算所述聚簇的聚簇概率。
15.如权利要求14所述的一种图像区域检测装置,其特征在于,所述距离计算模块计算所述聚簇中每个聚簇与其他聚簇的距离和包括:
采用下式计算所述聚簇中每个聚簇与其他聚簇的距离和D(Ci):
上式中,L为聚簇的个数,||ci,cj||为当前聚簇Ci的聚簇中心的混合特征向量与其他聚簇的聚簇中心混合特征向量的欧氏距离,Wj为根据当前聚簇Ci所包括的像素点设置的权重。
16.如权利要求10所述的一种图像区域检测装置,其特征在于,所述像素概率模块包括下述中的至少一种:
第一概率模块,用于将像素点所属聚簇的聚簇概率作为该像素点的像素概率;
第二概率模块,用于以待求像素点p为中心提取第一邻域窗口W(p)’的像素点,采用下式计算所述待求像素点p的像素概率Sal(p):
上式中,P(q)为所述第一邻域窗W(p)’内的像素点q所属的聚簇属于主体区域的概率,t为待求像素点p所属的聚簇中像素点的个数,σ为设置的平滑参数。
17.如权利要求10所述的一种图像区域检测装置,其特征在于,所述提取模块包括下述中的至少一种模块:
第一提取模块,用于将所述待处理图像中像素点的像素概率值符合判断阈值PV要求的像素点作为所述待处理图像的目标区域;
第二提取模块,用于将所述待处理图像中像素点属于主体区域的概率值大于第一阈值PF的像素点作为种子像素点;还用于以所述种子像素点为中心计算与周围第二邻域窗口中像素点的欧式距离;还用于将所述欧式距离小于第二阈值的像素点作为新的种子像素点;还用于遍历所有所述种子像素点与周围所述第二邻域窗口中像素点的欧式距离并做出判断,将所述计算得出的种子像素点作为所述待处理图像的目标区域。
18.如权利要求17所述的一种图像区域检测装置,其特征在于,所述判断阈值PV的取值范围为:0.8≤PV≤0.95;
和/或,
所述第一阈值PF的取值范围为:0.8≤PF≤0.95。
19.一种图像区域检测装置,其特征在于,所述装置被设置成,包括:
第一处理单元,用于获取用户/客户端的待处理图像,计算得出待处理图像像素点的颜色特征和梯度特征,构建所述待处理图像的混合特征向量;
第二处理单元,用于对所述混合特征向量进行聚类,获取聚类后的聚簇;还用于根据预定规则计算所述聚簇的聚簇概率,并基于所述聚簇概率计算所述聚簇中像素点的像素概率;
输出单元,用于基于所述像素概率对所述待处理图像进行获取目标区域,并将所述获取的目标区域存储或者展示于指定位置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510075465.8A CN105989594B (zh) | 2015-02-12 | 2015-02-12 | 一种图像区域检测方法及装置 |
PCT/CN2016/073274 WO2016127883A1 (zh) | 2015-02-12 | 2016-02-03 | 一种图像区域检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510075465.8A CN105989594B (zh) | 2015-02-12 | 2015-02-12 | 一种图像区域检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105989594A true CN105989594A (zh) | 2016-10-05 |
CN105989594B CN105989594B (zh) | 2019-02-12 |
Family
ID=56614213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510075465.8A Active CN105989594B (zh) | 2015-02-12 | 2015-02-12 | 一种图像区域检测方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105989594B (zh) |
WO (1) | WO2016127883A1 (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108389205A (zh) * | 2018-03-19 | 2018-08-10 | 北京航空航天大学 | 一种基于空基平台图像的铁轨异物监测方法及装置 |
CN108520259A (zh) * | 2018-04-13 | 2018-09-11 | 国光电器股份有限公司 | 一种前景目标的提取方法、装置、设备及存储介质 |
CN108961316A (zh) * | 2017-05-23 | 2018-12-07 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
CN109611916A (zh) * | 2018-12-06 | 2019-04-12 | 李珊珍 | 吸烟档位自动调节平台 |
CN109815762A (zh) * | 2018-12-29 | 2019-05-28 | 福建天泉教育科技有限公司 | 远距离识别二维码的方法、存储介质 |
CN111726476A (zh) * | 2020-07-06 | 2020-09-29 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、设备和计算机可读介质 |
CN111862084A (zh) * | 2020-07-31 | 2020-10-30 | 大连东软教育科技集团有限公司 | 基于复杂网络的图像质量评价方法、装置及存储介质 |
WO2021057463A1 (zh) * | 2019-09-25 | 2021-04-01 | 北京字节跳动网络技术有限公司 | 图像风格化处理方法、装置、电子设备及可读介质 |
CN113077308A (zh) * | 2021-03-30 | 2021-07-06 | 张雨钊 | 一种智能可视化电商交易平台 |
CN113627453A (zh) * | 2020-05-08 | 2021-11-09 | 珠海金山办公软件有限公司 | 一种纯色背景图像抠图方法、装置及电子设备 |
CN114663316A (zh) * | 2022-05-17 | 2022-06-24 | 深圳市普渡科技有限公司 | 确定沿边路径的方法、移动设备及计算机存储介质 |
CN115115893A (zh) * | 2022-07-26 | 2022-09-27 | 金乡县富通金属回收有限公司 | 用于废金属回收的智能分选方法 |
CN116485819A (zh) * | 2023-06-21 | 2023-07-25 | 青岛大学附属医院 | 一种耳鼻喉检查图像分割方法及系统 |
WO2023246189A1 (zh) * | 2022-06-24 | 2023-12-28 | 如你所视(北京)科技有限公司 | 图像信息显示方法和装置 |
CN118608569A (zh) * | 2024-07-25 | 2024-09-06 | 成都航天凯特机电科技有限公司 | 一种目标跟踪方法 |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178118B (zh) * | 2018-11-13 | 2023-07-21 | 浙江宇视科技有限公司 | 图像采集处理方法、装置及计算机可读存储介质 |
CN110334936B (zh) * | 2019-06-28 | 2023-09-29 | 创新先进技术有限公司 | 一种信贷资质评分模型的构建方法、装置和设备 |
CN110610438B (zh) * | 2019-09-16 | 2022-02-15 | 黑龙江八一农垦大学 | 一种农作物冠层叶柄夹角计算方法及系统 |
CN113920528A (zh) * | 2020-07-08 | 2022-01-11 | 顺丰科技有限公司 | 主体对象检测方法、装置、计算机设备和存储介质 |
CN111862244A (zh) * | 2020-07-16 | 2020-10-30 | 安徽慧视金瞳科技有限公司 | 一种基于图像处理的塑料片智能色选方法 |
CN112288624A (zh) * | 2020-09-11 | 2021-01-29 | 北京迈格威科技有限公司 | 图像处理方法、装置和电子系统 |
CN113034509A (zh) * | 2021-02-26 | 2021-06-25 | 北京达佳互联信息技术有限公司 | 图像处理方法及装置 |
CN113034454B (zh) * | 2021-03-16 | 2023-11-24 | 上海交通大学 | 一种基于人类视觉感官的水下图像质量评价方法 |
CN113052922B (zh) * | 2021-03-26 | 2023-03-14 | 重庆紫光华山智安科技有限公司 | 裸土识别方法、系统、设备及介质 |
CN113298829B (zh) * | 2021-06-15 | 2024-01-23 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN114445483B (zh) * | 2022-01-28 | 2023-03-24 | 泗阳三江橡塑有限公司 | 基于图像金字塔的注塑件质量分析方法 |
CN115496760B (zh) * | 2022-11-17 | 2023-04-07 | 澳润(山东)药业有限公司 | 一种阿胶品质鉴定方法 |
CN115526890B (zh) * | 2022-11-25 | 2023-03-24 | 深圳市腾泰博科技有限公司 | 一种电唱机唱头故障因素识别方法 |
CN115661669B (zh) * | 2022-12-13 | 2023-03-21 | 山东省土地发展集团有限公司 | 一种基于视频监控的耕地违法占用监测方法及系统 |
CN115861301B (zh) * | 2023-02-16 | 2023-05-16 | 山东百成新材料科技股份有限公司 | 用于改性沥青生产的多物料均匀性视觉评价方法 |
CN116092013B (zh) * | 2023-03-06 | 2023-06-09 | 广东汇通信息科技股份有限公司 | 一种用于智慧监控的危险路况识别方法 |
CN116205923B (zh) * | 2023-05-06 | 2023-07-14 | 威海锐鑫丰金属科技有限公司 | 基于x-ray的汽车轮毂内部缺陷无损检测方法 |
CN116309577B (zh) * | 2023-05-19 | 2023-08-04 | 山东晨光胶带有限公司 | 一种高强传送带物料智能检测方法及系统 |
CN116645354B (zh) * | 2023-06-02 | 2024-08-30 | 绿萌科技股份有限公司 | 一种面向多功能分选系统的表面瑕疵图像检测方法 |
CN116385434B (zh) * | 2023-06-02 | 2023-08-08 | 同济检测(济宁)有限公司 | 一种用于预制梁裂缝的智能检测方法 |
CN116740809B (zh) * | 2023-06-05 | 2024-03-29 | 嘉兴米兰映像家具有限公司 | 一种基于用户姿态的智能沙发控制方法 |
CN116503404B (zh) * | 2023-06-27 | 2023-09-01 | 梁山县创新工艺品股份有限公司 | 塑料玩具质量检测方法、装置、电子设备及存储介质 |
CN116824168B (zh) * | 2023-08-29 | 2023-11-21 | 青岛市中医医院(青岛市海慈医院、青岛市康复医学研究所) | 基于图像处理的耳部ct特征提取方法 |
CN116977329B (zh) * | 2023-09-21 | 2023-12-08 | 江苏惠汕新能源集团有限公司 | 一种基于机器视觉的光伏板栅线检测方法 |
CN117011303B (zh) * | 2023-10-08 | 2024-01-09 | 泰安金冠宏油脂工业有限公司 | 基于机器视觉的油料生产质量检测方法 |
CN117115494B (zh) * | 2023-10-23 | 2024-02-06 | 卡松科技股份有限公司 | 基于人工智能的润滑油杂质污染检测方法、装置 |
CN117173164B (zh) * | 2023-11-02 | 2023-12-26 | 江苏君杰新能源有限公司 | 太阳能电池板的栅线检测方法 |
CN117237384B (zh) * | 2023-11-16 | 2024-02-02 | 潍坊科技学院 | 一种智慧农业种植作物的视觉检测方法及系统 |
CN117333484B (zh) * | 2023-11-30 | 2024-02-20 | 山东罗斯夫新材料科技有限公司 | 一种基于图像处理的丙烯酸乳液生产废水检测方法 |
CN117520102B (zh) * | 2024-01-04 | 2024-04-26 | 广州大一互联网络科技有限公司 | 一种idc数据中心的能耗智能监控方法 |
CN117635507B (zh) * | 2024-01-26 | 2024-04-09 | 深圳市精森源科技有限公司 | 一种塑胶颗粒在线视觉检测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030147558A1 (en) * | 2002-02-07 | 2003-08-07 | Loui Alexander C. | Method for image region classification using unsupervised and supervised learning |
CN101447076A (zh) * | 2008-12-02 | 2009-06-03 | 浙江大学 | 一种web图像中感兴趣区域的分割方法 |
CN102842135A (zh) * | 2012-07-17 | 2012-12-26 | 杭州淘淘搜科技有限公司 | 一种商品图像主体区域检测方法 |
CN102867313A (zh) * | 2012-08-29 | 2013-01-09 | 杭州电子科技大学 | 一种融合区域颜色和HoG特征的视觉显著性检测方法 |
CN103824283A (zh) * | 2014-01-22 | 2014-05-28 | 西安电子科技大学 | 基于随机概率采样与多级融合的大幅面地形图分割方法 |
US20140241624A1 (en) * | 2013-02-27 | 2014-08-28 | Sony Corporation | Method and system for image processing |
CN104217438A (zh) * | 2014-09-19 | 2014-12-17 | 西安电子科技大学 | 基于半监督的图像显著性检测方法 |
CN104268595A (zh) * | 2014-09-24 | 2015-01-07 | 深圳市华尊科技有限公司 | 通用物件检测方法及系统 |
-
2015
- 2015-02-12 CN CN201510075465.8A patent/CN105989594B/zh active Active
-
2016
- 2016-02-03 WO PCT/CN2016/073274 patent/WO2016127883A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030147558A1 (en) * | 2002-02-07 | 2003-08-07 | Loui Alexander C. | Method for image region classification using unsupervised and supervised learning |
CN101447076A (zh) * | 2008-12-02 | 2009-06-03 | 浙江大学 | 一种web图像中感兴趣区域的分割方法 |
CN102842135A (zh) * | 2012-07-17 | 2012-12-26 | 杭州淘淘搜科技有限公司 | 一种商品图像主体区域检测方法 |
CN102867313A (zh) * | 2012-08-29 | 2013-01-09 | 杭州电子科技大学 | 一种融合区域颜色和HoG特征的视觉显著性检测方法 |
US20140241624A1 (en) * | 2013-02-27 | 2014-08-28 | Sony Corporation | Method and system for image processing |
CN103824283A (zh) * | 2014-01-22 | 2014-05-28 | 西安电子科技大学 | 基于随机概率采样与多级融合的大幅面地形图分割方法 |
CN104217438A (zh) * | 2014-09-19 | 2014-12-17 | 西安电子科技大学 | 基于半监督的图像显著性检测方法 |
CN104268595A (zh) * | 2014-09-24 | 2015-01-07 | 深圳市华尊科技有限公司 | 通用物件检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
VISWANATH GOPALAKRISHNAN 等: "Salient Region Detection by Modeling Distributions of Color and Orientation", 《IEEE TRANSACTIONS ON MULTIMEDIA》 * |
徐丹等: "融合颜色属性和空间信息的显著性物体检测", 《中国图象图形学报》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961316A (zh) * | 2017-05-23 | 2018-12-07 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
CN108961316B (zh) * | 2017-05-23 | 2022-05-31 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
CN108389205A (zh) * | 2018-03-19 | 2018-08-10 | 北京航空航天大学 | 一种基于空基平台图像的铁轨异物监测方法及装置 |
CN108520259A (zh) * | 2018-04-13 | 2018-09-11 | 国光电器股份有限公司 | 一种前景目标的提取方法、装置、设备及存储介质 |
CN109611916A (zh) * | 2018-12-06 | 2019-04-12 | 李珊珍 | 吸烟档位自动调节平台 |
CN109815762A (zh) * | 2018-12-29 | 2019-05-28 | 福建天泉教育科技有限公司 | 远距离识别二维码的方法、存储介质 |
CN109815762B (zh) * | 2018-12-29 | 2022-02-11 | 福建天泉教育科技有限公司 | 远距离识别二维码的方法、存储介质 |
WO2021057463A1 (zh) * | 2019-09-25 | 2021-04-01 | 北京字节跳动网络技术有限公司 | 图像风格化处理方法、装置、电子设备及可读介质 |
CN113627453A (zh) * | 2020-05-08 | 2021-11-09 | 珠海金山办公软件有限公司 | 一种纯色背景图像抠图方法、装置及电子设备 |
CN111726476A (zh) * | 2020-07-06 | 2020-09-29 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、设备和计算机可读介质 |
CN111862084A (zh) * | 2020-07-31 | 2020-10-30 | 大连东软教育科技集团有限公司 | 基于复杂网络的图像质量评价方法、装置及存储介质 |
CN111862084B (zh) * | 2020-07-31 | 2024-02-02 | 东软教育科技集团有限公司 | 基于复杂网络的图像质量评价方法、装置及存储介质 |
CN113077308A (zh) * | 2021-03-30 | 2021-07-06 | 张雨钊 | 一种智能可视化电商交易平台 |
CN113077308B (zh) * | 2021-03-30 | 2022-03-22 | 张雨钊 | 一种智能可视化电商交易平台 |
CN114663316A (zh) * | 2022-05-17 | 2022-06-24 | 深圳市普渡科技有限公司 | 确定沿边路径的方法、移动设备及计算机存储介质 |
WO2023246189A1 (zh) * | 2022-06-24 | 2023-12-28 | 如你所视(北京)科技有限公司 | 图像信息显示方法和装置 |
CN115115893A (zh) * | 2022-07-26 | 2022-09-27 | 金乡县富通金属回收有限公司 | 用于废金属回收的智能分选方法 |
CN115115893B (zh) * | 2022-07-26 | 2023-01-31 | 金乡县富通金属回收有限公司 | 用于废金属回收的智能分选方法 |
CN116485819A (zh) * | 2023-06-21 | 2023-07-25 | 青岛大学附属医院 | 一种耳鼻喉检查图像分割方法及系统 |
CN116485819B (zh) * | 2023-06-21 | 2023-09-01 | 青岛大学附属医院 | 一种耳鼻喉检查图像分割方法及系统 |
CN118608569A (zh) * | 2024-07-25 | 2024-09-06 | 成都航天凯特机电科技有限公司 | 一种目标跟踪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105989594B (zh) | 2019-02-12 |
WO2016127883A1 (zh) | 2016-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105989594B (zh) | 一种图像区域检测方法及装置 | |
KR101662972B1 (ko) | 단일 이미지로부터 깊이를 추정하기 | |
CN111242097B (zh) | 一种人脸识别方法、装置、计算机可读介质及电子设备 | |
Narihira et al. | Learning lightness from human judgement on relative reflectance | |
CN108229504B (zh) | 图像解析方法及装置 | |
EP3073443B1 (en) | 3d saliency map | |
CN110059728B (zh) | 基于注意力模型的rgb-d图像视觉显著性检测方法 | |
Nguyen et al. | Support local pattern and its application to disparity improvement and texture classification | |
CN102722880B (zh) | 图像主颜色的识别方法、装置及图像匹配方法和服务器 | |
CN101763429A (zh) | 一种基于颜色和形状特征的图像检索方法 | |
CN108921022A (zh) | 一种人体属性识别方法、装置、设备及介质 | |
CN110570402B (zh) | 基于边界感知神经网络的双目显著物体检测方法 | |
CN113301409B (zh) | 视频合成方法、装置、电子设备和可读存储介质 | |
EP4184413A1 (en) | Spatial image analysis-based color scheme recommendation apparatus and method | |
CN113901911B (zh) | 图像识别、模型训练方法、装置、电子设备及存储介质 | |
CN106296681A (zh) | 基于双通道低秩分解的协同学习显著性检测方法 | |
CN108388901B (zh) | 基于空间-语义通道的协同显著目标检测方法 | |
CN105979283A (zh) | 视频转码方法和装置 | |
JP5914046B2 (ja) | 画像処理装置および画像処理方法 | |
Lu et al. | Environment-aware multiscene image enhancement for internet of things enabled edge cameras | |
CN113822134A (zh) | 一种基于视频的实例跟踪方法、装置、设备及存储介质 | |
CN114842287B (zh) | 深度引导变形器的单目三维目标检测模型训练方法及装置 | |
Pagnutti et al. | Joint Color and Depth Segmentation based on Region Merging and Surface Fitting. | |
CN115019057A (zh) | 图像特征提取模型确定方法及装置、图像识别方法及装置 | |
CN114581734A (zh) | 分类模型训练方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1229936 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |