CN106683091B - 一种基于深度卷积神经网络的目标分类及姿态检测方法 - Google Patents

一种基于深度卷积神经网络的目标分类及姿态检测方法 Download PDF

Info

Publication number
CN106683091B
CN106683091B CN201710010558.1A CN201710010558A CN106683091B CN 106683091 B CN106683091 B CN 106683091B CN 201710010558 A CN201710010558 A CN 201710010558A CN 106683091 B CN106683091 B CN 106683091B
Authority
CN
China
Prior art keywords
target
window
candidate window
network
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710010558.1A
Other languages
English (en)
Other versions
CN106683091A (zh
Inventor
刘明
杜浩源
董立泉
赵跃进
刘小华
惠梅
孔令琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201710010558.1A priority Critical patent/CN106683091B/zh
Publication of CN106683091A publication Critical patent/CN106683091A/zh
Application granted granted Critical
Publication of CN106683091B publication Critical patent/CN106683091B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像处理与目标检测领域,公开了一种基于深度卷积神经网络的目标分类及姿态检测方法。所述方法核心内容包括:1.样本集的制作方法;2.候选窗口生成方法;3.特征提取方法;4.网络训练方法;5.目标标注方法。待检测图像经过卷积神经网络得到深度卷积特征后,将具备姿态角的候选窗口映射到该特征层上,得到方向性的区域特征向量,通过该特征向量进行分类和预测得到最终的检测结果。该方法能够从样本中提取更加纯净的目标特征,可提高分类的正确率,并且能够实现目标姿态角检测功能。

Description

一种基于深度卷积神经网络的目标分类及姿态检测方法
技术领域
本发明属于图像处理与目标检测领域,公开了一种基于深度卷积神经网络的目标分类及姿态检测方法。
背景技术
目标检测需要在给定的图像上精确地标记目标所在位置,并识别出物体的种类。目标尺寸大小不定、目标在图像当中的位置不定、目标的姿态角度不定以及背景光照变化等将会对检测过程造成困难,导致检测正确率下降。
经典的目标检测方法通常采用模板匹配加滑动窗口的方式来解决目标在图像中的识别和定位问题,这种方法耗时长且在目标变化剧烈的情况下效果较差。卷积神经网络的出现带动了这一课题的发展,大幅提高了检测精度(mAP)。
纽约大学的Pierre Sermanet等人提出的Overfeat网络采用多尺度的滑动窗口在同一卷积特征图上进行目标定位和识别,但该方法效果和速度都不尽如人意。RossGirshick等人提出的RCNN方法基于选择性搜索方法(Selective search)预测物体可能存在的区域,但存在着仿射变换破坏候选区域特征的问题。SPP-NET方法和Fast RCNN方法仍然通过选择性搜索的方式生成候选区域,利用图像金字塔机制解决了候选区域的尺度映射问题,同时实现了多阶段连续训练。Faster RCNN用一个单独的区域生成网络代替了选择性搜索的方法,解决了候选区域生成过程耗费大量时间的问题,加快了网络的训练速度和测试速度,也提高了检测结果的准确性。
根据上述每种方法的发明者撰写的学术论文内容显示,目前目标检测方法通常所采用的选框为与图像的四条边框分别平行的正立矩形,这种形式的选框仅对处于正立姿态角的目标(目标的几何中心线与图像边框近似平行或垂直)具有较好的检测正确率,从另一角度解释则为当前检测方法没有考虑到目标姿态角的变化。在实际检测情景当中,目标经常处于倾斜姿态,即中心线与图像边框存在一定幅度的夹角。因此若采用正立矩形框所框选的目标中会包含很多背景信息,造成信噪比大幅下降,不利于后续的目标分类和位置校正。并且由于方法并未考虑到目标的在图像中的姿态角变化,因此无法表征目标的姿态。综合上述观点,当前目标检测方法具备的检测能力有限,并且对于目标状态的表征不够充分。
发明内容
本发明提出一种目标检测方法。主要解决的问题识别目标的类别,定位目标在图像中的位置、尺寸和姿态角。
本发明是一种基于深度卷积神经网络的目标分类及姿态检测方法,包括样本集制作方法,神经网络的训练方法和目标的标注方法。
所述样本集的制作方法扩充了传统样本集的内容,传统的样本集当中只包含目标种类和目标左上角点、右下角点的横纵坐标,然而在目标倾斜的情形下,这种标注方式并不能准确的反应目标姿态。在本发明中,除记录目标的种类外,还记录目标中心点在图像中的横纵坐标,采用面积最小的矩形窗口框选目标,将矩形窗口的长边和短边所占像素数作为目标的宽和高,将矩形窗口长轴方向与基准轴之间的夹角作为目标的姿态角。
所述卷积神经网络的训练方法包括如下步骤:
输入批量训练图像Si,i=1,……,M,M代表批量训练图像的数量,同时需要输入图像中目标的标签及相对应的位置,对训练图像的尺寸进行归一化;
将图像划分为不同尺寸和不同姿态角的候选窗口,计算出所有候选窗口与真值窗口的重叠区域比例,通过设定正负阈值,将候选窗口分类为正负样本;
从每幅图像当中选取N/M个候选窗口作为训练样本,N代表批量随机梯度下降采用的样本数量,控制正负样本数量的比例接近于1:1,每个样本aj均包含六个参数(lj,xj,yj,hj,wjj),j=1,……,N,lj代表该样本的标签,xj,yj代表候选窗口中心在图像中的横纵坐标,hj,wj代表候选窗口的高和宽,θj表示候选窗口倾斜的角度。
通过网络前向传播提取样本的深度卷积特征,将候选窗口映射到该特征上,得到固定维度的特征向量;
在特征向量层上建立三个独立的网络,分别利用特征向量计算候选窗口的分类误差、位置偏差和角度误差;
网络输出的代价函数为:
式中,W和b为网络需要调整的参数;N表示单次批量随机梯度下降采用的样本数量;J1为分类误差项,代表候选窗口的分类误差,li'为预测标签,li为目标真实标签;J2为位置误差项,表示候选窗口与真值窗口的位置偏差,pi'是由网络输出的对候选窗口位置的修正量,pi是真值相对于候选窗口的位置偏差量,1{·}为指示函数,当花括号内表述为真(样本为正样本)时等于1,否则等于0;J3为角度误差项,用于计算候选窗口与真值窗口的角度误差,θi'为网络输出的目标姿态角对候选窗口角度的修正量,θi为目标真实姿态角与候选窗口角度的偏差量;λ和μ用来平衡三项之间的权重。
通过批量随机梯度下降的反向传播方法对网络各层参数进行调整,当迭代次数达到预设的最大值或者网络输出的误差收敛时即停止训练。
所述目标位置的标注方法包括如下步骤:
第一步,输入待检测图像,将图像的大小归一化为网络的固定输入尺寸;
第二步,针对每个候选窗口,通过网络计算得出目标类别、位置修正量、姿态角和分数;
第三步,设定目标尺寸阈值和分数阈值,保留一定数量的候选窗口;
第四步,通过极大值抑制方法,进一步去除重叠率较高且分数较低的候选窗口;
第五步,根据结果在图像中以具备姿态角的矩形窗口的框选出目标范围。
有益效果
本发明在图像中以固定间隔划分不同尺寸和不同姿态角的候选窗口,适于对不同大小和不同姿态角的目标进行检测,避免了选择性搜索方法的大量计算。相比于传统的矩形窗口,具备姿态角的窗口可以更加准确地框选处于倾斜姿态的物体,减少了窗口中包含的背景信息,通过图像金字塔的映射机制将倾斜窗口映射至深度卷积特征层上,可以提取到更纯净的特征,解决了现有目标分类方法对姿态敏感的问题,有效地提高了目标检测的准确率。此外,本方法还具备目标姿态角检测功能,对于图像中目标状态的表征更加完备。
附图说明
图1是依照本发明实施例的目标检测框架;
图2是依照本发明实施例将姿态角进行离散化的示意图;
图3是依照本发明实施例的网络训练流程;
图4是依照本发明实施例的特征提取网络和目标检测网络;
图5是依照本发明实施例对目标进行检测并标注的结果示意图。
具体实施方式
为了更加清楚地表述本发明的目的、技术方案和优点,以下结合具体实施例,并参照附图,给出了本发明进一步详细说明,但本发明的保护范围不限于下述的实施例。
本实施例当中对目标进行检测的框架如图1所示,图像经过卷积神经网络得到深度卷积特征后,将具备姿态角的候选窗口映射到该特征层上,得到方向性的区域特征向量,再通过对特征向量进行分类和预测得到最终的检测结果。
本实施例采用的数据集部分源自公开图像库PASCAL VOC 2007和PASCAL VOC2012,此外我们还添加了许多人工采集到的不同场景和不同角度下目标图像。最后得到的数据集中包含20类目标的彩色图像,共计15000张,其中10000张用于训练,5000张用于测试。数据集的标注当中包含目标的种类、目标的中心坐标和宽高像素数、目标的姿态角。
为降低网络对姿态角检测的难度,我们将姿态角进行离散化,使角度检测成为分类任务而不是回归任务。角度的离散如图2所示,将360度的方位角平分为16个区间,考虑到目标识别须具备旋转对称性,将对顶角的角度区间视为同一角度类别。以x轴正半轴为0°方位角、逆时针方向定义角度值,角度类别与角度区间对照如表1所示。
表1
训练的模型由特征提取网络(图-3 左)和目标检测网络(图-3 右)两部分构成,特征提取网络选取在ILSVRC2015数据库上预训练的VGG-16网络模型中的一部分,去除掉VGG-16网络最后一个最大池化层后面的层,保留下来的网络包含13个卷积层和4个最大池化层,在此基础上添加一层ROI pooling输出区域特征向量。目标检测网络由两个公共的全连接层、两个公共的dropout层和三个分支的全连接层构成,三个分支分别得出目标的类别、候选窗口的修正量和目标姿态角。
倾斜候选窗口的生成过程为:根据特征提取网络中卷积和池化操作的步长,在原图像上以16个像素为间隔均匀选取采样点,以采样点为中心生成四种尺寸(32,64,128,256)的基准框,在每个基准框中参照表1划分出8个姿态角的候选窗口,也就是在每个采样点周围生成共计32个倾斜候选窗口。
网络的训练过程如图4所示,描述如下:
输入训练图像和图像中所有目标的类别及相对应的位置信息。将图像尺寸归一化至固定的网络输入大小,图像像素值通过减去平均值做零均值处理;
计算出所有倾斜候选窗口与真值窗口的重叠区域比例,当比例大于0.7时,认为候选窗口为正样本,当比例小于0.3时,则认为是负样本;
训练方法采用批量梯度下降,本实施例中,每批次选取2幅图像,每幅图像上随机采样128个样本,使正负样本数量的比例接近于1:1;
通过网络前向传播提取样本的深度卷积特征,将候选窗口映射到该特征上,通过ROI pooling得到大小为7×7的区域特征向量;
在特征向量层上建立三个独立的网络,分别利用特征向量计算候选窗口的分类误差、位置偏差和角度分类误差;
网络输出的代价函数为:
式中,W和b为网络需要调整的参数;N表示单次批量随机梯度下降采用的样本数量;J1为分类误差项,代表候选窗口的分类误差,li'为预测标签,li为目标真实标签;J2为位置误差项,表示候选窗口与真值窗口的位置偏差,pi'是由网络输出的对候选窗口位置的修正量,pi是真值相对于候选窗口的位置偏差量,1{·}为指示函数,当花括号内表述为真(样本为正样本)时等于1,否则等于0;J3为角度误差项,用于计算候选窗口与真值窗口的角度误差,θ′i为网络输出的目标姿态角对候选窗口角度的修正量,θi为目标真实姿态角与候选窗口角度的偏差量;λ和μ用来平衡三项之间的权重。
通过批量随机梯度下降的反向传播方法对网络各层参数进行调整,当迭代次数达到预设的最大值或者网络输出的误差收敛时即停止训练。
对目标进行检测并标注大致流程为:输入待检测图像,将图像的大小归一化为网络的固定输入尺寸。针对每个候选窗口,通过网络计算得出目标类别、位置修正量、姿态角和分数。设定目标尺寸阈值和分数阈值,保留一定数量的候选窗口。通过极大值抑制方法,进一步去除重叠率较高且分数较低的候选窗口。根据结果在图像中以倾斜矩形框的方式框选出目标范围,结果如图5所示。

Claims (4)

1.一种基于深度卷积神经网络的目标分类及姿态检测方法,其特征在于包括以下步骤:
a)制作样本集,包括训练集和测试集,每张样本图像可包含多个目标,每个目标用六个参数(l,x,y,h,w,θ)进行表示,l代表该目标的标签,x和y代表目标中心在图像中的横纵坐标,h和w代表目标真值窗口的高和宽,θ表示目标相对于基准轴的姿态角;
b)候选窗口生成过程,在整幅图像上以一定步长均匀生成候选窗口,窗口采用不同尺寸和不同姿态角的矩形框;
c)深度特征提取过程,先将待检测的图像输入到预先训练的模型进行计算得到深度卷积特征图,将b)当中生成的候选窗口依据图像金字塔的机制映射到深度卷积特征图上面生成固定维度的特征向量;
d)子网络构建过程,在获得的卷积特征层的基础上,构建三个子网络分别用于识别目标种类、修正候选窗口位置和预测目标姿态角,对于网络中新添加的层,采用Xavier初始化方法建立参数;
e)训练样本的生成过程,样本中不仅包含图像,还包含候选窗口的正负样本,正负样本依据候选窗口与真值窗口的重叠比例IOU进行划分,使样本集中正负样本比例接近于1:1;
f)网络训练过程,通过批量随机梯度下降法对网络参数进行调整,每次训练需至少输入一幅图像,保证正样本数量的前提下随机抽取负样本,在训练起始阶段通过较大学习率对参数进行更新,在网络输出误差减小缓慢时减小学习率;
g)目标标注步骤,输入一幅待检测图像,利用训练完成的网络进行计算,得到候选窗口的类别、位置偏移量、姿态角和分数,设定阈值排除分数较低的窗口,通过极大值抑制方法保留分数较高的窗口作为最终检测结果,利用具备姿态角的矩形窗口框选目标位置。
2.根据权利要求1所述的方法,其特征在于,步骤a中所述姿态角通过对目标构成点阵做最小面积包围矩形得到,该包围矩形长轴方向与基准轴之间的夹角即为姿态角。
3.根据权利要求1所述的方法,其特征在于,步骤b中所述候选窗口通过正立矩形框进行旋转得到,旋转中心为在图像上以一定步长均匀分布的参考点。
4.根据权利要求1所述的方法,其特征在于,步骤f中所述训练方法包括:
采用批量梯度下降对网络参数进行迭代更新,网络的代价函数由多项构成,公式为
式中,N表示单次批量随机梯度下降采用的样本数量;J1为分类误差项,代表候选窗口的分类误差,l'i为预测标签,li为目标真实标签;J2为位置误差项,表示候选窗口与真值窗口的位置偏差,p'i是由网络输出的对候选窗口位置的修正量,pi是真值相对于候选窗口的位置偏差量,1{·}为指示函数,当花括号内表述为真时等于1,否则等于0;J3为角度误差项,用于计算候选窗口与真值窗口的角度误差,θ'i为网络输出的目标姿态角对候选窗口角度的修正量,θi为目标真实姿态角与候选窗口角度的偏差量;λ和μ用来平衡三项之间的权重。
CN201710010558.1A 2017-01-06 2017-01-06 一种基于深度卷积神经网络的目标分类及姿态检测方法 Expired - Fee Related CN106683091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710010558.1A CN106683091B (zh) 2017-01-06 2017-01-06 一种基于深度卷积神经网络的目标分类及姿态检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710010558.1A CN106683091B (zh) 2017-01-06 2017-01-06 一种基于深度卷积神经网络的目标分类及姿态检测方法

Publications (2)

Publication Number Publication Date
CN106683091A CN106683091A (zh) 2017-05-17
CN106683091B true CN106683091B (zh) 2019-09-24

Family

ID=58849997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710010558.1A Expired - Fee Related CN106683091B (zh) 2017-01-06 2017-01-06 一种基于深度卷积神经网络的目标分类及姿态检测方法

Country Status (1)

Country Link
CN (1) CN106683091B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627416A (zh) * 2021-10-12 2021-11-09 上海蜜度信息技术有限公司 图片分类和对象检测的同步处理方法、系统、存储介质及终端

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108230355A (zh) * 2017-06-14 2018-06-29 北京市商汤科技开发有限公司 目标跟踪及神经网络训练方法、装置、存储介质和电子设备
CN109117858B (zh) * 2017-06-26 2024-02-13 北京金风科创风电设备有限公司 监测风力发电机叶片结冰的方法及装置
CN107330439B (zh) * 2017-07-14 2022-11-04 腾讯科技(深圳)有限公司 一种图像中物体姿态的确定方法、客户端及服务器
CN107491733A (zh) * 2017-07-19 2017-12-19 南京农业大学 一种基于深度神经网络的菊花识别方法
CN107665336A (zh) * 2017-09-20 2018-02-06 厦门理工学院 智能冰箱中基于Faster‑RCNN的多目标检测方法
CN108009990A (zh) * 2017-11-30 2018-05-08 北京小米移动软件有限公司 倾斜对象处理方法及装置
CN107917700B (zh) * 2017-12-06 2020-06-09 天津大学 基于深度学习的小幅度目标三维姿态角测量方法
CN108319954B (zh) * 2018-02-12 2021-10-22 深圳市盈华讯方通信技术有限公司 一种无接触测重方法
CN108764063B (zh) * 2018-05-07 2020-05-19 华中科技大学 一种基于特征金字塔的遥感影像时敏目标识别系统及方法
CN109101966B (zh) * 2018-06-08 2022-03-08 中国科学院宁波材料技术与工程研究所 基于深度学习的工件识别定位和姿态估计系统和方法
CN110619255B (zh) * 2018-06-19 2022-08-26 杭州海康威视数字技术股份有限公司 一种目标检测方法及其装置
CN109064514B (zh) * 2018-07-03 2022-04-26 北京航空航天大学 一种基于投影点坐标回归的六自由度位姿估计方法
CN109063593A (zh) * 2018-07-13 2018-12-21 北京智芯原动科技有限公司 一种人脸跟踪方法及装置
CN110569699B (zh) * 2018-09-07 2020-12-29 创新先进技术有限公司 对图片进行目标采样的方法及装置
CN109523015B (zh) * 2018-11-09 2021-10-22 上海海事大学 一种神经网络中图像处理方法
CN109472264B (zh) * 2018-11-09 2020-10-27 北京字节跳动网络技术有限公司 用于生成物体检测模型的方法和装置
CN109685762A (zh) * 2018-11-09 2019-04-26 五邑大学 一种基于多尺度深度语义分割网络的天线下倾角测量方法
CN109614990A (zh) * 2018-11-20 2019-04-12 成都通甲优博科技有限责任公司 一种目标检测装置
CN109558902A (zh) * 2018-11-20 2019-04-02 成都通甲优博科技有限责任公司 一种快速目标检测方法
CN109813276B (zh) * 2018-12-19 2021-01-26 五邑大学 一种基站天线下倾角测量方法及其系统
CN109977945A (zh) * 2019-02-26 2019-07-05 博众精工科技股份有限公司 基于深度学习的定位方法和系统
CN110414337B (zh) * 2019-06-21 2023-12-05 上海汽车工业(集团)总公司 目标姿态检测系统及其检测方法
CN110807431A (zh) * 2019-11-06 2020-02-18 上海眼控科技股份有限公司 对象定位方法、装置、电子设备及存储介质
CN111079822A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法
CN111242088B (zh) * 2020-01-22 2023-11-28 上海商汤临港智能科技有限公司 一种目标检测方法、装置、电子设备及存储介质
CN111428567B (zh) * 2020-02-26 2024-02-02 沈阳大学 一种基于仿射多任务回归的行人跟踪系统及方法
CN111651674B (zh) * 2020-06-03 2023-08-25 北京妙医佳健康科技集团有限公司 双向搜索方法、装置及电子设备
CN112052946A (zh) * 2020-07-21 2020-12-08 重庆邮电大学移通学院 神经网络训练方法及相关产品
CN112015966A (zh) * 2020-10-19 2020-12-01 北京神州泰岳智能数据技术有限公司 一种图像搜索方法、装置、电子设备及存储介质
CN113376610B (zh) * 2021-06-22 2023-06-30 西安电子科技大学 基于信号结构信息的窄带雷达目标检测方法
CN113723217A (zh) * 2021-08-09 2021-11-30 南京邮电大学 一种基于yolo改进的物体智能检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533467A (zh) * 2009-04-28 2009-09-16 南京航空航天大学 一种基于决策树的多种人体姿态识别方法
CN104732243A (zh) * 2015-04-09 2015-06-24 西安电子科技大学 基于cnn的sar目标识别方法
CN104992142A (zh) * 2015-06-03 2015-10-21 江苏大学 一种基于深度学习和属性学习相结合的行人识别方法
CN105447473A (zh) * 2015-12-14 2016-03-30 江苏大学 一种基于PCANet-CNN的任意姿态人脸表情识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016197046A1 (en) * 2015-06-05 2016-12-08 Google Inc. Spatial transformer modules

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533467A (zh) * 2009-04-28 2009-09-16 南京航空航天大学 一种基于决策树的多种人体姿态识别方法
CN104732243A (zh) * 2015-04-09 2015-06-24 西安电子科技大学 基于cnn的sar目标识别方法
CN104992142A (zh) * 2015-06-03 2015-10-21 江苏大学 一种基于深度学习和属性学习相结合的行人识别方法
CN105447473A (zh) * 2015-12-14 2016-03-30 江苏大学 一种基于PCANet-CNN的任意姿态人脸表情识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627416A (zh) * 2021-10-12 2021-11-09 上海蜜度信息技术有限公司 图片分类和对象检测的同步处理方法、系统、存储介质及终端
CN113627416B (zh) * 2021-10-12 2022-01-25 上海蜜度信息技术有限公司 图片分类和对象检测的同步处理方法、系统、存储介质及终端

Also Published As

Publication number Publication date
CN106683091A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN106683091B (zh) 一种基于深度卷积神经网络的目标分类及姿态检测方法
Yang et al. Real-time face detection based on YOLO
CN106127204B (zh) 一种全卷积神经网络的多方向水表读数区域检测算法
CN108898047B (zh) 基于分块遮挡感知的行人检测方法及系统
CN109829398B (zh) 一种基于三维卷积网络的视频中的目标检测方法
Tang et al. Geometric correspondence network for camera motion estimation
CN104392228B (zh) 基于条件随机场模型的无人机图像目标类检测方法
Mahmon et al. A review on classification of satellite image using Artificial Neural Network (ANN)
CN112084869B (zh) 一种基于紧致四边形表示的建筑物目标检测方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN108537775A (zh) 一种基于深度学习检测的癌细胞跟踪方法
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN106845357A (zh) 一种基于多通道网络的视频人脸检测和识别方法
CN108470354A (zh) 视频目标跟踪方法、装置和实现装置
CN109711262B (zh) 一种基于深度卷积神经网络的智能挖掘机行人检测方法
CN104573744B (zh) 精细粒度类别识别及物体的部分定位和特征提取方法
CN108073888A (zh) 一种教学辅助方法及采用该方法的教学辅助系统
CN109255375A (zh) 基于深度学习的全景图像对象检测方法
CN110163836A (zh) 基于深度学习用于高空巡检下的挖掘机检测方法
CN103886325B (zh) 一种分块的循环矩阵视频跟踪方法
CN108062574A (zh) 一种基于特定类别空间约束的弱监督目标检测方法
CN103778436B (zh) 一种基于图像处理的行人姿态检测方法
CN109558902A (zh) 一种快速目标检测方法
Shuai et al. An improved YOLOv5-based method for multi-species tea shoot detection and picking point location in complex backgrounds
CN106055573A (zh) 一种多示例学习框架下的鞋印图像检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190924

CF01 Termination of patent right due to non-payment of annual fee