JP3459950B2 - Face detection and face tracking method and apparatus - Google Patents
Face detection and face tracking method and apparatusInfo
- Publication number
- JP3459950B2 JP3459950B2 JP11636998A JP11636998A JP3459950B2 JP 3459950 B2 JP3459950 B2 JP 3459950B2 JP 11636998 A JP11636998 A JP 11636998A JP 11636998 A JP11636998 A JP 11636998A JP 3459950 B2 JP3459950 B2 JP 3459950B2
- Authority
- JP
- Japan
- Prior art keywords
- window
- area
- face
- color
- dark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、ビデオカメラ等の
カラー画像入力手段から入力されるカラー画像に基づい
て人の顔の検出または追跡を高速で行う顔検出及び顔追
跡方法並びにその装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a face detection and face tracking method and apparatus for detecting or tracking a human face at high speed based on a color image input from a color image input means such as a video camera. Is.
【0002】[0002]
【従来の技術】ディジタル画像をコンピュータ処理する
ことにより顔検出または顔追跡を行う方法の研究は従来
から行われている。モノクロ画像を用いた顔検出の研究
としては、例えば、小杉氏による「個人識別のための多
重ピラミッドを用いたシーン中の顔の検索・位置決め」
(電子情報通信学会論文誌、Vol.J77-D-II,No.4,pp672-
681,1994) がある。また、カラー画像を用いた顔検出の
研究としては、Q.Chen氏らによる「Face detection by
fuzzy pattern matching」(Proceedings of 5thInterna
tional Conference on Computer Vision,pp591-596)等
がある。2. Description of the Related Art A method for detecting or tracking a face by processing a digital image with a computer has been studied. As a research on face detection using monochrome images, for example, "Finding and locating faces in a scene using multiple pyramids for personal identification" by Kosugi
(The Institute of Electronics, Information and Communication Engineers, Vol.J77-D-II, No.4, pp672-
681, 1994). For research on face detection using color images, see Face Detection by Q. Chen et al.
fuzzy pattern matching '' (Proceedings of 5th Interna
tional Conference on Computer Vision, pp 591-596).
【0003】[0003]
【発明が解決しようとする課題】ところが、上記モノク
ロ画像による顔検出では、顔の色を検出することができ
ないため、顔検出が不安定になりがちな問題がある。一
方、上記従来のカラー画像を用いた顔検出では、顔テン
プレートを用いた照合を行っているので、予め多くの顔
テンプレートを準備しておく必要があり、且つ実際の検
出に際しては、多くの位置において上記顔テンプレート
と実際の画像との間の相関計算を行わねばならないの
で、検出に要する時間が、通常、2秒以上と長くなり、
実時間による検出には適しないものであった。However, face detection using the monochrome image described above has a problem that face detection tends to be unstable because the face color cannot be detected. On the other hand, in the face detection using the conventional color image, since the matching is performed using the face template, it is necessary to prepare many face templates in advance, and in actual detection, many positions are detected. In the above, since the correlation calculation between the face template and the actual image has to be performed, the time required for detection is usually longer than 2 seconds,
It was not suitable for real-time detection.
【0004】また、上記顔テンプレートを用いた方法で
は、検出の精度がディジタル画像の明るさや顔の大き
さ、ヘアースタイルや眼鏡の着用の有無等に影響される
場合がある他、上記ディジタル画像中の顔の向きが正面
以外の横向き等になっている場合、顔が正面を向いてい
ても首が傾いている場合、或いは、ディジタル画像中に
複数の顔が含まれている場合等には、正確な検出が行え
ないこともあった。Further, in the method using the face template, the detection accuracy may be affected by the brightness of the digital image, the size of the face, the hair style, the presence or absence of wearing glasses, and the like. If the face orientation is horizontal other than the front, etc., if the head is tilted even if the face is facing the front, or if the digital image contains multiple faces, In some cases, accurate detection could not be performed.
【0005】[0005]
【課題を解決するための手段】本発明は、上記課題を解
決し、カラー画像に基づいて人の顔の検出または追跡を
高速で正確に行うことのできる顔検出及び顔追跡方法並
びにその装置を提供することを目的とする。そのため、
本発明の請求項1の顔検出方法は、カラー画像入力手段
から入力され、RGB表色系で表されるカラー画像をx
y表色系へと変換し、事前に用意した肌色サンプル画像
から決定され、上記xy表色系における色xについての
肌色分布を表すガウス関数に従って上記カラー画像から
肌色領域を抽出するとともに上記カラー画像から明るさ
があるしきい値以下の暗い領域を抽出し、上記肌色領域
と面積が略等しく且つ重心が一致する窓を設定し、該窓
を上下に2分割するとともに上半分をさらに左右に2分
割して、左上窓、右上窓、及び下部窓に分割し、上記左
上窓、上記右上窓、及び上記下部窓内に各々上記暗い領
域が存在して且つ該暗い領域の重心が各々上記左上窓、
上記右上窓、及び上記下部窓内に位置しており、しかも
上記肌色領域内に一定の面積比で上記暗い領域を検出し
たとき、人の顔であると判定することを特徴とするもの
である。SUMMARY OF THE INVENTION The present invention solves the above problems and provides a face detection and face tracking method and apparatus capable of detecting or tracking a human face at high speed and accurately based on a color image. The purpose is to provide. for that reason,
According to the face detection method of claim 1 of the present invention, a color image input from the color image input means and represented by the RGB color system is x.
y Skin color sample image prepared in advance by converting to y color system
For the color x in the xy color system
According Gaussian function representing the skin color distribution extracting threshold following dark area having a brightness of the color image extracts a <br/> skin color region from the color image, the skin color area
And a window whose area is approximately equal to each other and whose centers of gravity coincide with each other,
Is divided into upper and lower parts, and the upper half is further divided into left and right parts
Split into upper left window, upper right window, and lower window, above left
The dark areas are displayed in the upper window, the upper right window, and the lower window, respectively.
Area exists and the center of gravity of the dark area is the upper left window,
When the dark area is located in the upper right window and the lower window, and the dark area is detected in the skin color area at a constant area ratio, it is determined to be a human face. To do.
【0006】請求項2の顔追跡方法は、請求項1記載の
方法による顔検出を上記カラー画像の複数のフレームで
連続的に行うことにより人の顔の移動を追跡することを
特徴とするものである。A face tracking method according to a second aspect of the invention is characterized in that the movement of a human face is tracked by continuously performing face detection by the method according to the first aspect in a plurality of frames of the color image. Is.
【0007】請求項3の顔追跡方法は、請求項2記載の
方法による顔追跡を行うに当たり、各フレームにおける
顔検出を前回のフレームで顔が検出された領域の近傍の
領域のみで行うことを特徴とするものである。In the face tracking method according to a third aspect of the present invention, when the face tracking is performed by the method according to the second aspect, the face detection in each frame is performed only in an area near the area in which the face is detected in the previous frame. It is a feature.
【0008】請求項4の記録媒体は、請求項1乃至3の
いずれか記載の顔検出方法または顔追跡方法を実行する
ためのプログラムを記録したコンピュータ読取可能な記
録媒体である。A recording medium according to a fourth aspect is a computer-readable recording medium recording a program for executing the face detecting method or the face tracking method according to any one of the first to third aspects.
【0009】請求項5の顔検出装置は、カラー画像入力
手段から入力され、RGB表色系で表されるカラー画像
をxy表色系へと変換し、事前に用意した肌色サンプル
画像から決定され、上記xy表色系における色xについ
ての肌色分布を表すガウス関数に従って上記カラー画像
から肌色領域を抽出する肌色領域検出手段と、上記カラ
ー画像から明るさがあるしきい値以下の暗い領域を抽出
する暗い領域検出手段と、上記肌色領域検出手段で検出
された肌色領域の面積を求める肌色領域分析手段と、上
記暗い領域検出手段で検出された上記暗い領域の面積を
求める暗い領域分析手段と、肌色領域と面積が略等しく
且つ重心が一致する窓を設定し、該窓を上下に2分割す
るとともに、上半分をさらに上下に2分割して、上記左
上窓、上記右上窓、及び上記下部窓に分割し、上記左上
窓、上記右上窓、及び上記下部窓内に各々上記暗い領域
が存在して且つ該暗い領域の重心が各々上記左上窓、上
記右上窓、及び上記下部窓内に位置しており、しかも肌
色領域分析手段と暗い領域分析手段との分析結果に基づ
いて上記肌色領域内に暗い領域が存在し且つその面積比
が一定範囲内であるときに人の顔であると判定する顔判
定手段とを備えたことを特徴とするものである。A face detecting apparatus according to a fifth aspect of the present invention is a color image input from a color image input means and represented by an RGB color system.
Is converted to the xy color system and the skin color sample prepared in advance
For the color x in the xy color system determined from the image,
The above color image according to the Gaussian function that represents the distribution of all skin colors
From the skin color area detecting means for extracting a skin color area from, a dark area detecting means for extracting a dark area whose brightness is below a certain threshold from the color image, and an area of the skin color area detected by the skin color area detecting means. The flesh color area analyzing means to be obtained, the dark area analyzing means to obtain the area of the dark area detected by the dark area detecting means, and the flesh color area and the area are substantially equal to each other.
And set a window whose center of gravity is the same, and divide the window into two up and down.
In addition, the upper half is further divided into upper and lower parts,
Divided into upper window, upper right window, and lower window, above left window
The dark areas in the window, the upper right window, and the lower window, respectively.
Is present and the center of gravity of the dark area is the upper left window and upper window, respectively.
In the upper right window and the lower window , a dark area exists in the skin color area based on the analysis results of the skin color area analysis means and the dark area analysis means, and its area It is characterized by comprising a face determining means for determining that the face is a human face when the ratio is within a certain range.
【0010】請求項6の顔検出装置は、請求項5の構成
において、上記肌色領域分析手段及び上記暗い領域分析
手段は各々肌色領域及び暗い領域の重心を求める一方、
上記顔判定手段は肌色領域の重心を中心とし且つ肌色領
域の面積と略等しい面積の矩形窓を上記肌色領域上に設
定し、且つこの矩形窓を左上窓及び右上窓からなる上部
窓と下部窓とに分割して、上記左上窓、右上窓及び下部
窓内に各々上記暗い領域の重心が含まれるとともに上記
左上窓、右上窓及び下部窓内の肌色領域に対する暗い領
域の面積比が各々一定範囲内であるときに人の顔である
と判定することを特徴とするものである。According to a sixth aspect of the present invention, in the structure of the fifth aspect, the skin color area analyzing means and the dark area analyzing means respectively obtain the barycenters of the skin color area and the dark area, respectively.
The face determining means sets a rectangular window centered on the center of gravity of the flesh color area and having an area substantially equal to the area of the flesh color area on the flesh color area, and this rectangular window is an upper window and a lower window consisting of an upper left window and an upper right window. And the center of gravity of the dark area is included in each of the upper left window, the upper right window, and the lower window, and the area ratio of the dark area to the skin color area in the upper left window, the upper right window, and the lower window is within a certain range. It is characterized in that it is determined to be the face of a person when it is inside.
【0011】すなわち、人の顔の中で暗い領域は、主と
して、目の周辺(特に、黒目及び眉毛)と口の周辺(口
及び唇)とであるので、左目及び右目に対して上記左上
窓及び右上窓を設定するとともに、口に対して下部窓を
設定し、左上窓、右上窓及び下部窓内で暗い領域が各々
一定の面積比で含まれているか否かを判定するようにし
たものである。That is, since the dark area in the human face is mainly around the eyes (particularly, black eyes and eyebrows) and around the mouth (mouths and lips), the above-mentioned upper left window for the left and right eyes. In addition to setting the upper right window and the upper right window, a lower window is set for the mouth, and it is determined whether or not dark areas are included in the upper left window, the upper right window and the lower window at a constant area ratio. Is.
【0012】請求項7の顔検出装置は、請求項6の構成
において、上記左上窓または右上窓の少なくとも一方に
暗い領域の重心が含まれないとき、上記顔判定手段が左
上窓及び右上窓を上記肌色領域に対して左右方向へスラ
イドさせて上記判定を行うことを特徴とするものであ
る。すなわち、カラー画像内で人の顔が斜め横向きにな
っていた場合等には、左目及び右目に対応した暗い領域
の重心が左右にずれることがあるが、係る場合に上記左
上窓及び右上窓を上記肌色領域に対して左右へスライド
させることにより対応するものである。According to a seventh aspect of the present invention, in the configuration of the sixth aspect, when at least one of the upper left window and the upper right window does not include the center of gravity of a dark area, the face determination means opens the upper left window and the upper right window. The determination is performed by sliding the skin color region in the left-right direction. That is, when a person's face is turned sideways diagonally in the color image, the center of gravity of the dark areas corresponding to the left and right eyes may shift to the left and right. This is handled by sliding the skin color area to the left and right.
【0013】請求項8の顔追跡装置は、請求項5乃至7
のいずれかの構成において、請求項5乃至7のいずれか
の顔検出装置による顔検出を複数のフレームで連続的に
行うことにより顔の移動を追跡することを特徴とするも
のである。The face tracking device according to claim 8 is the face tracking device according to any one of claims 5 to 7.
In any of the above configurations, the movement of the face is tracked by continuously performing face detection by the face detection apparatus according to any one of claims 5 to 7 in a plurality of frames.
【0014】[0014]
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。本実施の形態の顔検出及び追跡装
置は、ヒューマンインターフェイス、データベース検
索、ビル監視、セキュリティ、テレビ会議、顔による照
合システム、仮想(人工)現実感、ゲーム、教育、映画
制作、エンタテインメント、画像通信等の種々の分野で
利用できるものである。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. The face detection and tracking device of this embodiment is a human interface, database search, building monitoring, security, video conference, face matching system, virtual (artificial) reality, game, education, movie production, entertainment, image communication, etc. Can be used in various fields.
【0015】図1に示すように、顔検出及び追跡装置1
は、カラー画像入力手段2から入力されるカラー画像中
の肌色領域を検出する肌色領域検出手段3と、上記カラ
ー画像中の暗い領域を検出する暗い領域検出手段4と、
肌色領域検出手段3で検出された肌色領域の面積及び重
心を求める肌色領域分析手段5と、暗い領域検出手段4
で検出された暗い領域の面積及び重心を求める暗い領域
分析手段6と、肌色領域分析手段5及び暗い領域分析手
段6の分析結果に基づいて、上記カラー画像中に人の顔
が存在するか否かを判定する顔判定手段7とを備えてい
る。As shown in FIG. 1, a face detection and tracking device 1
Is a flesh color area detecting means 3 for detecting a flesh color area in the color image input from the color image input means 2, a dark area detecting means 4 for detecting a dark area in the color image,
Skin color region analysis unit 5 for obtaining the area and center of gravity of the skin color region detected by the skin color region detection unit 3, and dark region detection unit 4
Whether or not a human face is present in the color image based on the analysis results of the dark area analysis means 6 for obtaining the area and the center of gravity of the dark area detected in step 6, and the skin color area analysis means 5 and the dark area analysis means 6. And a face determination means 7 for determining whether or not.
【0016】図2は図1の顔検出及び追跡装置1及びカ
ラー画像入力手段2のより詳細な構成を示すブロック図
である。カラー画像入力手段2は、撮像手段21と、撮
像手段21がアナログ信号を出力する場合に設けられる
A/D変換部22とからなる。顔検出及び追跡装置1で
顔追跡を行う場合、例えば、CCD(Charge CoupledDev
ice) ビデオカメラからなる撮像手段21で撮像された
フルカラーの動画がA/D変換部22でディジタル信号
に変換された後、顔検出及び追跡装置1の肌色領域検出
手段3に送られる。一方、顔検出及び追跡装置1で顔検
出を行う場合、例えば、ディジタルカメラ等からなる撮
像手段21で撮像されたカラーの静止画(ディジタル信
号)がそのまま肌色領域検出手段3に送られる。FIG. 2 is a block diagram showing a more detailed structure of the face detection and tracking device 1 and the color image input means 2 of FIG. The color image input unit 2 includes an image pickup unit 21 and an A / D conversion unit 22 provided when the image pickup unit 21 outputs an analog signal. When face tracking is performed by the face detection and tracking device 1, for example, CCD (Charge Coupled Dev)
ice) A full-color moving image picked up by the image pickup means 21 including a video camera is converted into a digital signal by the A / D converter 22, and then sent to the skin color area detection means 3 of the face detection and tracking device 1. On the other hand, when the face detection and tracking device 1 performs face detection, for example, a color still image (digital signal) captured by the image capturing unit 21 including a digital camera is sent to the skin color region detecting unit 3 as it is.
【0017】肌色領域検出手段3は第1変換手段31、
第2変換手段32及び肌色画素の検出手段33からな
る。上記CCDビデオカメラまたはディジタルカメラ等
の撮像手段21から入力されるカラー画像は、通常、N
TSC(National TelevisionSystem Committee) 方式の
RGB(赤、緑、青)表色系で表現されているが、本実
施の形態では、このRGB表色系を、まず、第1変換手
段31によりCIE(国際証明委員会)方式のXYZ表
色系に変換する。RGB表色系からXYZ表色系への変
換式(1) を以下に示す。The skin color area detecting means 3 comprises a first converting means 31,
The second conversion unit 32 and the skin color pixel detection unit 33 are included. The color image input from the image pickup means 21 such as the CCD video camera or the digital camera is usually N
Although it is expressed in the RGB (red, green, blue) color system of the TSC (National Television System Committee) system, in the present embodiment, this RGB color system is first converted into CIE (international) by the first conversion means 31. (Certification Committee) Convert to XYZ color system. The conversion formula (1) from the RGB color system to the XYZ color system is shown below.
【0018】[0018]
【数1】 [Equation 1]
【0019】次に、上記XYZ表色系を肌色領域検出手
段3内の第2変換手段32でxy表色系に変換する。す
なわち、X、Y、Zを各々2倍、3倍しても輝度(明る
さ)が変化するのみであるから、輝度に関係なく色だけ
を表現するのであれば、X、Y、Zの比率が分かってい
ればよい。X、Y、Zからx、yへの変換式(2) は、以
下の通りである。なお、後述するように、輝度はXYZ
表色系のYで表す。Next, the XYZ color system is converted into the xy color system by the second conversion means 32 in the skin color area detection means 3. That is, the brightness (brightness) changes only when X, Y, and Z are doubled and tripled, respectively. Therefore, if only colors are expressed regardless of brightness, the ratio of X, Y, and Z is calculated. You only need to know The conversion formula (2) from X, Y, Z to x, y is as follows. As described later, the brightness is XYZ.
It is represented by Y in the color system.
【0020】[0020]
【数2】 [Equation 2]
【0021】第2変換手段32でxy表色系に変換した
後、肌色画素の検出手段33が肌色画素の領域を検出す
る。ここで、肌色(顔の色)は個人差があるが、同じ人
種では正規分布に従うと考えられる。そのため、本発明
者は東洋人についての肌色分布状況を調査した。すなわ
ち、ビデオカメラを用いて顔画像を数人分取得し、肌色
部分のみを手動で切り取り、肌色サンプル画像を用意し
た。2次元の正規分布関数は次の数3中の式(3) で表さ
れる。After the conversion into the xy color system by the second conversion means 32, the skin color pixel detection means 33 detects the area of the skin color pixels. Here, although the skin color (face color) has individual differences, it is considered that the same race follows a normal distribution. Therefore, the present inventor investigated the skin color distribution situation of Oriental people. That is, face images for several people were acquired using a video camera, and only the skin color portion was manually cut out to prepare a skin color sample image. The two-dimensional normal distribution function is expressed by the following equation (3) in equation (3).
【0022】[0022]
【数3】 [Equation 3]
【0023】数3中の太字のxはxy表色系の色、太字
のμは肌色分布の中心、太字のΣは肌色分布の共分散行
列を示しており、太字のx、太字のμ及び太字のΣは各
々数4中の式(4) 、(5) 、(6) で表される。In Equation 3, bold x is a color of the xy color system, bold μ is the center of the skin color distribution, and bold Σ is the covariance matrix of the skin color distribution. Bold x, bold μ and The bold letters Σ are expressed by equations (4), (5), and (6) in the equation 4, respectively.
【0024】[0024]
【数4】 [Equation 4]
【0025】得られた肌色サンプル画像のxy色情報を
用いて、肌色サンプル画像のピクセル数をnとすると、
中心μ(太字)及び共分散行列Σ(太字)は各々数5中
の式(7) 、(8) で求めることができる。Using the xy color information of the obtained skin color sample image, and letting the number of pixels of the skin color sample image be n,
The center μ (bold type) and the covariance matrix Σ (bold type) can be calculated by the equations (7) and (8) in the equation 5, respectively.
【0026】[0026]
【数5】 [Equation 5]
【0027】正規分布関数の指数部分のマハラノビス距
離Dは、数6中の式(9) で表され、このマハラノビス距
離Dをカラー画像からの肌色領域抽出に用いる。肌色画
素の検出手段33は、マハラノビス距離Dの値があるし
きい値未満の場合、太字のxで表される色は肌色であ
り、Dが上記しきい値以上の場合、色は肌色でないと判
断する。The Mahalanobis distance D in the exponential part of the normal distribution function is expressed by the equation (9) in the equation 6, and this Mahalanobis distance D is used for extracting the skin color area from the color image. When the value of the Mahalanobis distance D is less than a certain threshold value, the flesh color pixel detection unit 33 determines that the color represented by bold x is a flesh color, and if D is equal to or more than the threshold value, the color is not a flesh color. to decide.
【0028】[0028]
【数6】 [Equation 6]
【0029】また、暗い領域検出手段4は第1変換手段
31から送られるXYZ表色系のYの輝度(明るさ)を
2値化し、これをあるしきい値と比較して、輝度がしき
い値以下の場合に暗い画素であると判断する。肌色領域
分析手段5及び暗い領域分析手段6は各々前述のよう
に、肌色領域と暗い領域の面積及び重心を求め、これら
のデータを顔判定手段7に送信する。Further, the dark area detecting means 4 binarizes the luminance (brightness) of Y of the XYZ color system sent from the first converting means 31 and compares this with a threshold value to determine the luminance. If it is less than or equal to the threshold value, it is determined to be a dark pixel. As described above, the skin color area analysis unit 5 and the dark area analysis unit 6 obtain the areas and the centers of gravity of the skin color area and the dark area, and transmit these data to the face determination unit 7.
【0030】顔判定手段7は、肌色領域内に暗い領域が
一定範囲の面積比で含まれている場合に当該肌色領域が
人の顔であると判定する。すなわち、人の顔の中で暗い
領域は、主として、左右の目の周辺(黒目、眉毛等)及
び口の周辺(口、唇等)であり、左右の目は顔の上部、
口は顔の下部に位置している。そのため、本実施の形態
では、カラー画像中で検出された肌色領域の上部及び下
部に各々目及び口に対応する暗い領域が存在するか否か
により当該肌色領域が人の顔であるか否かを判定する。The face determining means 7 determines that the flesh color area is a human face when the flesh color area includes a dark area in a certain area ratio. That is, the dark areas in a human face are mainly around the left and right eyes (black eyes, eyebrows, etc.) and around the mouth (mouth, lips, etc.), and the left and right eyes are the upper part of the face,
The mouth is located at the bottom of the face. Therefore, in the present embodiment, whether or not the skin color area is a human face is determined by whether or not there are dark areas corresponding to the eyes and the mouth above and below the skin color area detected in the color image. To judge.
【0031】より具体的には、図2の顔判定手段7内の
A部に示すように、顔判定手段7はカラー画像中で検出
された肌色領域H上に重なるように正方形状の窓Mを設
定する。その場合、窓Mの面積は肌色領域Hの面積と略
等しくし、且つ窓Mの重心と肌色領域Hの重心とを一致
させる。窓Mを上下に2分割するとともに、上半分をさ
らに左右に2分割して、左上窓M1、右上窓M2及び下
部窓M3に分割する。そして、左上窓M1、右上窓M2
及び下部窓M3内に各々暗い領域が存在して且つこれら
の暗い領域の重心が各々左上窓M1、右上窓M2及び下
部窓M3内に位置しており、しかもこれらの暗い領域の
面積の肌色領域Hの面積に対する比率が一定範囲内であ
れば、人の顔であると判定する。More specifically, as shown in part A of the face determining means 7 in FIG. 2, the face determining means 7 has a square window M so as to overlap with the skin color region H detected in the color image. To set. In that case, the area of the window M is made substantially equal to the area of the skin color region H, and the center of gravity of the window M and the center of gravity of the skin color region H are matched. The window M is vertically divided into two parts, and the upper half is further divided into left and right parts into an upper left window M1, an upper right window M2 and a lower window M3. Then, the upper left window M1 and the upper right window M2
And lower windows M3 have dark areas respectively, and the centers of gravity of these dark areas are respectively located in the upper left window M1, the upper right window M2 and the lower window M3, and the skin color area of the area of these dark areas is present. If the ratio of H to the area is within a certain range, it is determined to be a human face.
【0032】すなわち、左上窓M1及び右上窓M2内に
おける肌色領域H内に暗い領域が肌色領域Hに対して1
/900乃至1/40の面積比で存在していれば、これ
らの暗い領域は各々左目及び右目の周辺(特に黒目及び
眉毛)であると判定し、下部窓M3内における肌色領域
Hに暗い領域が1/200乃至1/5の面積比で存在し
ていれば、この暗い領域は口の周辺であると判定し、左
上窓M1、右上窓M2及び下部窓M3内に暗い領域が各
々上記の割合で存在しているときに、上記肌色領域Hが
人の顔であると判定する。That is, the dark area in the skin color area H in the upper left window M1 and the upper right window M2 is 1 with respect to the skin color area H.
If it exists in the area ratio of / 900 to 1/40, it is determined that these dark areas are around the left eye and the right eye (especially the black eye and the eyebrow), and the dark area in the skin color area H in the lower window M3. Is present at an area ratio of 1/200 to 1/5, it is determined that the dark region is around the mouth, and the dark regions in the upper left window M1, the upper right window M2, and the lower window M3 are respectively the above-mentioned. When it exists in proportion, it is determined that the skin color region H is a human face.
【0033】また、図2の顔判定手段7中のB部または
C部に示すように、カラー画像内で人の顔が斜め前方を
向いている場合、顔の中の目の位置で左右方向へずれる
ことになるが、この場合は、左上窓M1及び右上窓M2
を左右方向へスライドし、スライドした状態で左上窓M
1及び右上窓M2内に各々暗い領域が一定範囲の面積比
で含まれるか否かを判定し、左上窓M1及び右上窓M2
内に暗い領域が一定範囲の面積比で含まれていれば、人
の顔であると判定する。Further, as shown in the portion B or the portion C in the face determining means 7 in FIG. 2, when the human face is facing diagonally forward in the color image, the eye position in the face is left and right. In this case, the upper left window M1 and the upper right window M2
To the left and right, and then slide it to the upper left window M
1 and the upper right window M2, it is determined whether or not each of the dark areas is included in a certain area ratio, and the upper left window M1 and the upper right window M2 are determined.
If a dark area is included in the area within a certain area ratio, it is determined to be a human face.
【0034】顔検出及び追跡装置1でカラーの静止画像
に基づく顔検出を行う場合は、上記の手順で検出が可能
であるが、カラーの動画に基づく顔追跡を行う場合、カ
ラー画像入力手段2から肌色領域検出手段3及び暗い領
域検出手段4に入力される複数のフレームの各々につい
て上記の手順で顔検出を行うことにより、顔追跡を行え
ばよい。その場合、隣接するフレーム間での顔の位置の
移動は、比較的僅かであるから、図3に示すように、各
フレームにおける顔検出は、前回のフレームで肌色領域
が検出された領域F1の近傍の矩形領域F内のみで行う
ことにより、顔検出の所要時間を一層短縮することがで
きる。なお、図3中F2は今回のフレームにおいて検出
された肌色領域を示す。When face detection and tracking device 1 performs face detection based on a color still image, it can be detected by the above procedure, but when face tracking based on a color moving image is performed, color image input means 2 is used. Face tracking may be performed by performing face detection in each of the plurality of frames input to the skin color region detection unit 3 and the dark region detection unit 4 in the above procedure. In that case, the movement of the position of the face between the adjacent frames is relatively small. Therefore, as shown in FIG. 3, the face detection in each frame is performed in the area F1 in which the skin color area is detected in the previous frame. By performing only in the neighboring rectangular area F, the time required for face detection can be further shortened. Note that F2 in FIG. 3 indicates the skin color region detected in the current frame.
【0035】図4は顔検出及び追跡装置1による顔検出
または顔追跡の手順を示すフローチャートであり、上記
した説明と重複するので、詳述しないが、S1乃至S9
の各ステップが順次実行される。S9では、顔の位置が
表示されるが、これは用途が、例えば、ビル監視であれ
ば、検出された人の顔が監視用モニタに表示され、用途
がテレビ会議であれば、会議用のモニタに表示されるも
のである。FIG. 4 is a flow chart showing a procedure of face detection or face tracking by the face detection and tracking apparatus 1. Since it overlaps with the above description, it will not be described in detail, but S1 to S9.
Each step of is executed sequentially. In S9, the position of the face is displayed. If the application is, for example, building monitoring, the face of the detected person is displayed on the monitor for monitoring, and if the application is a video conference, it is displayed for the conference. It is what is displayed on the monitor.
【0036】なお、本実施の形態の顔検出及び追跡装置
1により顔追跡を行いながら、モニタ等に顔の位置を表
示する場合、撮像手段21、例えば、ビデオカメラは、
撮影方向及びズームの自動制御が可能なものを使用する
ことが好ましい。すなわち、ビデオカメラを水平面内で
の回転(パン)及び上下の首振り(チルト)の可能なも
のとし、カラー画像内での顔の位置の移動に応じて、ビ
デオカメラの撮影方向を変化させることにより、カラー
画像内の顔が常時当該カラー画像の中央部付近に位置す
る制御するとともに、カラー画像内の肌色領域の面積の
変化に応じてズームを変化させることにより、カラー画
像内の肌色領域の面積が常時一定の範囲内となるように
することが好ましい。When the face detection and tracking device 1 of the present embodiment performs face tracking while displaying the position of the face on a monitor or the like, the image pickup means 21, for example, a video camera,
It is preferable to use one that can automatically control the shooting direction and zoom. That is, the video camera should be able to rotate (pan) and swing vertically (tilt) in the horizontal plane, and change the shooting direction of the video camera according to the movement of the face position in the color image. By controlling the face in the color image always near the center of the color image by changing the zoom according to the change in the area of the skin color region in the color image, It is preferable that the area is always within a certain range.
【0037】なお、本発明者は、上記顔検出及び追跡装
置1を用いて人の顔を検出する実験を行った。実験にお
いては、カラー画像入力手段2としてCCDビデオカメ
ラを使用するとともに、顔検出及び追跡装置1としてパ
ーソナルコンピュータ(Gateway2000)を使用した。ま
た、カラー画像ボードはLinx DT3153 を使用した。入力
画像はフルカラーで、画像サイズは320 ×240 ピクセル
であった。The inventor conducted an experiment to detect a human face using the face detection and tracking device 1. In the experiment, a CCD video camera was used as the color image input means 2 and a personal computer (Gateway 2000) was used as the face detection and tracking device 1. The color image board used was Linx DT3153. The input image was full color and the image size was 320 x 240 pixels.
【0038】上記実験では、顔を斜め右または斜め左に
向けたり、顔とビデオカメラの距離を変えたり、複数の
顔を同時に撮影したり、眼鏡を着用したり、種々の条件
の下で顔検出を行ったが、顔が検出されなかったのは、
41人中2人のみであった。これら2人は頭髪が目にか
かっていたので原因であった。また、顔検出に要する時
間は0.2秒程度、顔追跡に要する時間は0.1秒程度
で、従来より大幅に短縮することができた。In the above experiment, the face is directed diagonally right or left, the distance between the face and the video camera is changed, a plurality of faces are photographed simultaneously, glasses are worn, and the face is exposed under various conditions. I detected it, but the face was not detected,
Only 2 out of 41 people. The cause was that these two had hair on their eyes. Further, the time required for face detection is about 0.2 seconds, and the time required for face tracking is about 0.1 seconds, which is significantly shorter than in the past.
【0039】なお、本実施の形態で説明した顔検出及び
追跡方法をパーソナルコンピュータ等を用いて実行する
ためのコンピュータプログラムを、CD−ROM等の各
種記録媒体に記録して販売、使用等する行為は、当然に
本発明の実施範囲内に含まれるものである。It should be noted that the computer program for executing the face detection and tracking method described in the present embodiment by using a personal computer or the like is recorded in various recording media such as a CD-ROM and sold or used. Are naturally included within the scope of implementation of the present invention.
【0040】[0040]
【発明の効果】以上説明したように、本発明の請求項1
の顔検出方法は、カラー画像入力手段から入力され、R
GB表色系で表されるカラー画像をxy表色系へと変換
し、事前に用意した肌色サンプル画像から決定され、上
記xy表色系における色xについての肌色分布を表すガ
ウス関数に従って上記カラー画像から肌色領域を抽出す
るとともに上記カラー画像から明るさがあるしきい値以
下の暗い領域を抽出し、上記肌色領域と面積が略等しく
且つ重心が一致する窓を設定し、該窓を上下に2分割す
るとともに上半分をさらに左右に2分割して、左上窓、
右上窓、及び下部窓に分割し、上記左上窓、上記右上
窓、及び上記下部窓内に各々上記暗い領域が存在して且
つ該暗い領域の重心が各々上記左上窓、上記右上窓、及
び上記下部窓内に位置しており、しかも上記肌色領域内
に一定の面積比で上記暗い領域を検出したとき、人の顔
であると判定するようにしたので、従来のカラー画像を
用いた顔検出の場合と異なり、予め準備した顔テンプレ
ートとの照合計算を多くの位置で繰り返し行うような必
要がなく、検出に要する時間を大幅に短縮することがで
きるので実時間による顔検出が可能となるとともに、肌
色(顔の色)領域内に暗い領域(目の周辺、口の周辺
等)がある一定の面積比で含まれているときに顔である
と判定するようにしたので、検出の精度は充分に高いも
のとなり、顔の大きさや向き、首を傾けているか否か等
により検出の精度が低下することもなく、カラー画像内
に複数の顔が含まれている場合でも検出が可能である。
また、肌色領域に対する暗い領域の面積比にある一定幅
を与えておけば、眼鏡の着用の有無にかかわらず、顔の
検出が正確に行えるようになる。As described above, according to the first aspect of the present invention.
The face detection method of R
Converts color images represented in GB color system into xy color system
Then, it is determined from the skin color sample image prepared in advance, and
Note that the xy color coordinate system represents the skin color distribution for color x.
The skin color area is extracted from the color image according to the Us function and the dark area whose brightness is lower than a certain threshold is extracted from the color image, and the area is almost equal to the skin color area.
And set a window whose center of gravity is the same, and divide the window into two up and down.
At the same time, the upper half is further divided into two parts, left and right,
Divided into upper right window and lower window, above left window, above right window
The dark area is present in the window and in the lower window, and
The center of gravity of the dark area is the upper left window, the upper right window, and
And the lower window, and when the dark area is detected in the skin color area at a constant area ratio, it is determined that the face is a human face. Therefore, a conventional color image is used. Unlike the case of face detection, it is not necessary to repeatedly perform collation calculation with a face template prepared in advance at many positions, and the time required for detection can be significantly shortened, so face detection in real time is possible. In addition, when a dark area (around the eyes, around the mouth, etc.) is included in the skin color (face color) area at a certain area ratio, it is determined to be a face. The accuracy is sufficiently high, and the detection accuracy does not decrease depending on the size and orientation of the face, whether or not the head is tilted, etc., and it is possible to detect even if multiple faces are included in the color image. Is.
Further, if a certain width is given to the area ratio of the dark area to the skin color area, the face can be accurately detected regardless of whether or not the eyeglasses are worn.
【0041】また、肌色領域内に暗い領域(目の周辺、
口の周辺等)があることを判定の対象とし、肌色領域外
に位置する頭髪に関する情報は顔検出には用いないこと
としたので、頭髪の量やヘアースタイルに影響されずに
顔検出を行うことができる。さらに、肌色領域の検出に
ガウス関数を用いて、ガウス関数の中心までの距離があ
るしきい値未満であれば肌色であると判定するようにす
るとともに、暗い領域の検出も明るさ(輝度)があるし
きい値以下であるかに基づいて行うようにしたので、検
出に用いるカラー画像の明るさや顔の色の個人差等に影
響されずに顔検出が正確に行える。In addition, a dark area (around the eyes,
Since it is determined that there is something around the mouth, etc., and information about the hair located outside the skin color area is not used for face detection, face detection is performed without being affected by the amount of hair or hair style. be able to. Furthermore, a Gaussian function is used to detect the flesh-colored area, and if the distance to the center of the Gaussian function is less than a certain threshold value, it is determined to be flesh-colored, and the dark area is also detected as brightness (luminance). Since it is performed based on whether or not the threshold value is less than or equal to a certain threshold, face detection can be accurately performed without being affected by the brightness of a color image used for detection, individual differences in face color, and the like.
【0042】請求項2の顔追跡方法は、請求項1記載の
方法による顔検出を上記カラー画像の複数のフレームで
連続的に行うことにより人の顔の移動を追跡するように
したので、動画中での顔追跡を実時間で正確に行えるよ
うになる。In the face tracking method according to the second aspect, the movement of the human face is tracked by continuously performing the face detection by the method according to the first aspect in a plurality of frames of the color image. Face tracking inside can be done accurately in real time.
【0043】請求項3の顔追跡方法は、請求項2記載の
方法による顔追跡を行うに当たり、各フレームにおける
顔検出を前回のフレームで顔が検出された領域の近傍の
領域のみで行うようにしたものであり、通常、隣接する
フレーム間では顔の位置の移動は僅かであるから、新た
なフレームでは、前回のフレームで顔が検出された領域
の近傍で検出を行うことにより顔の検出ができ、このよ
うに、検出領域を前回のフレームで顔が検出された領域
の近傍に限定することにより、検出に要する時間を一層
短縮することができるので、実時間での顔追跡に好適で
ある。In the face tracking method according to the third aspect, when performing the face tracking by the method according to the second aspect, the face detection in each frame is performed only in the area near the area where the face is detected in the previous frame. Since the movement of the position of the face is usually small between the adjacent frames, the face can be detected by performing detection in the vicinity of the area where the face was detected in the previous frame in the new frame. Therefore, by limiting the detection area to the vicinity of the area where the face is detected in the previous frame, the time required for detection can be further shortened, which is suitable for face tracking in real time. .
【0044】請求項4の記録媒体は、請求項1乃至3の
いずれか記載の顔検出方法または顔追跡方法を実行する
ためのプログラムを記録したコンピュータ読取可能な記
録媒体(CD−ROM等)であり、係る記録媒体からコ
ンピュータに上記プログラムをインストールすることに
より、本発明に係る顔検出方法または顔追跡方法の実行
が可能となる。A recording medium according to a fourth aspect is a computer-readable recording medium (CD-ROM or the like) recording a program for executing the face detecting method or the face tracking method according to any one of the first to third aspects. The face detection method or the face tracking method according to the present invention can be executed by installing the program from the recording medium to the computer.
【0045】請求項5の顔検出装置は、カラー画像入力
手段から入力され、RGB表色系で表されるカラー画像
をxy表色系へと変換し、事前に用意した肌色サンプル
画像から決定され、上記xy表色系における色xについ
ての肌色分布を表すガウス関数に従って上記カラー画像
から肌色領域を抽出する肌色領域検出手段と、上記カラ
ー画像から明るさがあるしきい値以下の暗い領域を抽出
する暗い領域検出手段と、上記肌色領域検出手段で検出
された肌色領域の面積を求める肌色領域分析手段と、上
記暗い領域検出手段で検出された上記暗い領域の面積を
求める暗い領域分析手段と、肌色領域と面積が略等しく
且つ重心が一致する窓を設定し、該窓を上下に2分割す
るとともに、上半分をさらに上下に2分割して、上記左
上窓、上記右上窓、及び上記下部窓に分割し、上記左上
窓、上記右上窓、及び上記下部窓内に各々上記暗い領域
が存在して且つ該暗い領域の重心が各々上記左上窓、上
記右上窓、及び上記下部窓内に位置しており、しかも肌
色領域分析手段と暗い領域分析手段との分析結果に基づ
いて上記肌色領域内に暗い領域が存在し且つその面積比
が一定範囲内であるときに人の顔であると判定する顔判
定手段とを備えたものであるから、従来の顔テンプレー
トを用いた顔検出方法と比べて、検出に要する時間を大
幅に短縮することができるので実時間による顔検出が可
能となるとともに、検出の精度は充分に高いものとな
り、顔の大きさや向き、首を傾けているか否かや眼鏡の
着用の有無等により検出の精度が低下することもなく、
カラー画像内に複数の顔が含まれている場合でも検出が
可能である。A face detecting apparatus according to a fifth aspect of the present invention is a color image input from a color image input means and represented by an RGB color system.
Is converted to the xy color system and the skin color sample prepared in advance
For the color x in the xy color system determined from the image,
The above color image according to the Gaussian function that represents the distribution of all skin colors
From the skin color area detecting means for extracting a skin color area from, a dark area detecting means for extracting a dark area whose brightness is below a certain threshold from the color image, and an area of the skin color area detected by the skin color area detecting means. The flesh color area analyzing means to be obtained, the dark area analyzing means to obtain the area of the dark area detected by the dark area detecting means, and the flesh color area and the area are substantially equal to each other.
And set a window whose center of gravity is the same, and divide the window into two up and down.
In addition, the upper half is further divided into upper and lower parts,
Divided into upper window, upper right window, and lower window, above left window
The dark areas in the window, the upper right window, and the lower window, respectively.
Is present and the center of gravity of the dark area is the upper left window and upper window, respectively.
In the upper right window and the lower window , a dark area exists in the skin color area based on the analysis results of the skin color area analysis means and the dark area analysis means, and its area Since it is provided with a face determination unit that determines that the face is a human face when the ratio is within a certain range, the time required for detection can be significantly increased as compared with the face detection method using the conventional face template. Since it can be shortened, face detection can be performed in real time, and the detection accuracy is sufficiently high.It can be detected depending on the size and orientation of the face, whether or not the neck is tilted, whether glasses are worn, etc. The accuracy does not decrease,
It is possible to detect even when a plurality of faces are included in the color image.
【0046】また、肌色領域内に暗い領域(目の周辺、
口の周辺等)があることを判定の対象とし、肌色領域外
に位置する頭髪に関する情報は顔検出には用いないこと
としたので、頭髪の量やヘアースタイルに影響されずに
顔検出を行うことができ、且つ肌色領域の検出にガウス
関数を用いて、ガウス関数の中心までの距離があるしき
い値未満であれば肌色であると判定するようにするとと
もに、暗い領域の検出も明るさがあるしきい値以下であ
るかに基づいて行うようにしたので、検出に用いるカラ
ー画像の明るさや顔の色の個人差等に影響されずに顔検
出が正確に行える。In addition, a dark area (around the eyes,
Since it is determined that there is something around the mouth, etc., and information about the hair located outside the skin color area is not used for face detection, face detection is performed without being affected by the amount of hair or hair style. If the distance to the center of the Gaussian function is less than a certain threshold, it is determined that the color is flesh color, and the dark area is also bright. Since it is performed based on whether or not the threshold value is less than or equal to a certain threshold, face detection can be accurately performed without being affected by the brightness of a color image used for detection, individual differences in face color, and the like.
【0047】請求項6の顔検出装置は、請求項5の構成
において、上記肌色領域分析手段及び上記暗い領域分析
手段は各々肌色領域及び暗い領域の重心を求める一方、
上記顔判定手段は肌色領域の重心を中心とし且つ肌色領
域の面積と略等しい面積の矩形窓を上記肌色領域上に設
定し、且つこの矩形窓を左上窓及び右上窓からなる上部
窓と下部窓とに分割して、上記左上窓、右上窓及び下部
窓内に各々上記暗い領域の重心が含まれるとともに上記
左上窓、右上窓及び下部窓内の肌色領域に対する暗い領
域の面積比が各々一定範囲内であるときに人の顔である
と判定するものであり、人の顔の中の暗い領域である左
右の目の周辺(黒目及び眉毛)と口の周辺(口及び唇)
とに対して各々上記左上窓、右上窓及び下部窓を設定
し、左上窓、右上窓及び下部窓内で暗い領域が各々一定
の面積比で含まれているか否かに基づいて人の顔である
か否かを判定するようにしたので、これら目及び口の有
無に基づいて顔検出を正確に行えるようになる。According to a sixth aspect of the present invention, in the structure of the fifth aspect, the flesh color area analyzing means and the dark area analyzing means determine the barycenters of the flesh color area and the dark area, respectively.
The face determining means sets a rectangular window centered on the center of gravity of the flesh color area and having an area substantially equal to the area of the flesh color area on the flesh color area, and this rectangular window is an upper window and a lower window consisting of an upper left window and an upper right window. And the center of gravity of the dark area is included in each of the upper left window, the upper right window, and the lower window, and the area ratio of the dark area to the skin color area in the upper left window, the upper right window, and the lower window is within a certain range. When it is inside, it is determined that it is the human face, and it is the dark areas in the human face, around the left and right eyes (black eyes and eyebrows) and around the mouth (mouth and lips).
The upper left window, the upper right window and the lower window are set for and, respectively, and the human face is determined based on whether or not the dark areas are included in the upper left window, the upper right window and the lower window at a constant area ratio. Since it is determined whether or not there is a face, face detection can be accurately performed based on the presence or absence of these eyes and mouth.
【0048】請求項7の顔検出装置は、請求項6の構成
において、上記左上窓または右上窓の少なくとも一方に
暗い領域の重心が含まれないとき、上記顔判定手段が左
上窓及び右上窓を上記肌色領域に対して左右方向へスラ
イドさせて上記判定を行うようにしたので、例えば、カ
ラー画像内で人の顔が斜め横向きになっていたり、首が
傾いていて、左目及び右目に対応した暗い領域の重心が
顔の左右にずれていた場合でも、上記左上窓及び右上窓
を上記肌色領域に対して左右へスライドさせることによ
り、顔検出が行えるようになるので、顔の向きや首の傾
き等に影響されずに人の顔を正確に検出できるようにな
る。According to a seventh aspect of the present invention, in the configuration of the sixth aspect, when at least one of the upper left window and the upper right window does not include the center of gravity of a dark area, the face determination means opens the upper left window and the upper right window. Since the determination is made by sliding the skin color region in the left-right direction, for example, the face of a person is diagonally sideways in the color image, or the neck is tilted to correspond to the left and right eyes. Even if the center of gravity of the dark area is shifted to the left and right of the face, it is possible to detect the face by sliding the upper left window and the upper right window to the left and right with respect to the skin color area. The person's face can be accurately detected without being affected by the inclination or the like.
【0049】請求項8の顔追跡装置は、請求項5乃至7
のいずれかの構成において、請求項5乃至7のいずれか
の顔検出装置による顔検出を複数のフレームで連続的に
行うことにより顔の移動を追跡するようにしたので、動
画中での顔追跡を実時間で正確に行えるようになる。こ
の場合、動画中での人の顔の位置の移動に応じて、カラ
ー画像入力手段における撮像手段の向き(撮像方向)を
自動的に変化させることにより、動画中での顔の位置が
常時、動画の中央部付近に位置するように制御すること
が好ましい。A face tracking device according to claim 8 is the face tracking device according to any one of claims 5 to 7.
In any one of the above configurations, the face movement is tracked by continuously performing the face detection by the face detection apparatus according to any one of claims 5 to 7 in a plurality of frames. Can be done accurately in real time. In this case, the position of the face in the moving image is constantly changed by automatically changing the direction (imaging direction) of the image pickup unit in the color image input unit according to the movement of the position of the person's face in the moving image. It is preferable to control so as to be located near the center of the moving image.
【図1】本発明の実施の形態に係る顔検出及び追跡装置
を示す概略ブロック図。FIG. 1 is a schematic block diagram showing a face detection and tracking device according to an embodiment of the present invention.
【図2】上記顔検出及び追跡装置のより詳細な構成を示
すブロック図。FIG. 2 is a block diagram showing a more detailed configuration of the face detection and tracking device.
【図3】上記顔検出及び追跡装置で顔追跡を行う場合の
各フレームにおける顔の検出範囲を示す説明図。FIG. 3 is an explanatory diagram showing a face detection range in each frame when face tracking is performed by the face detection and tracking device.
【図4】上記顔検出及び追跡装置による処理手順を示す
フローチャート。FIG. 4 is a flowchart showing a processing procedure by the face detection and tracking device.
1 顔検出及び追跡装置 2 カラー画像入力手段 3 肌色領域検出手段 4 暗い領域検出手段 5 肌色領域分析手段 6 暗い領域分析手段 7 顔判定手段 1 Face detection and tracking device 2 Color image input means 3 Skin color area detection means 4 Dark area detection means 5 Skin color area analysis means 6 Dark area analysis means 7 Face determination means
───────────────────────────────────────────────────── フロントページの続き 特許法第30条第1項適用申請有り 平成10年2月17日発 行の日経産業新聞に掲載。 (56)参考文献 特開 平6−153047(JP,A) 特開 平6−303601(JP,A) 特開 平7−311833(JP,A) 特開 平9−81732(JP,A) 特開 平7−44706(JP,A) 特開 平7−29014(JP,A) 特開 平9−44685(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06T 1/00 ─────────────────────────────────────────────────── --Continued from the front page Application for application of Article 30, Paragraph 1 of the Patent Act Yes, published in Nikkei Sangyo Shimbun, published on February 17, 1998. (56) References JP-A-6-153047 (JP, A) JP-A-6-303601 (JP, A) JP-A-7-311833 (JP, A) JP-A-9-81732 (JP, A) Kaihei 7-44706 (JP, A) JP 7-29014 (JP, A) JP 9-44685 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G06T 7 / 00-7/60 G06T 1/00
Claims (8)
B表色系で表されるカラー画像をxy表色系へと変換
し、事前に用意した肌色サンプル画像から決定され、上
記xy表色系における色xについての肌色分布を表すガ
ウス関数に従って上記カラー画像から肌色領域を抽出す
るとともに上記カラー画像から明るさがあるしきい値以
下の暗い領域を抽出し、上記肌色領域と面積が略等しく且つ重心が一致する窓を
設定し、該窓を上下に2分割するとともに上半分をさら
に左右に2分割して、左上窓、右上窓、及び下部窓に分
割し、 上記左上窓、上記右上窓、及び上記下部窓内に各々上記
暗い領域が存在して且つ該暗い領域の重心が各々上記左
上窓、上記右上窓、及び上記下部窓内に位置しており、
しかも 上記肌色領域内に一定の面積比で上記暗い領域を
検出したとき、人の顔であると判定することを特徴とす
る顔検出方法。1. An RG input from a color image input means.
Converts a color image represented by B color system to xy color system
Then, it is determined from the skin color sample image prepared in advance, and
Note that the xy color coordinate system represents the skin color distribution for color x.
Accordance mouse function extracts the threshold or less in the dark areas with the brightness of the color image extracts a skin color region from the color image, the skin color area and the area substantially equal and the center of gravity coincides window
Set the window and divide the window into upper and lower parts and expose the upper half.
It is divided into two parts, left and right, and divided into an upper left window, an upper right window, and a lower window.
Split into the upper left window, the upper right window, and the lower window, respectively.
There is a dark area and the center of gravity of the dark area is on the left side.
Located in the upper window, the upper right window, and the lower window,
Moreover , when the dark area is detected in the skin color area at a constant area ratio, it is determined that the face is a human face.
カラー画像の複数のフレームで連続的に行うことにより
人の顔の移動を追跡することを特徴とする顔追跡方法。2. A face tracking method characterized by tracking the movement of a person's face by continuously performing face detection by the method according to claim 1 in a plurality of frames of the color image.
に当たり、各フレームにおける顔検出を前回のフレーム
で顔が検出された領域の近傍の領域のみで行うことを特
徴とする顔追跡方法。3. The face tracking method according to claim 2, wherein face detection in each frame is performed only in a region near a region where a face is detected in a previous frame.
方法または顔追跡方法を実行するためのプログラムを記
録したコンピュータ読取可能な記録媒体。4. A computer-readable recording medium in which a program for executing the face detecting method or the face tracking method according to claim 1 is recorded.
B表色系で表されるカラー画像をxy表色系へと変換
し、事前に用意した肌色サンプル画像から決定され、上
記xy表色系における色xについての肌色分布を表すガ
ウス関数に従って上記カラー画像から肌色領域を抽出す
る肌色領域検出手段と、上記カラー画像から明るさがあ
るしきい値以下の暗い領域を抽出する暗い領域検出手段
と、上記肌色領域検出手段で検出された肌色領域の面積
を求める肌色領域分析手段と、上記暗い領域検出手段で
検出された上記暗い領域の面積を求める暗い領域分析手
段と、肌色領域と面積が略等しく且つ重心が一致する窓
を設定し、該窓を上下に2分割するとともに、上半分を
さらに上下に2分割して、上記左上窓、上記右上窓、及
び上記下部窓に分割し、上記左上窓、上記右上窓、及び
上記下部窓内に各々上記暗い領域が存在して且つ該暗い
領域の重心が各々上記左上窓、上記右上窓、及び上記下
部窓内に位置しており、しかも肌色領域分析手段と暗い
領域分析手段との分析結果に基づいて上記肌色領域内に
暗い領域が存在し且つその面積比が一定範囲内であると
きに人の顔であると判定する顔判定手段とを備えたこと
を特徴とする顔検出装置。5. An RG input from a color image input means.
Converts a color image represented by B color system to xy color system
Then, it is determined from the skin color sample image prepared in advance, and
Note that the xy color coordinate system represents the skin color distribution for color x.
A flesh color region detecting means for extracting a flesh color region from the color image in accordance with a Us function, a dark region detecting means for extracting a dark region having a brightness equal to or lower than a threshold value from the color image, and the flesh color region detecting means. Skin color area analysis means for obtaining the area of the skin color area , dark area analysis means for obtaining the area of the dark area detected by the dark area detection means, and a window whose area is substantially equal to that of the skin color area
Is set, the window is divided into upper and lower parts, and the upper half is
It is further divided into two parts, the upper left window, the upper right window, and
And the lower window, the upper left window, the upper right window, and
The dark areas are present in the lower window and are dark.
The center of gravity of the area is the upper left window, the upper right window, and the lower
When a dark region exists in the flesh color region based on the analysis result of the flesh color region analysis unit and the dark region analysis unit and the area ratio is within a certain range, A face detection apparatus comprising: a face determination unit that determines a face.
分析手段は各々肌色領域及び暗い領域の重心を求める一
方、上記顔判定手段は肌色領域の重心を中心とし且つ肌
色領域の面積と略等しい面積の矩形窓を上記肌色領域上
に設定し、且つこの矩形窓を左上窓及び右上窓からなる
上部窓と下部窓とに分割して、上記左上窓、右上窓及び
下部窓内に各々上記暗い領域の重心が含まれるとともに
上記左上窓、右上窓及び下部窓内の肌色領域に対する暗
い領域の面積比が各々一定範囲内であるときに人の顔で
あると判定することを特徴とする請求項5記載の顔検出
装置。6. The skin color area analyzing means and the dark area analyzing means respectively obtain the center of gravity of the skin color area and the dark area, respectively, while the face determining means has an area centered on the center of gravity of the skin color area and substantially equal to the area of the skin color area. Rectangular window is set on the flesh-colored area, and the rectangular window is divided into an upper window and a lower window consisting of an upper left window and an upper right window, and the dark areas are respectively provided in the upper left window, the upper right window and the lower window. 6. It is determined to be a human face when the center of gravity is included and the area ratio of the dark area to the skin color area in each of the upper left window, the upper right window and the lower window is within a certain range. Face detection device described.
方に暗い領域の重心が含まれないとき、上記顔判定手段
が左上窓及び右上窓を上記肌色領域に対して左右方向へ
スライドさせて上記判定を行うことを特徴とする請求項
6記載の顔検出装置。7. When the center of gravity of a dark area is not included in at least one of the upper left window or the upper right window, the face determining means slides the upper left window and the upper right window in the left-right direction with respect to the skin color area to perform the determination. The face detection device according to claim 6, wherein
による顔検出を複数のフレームで連続的に行うことによ
り顔の移動を追跡することを特徴とする顔追跡装置。8. A face tracking device for tracking the movement of a face by continuously performing face detection by the face detecting device according to claim 5 in a plurality of frames.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11636998A JP3459950B2 (en) | 1997-04-30 | 1998-04-27 | Face detection and face tracking method and apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14839597 | 1997-04-30 | ||
JP9-148395 | 1997-04-30 | ||
JP11636998A JP3459950B2 (en) | 1997-04-30 | 1998-04-27 | Face detection and face tracking method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1115979A JPH1115979A (en) | 1999-01-22 |
JP3459950B2 true JP3459950B2 (en) | 2003-10-27 |
Family
ID=26454712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11636998A Expired - Fee Related JP3459950B2 (en) | 1997-04-30 | 1998-04-27 | Face detection and face tracking method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3459950B2 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2349460B (en) * | 1999-04-29 | 2002-11-27 | Mitsubishi Electric Inf Tech | Method of representing colour images |
JP4509280B2 (en) * | 2000-02-08 | 2010-07-21 | オリンパス株式会社 | camera |
JP4233723B2 (en) | 2000-02-28 | 2009-03-04 | 本田技研工業株式会社 | Obstacle detection device, obstacle detection method, and recording medium recording an obstacle detection program |
JP4590717B2 (en) * | 2000-11-17 | 2010-12-01 | ソニー株式会社 | Face identification device and face identification method |
JP2005202562A (en) * | 2004-01-14 | 2005-07-28 | Konica Minolta Photo Imaging Inc | Image processing method, image processor and image processing program |
JP4317465B2 (en) | 2004-02-13 | 2009-08-19 | 本田技研工業株式会社 | Face identification device, face identification method, and face identification program |
JP2006293732A (en) * | 2005-04-12 | 2006-10-26 | Hitachi Ltd | Information processor, image sensor, biometrics system, and biometrics program for information processor |
JP4217698B2 (en) | 2005-06-20 | 2009-02-04 | キヤノン株式会社 | Imaging apparatus and image processing method |
JP4431532B2 (en) | 2005-09-16 | 2010-03-17 | 富士フイルム株式会社 | Target image position detecting device and method, and program for controlling target image position detecting device |
JP4478093B2 (en) | 2005-10-17 | 2010-06-09 | 富士フイルム株式会社 | Object image retrieval apparatus, digital camera, and control method thereof |
JP4921486B2 (en) * | 2005-11-30 | 2012-04-25 | シーイング・マシーンズ・プロプライエタリー・リミテッド | Visual tracking of glasses in a system that visually tracks head and eyes |
JP4845715B2 (en) | 2006-12-22 | 2011-12-28 | キヤノン株式会社 | Image processing method, image processing apparatus, program, and storage medium |
JP4799501B2 (en) * | 2007-07-27 | 2011-10-26 | 富士フイルム株式会社 | Image capturing apparatus, image capturing apparatus control method, and program |
JP4726251B2 (en) * | 2008-09-18 | 2011-07-20 | キヤノン株式会社 | Imaging apparatus and image processing method |
JP5471130B2 (en) * | 2009-07-31 | 2014-04-16 | カシオ計算機株式会社 | Image processing apparatus and method |
JP6614658B2 (en) * | 2015-12-24 | 2019-12-04 | Necソリューションイノベータ株式会社 | Color recognition apparatus, color recognition method, and program |
-
1998
- 1998-04-27 JP JP11636998A patent/JP3459950B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1115979A (en) | 1999-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3459950B2 (en) | Face detection and face tracking method and apparatus | |
US7003135B2 (en) | System and method for rapidly tracking multiple faces | |
JP4251719B2 (en) | Robust tracking system for human faces in the presence of multiple persons | |
JP3938257B2 (en) | Method and apparatus for detecting a face-like area and observer tracking display | |
KR100274999B1 (en) | Human face tracking system | |
US6556708B1 (en) | Technique for classifying objects within an image | |
US6141434A (en) | Technique for processing images | |
JP3761059B2 (en) | Method and apparatus for detecting human face and observer tracking display | |
US8687887B2 (en) | Image processing method, image processing apparatus, and image processing program | |
US6421462B1 (en) | Technique for differencing an image | |
JP4597391B2 (en) | Facial region detection apparatus and method, and computer-readable recording medium | |
Hongo et al. | Focus of attention for face and hand gesture recognition using multiple cameras | |
CN101390128B (en) | Detecting method and detecting system for positions of face parts | |
WO2006008944A1 (en) | Image processor, image processing method, image processing program, and recording medium on which the program is recorded | |
JPH0877334A (en) | Automatic feature point extracting method for face image | |
US7460705B2 (en) | Head-top detecting method, head-top detecting system and a head-top detecting program for a human face | |
JP3490910B2 (en) | Face area detection device | |
CN101398896A (en) | Device and method for extracting color characteristic with strong discernment for image forming apparatus | |
CN112926367B (en) | Living body detection equipment and method | |
WO2005055144A1 (en) | Person face jaw detection method, jaw detection system, and jaw detection program | |
KR102194511B1 (en) | Representative video frame determination system and method using same | |
JP3578321B2 (en) | Image normalizer | |
JP4831344B2 (en) | Eye position detection method | |
CN111199203A (en) | Motion capture method and system based on handheld device | |
JPH10111943A (en) | In-image front person image extracting method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |