JP5508534B2 - シーン切替検出 - Google Patents

シーン切替検出 Download PDF

Info

Publication number
JP5508534B2
JP5508534B2 JP2012527954A JP2012527954A JP5508534B2 JP 5508534 B2 JP5508534 B2 JP 5508534B2 JP 2012527954 A JP2012527954 A JP 2012527954A JP 2012527954 A JP2012527954 A JP 2012527954A JP 5508534 B2 JP5508534 B2 JP 5508534B2
Authority
JP
Japan
Prior art keywords
picture
current picture
scene switching
sum
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012527954A
Other languages
English (en)
Other versions
JP2013504256A (ja
Inventor
リー、ファン−ジュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc, Sony Computer Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2013504256A publication Critical patent/JP2013504256A/ja
Application granted granted Critical
Publication of JP5508534B2 publication Critical patent/JP5508534B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明の実施の形態はビデオ画像のデジタル符号化に関し、特に、ビデオ画像の符号化の際のシーン切替検出に関する。
本出願は、2009年9月2日に出願された「シーン切替検出」と題する米国出願第12/553,069号の優先権を主張し、開示内容全体を参照によりここに完全に組み入れる。
本出願は、同一出願人による同時係属中の米国特許出願12/553,070(「ビデオ符号化のためのピクチャレベル比率制御」、2009年9月2日出願、代理人ドケット番号:SCEA08073US00)に関連し、開示内容全体を参照によりここに完全に組み入れる。
本出願は、同一出願人による同時係属中の米国特許出願12/553,073(「並列デジタルピクチャ符号化」、2009年9月2日出願、代理人ドケット番号:SCEA08077US00)に関連し、開示内容全体を参照によりここに完全に組み入れる。
本出願は、同一出願人による同時係属中の米国特許出願12/553,075(「ビデオ符号化において高速な動き予測を達成するための閾値の利用および早期中止」、2009年9月2日出願、代理人ドケット番号:SCEA08078US00)に関連し、開示内容全体を参照によりここに完全に組み入れる。
デジタル信号圧縮は、多くのマルチメディアアプリケーションや装置で広く用いられている。符号化器/復号器(コーデック)を用いるデジタル信号圧縮によって、音声やビデオ信号のようなストリーミングメディアをインターネットを介して送信したり、コンパクトディスクに格納したりすることができるようになる。H.261、H263、DV、MPEG−1、MPEG−2、MPEG−4、VC1、およびAVC(H.264)を含むデジタルビデオ圧縮における多くの異なる標準が出現している。これらの標準は、他のビデオ圧縮技術と同様に、あるビデオフレームピクチャと連続するピクチャとの間における空間的および時間的な冗長性を取り除くことによって、そのビデオフレームピクチャを効率良く表現しようとする。このような圧縮標準を用いることを通して、ビデオコンテンツは高度に圧縮されたビデオビットで伝えることが可能となり、それゆえ効率よくディスクに格納したりネットワークを介して送信したりすることができる。
MPEG−4 AVC(Advanced Video Coding;H.264としても知られる)はビデオ圧縮標準であり、先行する標準よりも明らかに高い圧縮を提供する。H.264標準は、従前のMPEG−2標準の最大2倍の圧縮を提供することが期待される。H.264標準は、視覚的な質の向上を提供することも期待されている。その結果、ますます多くのビデオコンテンツがAVC(H.264)で符号ストリームの形態で配信されている。ふたつの競合するDVDフォーマット、すなわちHD−DVDフォーマットとBlu−Ray(登録商標)ディスクフォーマットは、H.264/AVCのハイプロファイルデコードを任意のプレイヤの機能としてサポートしている。AVC(H.264)符号化は、"Draft of Version 4 of H.264/AVC (ITU-T Recommendation H.264 and ISO/IEC 14496-10 (MPEG-4 part 10) Advanced Video Coding)" by Gary Sullivan, Thomas Wiegand and Ajay Luthra, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6), 14th Meeting: Hong Kong, CH 18-21 January, 2005, に詳細に記載されており、あらゆる目的のために開示内容全体を参照によりここに完全に組み入れる。
MPEG−2、MPEG−4、およびH.264のような最新のビデオ符号化/復号(コーデック)は、一般にビデオフレームを、イントラフレーム、プレディクティブフレーム、およびバイプレディクティブフレームとして知られる3つの基本的な種類に分割する。これらの3つのフレームはそれぞれ、通常はIフレーム、Pフレーム、およびBフレームと呼ばれる。
Iフレームは、Iフレーム自身を除くと、いかなるピクチャも参照することなく符号化される。Iフレームは、ランダムアクセスおよび他のPフレームまたはBフレームを復号するために用いられる。Iフレームは、ランダムアクセスのポイントを生成するため(デコーダに所与のピクチャ位置において0から適切に復号を開始できるようにするため)にエンコーダによって生成されてもよい。Iフレームは、画像の細部の違いが、効果的なPまたはBフレームを生成するのに妨げとなるときに生成されてもよい。Iフレームは完全なピクチャを含むので、Iフレームは通常、PフレームやBフレームよりも符号化するために多くのビットが必要となる。
Pフレームを復号するためには、前もって他の1またはいくつかのピクチャの復号が必要となる。Pフレームは通常、Iフレームの符号化に要するビットよりも少ないビットを要する。Pフレームは、復号の順序において先にあるIフレームに対する相違点に関する符号化された情報を含む。Pフレームは通常、GoP(Group of Pictures)内の先行するIフレームを参照する。Pフレームは、画像データと動きベクトルの変化との両方、およびそれらふたつの組み合わせを含む。MPEG−2のようないくつかの標準コーデックにおいてPフレームは、復号中に、既に復号されているピクチャをただひとつだけ参照として用いる。ここでPフレームは、符号時に参照するピクチャは、表示の順序においてもPフレームよりも前にあることを要求する。H.264においてPフレームは、復号中に、複数の既に復号されているピクチャを参照として用いることができ、また予測に用いられるピクチャに対して任意の表示順序となることができる。
Bフレームは、復号するために、前もってIフレームかPフレームのいずれか一方の復号が必要となる。Pフレームと同様に、Bフレームは、画像データと動きベクトルの変化との両方、および/またはそれらふたつの組み合わせを含んでもよい。Bフレームは、動き領域(例えばマクロブロックやそれより小さな領域のようなフレームのセグメント)の予測を、前もって復号されているふたつの異なる参照領域を用いて得られる予測を平均することで形成するいくつかの予測モードを含んでもよい。MPEG−2のようないくつかのコーデックでは、Bフレームは他のピクチャを予測するための参照としては使われることはない。その結果、これらのBフレームにはより低品質の符号化(そうでない場合よりもより少ないビットの使用)を用いることができる。なぜなら、細部の喪失が後続のピクチャの予測品質を害さないからである。H.264のような他のコーデックでは、Bフレームは、Bフレームは他のピクチャの復号のための参照に使われてもよいし使われなくてもよい(エンコーダの裁量による)。MPEG−2のようないくつかのコーデックは、復号中に、先に復号されたピクチャを参照として厳密にふたつ用い、このうち一方のピクチャは表示順序でBフレームに先行し、もう一方は追随する。H.264のような他のコーデックでは、Bフレームは、復号中に、1、2、または2よりも多くの先に復号されたピクチャを参照として用いることができ、また予測に用いられるピクチャに対して任意の表示順序となることができる。Bフレームは通常、IフレームまたはPフレームのいずれのフレームよりも、符号化に要求されるビットは少ない。
本明細書において、Iフレーム、Bフレーム、およびPフレームという用語は、例えば上述したストリーミングビデオの文脈におけるIフレーム、Bフレーム、およびPフレームと同様の性質を持つ任意のストリーミングデータの単位に適用される。
ビデオの符号化は、多くの場合、所与の映像シーン内においてそのシーンのビジュアルコンテンツのいくつかの要素が比較的静止したままでいる傾向があるという事実を利用する。それ故、所与のピクチャを、参照として用いられる先行ピクチャとそのピクチャとの差分の観点から符号化することによって、ビデオ信号の符号化に必要なデータを抑制することが可能となる。しかしながら、もしビデオシーケンスがシーン切替を含んでいると、参照として利用可能な先行ピクチャが存在しなくなりうる。したがって、シーン切替を検出することができると、符号化プログラムにとって利用価値がある。シーン切替は符号化プロセスに影響を及ぼすことができるからである。従来のシーン切替検出アルゴリズムは、ビデオフレームのコンテントの解析に基づくものである。
本発明の実施の形態は、この文脈の中で生まれたものである。
本発明の教示は、添付の図面とともに下記の詳細な説明を考慮することにより容易に理解されよう。
ふたつのビデオフレーム間のシーン切替を説明する図である。 符号化のためのビデオピクチャの分割のあり得るひとつの候補を説明する図である。 本発明の実施の形態に係るシーン切替検出アルゴリズムの一例を説明するフロー図である。 本発明の実施の形態に係るマクロブロックに基づくシーン切替アルゴリズムを説明するブロック図である。 本発明の実施の形態に係るマクロブロックに基づくシーン切替アルゴリズムを説明するブロック図である。 重み付きフィルタウィンドウのためのウィンドウの形を示す図である。 重み付きフィルタウィンドウのためのウィンドウの別の形を示す図である。 重み付きフィルタウィンドウのためのウィンドウのさらに別の形を示す図である。 4つの8×8ピクセルから構成されるマクロブロックを示す図である。 4つの8×8ピクセルから構成されるマクロブロックを示す図である。 移動方向とともにマクロブロックを示す図である。 移動方向とともにマクロブロックを示す図である。 本発明の実施の形態に係るビデオピクチャ中のシーン切替検出を実装するための装置を説明するブロック図である。 本発明の実施の形態に係るビデオピクチャ中のシーン切替検出を実装する装置のセルプロセッサの実装の一例を説明するブロック図である。 本発明の実施の形態に係るピクチャレベル比率制御の実装のためのコンピュータ読み取り可能な命令を含むコンピュータ読み取り可能な記録媒体を示す図である。
下記の詳細な説明は、例示を目的として多くの特定の詳細を含むが、下記の詳細に対する多くの変形及び置換が本発明の範囲に入ることは、当業者に認識されるところである。したがって、下記に説明する本発明の実施の形態は、請求された発明の一般性を失わせることなく、また限定を付加することもなく説明される。
イントロダクション
シーン切替検出の問題の特性は図1Aを参照することで理解されよう。図1Aは、第1ビデオフレーム101と第2ビデオフレーム102とをそれぞれ示している。フレーム101と102とは、ビデオシーケンスの中で連続するフレームである。第1フレーム101は、特定の背景105に対して特定のアングルから撮像したふたりのキャラクタ103および104の写真を示す。第2フレーム102は同じふたりのキャラクタ103および104を示すが、第1フレーム101と第2フレーム102との間でキャラクタ103と104との相対位置が変わっている。その上、第1フレーム101においてはキャラクタ103は笑っているが、第2フレーム102においてはキャラクタ103は顔をしかめている。
コンテンツの観点(従来技術のアプローチ)から見ると、第1フレーム101と第2フレーム102との間の相違はシーン切替と解釈されるであろう。しかしながら、符号化の観点から見ると、シーンの要素(例えば図1Aの例で言えば、キャラクタ103、104、および背景105)は実質的に同一であるため、これはシーン切替ではない。それ故、第1フレーム101と第2フレーム102が根底となる動き探索の範囲内にある限り、第1フレーム101は第2フレーム102の参照として用いることができる。このことは、残念なことに、コンテントベースのシーン切替検出を用いる従来技術に係るビデオ符号化スキームでは認識することができず、第2フレーム102を独立フレーム(Iフレーム)として符号化するであろう。これはフレーム101、102の符号化における非効率の原因となりうる。
この問題を克服するために、本発明の実施の形態は、ビデオシーン切替検出アルゴリズムを実装する。本明細書で提案するアルゴリズムは、ビデオシーケンス内に効果的なシーンカットを設置するため、続くビデオ処理モジュール(例えば、ビデオ圧縮/符号化)はその有益な情報を利用することができる、ビデオ符号化アプリケーションの領域における典型的なアプリケーションは、ピクチャフレームのタイプを決定する。例えば、シーンカットのあるピクチャフレームはIピクチャフレームと分類され、MPEGビデオエンコーダはこのフレームを過去のピクチャフレームを参照することなく独立に符号化することができる。
本明細書に記載されるシーン切替検出アルゴリズムは、多くの観点から他のシーン検出アルゴリズムと相違する。特に、提案するアルゴリズムは概念的にはビデオ符号化と結びつけられるが、必ずしも実装においてビデオ符号化と結びつける必要はない。すなわち、現存する多くのシーン切替アルゴリズムは動き推定モジュールの中に埋め込まれているが、本アルゴリズムはビデオ符号化プログラムの一部である必要はない。本アルゴリズムは、ビデオ符号化エンジンから分離してもよく、符号化のためのビデオシーケンスの前処理の形とみなすこともできる。
提案するアルゴリズムでは、あるピクチャフレームがシーン切替であるか否かの決定は、ピクチャのコンテントに加えて符号化の効率に基づく。例えば、あるピクチャフレームがその隣接するフレームに対して非常に類似した背景の上に異なる小さな前景のオブジェクトがあることを示しているとする。コンテンツの観点から見れば、このピクチャはシーン切替フレームであると分類されるであろう。しかしながら、符号化の効率の観点から見れば、ピクチャフレームの大きな部分(例えば、背景オブジェクト)は冗長であり、先行するフレームの背景と類似する。この冗長な情報は、内在する動き推定/圧縮モジュールによって抽出され除去される。
提案するアルゴリズムはマクロブロックベースのアプローチであり、典型的なMPEGベースのビデオ符号化に適合する。提案するアルゴリズムは、重み係数付きウィンドウフィルタリングも利用して、現在のピクチャ内のマクロブロックと先行するピクチャにおいて対応する位置にあるマクロブロックおよびそれと隣接するマクロブロックとの差異を決定する。ウィンドウベースのフィルタリングを用いて、統計的差異を計算して、最終的な決定のために収集する。
ビデオピクチャは符号化および復号のために適切な大きさの処理単位に分割される。例えば図1Bに示すように、あるひとつのピクチャ110は1以上の部分領域に分割される。上述のように、本明細書において「部分領域(section)」とは、ひとつのピクチャ内の1以上のピクセルの集まりを意味する。部分領域は、ひとつのピクチャ内の1ピクセルからピクチャ全体までの範囲を取り得る。部分領域についての限定しない例としては、スライス112、マクロブロック114、サブマクロブロック116、ブロック118、および個々のピクセル120を含む。図1Bに示すように、各スライス112は、1以上のマクロブロック114の列を含む。ひとつの列内のマクロブロックの数は、マクロブロックの大きさとピクチャ110の大きさおよび解像度に依存する。例えば、各マクロブロックが16×16ピクセルである場合、それぞれの列におけるマクロブロックの数は、ピクチャ110の幅(ピクセル数)を16で除算することで決定される。各マクロブロック114は、いくつかのサブブロック116に分割される。各サブマクロブロック116は、いくつかのブロック118に分割され、各ブロックはいくつかのピクセル120を含む。本発明を限定しない例として、通常のビデオ符号化スキームにおいて、ピクセルのマクロブロック114それぞれは、8×8ピクセルのサブマクロブロック116に分割される。各サブマクロブロックは、4つのブロック118に分割され、各ブロックは16個のピクセル120を含む4つの4×4ピクセルの配置を含む。
アルゴリズムの詳細
図2Aは、シーン切替検出アルゴリズム200の一例を示す。上述したように、ビデオストリーム内の各ピクチャは複数の部分領域に分割される。本発明の実施の形態においてシーン切替の決定は、部分領域毎における前のピクチャに対する現在のピクチャの分析に基づく。限定ではなく例示の目的として、この分析は上述した各マクロブロックベースで説明される。このアルゴリズムは部分領域の大きさを他の大きさに一般化できることは当業者には理解されよう。
符号202で示すように、現在のピクチャ内の各マクロブロックを特徴付けるために、各マクロブロックの統計量μが計算される。有用な統計量の例は、各マクロブロックのピクセルの値(例えばクロミナンスや輝度)の平均値やそれらの分散である。各マクロブロックの統計量μの値はマクロブロック基準でメモリに格納される。
図2B−2Cに描写するように、現在のビデオピクチャNは、先行するピクチャN−1と同様にマクロブロックに分割される。アルゴリズム200は、先行するピクチャN−1および現在のピクチャN内のマクロブロックの解析に基づいて現在のフレームがシーン切替フレームか否かを決定するために先行するフレームを用いる。特に、先行するフレームN−1内の各マクロブロックの統計量μの値が計算され、以下に説明するシーン切替決定のためのコンピュータメモリに格納される。
符号204が示すように、先行するピクチャ内の対応する位置にあるマクロブロックの周囲にウィンドウが規定される。限定ではない例として、現在のピクチャN内のマクロブロックAについて対応する位置にあるマクロブロックaは、先行するフレームN−1内に見出せる。また、マクロブロックaに隣接する8つの全てのマクロブロック(bからi)も、重み付きフィルタリングウィンドウを形成するために設置される。ここでマクロブロックAおよびaがそれぞれ異なるピクチャに存在するもののそれぞれのピクチャ内で対応する位置にあるとき、「対応する位置に存在する(co-located)」という。例として、マクロブロックAが、現在のピクチャ内のk番目のマクロブロック列中のj番目のマクロブロックであり、対応する位置に存在するマクロブロックaは、先行するピクチャ内のk番目のマクロブロック列中のj番目のマクロブロックである。ここで、シーン切替検出のために技術的意義がある限り、異なる形のウィンドウを選ぶこともできることは留意すべきである。図3A−3Cは、本発明の実施の形態に係るフィルタリングウィンドウとして用いることができる代替可能なウィンドウ形状を示す。
ひとたび先行するピクチャ内の対応する位置に存在するマクロブロックの周囲のフィルタリングウィンドウが選択されると、符号206に示すようにウィンドウ内の各マクロブロックそれぞれの統計量の値に基づいて統計的総和Eが計算される。限定されない例として、統計的総和Eはウィンドウ全体にわたる統計量μの重み付き総和であってもよい。ある実施の形態では、ウィンドウ内の各マクロブロックに重み係数が割り当てられ、中心のマクロブロック(例えばAおよびa)に対する各マクロブロックの関連度が表現される。例えば、マクロブロックAおよびaが統計的に十分に類似する場合、ウィンドウ内において隣接する他の全てのマクロブロックに等しい重み係数が割り当てられる。Aおよびaが統計的に十分に類似しない場合、関連する移動方向Mが導出される。検出された移動方向Mに基づいて、ウィンドウ内のマクロブロックのうち移動方向Mに沿わないマクロブロックと比較して、移動方向に沿うマクロブロックの方により大きな重み係数が割り当てられる。移動方向Mの導出の仕方はいくつか存在する。限定されない例としては、図4A−4Bに示すように、簡易な8×8ピクセルのブロック(典型的にはひとつのマクロブロックは4つの8×8ブロックを含む)を移動方向の推定に用いることができる。図5A−5Bに示すように、ブロックの最も大きな差異から移動方向を導くことができる。
移動方向はあらゆる適切なやり方で導出されてもよい。限定されない例として、移動方向は先行するピクチャN−1内のマクロブロックaと現在のピクチャ内のマクロブロックAとの間で最も統計的に異なるブロック間を結ぶラインと平行であってもよい。
図5A−5Bに示す例では、移動方向Mに沿わないマクロブロックg、b、i、e、およびhよりも、移動方向Mに沿うマクロブロックf、c、およびdの方に、より重みが割り当てられる。正規化のため、重み係数の総和は定数1に設定されてもよい。すなわち、
Figure 0005508534
ここでWは所与のマクロブロックmの重み係数であり、m={a,b,c,d,e,f,g,h,i}、0.0≦W≦1.0である。
重み付き係数が割り当てられると、重み付き総和が計算される。例えば、マクロブロックのピクセル値の平均値(他の統計データも同様に用いることができる)をμと表記して用いると仮定すると、重み付き総和Eは以下の式で与えられる。
Figure 0005508534
ひとたび重み付き総和Eが計算されると、符号208に示すように、マクロブロックAの平均値μと重み付き総和Eとの差分値が計算される。差分値が所定のしきい値(TH)を超える場合、マクロブロックAはシーン切替マクロブロックとしてカウントされ、双でなければそのマクロブロックはシーン切替ではないマクロブロックである。閾値THはピクチャのコンテンツに基づいてピクチャ毎に更新してもよいことは留意すべきである。
現在のピクチャN内の各マクロブロックについてシーン切替かシーン切替でないかの決定がなされた後、現在のピクチャN内のシーン切替マクロブロックの数がカウントされる。シーン切替マクロブロックの数に基づいてピクチャフレームがシーン切替であるか否かを決定することが可能となる。限定されない例として、本アルゴリズムはこの決定に際に、シーン切替マクロブロックの数が現在のピクチャN内のマクロブロックの中で過半数(majority)を占めるか否か、または、シーン切替マクロブロックの数が本ピクチャ用の所定のしきい値よりも大きいか否かに基づいてもよい。図2Aに図示する例では、シーン切替マクロブロックの数を増加させることで、シーン切替マクロブロックの集計が実行される。例えば、符号210においてあるマクロブロックがシーン切替マクロブロックであると決定されると、符号212において数が増加される。符号214において集計が閾値を超えると、符号216においてそのピクチャはシーン切替ピクチャとみなされ、それ以上のシーン切替マクロブロックの計算は実行されない。符号210においてマクロブロックがシーン切替マクロブロックでないことが分かり、符号218においてマクロブロックが最後のマクロブロックであり、かつ、符号214において集計が閾値以下を維持する場合、符号220において現在のピクチャNはシーン切替ピクチャでないと判断される。そうでなければ、現在のピクチャ内の次のマクロブロックについて処理を繰り返す。ひとたび現在のピクチャ内の各マクロブロックについて処理が繰り返されると、後続のピクチャN+1について処理が繰り返す。現在のピクチャN内の各マクロブロックについて計算されるμの値は、ピクチャN+1の先行ピクチャであるピクチャNの統計的総和Eの計算のために格納されてもよい。
ひとたび現在のピクチャがシーン切替ピクチャであるか否かの決定がなされると、現在のピクチャが、例えばソフトウェアエンコーダを用いて符号化される。アルゴリズム200は、現在のピクチャがシーン切替を含んでいるか否かを示す情報を格納するか、転送する。エンコーダは現在のピクチャを符号化するときにこの情報を用いる。例えば、現在のピクチャがシーン切替ピクチャであることをその情報が示している場合、エンコーダは現在のピクチャをIフレームとして符号化する。そうでない場合、エンコーダはそのピクチャをPフレームまたはBフレームとして符号化する。
上述したアルゴリズムは適切なコンピュータ装置上で実装されてもよい。図6は、上述したピクチャ符号化のためのシーン切替検出の実装に用いられるコンピュータ装置600を例示するブロック図である。装置600は概して、プロセッサモジュール601およびメモリ602を含む。プロセッサモジュール601は、1以上のプロセッサコアを含んでもよい。複数のプロセッサモジュールを用いるプロセッサシステムの一例はセルプロセッサである。セルプロセッサの例は、例えば、https://www-306.ibm.com/chips/techlib/techlib.nsf/techdocs/1AEEE1270EA2776387257060006E61BA/$file/CBEA_01_pub.pdfで参照可能な「Cell Broadband Engine Architecture」に詳細が説明されており、参照によりここに組み入れる。
メモリ602は、例えばRAM、DRAM、ROMまたはそれと類似する集積回路の形式であってもよい。メモリは、すべてのプロセッサモジュール601からアクセス可能なメインメモリであってもよい。ある実施の形態では、プロセッサモジュール601は、複数のプロセッサコアと、各コアに関連づけられたローカルメモリを含んでもよい。符号化プログラム603は、プロセッサモジュール601上で実行可能なプロセッサ読み取り可能な命令の形式でメインメモリ602内に格納されてもよい。符号化プログラム603は、ピクチャを圧縮信号データに符号化すること、および/または圧縮信号データを復号するように構成されてもよい。限定されない例として、符号化プログラム603は、同一出願人による同時係属中の米国特許出願公開第20090010338号(参照により開示内容全体をここに組み入れる)に説明されているように構成されてもよい。符号化プログラム603所与のピクチャがシーン切替ピクチャであるか否かの情報を受け取り、上述のように現在のピクチャがシーン切替ピクチャであるか否かに部分的に基づいて、そのピクチャをIフレーム、Pフレーム、またはBフレームとして符号化するように構成されてもよい。
シーン切替検出プログラム604もまた、メモリ602に格納されてもよい。シーン切替検出プログラムは、プロセッサモジュール601で実行されたときに、例えば図2Aにしたがって上述したアルゴリズム200としてシーン切替検出を実装する命令を含んでもよい。符号化プログラム603およびシーン切替検出プログラム604は、例えばC、C++、JAVA(登録商標)、アセンブリ言語、MATLAB、FORTLAN、および他のいくつかの言語等の、プロセッサ読み取り可能な適切な言語で記述されてもよい。
入力データ607はメモリ602に格納される。そのような入力データは、例えば符号化されたビデオピクチャやそれらの一部などの、バッファリングされたストリーミングデータの一部を含んでもよい。符号化プログラム603および/またはシーン切替検出プログラム604の実行の間、プログラムコードおよび/またはデータ607の一部は、メモリ602中、またはマルチプロセッサコアによって並列処理されるためにプロセッサコアのローカルストアにロードされる。限定されない例として、符号化の前や符号化の中間段階において、入力データ607はビデオピクチャやそれらの部分領域を含んでもよい。これらの様々な部分領域は1以上のバッファに格納されてもよい。具体的には、部分領域はメモリ602内に実装された出力ピクチャバッファ内に格納されてもよい。
装置600はさらに、入出力(I/O)装置611、電源(P/S)612、クロック(CLK)613およびキャッシュ614などの公知のサポート機能610を備えてもよい。装置600はオプションとして、プログラムおよび/またはデータを格納するためのディスクドライブ、CD−ROMドライブ、テープドライブなどの大容量記憶装置615を備えてもよい。装置600はまた、オプションとして、装置600とユーザの相互作用を容易にするために、ディスプレイユニット616とユーザインタフェースユニット618を備えてもよい。ディスプレイユニット616は、テキスト、数値、グラフィカルシンボルや画像を表示する陰極線管(CRT)、またはフラットパネルスクリーンの形態であってもよい。ユーザインタフェース618は、キーボード、マウス、ジョイスティック、ライトペンや他の装置を備えてもよく、これらは、グラフィカルユーザインタフェース(GUI)と併せて使われてもよい。装置600はまた、ネットワークインタフェース620を含み、これにより、当該装置がインターネットのようなネットワーク上で他の装置と通信することが可能になる。これらの構成要素はハードウェア、ソフトウェア、ファームウェアまたはこれらの2以上の組み合わせによって実装される。
装置600の複数のプロセッサを用いて並列処理を効率化する付加的な方法が多数ある。たとえば、2以上のプロセッサ上でコードを複製することによって、処理ループを「アンロール(unroll)」し、各プロセッサに異なるデータ部分を処理するためにコードを実装させることができる。そのような実装によって、ループ設定に関連するレイテンシを回避することができる。
並列処理を実装することができるマルチプロセッサシステムの一つの例は、セルプロセッサとして知られる。セルプロセッサとして分類できる異なるプロセッサアーキテクチャが多数ある。例示であり、限定するものではないが、図7は、セルプロセッサ700の一つのありうる構成を示す。セルプロセッサ700は、メインメモリ702、一つのPPE(power processor element)704、および8個のSPE(synergistic processor element)706を備える。あるいは、セルプロセッサ700は、任意の数のSPEで構成されてもよい。図7に関し、メモリ702、PPE704、および複数のSPE706は、リング型のエレメント・インターコネクト・バス710上でお互いに通信可能であり、また、I/Oデバイス708とも通信可能である。メモリ702は、上述した入力データ607と同じような特性を持つ入力データ703、上述した符号化プログラム603と同じような特性を持つ符号化プログラム709、および上述したシーン切替検出プログラム604と同じような特性を持つシーン切替検出プログラム711を含む。少なくともSPE706のひとつは、ローカルストア(LS)内にシーン切替検出命令705、および/または、例えば上述したように並列で処理されるためのバッファリングされた入力データの一部を含む。PPEは、L1キャッシュ内に上述した符号化プログラム603と同じ特性を持つコード命令707を含む。命令705およびデータ707は、SPEおよびPPEが必要なときにアクセスするためにメモリ702にも格納されてもよい。
例示として、PPE704は、関連するキャッシュを持った64ビットのパワーPCプロセッサユニット(PPU)であってもよい。PPE704はオプションとしてベクタマルチメディア拡張ユニットを含んでもよい。各SPE706は、SPU(synergistic processor unit)とローカルストア(LS)を含む。ある実装では、ローカルストアは、たとえば、コードとデータ用のおよそ256キロバイトのメモリ容量をもってもよい。SPUは、典型的にはシステム管理機能を実行しないという点で、PPUよりも単純な計算ユニットである。SPUは、SIMD(single instruction, multiple data)機能を有し、典型的にはデータ処理を行い、割り当てられたタスクを行うために(PPEにより設定されたアクセス特性にしたがって)要求されたデータ転送を開始する。SPUにより、システム700は、より高い計算ユニット密度を要求するアプリケーションを実装し、提供された命令セットを効率良く利用することができるようになる。PPE704によって管理されるシステム700の相当数のSPEによって、広範囲のアプリケーションにわたって費用対効果の高い処理が可能になる。例示として、セルプロセッサ700は、セル・ブロードバンド・エンジン・アーキテクチャ(CBEA)準拠のプロセッサとして知られるアーキテクチャで特徴づけられる。CBEA準拠のアーキテクチャにおいて、複数のPPEはPPEグループに結合され、複数のSPEはSPEグループに結合されてもよい。例示のために、セルプロセッサ700は、一つのSPEと一つのPPEをもつ一つのSPEグループと一つのPPEグループだけをもつとして図示している。別の構成として、セルプロセッサは、PPEの複数のグループとSPEの複数のグループを含むことができる。CBEA準拠のプロセッサは、たとえば、「セル・ブロードバンド・エンジン・アーキテクチャ」に詳細に記述されており、これは、https://www-306.ibm.com/chips/techlib/techlib.nsf/techdocs/1AEEE1270EA2776387257060006E61BA/$file/CBEA_01_pub.pdfにおいてオンラインで利用可能であり、その内容を参照によりここに取り込む。
本発明の実施の形態は、シーン切替検出およびストリーミングビデオのようなストリーミングデータの符号化の並列処理のためのシステムおよび方法を提供する。このような実施の形態は、ほとんどのビデオエンコーダ、具体的にはH.264/AVCエンコーダおよび特にモジュールとしてビデオエンコーダを持つ製品に適用される。限定はしないが、そのような製品の例はゲームコンソール、DVDプレイヤ、ソフトウェア(PC)ビデオエンコーダ/プレイヤ、携帯電話上のビデオ等を含む。別の実施の形態として、このようなシステムおよび方法を、ビデオ以外の他のストリーミングデータの符号化に適用してもよい。
そのような実施の形態に例は、ストリーミング音声データ、グラフィックレンダリングストリーム、静止画およびXML文書の符号化のためのシステムおよび方法を含む。本発明の実施の形態は、ビデオゲームを記録したり、携帯ゲーム装置にゲームの画像をストリーミングしたり、ネットワークを介した複数のゲームシステムによってゲームをアップロードや共有したりするのに好ましい。
上述したように、本発明の実施の形態によれば、既存のビデオ符号化標準を修正して一連のビデオピクチャ内の所与のピクチャを圧縮および符号化する前に、シーン切替検出をすることが可能となる。ビデオ画像を符号化する際のシーン切替検出の観点を例に説明したが、JPEGのような静止画像の符号化に本発明の実施の形態を利用してもよい。
他の実施の形態によれば、上述した画像符号化と連動するシーン切替検出を実行する命令は、コンピュータ読み出し可能な記録媒体に格納されてもよい。限定されない例として、図8は、コンピュータ読み出し可能な記録媒体800を例示する。記録媒体は、コンピュータプロセッシング装置から読み出して解釈可能な形で、コンピュータ読み出し可能な命令を含む。限定されない例として、コンピュータ読み出し可能な記録媒体800は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスクドライ等のコンピュータ読み出し可能なストレージディスク、またはリムーバブルディスクである。さらに、コンピュータ読み出し可能な記録媒体800は、フラッシュメモリ装置、コンピュータ読み出し可能なテープ、CD−ROM、DVD−ROM、Blu−ray、HD−DVD、UMD、またはその他の光学記録媒体であってもよい。
記録媒体800は、プロセッサによって実行されるとシーン切替検出を実施するように構成されたシーン切替検出命令801を含む。シーン切替検出命令801は、現在のピクチャ内の各マクロブロックについて統計量μの計算を実装する1以上の統計計算命令802を含む。加えて、シーン切替検出命令は、先行するピクチャ内の対応する位置にあるマクロブロック周辺にウィンドウを規定するように構成された1以上のウィンドウ規定命令803を含む。さらに、シーン切替検出命令801は、ウィンドウ内のマクロブロック全体にわたって統計的総和Eを計算する1以上の統計的総和命令804を含む。その上、シーン切替検出命令801は、現在のピクチャ内の所与のマクロブロックにおけるμと統計的総和Eとの差分を計算するように構成された差分計算命令805を含む。シーン切替検出命令801はまた、Eとμと差分を用いて所与のマクロブロックがシーン切替マクロブロックか否かを決定するシーン切替マクロブロック決定命令806も含む。シーン切替検出命令801はまた、いくつかのシーン切替マクロブロックを用いて現在のピクチャがシーン切替ピクチャであるか否かを決定するシーン切替マクロブロックカウント命令807も含む。
記録媒体800は、現在のピクチャがシーン切替ピクチャであると決定されたか否かに部分的に基づいて、そのピクチャをIフレーム、IDRフレーム、Pフレーム、またはBフレームとして符号化するように構成された1以上のピクチャ符号化命令810をオプションとして含んでもよい。
上記は、本発明の好ましい実施の形態の完全な説明であるが、種々の代替、変更及び等価物を用いることができる。したがって、本発明の範囲は、上記の説明を参照して決定されるべきではなく、添付された特許請求の範囲をそれらと等価な範囲の全てとともに参照して決定されるべきである。ここで記述される全ての特徴は、好ましいか否かにかかわらず、ここで記述される他の全ての特徴に結合されてもよい。特許請求の範囲において、不定冠詞に続くものは、別段の明示がない限り、1以上の事項の数量をさす。添付された特許請求の範囲は、「〜するための手段」という語句を用いて明示的に限定されない限り、ミーンズプラスファンクションの限定を含むものと解釈されるべきではない。

Claims (20)

  1. a)現在のピクチャ内の所与の部分領域における統計量を計算するステップと、
    b)先行するピクチャ内の対応する位置にある部分領域周辺の以上の部分領域のウィンドウを規定するステップと、
    c)前記ウィンドウ内の2以上の部分領域における統計量の総和を計算するステップと、
    d)前記総和と前記所与の部分領域における統計量との差分を計算するステップと、
    e)前記総和と前記所与の部分領域における前記統計量との差分を用いて前記所与の部分領域がシーン切替領域か否かを決定するステップと、
    f)前記現在のピクチャについてシーン切替領域の数を決定するステップと、
    g)前記シーン切替領域の数から前記現在のピクチャがシーン切替ピクチャか否かを決定するステップと、
    h)前記現在のピクチャがシーン切替ピクチャか否かを示す情報を格納または転送するステップとを含むことを特徴とする、1以上のデジタルピクチャを符号化する際のシーン切替を検出する方法。
  2. i)前記現在のピクチャがシーン切替ピクチャか否かを示す情報にしたがって、エンコーダを用いて前記現在のピクチャを符号化するステップをさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記i)のステップは、
    前記現在のピクチャがシーン切替ピクチャであることを前記情報が示す場合、前記現在のピクチャをIフレームとして符号化し、現在のピクチャがシーン切替ピクチャではないことを前記情報が示す場合、前記現在のピクチャをBフレームまたはPフレームとして符号化するステップを含むことを特徴とする請求項2に記載の方法。
  4. 前記現在のピクチャ内の複数の部分領域について、前記a)のステップからe)のステップを繰り返すステップをさらに含むことを特徴とする請求項1に記載の方法。
  5. 各部分領域はマクロブロックであることを特徴とする請求項1に記載の方法。
  6. 前記a)のステップは、現在のピクチャ内の各部分領域における画素値の平均値または画素値の分散を計算するステップを含むことを特徴とする請求項1に記載の方法。
  7. 前記ウィンドウは、先行するピクチャ内の対応する位置にある部分領域に隣接する1以上の部分領域を含むことを特徴とする請求項1に記載の方法。
  8. 記c)のステップは、ウィンドウ内の各部分領域における重みと統計とを決定し、
    前記総和は、前記重みと前記各部分領域における統計量との積の総和で与えられ、
    前記ウィンドウ内の全ての部分領域に渡って前記総和を計算するステップを含むことを特徴とする請求項1に記載の方法。
  9. 前記ウィンドウ内の各部分領域における重みを決定するステップは、運動方向を決定し、前記ウィンドウ内の対応する部分領域前記運動方向に沿って位置するか否かにしたがって各重みを割り当てるステップとを含むことを特徴とする請求項8に記載の方法。
  10. 前記e)のステップは、前記総和前記統計量との差分を閾値と比較するステップを含むことを特徴とする請求項1に記載の方法。
  11. 前記g)のステップは、前記シーン切替領域の数を閾値と比較するステップを含むことを特徴とする請求項1に記載の方法。
  12. 前記g)のステップは、前記シーン切替領域の数が前記現在のピクチャ内の部分領域の過半数か否かを決定するステップを含むことを特徴とする請求項1に記載の方法。
  13. プロセッサと、
    前記プロセッサと接続するメモリと、
    前記メモリ内に具現化され前記プロセッサが実行可能な命令であって、1以上のデジタルピクチャを符号化する際のシーン切替を検出する方法を実装するように構成された命令を含み、前記方法は、
    a)現在のピクチャ内の所与の部分領域における統計量を計算するステップと、
    b)先行するピクチャ内の対応する位置にある部分領域周辺の以上の部分領域のウィンドウを規定するステップと、
    c)前記ウィンドウ内の部分領域全面における統計量の総和を計算するステップと、
    d)前記総和と前記所与の部分領域における統計量との差分を計算するステップと、
    e)前記総和と前記所与の部分領域における前記統計量との差分を用いて前記所与の部分領域がシーン切替領域か否かを決定するステップと、
    f)前記現在のピクチャについてシーン切替領域の数を決定するステップと、
    g)前記シーン切替領域の数から前記現在のピクチャがシーン切替ピクチャか否かを決定するステップと、
    h)前記現在のピクチャがシーン切替ピクチャか否かを示す情報を格納または転送するステップと
    i)前記現在のピクチャがシーン切替ピクチャか否かを示す情報にしたがって、エンコーダを用いて前記現在のピクチャを符号化するステップとを含むことを特徴とする、1以上のデジタルピクチャを符号化する際のシーン切替を検出するシステム。
  14. 前記現在のピクチャがシーン切替ピクチャか否かを示す情報にしたがって、前記現在のピクチャを符号化するように構成されたエンコーダをさらに含むことを特徴とする請求項13に記載のシステム。
  15. 前記命令はさらに、前記現在のピクチャ内の複数の部分領域について前記a)のステップからe)のステップを繰り返すように構成されていることを特徴とする請求項13に記載のシステム。
  16. 記c)のステップは、ウィンドウ内の各部分領域における重みと統計値とを決定し、
    前記総和は、前記重みと前記各部分領域における統計量との積の総和で与えられ、
    前記ウィンドウ内の全ての部分領域に渡って前記総和を計算するステップを含むことを特徴とする請求項13に記載のシステム。
  17. 前記ウィンドウ内の各部分領域における重みを決定するステップは、運動方向を決定し、前記ウィンドウ内の対応する部分領域前記運動方向に沿って位置するか否かにしたがって各重みを割り当てるステップを含むことを特徴とする請求項16に記載のシステム。
  18. 前記エンコーダは、前記現在のピクチャがシーン切替ピクチャであることを前記情報が示す場合、前記現在のピクチャをIフレームとして符号化し、現在のピクチャがシーン切替ピクチャではないことを前記情報が示す場合、前記現在のピクチャをBフレームまたはPフレームとして符号化するように構成されていることを特徴とする請求項14に記載のシステム。
  19. コンピュータプログラム命令が格納されているコンピュータ読み取り可能な記録媒体であって、前記コンピュータプログラム命令は実行されたときに、1以上のデジタルピクチャを符号化する際のシーン切替を検出する方法を実装するように構成されており、前記方法は、
    a)現在のピクチャ内の所与の部分領域における統計量を計算するステップと、
    b)先行するピクチャ内の対応する位置にある部分領域周辺の以上の部分領域のウィンドウを規定するステップと、
    c)前記ウィンドウ内の部分領域全面における統計量の総和を計算するステップと、
    d)前記総和と前記所与の部分領域における統計量との差分を計算するステップと、
    e)前記総和と前記所与の部分領域における前記統計量との差分を用いて前記所与の部分領域がシーン切替領域か否かを決定するステップと、
    f)前記現在のピクチャについてシーン切替領域の数を決定するステップと、
    g)前記シーン切替領域の数から前記現在のピクチャがシーン切替ピクチャか否かを決定するステップと、
    h)前記現在のピクチャがシーン切替ピクチャか否かを示す情報を格納または転送するステップと
    i)前記現在のピクチャがシーン切替ピクチャか否かを示す情報にしたがって、エンコーダを用いて前記現在のピクチャを符号化するステップとを含むことを特徴とするコンピュータ読み取り可能な記録媒体。
  20. 前記コンピュータプログラム命令はさらに、前記現在のピクチャがシーン切替ピクチャか否かを示す情報にしたがって、前記現在のピクチャを符号化するように構成されていることを特徴とする請求項19に記載のコンピュータ読み取り可能な記録媒体。
JP2012527954A 2009-09-02 2010-08-30 シーン切替検出 Active JP5508534B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/553,069 US8345750B2 (en) 2009-09-02 2009-09-02 Scene change detection
US12/553,069 2009-09-02
PCT/US2010/047178 WO2011028666A1 (en) 2009-09-02 2010-08-30 Scene change detection

Publications (2)

Publication Number Publication Date
JP2013504256A JP2013504256A (ja) 2013-02-04
JP5508534B2 true JP5508534B2 (ja) 2014-06-04

Family

ID=43624860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012527954A Active JP5508534B2 (ja) 2009-09-02 2010-08-30 シーン切替検出

Country Status (5)

Country Link
US (1) US8345750B2 (ja)
EP (1) EP2473949B1 (ja)
JP (1) JP5508534B2 (ja)
CN (1) CN102576411B (ja)
WO (1) WO2011028666A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379718B2 (en) * 2009-09-02 2013-02-19 Sony Computer Entertainment Inc. Parallel digital picture encoding
US8848799B2 (en) * 2009-09-02 2014-09-30 Sony Computer Entertainment Inc. Utilizing thresholds and early termination to achieve fast motion estimation in a video encoder
US8711933B2 (en) 2010-08-09 2014-04-29 Sony Computer Entertainment Inc. Random access point (RAP) formation using intra refreshing technique in video coding
JP2013115583A (ja) * 2011-11-28 2013-06-10 Canon Inc 動画像符号化装置及びその制御方法並びにプログラム
WO2014054325A1 (ja) * 2012-10-05 2014-04-10 ソニー株式会社 符号化制御装置および符号化制御方法
US9565440B2 (en) 2013-06-25 2017-02-07 Vixs Systems Inc. Quantization parameter adjustment based on sum of variance and estimated picture encoding cost
US9426475B2 (en) * 2013-06-25 2016-08-23 VIXS Sytems Inc. Scene change detection using sum of variance and estimated picture encoding cost
EP3061233B1 (en) 2013-10-25 2019-12-11 Microsoft Technology Licensing, LLC Representing blocks with hash values in video and image coding and decoding
CN105684441B (zh) 2013-10-25 2018-09-21 微软技术许可有限责任公司 视频和图像编码中的基于散列的块匹配
CN105556971B (zh) 2014-03-04 2019-07-30 微软技术许可有限责任公司 针对帧内块复制预测中的块翻动和跳跃模式的编码器侧判定
US10567754B2 (en) 2014-03-04 2020-02-18 Microsoft Technology Licensing, Llc Hash table construction and availability checking for hash-based block matching
EP3158751B1 (en) 2014-06-23 2019-07-31 Microsoft Technology Licensing, LLC Encoder decisions based on results of hash-based block matching
US9386317B2 (en) 2014-09-22 2016-07-05 Sony Interactive Entertainment Inc. Adaptive picture section encoding mode decision control
US10419760B2 (en) 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
CA2961089C (en) * 2014-09-30 2023-03-28 Microsoft Technology Licensing, Llc Hash-based encoder decisions for video coding
US10200716B2 (en) 2015-06-25 2019-02-05 Sony Interactive Entertainment Inc. Parallel intra-prediction encoding/decoding process utilizing PIPCM and/or PIDC for selected sections
US10353758B2 (en) * 2016-03-18 2019-07-16 Samsung Electronics Co., Ltd. Data coding methods for a communication between semiconductor chips
US10178390B2 (en) 2016-03-30 2019-01-08 Sony Interactive Entertainment Inc. Advanced picture quality oriented rate control for low-latency streaming applications
US10390039B2 (en) 2016-08-31 2019-08-20 Microsoft Technology Licensing, Llc Motion estimation for screen remoting scenarios
US11095877B2 (en) 2016-11-30 2021-08-17 Microsoft Technology Licensing, Llc Local hash-based motion estimation for screen remoting scenarios
US11212536B2 (en) 2017-07-14 2021-12-28 Sony Interactive Entertainment Inc. Negative region-of-interest video coding
US11093788B2 (en) * 2018-02-08 2021-08-17 Intel Corporation Scene change detection
US11202085B1 (en) 2020-06-12 2021-12-14 Microsoft Technology Licensing, Llc Low-cost hash table construction and hash-based block matching for variable-size blocks

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2611607B2 (ja) * 1992-06-29 1997-05-21 日本ビクター株式会社 シーンチェンジ検出装置
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
US5731835A (en) * 1996-02-26 1998-03-24 David Sarnoff Research Center, Inc. Dynamic coding rate control in a block-based video coding system
US5751378A (en) 1996-09-27 1998-05-12 General Instrument Corporation Scene change detector for digital video
JP3409834B2 (ja) * 1997-07-10 2003-05-26 ソニー株式会社 画像処理装置および画像処理方法、並びに記録媒体
US6618507B1 (en) * 1999-01-25 2003-09-09 Mitsubishi Electric Research Laboratories, Inc Methods of feature extraction of video sequences
JP3778721B2 (ja) * 1999-03-18 2006-05-24 富士通株式会社 動画像符号化方法および装置
US7016414B2 (en) * 2001-10-19 2006-03-21 Koninklijke Philips Electronics N.V. Method and system for skipping decoding of overlaid areas of video
KR100850935B1 (ko) * 2001-12-27 2008-08-08 주식회사 엘지이아이 장면 전환 검출 장치
US7292690B2 (en) * 2002-01-02 2007-11-06 Sony Corporation Video scene change detection
US6993182B2 (en) * 2002-03-29 2006-01-31 Koninklijke Philips Electronics N.V. Method and apparatus for detecting scene changes in video using a histogram of frame differences
US7313183B2 (en) 2003-06-24 2007-12-25 Lsi Corporation Real time scene change detection in video sequences
US20050089232A1 (en) * 2003-10-23 2005-04-28 Chun-Ming Hsu Method of video compression that accommodates scene changes
US7177474B2 (en) * 2003-11-10 2007-02-13 Mobixell Networks Inc. Video to animation conversion with file size constraint
JP4835439B2 (ja) * 2004-08-10 2011-12-14 ソニー株式会社 情報信号処理方法、情報信号処理装置及びコンピュータプログラム記録媒体
EP1784011A4 (en) * 2004-08-10 2011-09-28 Sony Corp INFORMATION SIGNAL PROCESSING METHOD, INFORMATION SIGNAL PROCESSING DEVICE, AND COMPUTER PROGRAM RECORDING MEDIUM
KR20120068050A (ko) * 2004-08-10 2012-06-26 소니 주식회사 정보 신호 처리 방법 및 정보 신호 처리 장치
US7382417B2 (en) * 2004-12-23 2008-06-03 Intel Corporation Method and algorithm for detection of scene cuts or similar images in video images
US8218641B2 (en) 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture encoding using same-picture reference for pixel reconstruction
EP1924098A1 (en) 2006-11-14 2008-05-21 Sony Deutschland GmbH Motion estimation and scene change detection using two matching criteria
JP4698754B2 (ja) * 2007-05-21 2011-06-08 三菱電機株式会社 シーンチェンジ検出方法および装置
US20090268097A1 (en) * 2008-04-28 2009-10-29 Siou-Shen Lin Scene change detection method and related apparatus according to summation results of block matching costs associated with at least two frames
US8451907B2 (en) * 2008-09-02 2013-05-28 At&T Intellectual Property I, L.P. Methods and apparatus to detect transport faults in media presentation systems

Also Published As

Publication number Publication date
EP2473949A4 (en) 2017-03-22
CN102576411A (zh) 2012-07-11
EP2473949A1 (en) 2012-07-11
WO2011028666A1 (en) 2011-03-10
US8345750B2 (en) 2013-01-01
JP2013504256A (ja) 2013-02-04
US20110051809A1 (en) 2011-03-03
EP2473949B1 (en) 2021-03-10
CN102576411B (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
JP5508534B2 (ja) シーン切替検出
JP3957915B2 (ja) フェード検出装置及び情報符号化装置
US9332279B2 (en) Method and digital video encoder system for encoding digital video data
EP1078531A1 (en) Method and apparatus for encoding video information
JP2005191706A (ja) 動画像符号化方法及びその装置
JP2011507461A (ja) 適応型グループオブピクチャ(agop)構造の決定
JP2008167449A (ja) 映像の符号化、復号化方法及び装置
US7881366B2 (en) Moving picture encoder
TWI511531B (zh) 影像編碼裝置、影像編碼方法及影像編碼程式
US20150249829A1 (en) Method, Apparatus and Computer Program Product for Video Compression
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
JP5178616B2 (ja) シーンチェンジ検出装置および映像記録装置
JP5748225B2 (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
JP2011250400A (ja) 動画像符号化装置及び動画像符号化方法
JP2009535881A (ja) エンコード/トランスコード及びデコードのための方法及び装置
JP2001128179A (ja) 動画像符号化装置および方法
JP2007221201A (ja) 動画像符号化装置及び動画像符号化プログラム
RU2602980C2 (ru) Устройство кодирования видео с предсказанием, способ кодирования видео с предсказанием, программа кодирования видео с предсказанием, устройство декодирования видео с предсказанием, способ декодирования видео с предсказанием и программа декодирования видео с предсказанием
US8126277B2 (en) Image processing method, image processing apparatus and image pickup apparatus using the same
JP2008028707A (ja) 画質評価装置、符号化装置及び画質評価方法
KR20110021198A (ko) 데이터 부호화 방법 및 장치와 데이터 복호화 방법 및 장치
JP2007251996A (ja) 動画像符号化方法及びその装置
US20150326874A1 (en) Apparatus and method for coding a video signal
JP4962609B2 (ja) 動画像符号化装置及び動画像符号化プログラム
JP2011129979A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140320

R150 Certificate of patent or registration of utility model

Ref document number: 5508534

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250