JP5544996B2

JP5544996B2 - 画像処理装置および方法

Info

Publication number: JP5544996B2
Application number: JP2010090958A
Authority: JP
Inventors: 一哉小川
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-04-09
Filing date: 2010-04-09
Publication date: 2014-07-09
Anticipated expiration: 2030-04-09
Also published as: KR20130037200A; JP2011223356A; EP2557793A4; BR112012025204A2; AU2011237021A1; US20160381371A1; US20130077883A1; RU2012141996A; WO2011125868A1; EP2557793A1; US9405989B2; CN102823254A; US20140369411A1; MX2012011451A; US9008449B2; CA2793238A1

Description

本発明は、画像処理装置および方法に関し、特に、画面内予測に必要なメモリ量を低減させることができるようにした画像処理装置および方法に関する。

従来、ITU-T（International Telecommunication Union Telecommunication Standardization Sector）H.264、MPEG4（Moving Picture Experts Group 4）-AVC（Advanced Video Coding）における画像符号化標準方式では、イントラピクチャの予測符号化として画面内予測(イントラ予測)符号化が採用されている。

このITU-T H.264、MPEG4-AVCにおけるイントラ予測においては、処理対象ブロックに隣接するブロックの、デブロックフィルタがかけられる前の画素データである再構成画素値の内、処理対象ブロックに隣接する隣接画素の画素値が使用される。

したがって、各イントラ予測モードにおける予測画素値と残差成分が加算され、復号されたブロックの右端の１画素列と下端の１画素行は、再構成画素値として次のブロックのイントラ予測のために保存される。

この再構成画素値は、デブロックフィルタがかけられた後の、復号処理が完了した画素データである復号画素値とは別の領域に保存される。

ところで、次世代の画像符号化規格の要素技術として、マクロブロックの水平および垂直方向の画素数を拡張する提案がなされている（例えば、非特許文献１参照）。この提案によると、例えば、MPEG1、MPEG2、ITU-T H.264、またはMPEG4-AVC等で規定されている１６×１６画素のマクロブロックサイズの他に、例えば３２×３２画素や、６４×６４画素からなるマクロブロックを使用することも提案されている。また、近年、符号化や復号処理される画像のサイズは、年々増大している。

Peisong Chenn,Yan Ye,Marta Karczewicz,"Video Coding Using Extended Block Sizes", COM16-C123-E, Qualcomm Inc

しかしながら、従来の方法の場合、マクロブロックの垂直方向画素サイズに応じてマクロブロックを処理するために保存すべき隣接再構成画素の個数が増大するので、この隣接再構成画素値の保存に必要な容量が増大する恐れがあった。

また、処理対象マクロブロックの１つ上のマクロブロックの一番下の画素行を１ライン分、隣接画素値として保持しなければならないので、画像の水平サイズが増大すると、この隣接再構成画素値の保存に必要な容量が増大する恐れがあった。

例えば色差規格４：２：０、８ビット、水平方向４０９６画素のサイズのプログレッシブ画像に対しては６キロバイト、インターレース画像に対してはマクロブロックアダプティブフレーム・フィールド復号処理を考慮すると１２キロバイトのメモリ領域若しくはラインバッファが必要となる。水平方向の画素数が７６８０画素の場合はそれぞれ、１１．５キロバイト、２３キロバイト必要となる。

本発明は、このような状況に鑑みてなされたものであり、より少ないメモリ量で画面内予測を実現させることを目的とする。

本発明の一側面は、符号化される画像の内容に従って、画面内予測において隣接画素として使用される画素値を間引くサンプリングを行うサンプリング手段と、前記サンプリング手段によりサンプリングされた前記画素値を用いて補間処理を行い、前記隣接画素を再構成する再構成手段と、前記再構成手段により再構成された前記隣接画素を用いて前記画面内予測を行い、予測画像を生成する予測画像生成手段とを備える画像処理装置である。

前記サンプリング手段は、前記画像のスキャン順に従って前記サンプリングを行うことができる。

前記サンプリング手段は、前記画像を符号化する際のピクチャタイプに従って前記サンプリングを行うことができる。
前記画像の内容に従って、前記サンプリングを行うかを決定する決定手段を更に備え、前記サンプリング手段は、前記決定手段により前記サンプリングを行うことが決定された場合に、前記サンプリングを行うことができる。

前記決定手段により前記サンプリングを行うことが決定された場合、前記画像の内容に従って、前記サンプリングの方法を決定するサンプリング方法決定手段をさらに備え、前記サンプリング手段は、前記サンプリング方法決定手段により決定された方法で前記サンプリングを行うことができる。

前記サンプリング方法決定手段は、前記画像のスキャン順に従って前記サンプリングの方法を決定することができる。

前記サンプリング方法決定手段は、前記画像を符号化する際のピクチャタイプに従って前記サンプリングの方法を決定することができる。

前記サンプリング方法決定手段は、前記補間処理の方法を決定し、前記再構成手段は、前記サンプリング方法決定手段により決定された前記補間処理の方法で前記補間処理を行って前記隣接画素を再構成することができる。

前記サンプリング手段は、領域毎に分割された前記画像を対象として、一番下の画素行の一部と一番右の画素列の一部とを、サンプリングすることができる。

前記サンプリング手段は、領域毎に分割された前記画像の、一番下の画素行の一部をサンプリングすることができる。

前記画像の特徴量を抽出する特徴量抽出手段をさらに備え、前記サンプリング手段は、前記特徴量抽出手段により前記画像の特徴量として抽出された、前記画像の内容に従って、前記サンプリングを行うことができる。

前記予測画像生成手段により生成された前記予測画像と、領域毎の画像との差分情報を符号化する符号化手段をさらに備えることができる。

前記符号化手段は、前記差分情報を符号化して得られる符号化データと、前記サンプリング手段により前記サンプリングが行われたかを示す情報とを伝送することができる。

前記符号化手段は、前記差分情報を符号化して得られる符号化データと、前記サンプリング手段により行われた前記サンプリングの方法を示す情報とを伝送することができる。

前記画像が符号化された符号化データを復号する復号手段をさらに備え、前記サンプリング手段は、前記復号手段により前記符号化データが復号されて得られた画像データをサンプリングすることができる。

前記復号手段は、前記符号化データと前記サンプリングが行われたかを示す情報とを受け取り、前記サンプリング手段は、前記復号手段により受け取られた前記サンプリングが行われたかを示す情報に基づいて、前記サンプリングを行うことができる。

本発明の一側面は、また、画像処理装置の画像処理方法であって、サンプリング手段が、符号化される画像の内容に従って、画面内予測において隣接画素として使用される画素値を間引くサンプリングを行い、再構成手段が、サンプリングされた前記画素値を用いて補間処理を行い、前記隣接画素を再構成し、予測画像生成手段が、再構成された前記隣接画素を用いて前記画面内予測を行い、予測画像を生成する画像処理方法である。

本発明の一側面においては、符号化される画像の内容に従って、画面内予測において隣接画素として使用される画素値を間引くサンプリングが行われ、サンプリングされた画素値を用いて補間処理が行われて隣接画素が再構成され、再構成された隣接画素を用いて画面内予測が行われ、予測画像が生成される。

本発明によれば、画像データの符号化、若しくは、符号化された画像データの復号を行うことができる。特に、画面内予測に必要なメモリ量を低減させることができる。

本発明を適用した画像符号化装置の主な構成例を示すブロック図である。マクロブロックの分割例を示す図である。イントラ４×４予測モードを説明する図である。イントラ８×８予測モードを説明する図である。イントラ１６×１６予測モードを説明する図である。色差成分のイントラ予測モードを説明する図である。マクロブロックの処理順を説明する図である。図１のイントラ予測部の構成例を示すブロック図である。サンプリング方法の例を説明する図である。サンプリング方法の他の例を説明する図である。サンプリング方法のさらに例を説明する図である。サンプリング方法のさらに例を説明する図である。符号化処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明するフローチャートである。イントラ予測処理の流れの例を説明するフローチャートである。再構成画素記憶処理の流れの例を説明するフローチャートである。本発明を適用した画像復号装置の主な構成例を示すブロック図である。図１６のイントラ予測部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明するフローチャートである。イントラ予測処理の流れの例を説明するフローチャートである。マクロブロックの他の例を示す図である。本発明を適用したパーソナルコンピュータの主な構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

以下、発明を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（画像符号化装置）
２．第２の実施の形態（画像復号装置）
３．第３の実施の形態（パーソナルコンピュータ）
４．第４の実施の形態（テレビジョン受像機）
５．第５の実施の形態（携帯電話機）
６．第６の実施の形態（ハードディスクレコーダ）
７．第７の実施の形態（カメラ）

＜１．第１の実施の形態＞
［画像符号化装置］
図１は、本発明を適用した画像処理装置としての画像符号化装置の一実施の形態の構成を表している。

図１に示される画像符号化装置１００は、例えば、H．264及びMPEG（Moving Picture Experts Group）４ Part１０（AVC（Advanced Video Coding））（以下H．264/AVCと称する）方式で画像を符号化する符号化装置である。ただし、画像符号化装置１００は、イントラ予測（画面内予測）の際に使用される隣接画素を所定の方法でサンプリングして（間引いて）記憶する。そして、画像符号化装置１００は、そのサンプリングされた隣接画素を所定の方式に従って補間してからイントラ予測に使用する。

図１の例において、画像符号化装置１００は、A/D（Analog / Digital）変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、および蓄積バッファ１０７を有する。また、画像符号化装置１００は、逆量子化部１０８、逆直交変換部１０９、および演算部１１０を有する。さらに、画像符号化装置１００は、デブロックフィルタ１１１、およびフレームメモリ１１２を有する。また、画像符号化装置１００は、イントラ予測部１１４、動き予測補償部１１５、および選択部１１６を有する。さらに、画像符号化装置１００は、レート制御部１１７を有する。

また、画像符号化装置１００は、特徴量抽出部１２１、サンプリング実行決定部１２２、およびサンプリング方式決定部１２３を有する。

A/D変換部１０１は、入力された画像データをA/D変換し、画面並べ替えバッファ１０２に出力し、記憶させる。画面並べ替えバッファ１０２は、記憶した表示の順番のフレームの画像を、GOP（Group of Picture）構造に応じて、符号化のためのフレームの順番に並べ替える。画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、演算部１０３、イントラ予測部１１４、および動き予測補償部１１５に供給する。

演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、選択部１１６から供給される予測画像を減算し、その差分情報を直交変換部１０４に出力する。例えば、イントラ符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像にイントラ予測部１１４から供給される予測画像を加算する。また、例えば、インター符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像に動き予測補償部１１５から供給される予測画像を加算する。

直交変換部１０４は、演算部１０３からの差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を量子化部１０５に供給する。量子化部１０５は、直交変換部１０４が出力する変換係数を量子化する。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、その量子化された変換係数に対して、可変長符号化、算術符号化等の可逆符号化を施す。

可逆符号化部１０６は、イントラ予測を示す情報などをイントラ予測部１１４から取得し、インター予測モードを示す情報などを動き予測補償部１１５から取得する。なお、イントラ予測を示す情報は、以下、イントラ予測モード情報とも称する。また、インター予測を示す情報モードを示す情報は、以下、インター予測モード情報とも称する。

可逆符号化部１０６は、量子化された変換係数を符号化するとともに、フィルタ係数、イントラ予測モード情報、インター予測モード情報、および量子化パラメータなどを、符号化データのヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、符号化して得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

例えば、可逆符号化部１０６においては、可変長符号化または算術符号化等の可逆符号化処理が行われる。可変長符号化としては、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などがあげられる。算術符号化としては、CABAC（Context-Adaptive Binary Arithmetic Coding）などがあげられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持し、所定のタイミングにおいて、H．264/AVC方式で符号化された符号化画像として、例えば、後段の図示せぬ記録装置や伝送路などに出力する。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化し、得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。逆直交変換された出力は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９より供給された逆直交変換結果、すなわち、復元された差分情報に、選択部１１６から供給される予測画像を加算し、局部的に復号された画像（復号画像）を得る。例えば、差分情報が、イントラ符号化が行われる画像に対応する場合、演算部１１０は、その差分情報にイントラ予測部１１４から供給される予測画像を加算する。また、たとえば、差分情報が、インター符号化が行われる画像に対応する場合、演算部１１０は、その差分情報に動き予測補償部１１５から供給される予測画像を加算する。

その加算結果は、デブロックフィルタ１１１またはイントラ予測部１１４に供給される。

デブロックフィルタ１１１は、適宜デブロックフィルタ処理を行うことにより復号画像のブロック歪を除去するとともに、例えばウィナーフィルタ（Wiener Filter）を用いて適宜ループフィルタ処理を行うことにより画質改善を行う。デブロックフィルタ１１１は、各画素をクラス分類し、クラスごとに適切なフィルタ処理を施す。デブロックフィルタ１１１は、そのフィルタ処理結果をフレームメモリ１１２に供給する。

フレームメモリ１１２は、所定のタイミングにおいて、蓄積されている参照画像を動き予測補償部１１５に出力する。

イントラ予測部１１４は、画面内の画素値を用いて予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１１４は、複数のモード（イントラ予測モード）によりイントラ予測を行う。このイントラ予測モードには、演算部１１０から供給された、局所的な復号画像に基づいて予測画像を生成するモードがある。

なお、この局所的な復号画像は、デブロックフィルタ処理されていない画像である。以下においては、デブロックフィルタ１１１によりデブロックフィルタ処理され、フレームメモリ１１２に記憶される画素値と区別するために、局所的な復号画像の、このデブロックフィルタ処理前の画素値を再構成画素値と称する。すなわち、イントラ予測部１１４には、この再構成画素値が供給される。

この再構成画素値は、イントラ予測部１１４において、他のマクロブロックの予測処理の際に、その一部が隣接画素値として使用される。より具体的には、イントラ予測部１１４に供給されるマクロブロック単位の再構成画素値のうち、一番下の画素行と一番右の画素列の画素値が隣接画素値として使用される。

そこでイントラ予測部１１４は、演算部１１０から供給されるマクロブロック単位の再構成画素値のうち、一番下の画素行と一番右の画素列の画素値を保持する。イントラ予測部１１４は、１行分以上のマクロブロック（１マクロブロックライン以上）について、このように再構成画素値の一部を記憶する。

イントラ予測部１１４は、その記憶している再構成画素値を隣接画素値として用いながら後続のマクロブロックについてのイントラ予測処理を行う。

なお、この再構成画素値に対して、局所的な復号画像の、デブロックフィルタ１１１においてデブロックフィルタ処理され、フレームメモリ１１２に記憶される画素値を復号画素値と称する。この復号画素値は、参照画像として動き予測補償部１１５に供給される。

イントラ予測部１１４は、全てのイントラ予測モードで予測画像を生成し、各予測画像を評価し、最適なモードを選択する。イントラ予測部１１４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、選択部１１６を介して演算部１０３や演算部１１０に供給する。

また、上述したように、イントラ予測部１１４は、採用したイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１０６に供給する。

動き予測補償部１１５は、インター符号化が行われる画像について、画面並べ替えバッファ１０２から供給される入力画像と、フレームメモリ１１２から供給される参照画像（復号画素値）とを用いて、動きベクトルを算出する。動き予測補償部１１５は、算出した動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。

動き予測補償部１１５は、候補となる全てのインター予測モードのインター予測処理を行い、予測画像を生成する。動き予測補償部１１５は、生成された予測画像を、選択部１１６を介して演算部１０３や演算部１１０に供給する。

動き予測補償部１１５は、採用されたインター予測モードを示すインター予測モード情報や、算出した動きベクトルを示す動きベクトル情報を可逆符号化部１０６に供給する。

選択部１１６は、イントラ符号化を行う画像の場合、イントラ予測部１１４の出力を演算部１０３に供給し、インター符号化を行う画像の場合、動き予測補償部１１５の出力を演算部１０３に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

特徴量抽出部１２１は、A/D変換部１０１から出力される画像データの特徴量を抽出する。例えば、特徴量抽出部１２１は、画像データのヘッダ情報を参照したり、実データを解析したりして、画像の水平サイズおよびマクロブロックの垂直サイズのうち、少なくともいずれか一方を特定する。

特徴量抽出部１２１が抽出する画像の特徴の内容は任意である。例えば、特徴量抽出部１２１が、画像の内容（例えばテクスチャのパターンや複雑さ）を解析し、その内容を示す情報を生成するようにしてもよい。また、例えば、特徴量抽出部１２１が、画像のピクチャタイプ（Ｉピクチャ、Ｐピクチャ、若しくはＢピクチャ）やスキャン方式を特定するようにしてもよい。

もちろん、特徴量抽出部１２１が、これら以外のパラメータを特徴量として抽出するようにしてもよいし、複数種類の特徴量を抽出するようにしてもよい。

特徴量抽出部１２１は、抽出した特徴量（画像の特徴を示す情報）を、サンプリング実行判定部１２２に供給する。

サンプリング実行決定部１２２は、供給された画像の特徴に応じて、イントラ予測部１１４が、隣接画素値として使用する再構成画素値をサンプリングしてから（間引いてから）記憶するか否かを決定し、再構成画素値のサンプリングを行うか否かを制御する制御情報を生成する。サンプリング実行決定部１２２は、画像の特徴量（画像の特徴を示す情報）とともに、生成した制御情報をサンプリング方式決定部１２３に供給する。

サンプリング方式決定部１２３は、制御情報に基づいてサンプリングを行うか否かを判定し、サンプリングが行われる場合、そのサンプリングの方法（サンプリング方式）を決定し、そのサンプリング方式を指定する制御情報を生成する。サンプリング方式決定部１２３は、画像の特徴量（画像の特徴を示す情報）とともに、生成した各種制御情報等をイントラ予測部１１４に供給する。

イントラ予想部１１４は、サンプリング方式判定部１２３から供給される制御情報に従って、再構成画素値のサンプリングを実行する。

［マクロブロック］
H．264/AVCにおけるマクロブロック内係数データのブロック分割は、輝度成分の場合、図２Ａに示されるように４×４画素単位でのブロック分割（４×４ブロック）と、図２Ｂに示されるように８×８画素単位でのブロック分割（８×８ブロック）の２種類が定義されている。図２に示される各四角はブロック（４×４ブロック若しくは８×８ブロック）を示し、そのブロック内の数字はマクロブロック内のブロックスキャンの順序を示している。なお、色差成分については４×４画素単位でのブロック分割のみが定義されている。

［イントラ予測モード］
H．264/AVCにおけるイントラ予測では、４×４ブロック単位、８×８ブロック単位、およびマクロブロック単位でのイントラ予測方式が定義されている。

図３は、４×４ブロック単位でのイントラ予測であるイントラ４×４予測の予測モードを説明する図である。この場合、処理対象の４×４ブロックに対して、左、左上、上、右上の１３画素の隣接再構成画素値がイントラ予測をするために使用される可能性がある。

図４は、８×８ブロック単位でのイントラ予測であるイントラ８×８予測の予測モードを説明する図である。この場合、処理対象の８×８ブロックに対して、左、左上、上、右上の２５画素の隣接再構成画素がイントラ予測をするために使用される可能性がある。

なお、イントラ８×８予測においては、隣接再構成画素から予測画を生成する前段階の処理として、それぞれの画素に対して平滑化フィルタ処理が行われる。予測画の生成はフィルタ処理後の隣接再構成画素値から計算される。

図５は、マクロブロック単位でのイントラ予測であるイントラ１６×１６予測の予測モード、および予測に使用される隣接再構成画素を示したものである。この場合１６×１６ブロック(マクロブロック)に対して左、左上、上の３３画素の隣接再構成画素がイントラ予測をするために使用される可能性がある。

色差成分については輝度成分とは独立したマクロブロック単位で予測モードが準備される。図６は色差フォーマット４：２：０の場合における色差成分のイントラ予測に使用される隣接再構成画素を示したものである。

図４乃至図６の各図において、白抜きの四角で示される画素が、処理対象マクロブロックの予測を行う画素である。これに対して、グレーの四角で示される画像は、そのイントラ予測を行うのに必要な隣接画素（再構成画素）である。つまり、イントラ予測部１１４は、図４乃至図６にグレーで示される画素値を記憶する必要がある。

したがって、例えば、画像の水平サイズやマクロブロックサイズが大きくなると、イントラ予測部１１４が記憶しなければならない再構成画素値のデータ量が増大する恐れがある。

［マクロブロック符号化順］
H．264/AVCでのインターレース画像の符号化処理においてマクロブロックアダプティブフレーム・フィールド符号化処理を行う場合、マクロブロックの復号化順序が変化するため、保存に必要な画素数が増大する。

例えば、マクロブロックアダプティブフレーム・フィールド符号化処理以外でのマクロブロックの処理順は、図７Ａに示されるラスタースキャン順である。これに対して、マクロブロックアダプティブフレーム・フィールド符号化処理の真っ黒ブロックの処理順は、図７Ｂに示される順序となる。

したがって、この場合、マクロブロックペアとして２ライン分の画素値を直下のマクロブロックペアのイントラ予測のため、メモリ領域あるいはラインバッファに保存しておく必要がある。同様に右端１ピクセル分の画素値についてもマクロブロックペア単位となるため、倍の３２個の画素値を保存しておく必要がある。

このように、例えば、スキャン方式（マクロブロック処理順）によっても、イントラ予測部１１４が記憶しなければならない再構成画素値のデータ量が増大する恐れがある。

また、例えば、画像の内容（例えばエッジの有無やテクスチャの複雑さ）やピクチャタイプ等によって、サンプリングが与える復号画像への影響の大きさが異なる可能性がある。

そこで、サンプリング実行決定部１２２は、画像の特徴に応じて、イントラ予測部１１４に、記憶する再構成画素値のサンプリングを行わせるか否かを決定する。

例えば、符号化する画像の水平方向のサイズ（水平サイズ）が所定の閾値より大きい場合、サンプリング実行決定部１２２は、イントラ予測部１１４が記憶するデータ量の増大を抑制させるために、再構成画素値のサンプリングを実行させることを決定し、その旨を指示する制御情報を生成する。逆に、画像の水平サイズが所定の閾値以下である場合、サンプリング実行決定部１２２は、不要な画質劣化を抑制するために、再構成画素値のサンプリングを実行させないことを決定し、その旨を指示する制御情報を生成する。

また、例えば、マクロブロックの垂直方向のサイズ（垂直方向のマクロブロックサイズ）が所定の閾値より大きい場合（例えば拡張マクロブロックの場合）、サンプリング実行決定部１２２は、イントラ予測部１１４が記憶するデータ量の増大を抑制させるために、再構成画素値のサンプリングを実行させることを決定し、その旨を指示する制御情報を生成する。逆に、垂直方向のマクロブロックサイズが所定の閾値以下である場合（例えば１６×１６画素以下のマクロブロックの場合）、サンプリング実行決定部１２２は、不要な画質劣化を抑制するために、再構成画素値のサンプリングを実行させないことを決定し、その旨を指示する制御情報を生成する。

さらに、例えば、マクロブロックの処理順がラスタスキャン順でない場合、サンプリング実行決定部１２２は、イントラ予測部１１４が記憶するデータ量の増大を抑制させるために、再構成画素値のサンプリングを実行させることを決定し、その旨を指示する制御情報を生成する。逆に、マクロブロックの処理順がラスタスキャン順である場合、サンプリング実行決定部１２２は、不要な画質劣化を抑制するために、再構成画素値のサンプリングを実行させないことを決定し、その旨を指示する制御情報を生成する。

また、例えば、画像に含まれるエッジ成分や、テクスチャの複雑さや、テクスチャの変化の頻度等が、所定の基準以下である場合、サンプリング実行決定部１２２は、イントラ予測部１１４が記憶するデータ量の増大を抑制させるために、再構成画素値のサンプリングを実行させることを決定し、その旨を指示する制御情報を生成する。逆に、所定の基準より、画像にエッジ成分が多数含まれていたり、テクスチャが複雑であったり、テクスチャの変化の頻度が多かったりする場合、サンプリング実行決定部１２２は、不要な画質劣化を抑制するために、再構成画素値のサンプリングを実行させないことを決定し、その旨を指示する制御情報を生成する。

さらに、例えば、ピクチャタイプがＰピクチャやＢピクチャの場合、サンプリングが復号画像に与える視覚的影響が比較的小さいので、サンプリング実行決定部１２２は、イントラ予測部１１４が記憶するデータ量を低減させるために、再構成画素値のサンプリングを実行させることを決定し、その旨を指示する制御情報を生成する。逆に、ピクチャタイプがＩピクチャである場合、サンプリング実行決定部１２２は、サンプリングが復号画像に与える視覚的影響が比較的大きいので、再構成画素値のサンプリングを実行させないことを決定し、その旨を指示する制御情報を生成する。

もちろん、サンプリング実行決定部１２２が、これら以外の判断基準に従ってサンプリングを実行するか否かを決定するようにしてもよい。

同様に、サンプリング方式決定部１２３は、画像の特徴に応じて、イントラ予測部１１４に、記憶する再構成画素値をどの程度の割合でサンプリングさせるかを決定する。

例えば、サンプリング方式決定部１２３は、符号化する画像の水平方向のサイズ（水平サイズ）が大きいほど、イントラ予測部１１４が記憶するデータ量の増大をより強く抑制するように、サンプリングする画素数を低減させる（間引く画素数を増大させる）ことを決定し、その旨を指示する制御情報を生成する。

また、例えば、サンプリング方式決定部１２３は、マクロブロックの垂直方向のサイズ（垂直方向のマクロブロックサイズ）が大きいほど、イントラ予測部１１４が記憶するデータ量の増大をより強く抑制するように、サンプリングする画素数を低減させる（間引く画素数を増大させる）ことを決定し、その旨を指示する制御情報を生成する。

さらに、例えば、サンプリング方式決定部１２３は、マクロブロックの処理順がラスタスキャン順でない場合、イントラ予測部１１４が記憶するデータ量の増大をより強く抑制するように、サンプリングする画素数を低減させる（間引く画素数を増大させる）ことを決定し、その旨を指示する制御情報を生成する。逆に、マクロブロックの処理順がラスタスキャン順である場合、サンプリング方式決定部１２３は、できるだけ不要な画質劣化を抑制するように、サンプリングする画素数を増大させる（間引く画素数を低減させる）ことを決定し、その旨を指示する制御情報を生成する。

また、例えば、サンプリング方式決定部１２３は、画像に含まれるエッジ成分の数が多いほど、テクスチャがより複雑な程、若しくは、テクスチャの変化の頻度が多いほど、イントラ予測部１１４が記憶するデータ量の増大をより強く抑制するように、サンプリングする画素数を低減させる（間引く画素数を増大させる）ことを決定し、その旨を指示する制御情報を生成する。

さらに、例えば、サンプリング方式決定部１２３は、ピクチャタイプがＰピクチャやＢピクチャの場合、サンプリングが復号画像に与える視覚的影響が比較的小さいので、サンプリングする画素数を低減させる（間引く画素数を増大させる）ことを決定し、その旨を指示する制御情報を生成する。逆に、ピクチャタイプがＩピクチャである場合、サンプリング方式決定部１２３は、サンプリングが復号画像に与える視覚的影響が比較的大きいので、できるだけ不要な画質劣化を抑制するように、サンプリングする画素数を増大させる（間引く画素数を低減させる）ことを決定し、その旨を指示する制御情報を生成する。

もちろん、サンプリング方式決定部１２３が、これら以外の判断基準に従ってサンプリングする程度を決定するようにしてもよい。

なお、サンプリング方式決定部１２３は、サンプリングの方式（間引く度合い）だけでなく、サンプリングされた再構成画素値（隣接画素値）の補間方式（方法）も決定し、その補間方式を指定する制御情報を生成し、その制御情報をイントラ予測部１１４に供給する。

イントラ予測部１１４は、サンプリングされた再構成画素値を使用する際、間引かれた画素値を補間してから使用する。この補間方法は任意である。サンプリング方式決定部１２３は、例えば画像の内容や装置の処理能力等に応じて、補間方法を決定する。

［イントラ予測部の構成］
図８は、図１のイントラ予測部１１４の主な構成例を示すブロック図である。図８に示されるように、イントラ予測部１１４は、サンプリング部１５１、再構成画素記憶部１５２、隣接画素再構成部１５３、および予測画生成部１５４を有する。イントラ予測部１１４は、さらに、コスト関数算出部１５５、およびモード判定部１５６を有する。

サンプリング部１５１は、サンプリング方式決定部１２３から供給されるサンプリングを実行するか否かを示す制御情報とサンプリング方式を示す制御情報とを取得し、それらの制御情報に従って、演算部１１０から供給される再構成画素値のうち、隣接画素として後続のマクロブロックの処理に用いる画素値に対してサンプリング（間引き）を行う。サンプリング部１５１は、制御情報に基づいてサンプリングされた再構成画素値（サンプリング部１５１が間引いて残った再構成画素値）、若しくは制御情報に基づいてサンプリングされなかった再構成画素値を再構成画素記憶部１５２に供給する。

再構成画素記憶部１５２は、サンプリング部１５１から供給される再構成画素値を記憶する。隣接画素再構成部１５３は、処理対象マクロブロックの隣接画素の画素値を、再構成画素記憶部１５２から読み出す。この読み出された画素値がサンプリング部１５１によりサンプリングされたものである場合、隣接画素再構成部１５３は、サンプリング方式決定部１２３から供給される制御情報により指定される補間方式で、その読みだされた画素値に対して補間処理を行い、間引かれた画素値を復元する。隣接画素再構成部１５３は、このように必要に応じて補間した隣接画素値を予測画生成部１５４に供給する。

予測画生成部１５４は、供給された隣接画素値を用いて、処理対象マクロブロックの予測画像を生成し、その予測画像をコスト関数算出部１５５に供給する。予測画生成部１５４は、全てのイントラ予測モードで予測画像を生成する。隣接画素再構成部１５３は、必要に応じて再構成画素記憶部１５２から再構成画素を読み出し、隣接画素値として予測画生成部１５４に供給する。

コスト関数算出部１５５は、予測画生成部１５４により生成された予測画像に対して、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対するコスト関数値を算出する。

ここで、コスト関数値としては、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて行う。これらのモードは、H．264/AVC方式における参照ソフトウエアであるＪＭ(Joint Model)で定められている。

コスト関数算出部１５５は、以上のように算出したコスト関数値をモード判定部１５６に供給する。モード判定部１５６は、供給されたコスト関数値に基づいて、最適イントラ予測モードを選択する。すなわち、各イントラ予測モードの中から、コスト関数値が最小値であるモードを、最適イントラ予測モードとして選択する。

モード判定部１５６は、最適イントラ予測モードとして選択した予測モードの予測画像を、必要に応じて、選択部１１６を介して演算部１０３や演算部１１０に供給する。また、モード判定部１５６は、必要に応じて、その予測モードの情報を可逆符号化部１０６に供給する。

［サンプリング例および補間例］
次に、サンプリング方法および補間方法の例について説明する。

イントラ予測部１１４に供給されるマクロブロック毎の再構成画素のうち、後続のマクロブロックに対する予測画像生成に隣接画素として使用される画素は、マクロブロックの一番下の画素行と、一番右の画素列である。

サンプリング方法の第１の例は、これらのマクロブロックの一番下の画素行と一番右の画素列を、２画素に１画素の割合で間引く（１画素おきにサンプリングする）方法である。

この第１の例の方法でサンプリングされた再構成画素を隣接画素として使用する場合の例を図９に示す。図９に示される白抜きの四角はマクロブロックを分割するブロックを示す。つまり各四角がブロックを示し、四角群の外枠が処理対象のマクロブロックを示す。各四角の内部の数字はそのマクロブロック内における処理順（ブロック番号）を示す。グレーの四角は最初に処理されるブロック番号０のブロックの予測に使用される隣接画素の例を示している。この隣接画素は、上述した第１の例の方法によりサンプリングされている。

図９Ａは、処理対象マクロブロック（輝度成分）をイントラ４×４予測モードでイントラ予測する場合の例を示している。図９Ｂは、処理対象マクロブロック（輝度成分）をイントラ８×８予測モードでイントラ予測する場合の例を示している。図９Ｃは、処理対象マクロブロック（輝度成分）をイントラ１６×１６予測モードでイントラ予測する場合の例を示している。図９Ｄは、処理対象マクロブロック（色差成分のＣｂ）をイントラ予測する場合の例を示している。

図９に示されるように、イントラ予測処理対象マクロブロックの水平方向をｘ軸とし、垂直方向をｙ軸とし、マクロブロックの左上端を原点とする。最初のブロックのイントラ予測において隣接画素として使用される、間引かれずに保存された再構成画素の位置ｐ（ｘ，ｙ）は、以下の式（１）乃至式（４）のように表すことができる。なお、式（１）は図９Ａに対応し、式（２）は図９Ｂに対応し、式（３）は図９Ｃに対応し、式（４）は図９Ｄに対応する。

p(2n-1,-1) n=0..4, p(-1,2m-1) m=0..2 ・・・（１）
p(2n-1,-1) n=0..8, p(-1,2m-1) m=0..4 ・・・（２）
p(2n-1,-1) n=0..8, p(-1,2m-1) m=0..8 ・・・（３）
p(2n-1,-1) n=0..4, p(-1,2m-1) m=0..4 ・・・（４）

つまり、最初のブロックのイントラ予測の際に、隣接画素再構成部１５３は、上述した式（１）乃至式（４）のうち、イントラ予測モードに応じたいずれかの式で表される位置の再構成画素を隣接画素として再構成画素記憶部１５２から読み出す。

隣接画素再構成部１５３は、読みだした隣接画素に対して、例えば、以下の式（５）乃至式（８）に示されるような方法で補間処理を行う。

x=2n n=0,1,2.. の場合、
p'(x,-1)={p(x-1,-1)+p(x+1,-1)}/2 ・・・（５）
それ以外の場合、
p'(x,-1)=p(x,-1) ・・・（６）
y=2n n=0,1,2.. の場合、
p'(-1,y)={p(-1,y-1)+p(-1,y+1)}/2 ・・・（７）
それ以外の場合、
p'(-1,y)=p(-1,y) ・・・（８）

なお、補間処理方法の他の例としては、例えば、以下の式（９）乃至式（１２）に示されるような方法も考えられる。このようにすることにより、演算量が低減され、補間処理の負荷が低減される。

x=2n n=0,1,2.. の場合、
p'(x,-1)=p(x-1,-1) ・・・（９）
それ以外の場合、
p'(x,-1)=p(x,-1) ・・・（１０）
y=2n n=0,1,2.. の場合、
p'(-1,y)={p(-1,y-1) ・・・（１１）
それ以外の場合、
p'(-1,y)=p(-1,y) ・・・（１２）

もちろん、サンプリング方式決定部１２３が決定した方法であれば、これら以外の補間方法であってもよい。

なお、マクロブロック内においては、各ブロックのイントラ予測結果のうち、一番下の画素行と、一番右の画素列が、後続のブロックの予測処理に隣接画素として使用される。例えば、ブロック番号０のブロックの予測結果のうち、一番下の画素行は、ブロック番号２のブロックのイントラ予測処理において隣接画素として使用される。また、ブロック番号０のブロックの予測結果のうち、一番右の画素列は、例えば、ブロック番号１のブロックのイントラ予測処理において隣接画素として使用される。

しかしながら、これらの画素値は少量であり、かつ、保持される時間は短時間（そのマクロブロックの処理の間のみ）であるので、サンプリング部１５１は、これらの画素はサンプリングしない（間引かない）。

サンプリング方法の第２の例は、これらのマクロブロックの一番下の画素行のみを、２画素に１画素の割合で間引く（１画素おきにサンプリングする）方法である。

この第２の例の方法でサンプリングされた再構成画素を隣接画素として使用し、処理対象マクロブロック（輝度成分）をイントラ４×４予測モードでイントラ予測する場合の例を図１０に示す。

この場合、最初のブロックのイントラ予測において隣接画素として使用される、間引かれずに保存された再構成画素の位置ｐ（ｘ，ｙ）は、以下の式（１３）のように表すことができる。

p(2n-1,-1) n=0..4, p(-1,m-1) m=0..4 ・・・（１３）

ブロック番号０のブロックのイントラ予測においては、図１０Ａに示されるような位置の隣接画素が使用される。図１０Ａに示されるように、この場合、処理対象ブロック（ブロック番号０のブロック）の左に隣接する、垂直方向に並ぶ隣接画素は、隣接するマクロブロックの再構成画素であり、図９の例の場合では間引かれていたが、この例では間引かれていない。したがって、隣接画素再構成部１５３は、上側の隣接画素のみ補間してやればよい。

ブロック番号０のブロックの予測が終了すると、次に、図１０Ｂに示されるように、ブロック番号１のイントラ予測処理が行われる。

ブロック番号１のブロックのイントラ予測においては、図１０Ｂに示されるような位置の隣接画素が使用される。図１０Ｂに示されるように、ブロック番号０のブロックの予測結果は間引かれない。したがって、隣接画素再構成部１５３は、上側の隣接画素のみ補間してやればよい。

ブロック番号１のブロックの予測が終了すると、次に、図１０Ｃに示されるように、ブロック番号２のイントラ予測処理が行われる。

ブロック番号２のブロックのイントラ予測においては、図１０Ｃに示されるような位置の隣接画素が使用される。つまり、ブロック番号０のブロックの予測結果の一番下の行と、ブロック番号１のブロックの予測結果の一番下の画素行とが隣接画素として使用されるので、これらの隣接画素は間引かれない。また、図１０Ａの場合と同様に、処理対象ブロック（ブロック番号２のブロック）の左に隣接する、垂直方向に並ぶ隣接画素は間引かれない。したがって、隣接画素再構成部１５３は、隣接画素の補間は行わない。

図１０Ｄは、ブロック番号４のイントラ予測の場合、図１０Ｅはブロック番号５のイントラ予測の場合の例をそれぞれ示している。これらの場合、隣接画素の位置が、図１０Ａや図１０Ｂの場合と同様であるので、隣接画素再構成部１５３は、上側の隣接画素のみ補間してやればよい。

図１１は、イントラ８×８予測モードでイントラ予測する場合の例を示す図である。

図１１Ａに示されるように、ブロック番号０のブロックで予測が行われると、図１１Ｂに示されるように、ブロック番号１のブロックで予測が行われ、次に、図１１Ｃに示されるように、ブロック番号２のブロックで予測が行われ、最後に、図１１Ｄに示されるように、ブロック番号３のブロックで予測が行われる。

この場合、図１１Ａおよび図１１Ｂに示されるように、ブロック番号０とブロック番号１の予測処理においては、隣接画素再構成部１５３は、上側の隣接画素のみ補間する。これに対して、図１１Ｃおよび図１１Ｄに示されるように、ブロック番号２とブロック番号３の予測処理においては、隣接画素再構成部１５３は、隣接画素の補間を行わない。

この方式により、画像符号化装置１００は、マクロブロックの最下１ラインを保存するメモリ領域ないしはラインバッファの容量を削減しつつ、それ以外の画素は従来の方式と同数の隣接再構成画素を保存することにより画質の劣化を抑えることができる。

サンプリング方法の第３の例は、マクロブロックの一番下の画素行のみを、４画素に３画素の割合で間引く（３画素おきにサンプリングする）方法である。

この第３の例の方法でサンプリングされた再構成画素を隣接画素として使用する場合の例を図１２に示す。

図１２Ａは、処理対象マクロブロック（輝度成分）をイントラ４×４予測モードでイントラ予測する場合の例を示している。図１２Ｂは、処理対象マクロブロック（輝度成分）をイントラ８×８予測モードでイントラ予測する場合の例を示している。図１２Ｃは、処理対象マクロブロック（輝度成分）をイントラ１６×１６予測モードでイントラ予測する場合の例を示している。

図１２に示されるように、最初のブロックのイントラ予測において隣接画素として使用される、間引かれずに保存された再構成画素の位置ｐ（ｘ，ｙ）は、以下の式（１４）乃至式（１７）のように表すことができる。なお、式（１４）は図１２Ａに対応し、式（１５）は図１２Ｂに対応し、式（１６）は図１２Ｃに対応する。

p(4n-1,-1) n=0..2, p(-1,4m-1) m=0,1 ・・・（１４）
p(4n-1,-1) n=0..4, p(-1,4m-1) m=0..2 ・・・（１５）
p(4n-1,-1) n=0..4, p(-1,4m-1) m=0..4 ・・・（１６）
p(4n-1,-1) n=0..2, p(-1,4m-1) m=0..2 ・・・（１７）

この場合、隣接画素再構成部１５３は、は、例えば、以下の式（１８）乃至式（２５）に示されるように間引かれた隣接画素を補間する。

x=4n n=0,1,2.. の場合、
p'(x,-1)={p(x-1,-1)×3+p(x+3,-1)}/4 ・・・（１８）
x=4n+1 n=0,1,2.. の場合、
p'(x,-1)={p(x-2,-1)+p(x+2,-1)}/2 ・・・（１９）
x=4n+2 n=0,1,2.. の場合、
p'(x,-1)={p(x-3,-1)+p(x+1,-1)×3}/2 ・・・（２０）
それ以外の場合、
p'(x,-1)=p(x,-1) ・・・（２１）
y=4n n=0,1,2.. の場合、
p'(-1,y)={p(-1,y-1)×3+p(-1,y+3)}/4 ・・・（２２）
y=4n+1 n=0,1,2.. の場合、
p'(-1,y)={p(-1,y-2)+p(-1,-y+2)}/2 ・・・（２３）
y=4n+2 n=0,1,2.. の場合、
p'(-1,y)={p(-1,y-3)+p(-1,y+1)×3}/4 ・・・（２４）
それ以外の場合、
p'(-1,y)=p(-1,y) ・・・（２５）

この方式は間引きかれる画素の量が多くなるため、前述の方式にくらべて符号化効率は劣化する可能性があるが、隣接画素を保存する必要なメモリ領域ないしはラインバッファの容量は大きく削減することができる。

以上のように、隣接画素再構成部１５３は、再構成画素記憶部１５２に記憶されている再構成画素が間引かれている場合のみ、適切な方法で隣接画素を補間する。これにより、予測画生成部１５４は、どのような方法で再構成画素がサンプリングされていても、適切に予測画像を生成することができる。

［符号化処理］
次に、以上のような画像符号化装置１００により実行される各処理の流れについて説明する。最初に、図１３のフローチャートを参照して、符号化処理の流れの例を説明する。

ステップＳ１０１において、A/D変換部１０１は入力された画像をA/D変換する。ステップＳ１０２において、特徴量抽出部１２１は、A/D変換された画像についての特徴量を抽出する。ステップＳ１０３において、サンプリング実行決定部１２２は、画像の特徴量として抽出された、画像の水平サイズおよび垂直方向のマクロブロックサイズのうち、少なくともいずれか一方に基づいて、再構成画素値のサンプリングを行うか否かを決定する。

ステップＳ１０４において、サンプリング方式決定部１２３は、ステップＳ１０３においてサンプリングを行うと判定された場合、画像の特徴量として抽出された、画像の水平サイズおよび垂直方向のマクロブロックサイズのうち、少なくともいずれか一方に基づいて、そのサンプリング方式を決定する。

ステップＳ１０５において、画面並べ替えバッファ１０２は、A/D変換部１０１から供給された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１０６において、イントラ予測部１１４および動き予測補償部１１５は、それぞれ画像の予測処理を行う。すなわち、ステップＳ１０６において、イントラ予測部１１４は、イントラ予測モードのイントラ予測処理を行う。動き予測補償部１１５は、インター予測モードの動き予測補償処理を行う。

ステップＳ１０７において、選択部１１６は、イントラ予測部１１４および動き予測補償部１１５から出力された各コスト関数値に基づいて、最適予測モードを決定する。つまり、選択部１１６は、イントラ予測部１１４により生成された予測画像と、動き予測補償部１１５により生成された予測画像のいずれか一方を選択する。

また、この予測画像の選択情報は、イントラ予測部１１４または動き予測補償部１１５に供給される。最適イントラ予測モードの予測画像が選択された場合、イントラ予測部１１４は、最適イントラ予測モードを示す情報（すなわち、イントラ予測モード情報）を、可逆符号化部１０６に供給する。

なお、イントラ予測において再構成画素のサンプリングを行う場合、イントラ予測部１１４は、サンプリングを実行する旨の通知と、サンプリング方式や補間方式の指定とを含む情報を可逆符号化部１０６に供給する。

最適インター予測モードの予測画像が選択された場合、動き予測補償部１１５は、最適インター予測モードを示す情報と、必要に応じて、最適インター予測モードに応じた情報を可逆符号化部１０６に出力する。最適インター予測モードに応じた情報としては、動きベクトル情報やフラグ情報、参照フレーム情報などがあげられる。

ステップＳ１０８において、演算部１０３は、ステップＳ１０５で並び替えられた画像と、ステップＳ１０６の予測処理により得られた予測画像との差分を演算する。予測画像は、インター予測する場合は動き予測補償部１１５から、イントラ予測する場合はイントラ予測部１１４から、それぞれ選択部１１６を介して演算部１０３に供給される。

差分データは元の画像データに較べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１０９において、直交変換部１０４は演算部１０３から供給された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。ステップＳ１１０において、量子化部１０５は変換係数を量子化する。

ステップＳ１１１において、可逆符号化部１０６は量子化部１０５から出力された量子化された変換係数を符号化する。すなわち、差分画像（インターの場合、２次差分画像）に対して、可変長符号化や算術符号化等の可逆符号化が行われる。

なお、可逆符号化部１０６は、ステップＳ１０４の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データのヘッダ情報に付加する。

つまり、可逆符号化部１０６は、イントラ予測部１１４から供給されるイントラ予測モード情報、または、動き予測補償部１１５から供給される最適インター予測モードに応じた情報なども符号化し、ヘッダ情報に付加する。また、可逆符号化部１０６は、イントラ予測部１１４からサンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等が供給される場合、それらの情報も、符号化データのヘッダ情報等に付加する。

ステップＳ１１２において蓄積バッファ１０７は、可逆符号化部１０６から出力される符号化データを蓄積する。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出され、伝送路を介して復号側に伝送される。

ステップＳ１１３においてレート制御部１１７は、蓄積バッファ１０７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

また、ステップＳ１１０の処理により量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１１４において、逆量子化部１０８は量子化部１０５により量子化された変換係数を量子化部１０５の特性に対応する特性で逆量子化する。ステップＳ１１５において、逆直交変換部１０９は、逆量子化部１０８により逆量子化された変換係数を直交変換部１０４の特性に対応する特性で逆直交変換する。

ステップＳ１１６において、演算部１１０は、選択部１１６を介して入力される予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部１０３への入力に対応する画像）である再構成画素を生成する。

ステップＳ１１７において、イントラ予測部１１４は、ステップＳ１１６において生成された再構成画素を記憶する。

ステップＳ１１８においてデブロックフィルタ１１１は、演算部１１０から出力された画像をフィルタリングする。これによりブロック歪みが除去される。ステップＳ１１９においてフレームメモリ１１２は、フィルタリングされた画像を記憶する。

［予測処理］
次に、図１４のフローチャートを参照して、図１３のステップＳ１０６において実行される予測処理の流れの例を説明する。

ステップＳ１３１において、イントラ予測部１１４は処理対象のブロックの画素を、候補となる全てのイントラ予測モードでイントラ予測する。

画面並べ替えバッファ１０２から供給される処理対象の画像がインター処理される画像である場合、参照される画像がフレームメモリ１１２から読み出され、動き予測補償部１１５に供給される。これらの画像に基づいて、ステップＳ１３２において、動き予測補償部１１５はインター動き予測処理を行う。すなわち、動き予測補償部１１５は、フレームメモリ１１２から供給される画像を参照して、候補となる全てのインター予測モードの動き予測処理を行う。

ステップＳ１３３において、動き予測補償部１１５は、ステップＳ１３２において算出されたインター予測モードに対してのコスト関数値の中から、最小値を与える予測モードを、最適インター予測モードとして決定する。そして、動き予測補償部１１５は、インター処理する画像と最適インター予測モードで生成された２次差分情報との差分、および最適インター予測モードのコスト関数値を、選択部１１６に供給する。

［イントラ予測処理］
図１５は、図１４のステップＳ１３１において実行されるイントラ予測処理の流れの例を説明するフローチャートである。

イントラ予測処理が開始されると、ステップＳ１５１において、隣接画素再構成部１５３は、サンプリング方式決定部１２３の指定に従って補間方法を決定する。ステップＳ１５２において、予測画生成部１５４は、未処理の予測モードの中から実行する予測モードを選択する。ステップＳ１５３において、隣接画素再構成部１５３は、ステップＳ１５２において選択された予測モードに応じて隣接画素を再構成画素記憶部１５２から読み出す。

ステップＳ１５４において、隣接画素再構成部１５３は、読み出した隣接画素に対して必要に応じて補間処理を行い、予測に用いる隣接画素を再構成する。ステップＳ１５５において、予測画生成部１５４は、ステップＳ１５４において再構成された隣接画素を用いて予測画像を生成する。

ステップＳ１５６において、予測画生成部１５４は、全ての予測モードで予測画像を生成したか否かを判定し、予測画像を生成していない予測モードが存在すると判定された場合、処理をステップＳ１５２に戻し、それ以降の処理を繰り返す。

つまり、ステップＳ１５２乃至ステップＳ１５６の処理が繰り返されることにより、予測画生成部１５４は、全ての予測モードにより予測画像を生成する。ステップＳ１５６において全ての予測モードで予測画像が生成されたと判定された場合、予測画生成部１５４は、処理をステップＳ１５７に進める。

ステップＳ１５７において、コスト関数算出部１５５は、各予測モードについて、コスト関数値を算出する。

ステップＳ１５８において、モード判定部１５６は、ステップＳ１５７の処理により算出された各モードのコスト関数値に基づいて、各イントラ予測モードに対して最適モードを決定する。

ステップＳ１５９において、モード判定部１５６は、ステップＳ１５７の処理により算出された各モードのコスト関数値に基づいて、最適イントラ予測モードを選択する。

モード判定部１５６は、最適イントラ予測モードとして選択したモードで生成された予測画像を演算部１０３および演算部１１０に供給する。また、モード判定部１５６は、選択した予測モードを示す情報や、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等を可逆符号化部１０６に供給する。

ステップＳ１５９の処理が終わると、イントラ予測部１１４は、処理を図１４に戻し、ステップＳ１３２以降の処理を実行させる。

［再構成画素記憶処理］
次に、図１６のフローチャートを参照して、図１３のステップＳ１１７において実行される再構成画素記憶処理の流れの例を説明する。

再構成画素記憶処理が開始されると、サンプリング部１５１は、ステップＳ１７１において、サンプリング方式決定部１２３から供給される通知に基づいて、再構成画素記憶部１５２に記憶させる再構成画素に対してサンプリングを行うか否かを判定する。サンプリングを行うと判定された場合、サンプリング部１５１は、処理をステップＳ１７２に進める。

ステップＳ１７２において、サンプリング部１５１は、サンプリング方式決定部１２３から供給される通知に基づいて、再構成画素に対するサンプリング方式を決定する。ステップＳ１７３において、サンプリング部１５１は、供給されるマクロブロック毎の再構成画素に対して、そのマクロブロックの右端および下端の画素をサンプリングする。

ステップＳ１７４において、再構成画素記憶部１５２は、ステップＳ１７３においてサンプリングされた再構成画素（間引かれて残った再構成画素）を記憶する。ステップＳ１７４の処理を終了すると、イントラ予測部１１４は、再構成画素記憶処理を終了し、処理を図１３のステップＳ１１７に戻し、ステップＳ１１８に処理を進める。

また、図１６のステップＳ１７１において、サンプリングを行わないと判定された場合、サンプリング部１５１は、処理をステップＳ１７５に進める。ステップＳ１７５において、再構成画素記憶部１５２は、供給されるマクロブロック毎の再構成画素のうち、そのマクロブロックの右端および下端の画素を全て記憶する。ステップＳ１７５の処理を終了すると、イントラ予測部１１４は、再構成画素記憶処理を終了し、処理を図１３のステップＳ１１７に戻し、ステップＳ１１８に処理を進める。

以上のように、画像符号化装置１００は、イントラ予測に利用される再構成画素をサンプリングすることにより、より少ないメモリ量で画面内予測を実現させることができる。これにより、画像符号化装置１００は、装置の小型化を実現することが出来るとともに、コストや消費電力の低減も実現することができる。

なお、以上に説明した各ブロックのサイズは一例であり、上述した以外のサイズであってもよい。また、以上においては、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等を伝送する方法として、符号化データのヘッダ情報にこれらの情報を多重化するように説明したが、これらの情報の格納場所は任意である。例えば、これらの情報がSEI（Suplemental Enhancement Information）等のパラメータセット（例えばシーケンスやピクチャのヘッダ等）に格納されるようにしてもよい。またこれらの情報が、符号化データとは別に（別のファイルとして）、画像符号化装置から画像復号装置に伝送されるようにしてもよい。

なお、サンプリングを行うか否かの制御やその方法等の制御は、任意の処理単位毎に行われるようにしてもよい。例えば、ピクチャ単位毎に行われるようにしてもよいし、シーケンス単位毎に行われるようにしてもよい。もちろんこれら以外の処理単位毎に行われるようにしてもよい。

＜２．第２の実施の形態＞
［画像復号装置］
第１の実施の形態において説明した画像符号化装置１００により符号化された符号化データは、所定の伝送路を介して、画像符号化装置１００に対応する画像復号装置に伝送され、復号される。

以下に、その画像復号装置について説明する。図１７は、本発明を適用した画像復号装置の主な構成例を示すブロック図である。

図１７に示されるように、画像復号装置２００は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、デブロックフィルタ２０６、画面並べ替えバッファ２０７、およびD/A変換部２０８を有する。また、画像復号装置２００は、フレームメモリ２０９、イントラ予測部２１１、動き予測補償部２１２、および選択部２１３をさらに有する。

蓄積バッファ２０１は、伝送されてきた符号化データを蓄積する。この符号化データは、画像符号化装置１００により符号化されたものである。可逆復号部２０２は、蓄積バッファ２０１から所定のタイミングで読み出された符号化データを、図１の可逆符号化部１０６の符号化方式に対応する方式で復号する。

逆量子化部２０３は、可逆復号部２０２により復号されて得られた係数データを、図１の量子化部１０５の量子化方式に対応する方式で逆量子化する。逆量子化部２０３は、逆量子化された係数データを、逆直交変換部２０４に供給する。逆直交変換部２０４は、図１の直交変換部１０４の直交変換方式に対応する方式で、その係数データを逆直交変換し、画像符号化装置１００において直交変換される前の残差データに対応する復号残差データを得る。

逆直交変換されて得られた復号残差データは、演算部２０５に供給される。また、演算部２０５には、選択部２１３を介して、イントラ予測部２１１若しくは動き予測補償部２１２から予測画像が供給される。

演算部２０５は、その復号残差データと予測画像とを加算し、画像符号化装置１００の演算部１０３により予測画像が減算される前の画像データに対応する復号画像データを得る。演算部２０５は、その復号画像データをイントラ予測部２１１およびデブロックフィルタ２０６に供給する。

デブロックフィルタ２０６は、復号された画像のブロック歪を除去した後、フレームメモリ２０９に供給し、蓄積させるとともに、画面並べ替えバッファ２０７にも供給する。

画面並べ替えバッファ２０７は、画像の並べ替えを行う。すなわち、図１の画面並べ替えバッファ１０２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部２０８は、画面並べ替えバッファ２０７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

イントラ予測部２１１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報や、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等が可逆復号部２０２から適宜供給される。イントラ予測部２１１は、これらの情報に基づいて、必要に応じて隣接画素の補間処理を行い、予測画像を生成し、生成した予測画像を選択部２１３に供給する。

動き予測補償部２１２は、ヘッダ情報を復号して得られた情報（予測モード情報、動きベクトル情報、参照フレーム情報）を可逆復号部２０２から取得する。インター予測モードを示す情報が供給された場合、動き予測補償部２１２は、可逆復号部２０２からのインター動きベクトル情報に基づいてフレームメモリ２０９から参照画像を取得し、その参照画像や動きベクトル情報を用いて予測画像を生成し、生成した予測画像を選択部２１３に供給する。

選択部２１３は、動き予測補償部２１２またはイントラ予測部２１１により生成された予測画像を選択し、演算部２０５に供給する。

［イントラ予測部］
図１８は、図１７のイントラ予測部２１１の主な構成例を示すブロック図である。

図１８に示されるように、イントラ予測部２１１は、制御部２３１、サンプリング部２３２、再構成画素記憶部２３３、隣接画素再構成部２３４、および予測画像生成部２３５を有する。

制御部２３１は、可逆復号部２０２から供給される予測モードや、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等に基づいて、サンプリング部２３２乃至予測画像生成部２３５の各部を制御し、画像符号化装置１００のイントラ予測部１１４の場合と同様に、再構成画素のサンプリングや補間を実行させる。

サンプリング部２３２は、サンプリング部１５１と基本的に同様の構成を有し、基本的に同様の処理を行う。つまり、サンプリング部２３２は、制御部２３１の制御に従って、演算部２０５から供給される再構成画素に対して必要に応じてサンプリングを行い、サンプリングされた再構成画素値（サンプリング部２３２が間引いて残った再構成画素値）、若しくは制御情報に基づいてサンプリングされなかった再構成画素値を再構成画素記憶部２３３に供給する。

再構成画素記憶部２３３は、基本的に再構成画素記憶部１５２と同様の構成を有し、同様の処理を行う。つまり、再構成画素記憶部２３３は、制御部２３１に制御され、サンプリング部２３２から供給される再構成画素値を記憶する。

隣接画素再構成部２３４は、基本的に隣接画素再構成部１５３と同様の構成を有し、同様の処理を行う。つまり、隣接画素再構成部２３４は、制御部２３１に制御され、処理対象マクロブロックの隣接画素の画素値を、再構成画素記憶部２３３から読み出す。この読み出された画素値がサンプリング部２３２によりサンプリングされたものである場合、隣接画素再構成部２３４は、制御部２３１を介して供給される制御情報により指定される補間方式で、その読みだされた画素値に対して補間処理を行い、間引かれた画素値を復元する。隣接画素再構成部２３４は、このように必要に応じて補間した隣接画素値を予測画像生成部２３５に供給する。

予測画像生成部２３５は、基本的に予測画生成部１５４と同様の構成を有し、同様の処理を行う。つまり予測画像生成部２３５は、制御部２３１に制御されて、隣接画素再構成部２３４から供給された隣接画素値を用いて、処理対象マクロブロックの予測画像を生成し、その予測画像を演算部２０５に供給する。予測画像生成部２３５は、全てのイントラ予測モードでこのように予測画像を生成する。隣接画素再構成部２３４は、必要に応じて再構成画素記憶部２３３から再構成画素を読み出し、隣接画素値として予測画像生成部２３５に供給する。

つまり、画像復号装置２００のイントラ予測部２１１においても、画像符号化装置１００のイントラ予測部１１４の場合と同様のイントラ予測が行われるが、イントラ予測部２１１は、イントラ予測部１１４の場合と同様に、必要に応じて、そのイントラ予測において隣接画素として用いられる再構成画素に対するサンプリング（間引き）を行う。

このとき、画像復号装置２００のイントラ予測部２１１は、画像符号化装置１００から提供される、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等の情報に基づいて、画像符号化装置１００において行われたのと同様のサンプリングや補間を行う。これにより、画像復号装置２００は、画面内予測に必要なメモリ量を低減させることができる。

［復号処理］
次に、以上のような画像復号装置２００により実行される各処理の流れについて説明する。最初に、図１９のフローチャートを参照して、復号処理の流れの例を説明する。

復号処理が開始されると、ステップＳ２０１において、蓄積バッファ２０１は伝送されてきた符号化データを蓄積する。ステップＳ２０２において、可逆復号部２０２は、蓄積バッファ２０１から供給される符号化データを復号する。すなわち、図１の可逆符号化部１０６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。

このとき、動きベクトル情報、参照フレーム情報、予測モード情報（イントラ予測モード、またはインター予測モード）、フラグ情報、並びに、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等も復号される。

すなわち、予測モード情報がイントラ予測モード情報である場合、予測モード情報は、イントラ予測部２１１に供給される。予測モード情報がインター予測モード情報である場合、予測モード情報と対応する動きベクトル情報は、動き予測補償部２１２に供給される。

また、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等の情報は、イントラ予測部２１１に供給される。

ステップＳ２０３において、逆量子化部２０３は可逆復号部２０２により復号された変換係数を、図１の量子化部１０５の特性に対応する特性で逆量子化する。ステップＳ２０４において逆直交変換部２０４は逆量子化部２０３により逆量子化された変換係数を、図１の直交変換部１０４の特性に対応する特性で逆直交変換する。これにより図１の直交変換部１０４の入力（演算部１０３の出力）に対応する差分情報が復号されたことになる。

ステップＳ２０５において、イントラ予測部２１１、または動き予測補償部２１２は、可逆復号部２０２から供給される予測モード情報に対応して、それぞれ画像の予測処理を行う。

すなわち、可逆復号部２０２からイントラ予測モード情報が供給された場合、イントラ予測部２１１は、イントラ予測モードのイントラ予測処理を行う。また、可逆復号部２０２からサンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等も供給された場合、イントラ予測部２１１は、それらの情報を用いたイントラ予測処理（再構成画素のサンプリングや補間処理等を伴う画面内予測）を行う。

可逆復号部２０２からインター予測モード情報が供給された場合、動き予測補償部２１２は、インター予測モードの動き予測処理を行う。

ステップＳ２０６において、選択部２１３は予測画像を選択する。すなわち、選択部２１３には、イントラ予測部２１１により生成された予測画像、若しくは、動き予測補償部２１２により生成された予測画像が供給される。選択部２１３は、そのいずれか一方を選択する。選択された予測画像は、演算部２０５に供給される。

ステップＳ２０７において、演算部２０５は、ステップＳ２０４の処理により得られた差分情報に、ステップＳ２０６の処理により選択された予測画像を加算する。これにより元の画像データが復元される。

ステップＳ２０８において、イントラ予測部２１１は、ステップＳ２０７において復元された画像データである再構成画素を記憶する。

ステップＳ２０９において、デブロックフィルタ２０６は、演算部２０５から供給された復号画像データをフィルタリングする。これによりブロック歪みが除去される。

ステップＳ２１０において、フレームメモリ２０９は、フィルタリングされた復号画像データを記憶する。

ステップＳ２１１において、画面並べ替えバッファ２０７は、復号画像データのフレームの並べ替えを行う。すなわち、復号画像データの、画像符号化装置１００の画面並べ替えバッファ１０２（図１）により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ２１２において、D/A変換部２０８は、画面並べ替えバッファ２０７においてフレームが並べ替えられた復号画像データをD/A変換する。この復号画像データが図示せぬディスプレイに出力され、その画像が表示される。

［予測処理］
次に図２０のフローチャートを参照して、図１９のステップＳ２０５において実行される予測処理の流れの例を説明する。

予測処理が開始されると、可逆復号部２０２は、イントラ予測モード情報に基づいて、イントラ符号化されているか否かを判定する。イントラ符号化されていると判定した場合、可逆復号部２０２は、イントラ予測モード情報をイントラ予測部２１１に供給し、処理をステップＳ２３２に進める。なお、サンプリングを実行する旨の通知や、サンプリング方式や補間方式の指定等が存在する場合、可逆復号部２０２は、それらの情報もイントラ予測部２１１に供給する。

ステップＳ２３２において、イントラ予測部２１１は、イントラ予測処理を行う。イントラ予測処理が終了すると、画像復号装置２００は、処理を図１９のステップＳ２０５に戻し、ステップＳ２０６以降の処理を実行させる。

また、ステップＳ２３１において、インター符号化されていると判定された場合、可逆復号部２０２は、インター予測モード情報を動き予測補償部２１２に供給し、処理をステップＳ２３３に進める。

ステップＳ２３３において、動き予測補償部２１２は、インター動き予測補償処理を行う。インター動き予測補償処理が終了すると、画像復号装置２００は、処理を図１９のステップＳ２０５に戻し、ステップＳ２０６以降の処理を実行させる。

［イントラ予測処理］
次に、図２１のフローチャートを参照して、図２０のステップＳ２３２において実行されるイントラ予測処理の流れの例を説明する。

イントラ予測処理が開始されると、隣接画素再構成部２３４は、制御部２３１の制御に従って補間方法を決定する。ステップＳ２５２において、予測画像生成部２３５は、制御部２３１の制御に従って予測モードを決定する。ステップＳ２５３において、隣接画素再構成部２３４は、ステップＳ２５２において決定された予測モードに応じて隣接画素を読み出す。

ステップＳ２５４において、隣接画素再構成部２３４は、ステップＳ２５１において決定された補間方法に従って隣接画素を再構成する。ステップＳ２５５において、予測画像生成部２３５は、再構成された隣接画素を用いて予測画像を生成する。

ステップＳ２５５の処理が終了すると、制御部２３１は、イントラ予測処理を終了し、処理を図２０のステップＳ２３２に処理を戻し、それ以降の処理を行う。

なお、図１９のステップＳ２０８において実行される再構成画素記憶処理は、図１６のフローチャートに示される場合と同様に行われるので、その説明を省略する。

以上のように、画像復号装置２００は、画面内予測に必要なメモリ量を低減させることができる。

なお、以上において説明した直交変換や逆直交変換の代わりにアダマール変換等を用いるようにしてもよい。また、以上に説明した各ブロックのサイズは一例である。

以上においては、画像符号化装置１００においてサンプリングが行われたか否かを示す情報や、画像符号化装置１００において行われたサンプリング方法や補間方法を示す情報が画像符号化装置１００から画像復号装置２００に伝送され、画像復号装置２００がそれらの情報に基づいて画像符号化装置１００と同様のサンプリングや補間処理を行うように説明した。しかしながら、これに限らず、画像復号装置２００が、画像符号化装置１００と同様に画像の特徴量を抽出し、その抽出した特徴量に基づいてサンプリングや補間処理を行うようにしてもよい。

その場合、サンプリングが行われたか否かを示す情報や、画像符号化装置１００において行われたサンプリング方法や補間方法を示す情報等の伝送は省略可能である。画像復号装置２００は、符号化データのヘッダ情報等から画像の特徴量を抽出するようにしてもよいし、復号画像データを解析して特徴量を抽出するようにしてもよい。

［マクロブロック］
以上においては、１６×１６以下のマクロブロックについて説明したが、マクロブロックのサイズは、１６×１６より大きくてもよい。

本発明は、例えば図２２に示されるようなあらゆる大きさのマクロブロックに対して適用することができる。例えば、本発明は、通常の１６×１６画素のようなマクロブロックだけでなく、３２×３２画素のような拡張されたマクロブロック（拡張マクロブロック）にも適用することができる。

図２２において、上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。また、中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。さらに、下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

上段の右側に示される１６×１６画素のブロックは、H．264/AVC方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

中段の右側に示される８×８画素のブロックは、H．264/AVC方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

これらのブロックは、以下の３階層に分類することができる。すなわち、図２０の上段に示される３２×３２画素、３２×１６画素、および１６×３２画素のブロックを第１階層と称する。上段の右側に示される１６×１６画素のブロック、並びに、中段に示される１６×１６画素、１６×８画素、および８×１６画素のブロックを、第２階層と称する。中段の右側に示される８×８画素のブロック、並びに、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックを、第３階層と称する。

このような階層構造を採用することにより、１６×１６画素のブロック以下に関しては、H．264/AVC方式と互換性を保ちながら、そのスーパーセットとして、より大きなブロックを定義することができる。

＜３．第３の実施の形態＞
［パーソナルコンピュータ］
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図２３に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。

図２３において、パーソナルコンピュータ５００のCPU５０１は、ROM（Read Only Memory）５０２に記憶されているプログラム、または記憶部５１３からRAM（Random Access Memory）５０３にロードされたプログラムに従って各種の処理を実行する。RAM５０３にはまた、CPU５０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU５０１、ROM５０２、およびRAM５０３は、バス５０４を介して相互に接続されている。このバス５０４にはまた、入出力インタフェース５１０も接続されている。

入出力インタフェース５１０には、キーボード、マウスなどよりなる入力部５１１、CRT（Cathode Ray Tube）やLCD（Liquid Crystal Display）などよりなるディスプレイ、並びにスピーカなどよりなる出力部５１２、ハードディスクなどより構成される記憶部５１３、モデムなどより構成される通信部５１４が接続されている。通信部５１４は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース５１０にはまた、必要に応じてドライブ５１５が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア５２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部５１３にインストールされる。

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。

この記録媒体は、例えば、図２３に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM（Compact Disc - Read Only Memory）,DVD（Digital Versatile Disc）を含む）、光磁気ディスク（MD（Mini Disc）を含む）、もしくは半導体メモリなどよりなるリムーバブルメディア５２１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM５０２や、記憶部５１３に含まれるハードディスクなどで構成される。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数のデバイス（装置）により構成される装置全体を表すものである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した画像符号化装置１００や画像復号装置２００は、任意の電子機器に適用することができる。以下にその例について説明する。

＜４．第４の実施の形態＞
［テレビジョン受像機］
図２４は、本発明を適用した画像復号装置２００を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図２４に示されるテレビジョン受像機１０００は、地上波チューナ１０１３、ビデオデコーダ１０１５、映像信号処理回路１０１８、グラフィック生成回路１０１９、パネル駆動回路１０２０、および表示パネル１０２１を有する。

地上波チューナ１０１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ１０１５に供給する。ビデオデコーダ１０１５は、地上波チューナ１０１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路１０１８に供給する。

映像信号処理回路１０１８は、ビデオデコーダ１０１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路１０１９に供給する。

グラフィック生成回路１０１９は、表示パネル１０２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路１０２０に供給する。また、グラフィック生成回路１０１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路１０２０に供給するといった処理も適宜行う。

パネル駆動回路１０２０は、グラフィック生成回路１０１９から供給されたデータに基づいて表示パネル１０２１を駆動し、番組の映像や上述した各種の画面を表示パネル１０２１に表示させる。

表示パネル１０２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路１０２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機１０００は、音声A/D（Analog/Digital)変換回路１０１４、音声信号処理回路１０２２、エコーキャンセル／音声合成回路１０２３、音声増幅回路１０２４、およびスピーカ１０２５も有する。

地上波チューナ１０１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ１０１３は、取得した音声信号を音声A/D変換回路１０１４に供給する。

音声A/D変換回路１０１４は、地上波チューナ１０１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路１０２２に供給する。

音声信号処理回路１０２２は、音声A/D変換回路１０１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声信号処理回路１０２２から供給された音声データを音声増幅回路１０２４に供給する。

音声増幅回路１０２４は、エコーキャンセル／音声合成回路１０２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ１０２５から出力させる。

さらに、テレビジョン受像機１０００は、デジタルチューナ１０１６およびMPEGデコーダ１０１７も有する。

デジタルチューナ１０１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ１０１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路１０２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路１０１８に供給する。また、MPEGデコーダ１０１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU１０３２に供給する。

テレビジョン受像機１０００は、このように映像パケットをデコードするMPEGデコーダ１０１７として、上述した画像復号装置２００を用いる。なお、放送局等より送信されるMPEG-TSは、画像符号化装置１００によって符号化されている。

MPEGデコーダ１０１７は、画像復号装置２００の場合と同様に、放送局（画像符号化装置１００）より供給される符号化データから抽出した、放送局（画像符号化装置１００）においてサンプリングが行われたか否かの通知やサンプリング方式および補間方式の指定等の情報を用いて、隣接画素のサンプリングや補間処理を必要に応じて行い、その隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から復号画像データを生成する。したがって、MPEGデコーダ１０１７は、画面内予測に必要なメモリ量を低減させることができる。

MPEGデコーダ１０１７から供給された映像データは、ビデオデコーダ１０１５から供給された映像データの場合と同様に、映像信号処理回路１０１８において所定の処理が施され、グラフィック生成回路１０１９において、生成された映像データ等が適宜重畳され、パネル駆動回路１０２０を介して表示パネル１０２１に供給され、その画像が表示される。

MPEGデコーダ１０１７から供給された音声データは、音声A/D変換回路１０１４から供給された音声データの場合と同様に、音声信号処理回路１０２２において所定の処理が施され、エコーキャンセル／音声合成回路１０２３を介して音声増幅回路１０２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ１０２５から出力される。

また、テレビジョン受像機１０００は、マイクロホン１０２６、およびA/D変換回路１０２７も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、テレビジョン受像機１０００のユーザ（ユーザＡ）の音声のデータがA/D変換回路１０２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

さらに、テレビジョン受像機１０００は、音声コーデック１０２８、内部バス１０２９、SDRAM（Synchronous Dynamic Random Access Memory)１０３０、フラッシュメモリ１０３１、CPU１０３２、USB（Universal Serial Bus) I/F１０３３、およびネットワークI/F１０３４も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック１０２８に供給する。

音声コーデック１０２８は、A/D変換回路１０２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス１０２９を介してネットワークI/F１０３４に供給する。

ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F１０３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック１０２８から供給された音声データを送信する。また、ネットワークI/F１０３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子１０３５を介して受信し、それを、内部バス１０２９を介して音声コーデック１０２８に供給する。

音声コーデック１０２８は、ネットワークI/F１０３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声コーデック１０２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

SDRAM１０３０は、CPU１０３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ１０３１は、CPU１０３２により実行されるプログラムを記憶する。フラッシュメモリ１０３１に記憶されているプログラムは、テレビジョン受像機１０００の起動時などの所定のタイミングでCPU１０３２により読み出される。フラッシュメモリ１０３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ１０３１には、CPU１０３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ１０３１は、例えばCPU１０３２の制御により、そのMPEG-TSを、内部バス１０２９を介してMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機１０００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ１０１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機１０００は、リモートコントローラ１０５１から送信される赤外線信号を受光する受光部１０３７も有する。

受光部１０３７は、リモートコントローラ１０５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU１０３２に出力する。

CPU１０３２は、フラッシュメモリ１０３１に記憶されているプログラムを実行し、受光部１０３７から供給される制御コードなどに応じてテレビジョン受像機１０００の全体の動作を制御する。CPU１０３２とテレビジョン受像機１０００の各部は、図示せぬ経路を介して接続されている。

USB I/F１０３３は、USB端子１０３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機１０００の外部の機器との間でデータの送受信を行う。ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機１０００は、MPEGデコーダ１０１７として画像復号装置２００を用いることにより、画面内予測に必要なメモリ量を低減させることができる。その結果として、テレビジョン受像機１０００は、アンテナを介して受信する放送波信号や、ネットワークを介して取得するコンテンツデータの画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

＜５．第５の実施の形態＞
［携帯電話機］
図２５は、本発明を適用した画像符号化装置１００および画像復号装置２００を用いる携帯電話機の主な構成例を示すブロック図である。

図２５に示される携帯電話機１１００は、各部を統括的に制御するようになされた主制御部１１５０、電源回路部１１５１、操作入力制御部１１５２、画像エンコーダ１１５３、カメラI/F部１１５４、LCD制御部１１５５、画像デコーダ１１５６、多重分離部１１５７、記録再生部１１６２、変復調回路部１１５８、および音声コーデック１１５９を有する。これらは、バス１１６０を介して互いに接続されている。

また、携帯電話機１１００は、操作キー１１１９、CCD（Charge Coupled Devices）カメラ１１１６、液晶ディスプレイ１１１８、記憶部１１２３、送受信回路部１１６３、アンテナ１１１４、マイクロホン（マイク）１１２１、およびスピーカ１１１７を有する。

電源回路部１１５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機１１００を動作可能な状態に起動する。

携帯電話機１１００は、CPU、ROMおよびRAM等でなる主制御部１１５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機１１００は、マイクロホン（マイク）１１２１で集音した音声信号を、音声コーデック１１５９によってデジタル音声データに変換し、これを変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機１１００は、アンテナ１１１４で受信した受信信号を送受信回路部１１６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部１１５８でスペクトラム逆拡散処理し、音声コーデック１１５９によってアナログ音声信号に変換する。携帯電話機１１００は、その変換して得られたアナログ音声信号をスピーカ１１１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機１１００は、操作キー１１１９の操作によって入力された電子メールのテキストデータを、操作入力制御部１１５２において受け付ける。携帯電話機１１００は、そのテキストデータを主制御部１１５０において処理し、LCD制御部１１５５を介して、画像として液晶ディスプレイ１１１８に表示させる。

また、携帯電話機１１００は、主制御部１１５０において、操作入力制御部１１５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機１１００は、その電子メールデータを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機１１００は、復元された電子メールデータを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示する。

なお、携帯電話機１１００は、受信した電子メールデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

この記憶部１１２３は、書き換え可能な任意の記憶媒体である。記憶部１１２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機１１００は、撮像によりCCDカメラ１１１６で画像データを生成する。CCDカメラ１１１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。CCDカメラ１１１６は、その画像データを、カメラI/F部１１５４を介して、画像エンコーダ１１５３で符号化し、符号化画像データに変換する。

携帯電話機１１００は、このような処理を行う画像エンコーダ１１５３として、上述した画像符号化装置１００を用いる。画像エンコーダ１１５３は、画像符号化装置１００の場合と同様に、画像データから抽出した特徴量に基づいて隣接画素のサンプリングを行うか否かの決定、行う場合はそのサンプリング方式や補間処理の方式の決定等を行い、必要に応じて隣接画素をサンプリングして記憶する。画像エンコーダ１１５３は、イントラ予測を行う際に、その隣接画素を読み出し、必要に応じて補間処理を行い、隣接画素を再構成する。そして画像エンコーダ１１５３は、再構成された隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から符号化データを生成する。したがって、画像エンコーダ１１５３は、画面内予測に必要なメモリ量を低減させることができる。

なお、携帯電話機１１００は、このとき同時に、CCDカメラ１１１６で撮像中にマイクロホン（マイク）１１２１で集音した音声を、音声コーデック１１５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機１１００は、多重分離部１１５７において、画像エンコーダ１１５３から供給された符号化画像データと、音声コーデック１１５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機１１００は、その結果得られる多重化データを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機１１００は、CCDカメラ１１１６で生成した画像データを、画像エンコーダ１１５３を介さずに、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機１１００は、多重分離部１１５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機１１００は、画像デコーダ１１５６において符号化画像データをデコードすることにより、再生動画像データを生成し、これを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ１１１８に表示される。

携帯電話機１１００は、このような処理を行う画像デコーダ１１５６として、上述した画像復号装置２００を用いる。つまり、画像デコーダ１１５６は、画像復号装置２００の場合と同様に、他の装置の画像エンコーダ１１５３（画像符号化装置１００）より供給される符号化データから抽出した、他の装置の画像エンコーダ１１５３（画像符号化装置１００）においてサンプリングが行われたか否かの通知やサンプリング方式および補間方式の指定等の情報を用いて、隣接画素のサンプリングや補間処理を必要に応じて行い、その隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から復号画像データを生成する。したがって、画像デコーダ１１５６は、画面内予測に必要なメモリ量を低減させることができる。

このとき、携帯電話機１１００は、同時に、音声コーデック１１５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ１１１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機１１００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

また、携帯電話機１１００は、主制御部１１５０において、撮像されてCCDカメラ１１１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機１１００は、赤外線通信部１１８１で赤外線により外部の機器と通信することができる。

携帯電話機１１００は、画像エンコーダ１１５３として画像符号化装置１００を用いることにより、例えばCCDカメラ１１１６において生成された画像データを符号化して伝送する際の、画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

また、携帯電話機１１００は、画像デコーダ１１５６として画像復号装置２００を用いることにより、例えば、簡易ホームページ等にリンクされた動画像ファイルのデータ（符号化データ）を復号する際の画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

なお、以上において、携帯電話機１１００が、CCDカメラ１１１６を用いるように説明したが、このCCDカメラ１１１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機１１００は、CCDカメラ１１１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機１１００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機１１００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機１１００の場合と同様に、画像符号化装置１００および画像復号装置２００を適用することができる。

＜６．第６の実施の形態＞
［ハードディスクレコーダ］
図２６は、本発明を適用した画像符号化装置１００および画像復号装置２００を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図２６に示されるハードディスクレコーダ（HDDレコーダ）１２００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ１２００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ１２００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ１２００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることができる。また、ハードディスクレコーダ１２００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図２６に示されるように、ハードディスクレコーダ１２００は、受信部１２２１、復調部１２２２、デマルチプレクサ１２２３、オーディオデコーダ１２２４、ビデオデコーダ１２２５、およびレコーダ制御部１２２６を有する。ハードディスクレコーダ１２００は、さらに、EPGデータメモリ１２２７、プログラムメモリ１２２８、ワークメモリ１２２９、ディスプレイコンバータ１２３０、OSD（On Screen Display）制御部１２３１、ディスプレイ制御部１２３２、記録再生部１２３３、D/Aコンバータ１２３４、および通信部１２３５を有する。

また、ディスプレイコンバータ１２３０は、ビデオエンコーダ１２４１を有する。記録再生部１２３３は、エンコーダ１２５１およびデコーダ１２５２を有する。

受信部１２２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部１２２６に出力する。レコーダ制御部１２２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ１２２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部１２２６は、このとき、ワークメモリ１２２９を必要に応じて使用する。

通信部１２３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部１２３５は、レコーダ制御部１２２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部１２２２は、チューナより供給された信号を、復調し、デマルチプレクサ１２２３に出力する。デマルチプレクサ１２２３は、復調部１２２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ１２２４、ビデオデコーダ１２２５、またはレコーダ制御部１２２６に出力する。

オーディオデコーダ１２２４は、入力されたオーディオデータをデコードし、記録再生部１２３３に出力する。ビデオデコーダ１２２５は、入力されたビデオデータをデコードし、ディスプレイコンバータ１２３０に出力する。レコーダ制御部１２２６は、入力されたEPGデータをEPGデータメモリ１２２７に供給し、記憶させる。

ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されたビデオデータを、ビデオエンコーダ１２４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部１２３３に出力する。また、ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されるビデオデータの画面のサイズを、モニタ１２６０のサイズに対応するサイズに変換し、ビデオエンコーダ１２４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部１２３２に出力する。

ディスプレイ制御部１２３２は、レコーダ制御部１２２６の制御のもと、OSD（On Screen Display）制御部１２３１が出力したOSD信号を、ディスプレイコンバータ１２３０より入力されたビデオ信号に重畳し、モニタ１２６０のディスプレイに出力し、表示させる。

モニタ１２６０にはまた、オーディオデコーダ１２２４が出力したオーディオデータが、D/Aコンバータ１２３４によりアナログ信号に変換されて供給されている。モニタ１２６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部１２３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部１２３３は、例えば、オーディオデコーダ１２２４より供給されるオーディオデータを、エンコーダ１２５１によりエンコードする。また、記録再生部１２３３は、ディスプレイコンバータ１２３０のビデオエンコーダ１２４１より供給されるビデオデータを、エンコーダ１２５１によりエンコードする。記録再生部１２３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部１２３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部１２３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部１２３３は、デコーダ１２５２によりオーディオデータおよびビデオデータをデコードする。記録再生部１２３３は、復号したオーディオデータをD/A変換し、モニタ１２６０のスピーカに出力する。また、記録再生部１２３３は、復号したビデオデータをD/A変換し、モニタ１２６０のディスプレイに出力する。

レコーダ制御部１２２６は、受信部１２２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ１２２７から最新のEPGデータを読み出し、それをOSD制御部１２３１に供給する。OSD制御部１２３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部１２３２に出力する。ディスプレイ制御部１２３２は、OSD制御部１２３１より入力されたビデオデータをモニタ１２６０のディスプレイに出力し、表示させる。これにより、モニタ１２６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ１２００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部１２３５は、レコーダ制御部１２２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部１２２６に供給する。レコーダ制御部１２２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部１２３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部１２２６および記録再生部１２３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部１２２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ１２３０に供給する。ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５から供給されるビデオデータと同様に、レコーダ制御部１２２６から供給されるビデオデータを処理し、ディスプレイ制御部１２３２を介してモニタ１２６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部１２２６が、復号したオーディオデータを、D/Aコンバータ１２３４を介してモニタ１２６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部１２２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ１２２７に供給する。

以上のようなハードディスクレコーダ１２００は、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダとして画像復号装置２００を用いる。つまり、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、画像復号装置２００の場合と同様に、画像符号化装置１００より供給される符号化データから抽出した、画像符号化装置１００においてサンプリングが行われたか否かの通知やサンプリング方式および補間方式の指定等の情報を用いて、隣接画素のサンプリングや補間処理を必要に応じて行い、その隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から復号画像データを生成する。したがって、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、画面内予測に必要なメモリ量を低減させることができる。

したがって、ハードディスクレコーダ１２００は、例えば、チューナや通信部１２３５が受信するビデオデータ（符号化データ）や、記録再生部１２３３が再生するビデオデータ（符号化データ）を復号する際の画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

また、ハードディスクレコーダ１２００は、エンコーダ１２５１として画像符号化装置１００を用いる。したがって、エンコーダ１２５１は、画像符号化装置１００の場合と同様に、画像データから抽出した特徴量に基づいて隣接画素のサンプリングを行うか否かの決定、行う場合はそのサンプリング方式や補間処理の方式の決定等を行い、必要に応じて隣接画素をサンプリングして記憶する。エンコーダ１２５１は、イントラ予測を行う際に、その隣接画素を読み出し、必要に応じて補間処理を行い、隣接画素を再構成する。そしてエンコーダ１２５１は、再構成された隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から符号化データを生成する。したがって、エンコーダ１２５１は、画面内予測に必要なメモリ量を低減させることができる。

したがって、ハードディスクレコーダ１２００は、例えば、ハードディスクに記録する符号化データを生成する際の、画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ１２００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ１２００の場合と同様に、画像符号化装置１００および画像復号装置２００を適用することができる。

＜７．第７の実施の形態＞
［カメラ］
図２７は、本発明を適用した画像符号化装置１００および画像復号装置２００を用いるカメラの主な構成例を示すブロック図である。

図２７に示されるカメラ１３００は、被写体を撮像し、被写体の画像をLCD１３１６に表示させたり、それを画像データとして、記録メディア１３３３に記録したりする。

レンズブロック１３１１は、光（すなわち、被写体の映像）を、CCD/CMOS１３１２に入射させる。CCD/CMOS１３１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部１３１３に供給する。

カメラ信号処理部１３１３は、CCD/CMOS１３１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部１３１４に供給する。画像信号処理部１３１４は、コントローラ１３２１の制御の下、カメラ信号処理部１３１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ１３４１で符号化したりする。画像信号処理部１３１４は、画像信号を符号化して生成した符号化データを、デコーダ１３１５に供給する。さらに、画像信号処理部１３１４は、オンスクリーンディスプレイ（OSD）１３２０において生成された表示用データを取得し、それをデコーダ１３１５に供給する。

以上の処理において、カメラ信号処理部１３１３は、バス１３１７を介して接続されるDRAM（Dynamic Random Access Memory）１３１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM１３１８に保持させる。

デコーダ１３１５は、画像信号処理部１３１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD１３１６に供給する。また、デコーダ１３１５は、画像信号処理部１３１４から供給された表示用データをLCD１３１６に供給する。LCD１３１６は、デコーダ１３１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ１３２０は、コントローラ１３２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス１３１７を介して画像信号処理部１３１４に出力する。

コントローラ１３２１は、ユーザが操作部１３２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス１３１７を介して、画像信号処理部１３１４、DRAM１３１８、外部インタフェース１３１９、オンスクリーンディスプレイ１３２０、およびメディアドライブ１３２３等を制御する。FLASH ROM１３２４には、コントローラ１３２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５に代わって、DRAM１３１８に記憶されている画像データを符号化したり、DRAM１３１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部１３１４やデコーダ１３１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部１３２２から画像印刷の開始が指示された場合、コントローラ１３２１は、DRAM１３１８から画像データを読み出し、それを、バス１３１７を介して外部インタフェース１３１９に接続されるプリンタ１３３４に供給して印刷させる。

さらに、例えば、操作部１３２２から画像記録が指示された場合、コントローラ１３２１は、DRAM１３１８から符号化データを読み出し、それを、バス１３１７を介してメディアドライブ１３２３に装着される記録メディア１３３３に供給して記憶させる。

記録メディア１３３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア１３３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ１３２３と記録メディア１３３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース１３１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ１３３４と接続される。また、外部インタフェース１３１９には、必要に応じてドライブ１３３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア１３３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM１３２４にインストールされる。

さらに、外部インタフェース１３１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ１３２１は、例えば、操作部１３２２からの指示に従って、DRAM１３１８から符号化データを読み出し、それを外部インタフェース１３１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ１３２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース１３１９を介して取得し、それをDRAM１３１８に保持させたり、画像信号処理部１３１４に供給したりすることができる。

以上のようなカメラ１３００は、デコーダ１３１５として画像復号装置２００を用いる。つまり、デコーダ１３１５は、画像復号装置２００の場合と同様に、画像符号化装置１００より供給される符号化データから抽出した、画像符号化装置１００においてサンプリングが行われたか否かの通知やサンプリング方式および補間方式の指定等の情報を用いて、隣接画素のサンプリングや補間処理を必要に応じて行い、その隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から復号画像データを生成する。したがって、デコーダ１３１５は、画面内予測に必要なメモリ量を低減させることができる。

したがって、カメラ１３００は、例えば、CCD/CMOS１３１２において生成される画像データや、DRAM１３１８または記録メディア１３３３から読み出すビデオデータの符号化データや、ネットワークを介して取得するビデオデータの符号化データを復号する際の画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

また、カメラ１３００は、エンコーダ１３４１として画像符号化装置１００を用いる。エンコーダ１３４１は、画像符号化装置１００の場合と同様に、画像データから抽出した特徴量に基づいて隣接画素のサンプリングを行うか否かの決定、行う場合はそのサンプリング方式や補間処理の方式の決定等を行い、必要に応じて隣接画素をサンプリングして記憶する。エンコーダ１３４１は、イントラ予測を行う際に、その隣接画素を読み出し、必要に応じて補間処理を行い、隣接画素を再構成する。そしてエンコーダ１３４１は、再構成された隣接画素を用いて予測画像を生成し、その予測画像を用いて残差情報から符号化データを生成する。したがって、エンコーダ１３４１は、画面内予測に必要なメモリ量を低減させることができる。

したがって、カメラ１３００は、例えば、DRAM１３１８や記録メディア１３３３に記録する符号化データや、他の装置に提供する符号化データを生成する際の画面内予測に必要なメモリ量を低減させることができ、リアルタイム処理をより低いコストで実現することができる。

なお、コントローラ１３２１が行う復号処理に画像復号装置２００の復号方法を適用するようにしてもよい。同様に、コントローラ１３２１が行う符号化処理に画像符号化装置１００の符号化方法を適用するようにしてもよい。

また、カメラ１３００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、画像符号化装置１００および画像復号装置２００は、上述した装置以外の装置やシステムにも適用可能である。

１００画像符号化装置，１１４イントラ予測部，１２１特徴量抽出部，１２２サンプリング実行決定部，１２３サンプリング方式決定部、１５１サンプリング部，１５２再構成画素記憶部，１５３隣接画素再構成部，１５４予測画生成部，２００画像復号装置，２１１イントラ予測部，２３１制御部，２３２サンプリング部，２３３再構成画素記憶部２３４隣接画素再構成部，２３５予測画像生成部

Claims

符号化される画像の内容に従って、画面内予測において隣接画素として使用される画素値を間引くサンプリングを行うサンプリング手段と、
前記サンプリング手段によりサンプリングされた前記画素値を用いて補間処理を行い、前記隣接画素を再構成する再構成手段と、
前記再構成手段により再構成された前記隣接画素を用いて前記画面内予測を行い、予測画像を生成する予測画像生成手段と
を備える画像処理装置。
前記サンプリング手段は、前記画像のスキャン順に従って前記サンプリングを行う
請求項１に記載の画像処理装置。
前記サンプリング手段は、前記画像を符号化する際のピクチャタイプに従って前記サンプリングを行う
請求項１に記載の画像処理装置。
前記画像の内容に従って、前記サンプリングを行うかを決定する決定手段を更に備え、
前記サンプリング手段は、前記決定手段により前記サンプリングを行うことが決定された場合に、前記サンプリングを行う
請求項１に記載の画像処理装置。
前記決定手段により前記サンプリングを行うことが決定された場合、前記画像の内容に従って、前記サンプリングの方法を決定するサンプリング方法決定手段をさらに備え、
前記サンプリング手段は、前記サンプリング方法決定手段により決定された方法で前記サンプリングを行う
請求項４に記載の画像処理装置。
前記サンプリング方法決定手段は、前記画像のスキャン順に従って前記サンプリングの方法を決定する
請求項５に記載の画像処理装置。
前記サンプリング方法決定手段は、前記画像を符号化する際のピクチャタイプに従って前記サンプリングの方法を決定する
請求項５に記載の画像処理装置。
前記サンプリング方法決定手段は、前記補間処理の方法を決定し、
前記再構成手段は、前記サンプリング方法決定手段により決定された前記補間処理の方法で前記補間処理を行って前記隣接画素を再構成する
請求項５に記載の画像処理装置。
前記サンプリング手段は、領域毎に分割された前記画像を対象として、一番下の画素行の一部と一番右の画素列の一部とをサンプリングする
請求項１に記載の画像処理装置。
前記サンプリング手段は、領域毎に分割された前記画像を対象として、一番下の画素行の一部をサンプリングする
請求項１に記載の画像処理装置。
前記画像の特徴量を抽出する特徴量抽出手段をさらに備え、
前記サンプリング手段は、前記特徴量抽出手段により前記画像の特徴量として抽出された、前記画像の内容に従って、前記サンプリングを行う
請求項１に記載の画像処理装置。
前記予測画像生成手段により生成された前記予測画像と、領域毎の画像との差分情報を符号化する符号化手段をさらに備える
請求項１に記載の画像処理装置。
前記符号化手段は、前記差分情報を符号化して得られる符号化データと、前記サンプリング手段により前記サンプリングが行われたかを示す情報とを伝送する
請求項１２に記載の画像処理装置。
前記符号化手段は、前記差分情報を符号化して得られる符号化データと、前記サンプリング手段により行われた前記サンプリングの方法を示す情報とを伝送する
請求項１２に記載の画像処理装置。
前記画像が符号化された符号化データを復号する復号手段をさらに備え、
前記サンプリング手段は、前記復号手段により前記符号化データが復号されて得られた画像データをサンプリングする
請求項１に記載の画像処理装置。
前記復号手段は、前記符号化データと前記サンプリングが行われたかを示す情報とを受け取り、
前記サンプリング手段は、前記復号手段により受け取られた前記サンプリングが行われたかを示す情報に基づいて、前記サンプリングを行う
請求項１５に記載の画像処理装置。
画像処理装置の画像処理方法であって、
サンプリング手段が、符号化される画像の内容に従って、画面内予測において隣接画素として使用される画素値を間引くサンプリングを行い、
再構成手段が、サンプリングされた画素値を用いて補間処理を行い、前記隣接画素を再構成し、
予測画像生成手段が、再構成された前記隣接画素を用いて前記画面内予測を行い、予測画像を生成する
画像処理方法。