KR20110043407A - Video coding and decoding method and apparatus - Google Patents
Video coding and decoding method and apparatus Download PDFInfo
- Publication number
- KR20110043407A KR20110043407A KR1020100035536A KR20100035536A KR20110043407A KR 20110043407 A KR20110043407 A KR 20110043407A KR 1020100035536 A KR1020100035536 A KR 1020100035536A KR 20100035536 A KR20100035536 A KR 20100035536A KR 20110043407 A KR20110043407 A KR 20110043407A
- Authority
- KR
- South Korea
- Prior art keywords
- transform
- subblock
- macroblock
- block
- pixel
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 발명은 영상 부호화/복호화 장치 및 방법에 관한 것이다. 더욱 상세하게는, 확장된 매크로블록을 다양한 크기와 형상의 서브블록으로 분할하고 분할된 서브블록의 크기와 형상에 따라 다른 예측 단위와 변환 단위를 이용하여 영상을 부호화함으로써 영상압축 효율을 향상시키기 위한 방법 및 장치에 관한 것이다. 또한, 이와 같은 영상 부호화 장치로부터 비트스트림을 수신하여 대응적으로 영상을 복호화함으로써, 영상의 복원 효율을 향상시키기 위한 장치 및 방법에 관한 것이다.The present invention relates to an image encoding / decoding apparatus and method. More specifically, by dividing the expanded macroblock into subblocks of various sizes and shapes, and encoding the image using different prediction units and transformation units according to the size and shape of the divided subblocks to improve image compression efficiency. A method and apparatus are disclosed. The present invention also relates to an apparatus and method for improving the reconstruction efficiency of an image by receiving a bitstream from such an image encoding apparatus and correspondingly decoding the image.
동영상 데이터를 압축하기 위한 표준화된 기술로는 현재 H.261, H.263, H.264, MPEG-2, MPEG-4 등이 있다. 이러한 기존의 동영상 압축 기술에 따르면, 각 영상을 휘도 성분의 16x16 크기의 화소들과 색차 성분의 8x8 크기의 화소들의 사각 영역으로 이루어진 고정된 크기의 매크로블록(Macroblock)들로 나누어 부호화한다. 각 매크로블록의 모든 휘도 성분(Luma Component)과 색차 성분(Chroma Component)들은 공간적으로나 시간적으로 예측되고, 예측 잔여(Predicted Residual)는 변환(Transform) 및 양자화(Quantization), 엔트로피 부호화(Entropy Coding) 등의 과정을 거치면서 압축된다.Standardized techniques for compressing video data currently include H.261, H.263, H.264, MPEG-2, and MPEG-4. According to the existing video compression technology, each image is encoded by dividing each image into fixed-size macroblocks consisting of a rectangular region of pixels of size 16x16 of luminance and pixels of size 8x8 of chrominance. Luma and chrominance components of each macroblock are predicted spatially and temporally, and the predicted residuals are transform and quantization, entropy coding, etc. Compressed through the process of.
H.264/AVC 압축 표준에 따른 부호화 장치는 각 매크로블록을 16x16 크기, 8x8 크기, 4x4 크기의 더 작은 블록으로 분할하여 인트라 예측 부호화(Intra Prediction Encoding)할 수 있으며, 16x16 화소 블록에 대해서는 4 가지의 예측 모드 중 하나를 사용하고, 8x8 화소 블록과 4x4 화소 블록에 대해서는 9 가지의 예측 모드 중 하나를 사용하여 인트라 예측 부호화한다. 인터 예측 부호화(Inter Prediction Encoding)의 경우, 각 매크로블록은 16x16 크기, 16x8 크기, 8x16 크기, 8x8 크기, 8x4 크기, 4x8 크기, 4x4 화소 블록으로 분할되어 인터 예측 부호화될 수 있다. 변환은 8x8 크기 또는 4x4 화소 블록 단위로 적용되고, 변환 계수(Transform Coefficient)의 양자화로는 스칼라(Scalar) 양자화가 사용된다.The encoding apparatus according to the H.264 / AVC compression standard can intra-prediction encode by dividing each macroblock into smaller blocks of 16x16 size, 8x8 size, and 4x4 size, and 4 kinds of 16x16 pixel blocks. Intra prediction encoding is performed using one of prediction modes, and one of nine prediction modes for 8x8 pixel blocks and 4x4 pixel blocks. In the case of inter prediction encoding, each macroblock may be divided into 16x16 size, 16x8 size, 8x16 size, 8x8 size, 8x4 size, 4x8 size, and 4x4 pixel blocks to be inter prediction encoded. Transform is applied in units of 8x8 size or 4x4 pixel block, and scalar quantization is used as quantization of transform coefficients.
하지만, 16x16 크기의 매크로블록은 대체로 QCIF, CIF급의 작은 영상에 적합한 크기라 할 수 있으며, 4Kx2K 영상과 같은 고해상도 영상 압축을 위한 매크로블록의 크기로 부적합하다. 또한, 통상적인 영상 압축 기술에서는 고정된 크기의 매크로블록을 이용하여 영상을 부호화하기 때문에(비록 H.264/AVC에서는 매크로블록을 더 작은 블록 단위로 분할하여 부호화하지만, 매크로블록의 크기는 고정됨), 고해상도의 영상을 부호화하는 경우에는 효율적인 부호화가 어려운 문제점이 있다.However, 16x16 macroblocks are generally suitable for small QCIF and CIF sized images, and are not suitable for macroblocks for high resolution image compression such as 4Kx2K video. In addition, the conventional video compression technique encodes an image using a fixed size macroblock (although H.264 / AVC divides and encodes a macroblock into smaller block units, the macroblock size is fixed). In the case of encoding a high resolution image, there is a problem that efficient encoding is difficult.
또한, 영상의 복호화는 영상의 부호화에 대응하여 이루어지기 때문에, 고해상도 영상의 부호화에 대한 압축 효율이 저하된 상태에서는 고효율의 복호화를 기대하기 어렵다는 문제점이 있다.In addition, since the decoding of the image is performed corresponding to the encoding of the image, it is difficult to expect high-efficiency decoding in a state where the compression efficiency for encoding of the high resolution image is deteriorated.
전술한 문제점을 해결하기 위해 본 발명은, 매크로블록을 다양한 크기로 확장시키고, 확장된 매크로블록을 다양한 크기와 모양의 서브블록으로 분할하며 분할된 서브블록의 크기에 따라 다른 예측 단위와 변환 단위를 이용하여 영상을 부호화 및 복호화함으로써 압축 효율 및 복원 효율을 향상시키는 데 주된 목적이 있다.In order to solve the above-described problem, the present invention extends a macroblock to various sizes, divides the expanded macroblock into subblocks of various sizes and shapes, and different prediction units and transform units according to the size of the divided subblocks. The main purpose is to improve the compression efficiency and the reconstruction efficiency by encoding and decoding an image using the image.
전술한 목적을 달성하기 위해 본 발명은, 영상 부호화/복호화 장치에 있어서, 매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하고, 서브블록과 예측 서브블록을 감산하여 잔여 서브블록을 생성하며, 잔여 서브블록을 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환계수를 생성하며, 양자화된 변환계수를 부호화하여 부호화된 영상 데이터를 생성하는 영상 부호화부; 및 부호화된 영상 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환계수를 복원하고, 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 복원되는 분할타입 정보에 따라 식별되는 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하고, 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원하는 영상 복호화부를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치를 제공한다.In order to achieve the above object, according to the present invention, in the image encoding / decoding apparatus, a prediction subblock is generated by predicting a subblock in which a macroblock is divided, and a residual subblock is generated by subtracting the subblock and the prediction subblock. A video encoder for transforming and quantizing the remaining subblocks using a transform selected according to the size of the subblock to generate quantized transform coefficients, and encoding the quantized transform coefficients to generate encoded image data; And decoding the encoded image data to restore partition type information, motion information, transform type information, and quantized transform coefficients, and inversely quantize and inverse transform the quantized transform coefficients using transforms identified by the restored transform type information. Reconstructing the remaining subblocks, predicting the subblocks identified according to the reconstructed partition type information by using the reconstructed motion information, generating a prediction subblock, and adding the prediction subblocks and the remaining subblocks to reconstruct the subblocks. An image encoding / decoding apparatus comprising an image decoder is provided.
전술한 목적을 달성하기 위한 영상 부호화 장치는, 매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하는 예측기; 서브블록과 예측 서브블록을 감산하여 잔여 서브블록을 생성하는 감산기; 잔여 서브블록을 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환 계수를 생성하는 변환 및 양자화기; 및 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성하는 부호화기를 포함하는 것을 특징으로 한다.An image encoding apparatus for achieving the above object includes a predictor for predicting a subblock in which a macroblock is divided to generate a predicted subblock; A subtractor for subtracting the subblock and the predictive subblock to generate a residual subblock; A transform and quantizer for transforming and quantizing the remaining subblocks using a transform selected according to the size of the subblock to produce quantized transform coefficients; And an encoder for encoding the quantized transform coefficients to generate encoded image data.
여기서, 예측기는, NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 매크로블록에 대하여, 매크로블록 레이어 K(단, )의 화소 블록이 4개의 블록으로 분할되는 경우에 매크로블록 레이어 K+1의 서브블록들을 사용할 수 있다.Here, the predictor is a macroblock layer K (wherein, N is a macroblock having a size of NxN (where N is an integer of 16 or more)). )of When the pixel block is divided into four blocks, subblocks of the macroblock layer K + 1 may be used.
또한, 예측기는, NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 매크로블록에 대하여, N이 16보다 큰 경우 16x16 화소 블록 단위로 분할하여 서브블록을 예측할 수 있다.In addition, the predictor may predict a subblock by dividing the macroblock having the size of NxN (where N is an integer greater than or equal to 16) pixel blocks in units of 16x16 pixel blocks when N is larger than 16.
또한, 예측기는 매크로블록이 인트라 매크로블록인 경우, mxn 화소 단위로 서브블록을 예측하되, m과 n은 4, 8 및 16 중 하나이고 서로 동일하지 않은 경우이거나 16보다 크며 N(N은 NxN 화소 블록의 크기를 갖는 매크로블록의 화소 단위)이하인 정수인 것이 바람직하다.Also, when the macroblock is an intra macroblock, the predictor predicts the subblock in units of mxn pixels, wherein m and n are one of 4, 8, and 16, which are not equal to each other, or larger than 16, and N (N is N × N pixels). It is preferably an integer less than or equal to the pixel unit of the macroblock having the size of the block.
매크로블록은 64x64, 32x64, 64x32, 32x32, 16x32, 32x16 화소블록 중 적어도 하나를 포함할 수 있다.The macroblock may include at least one of 64x64, 32x64, 64x32, 32x32, 16x32, and 32x16 pixel blocks.
또한, 변환 및 양자화기는, 매크로블록이 인트라 매크로블록인 경우, 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용할 수 있다.In addition, the transform and quantizer uses a 4x4 transform if the size of the subblock is one of 4x4, 4x8, and 8x4 when the macroblock is an intra macroblock, and an 8x8 transform if the size of the subblock is one of 8x8, 8x16, and 16x8. If the size of the subblock is 16x16 or more, 16x16 transform may be used.
또한, 변환 및 양자화기는, 확장된 매크로블록이 인트라 매크로블록인 경우, 선택되는 변환의 종류를 나타내는 변환타입을 부호화하여 변환타입 데이터를 생성할 수 있다.Also, when the extended macroblock is an intra macroblock, the transform and quantizer may generate transform type data by encoding a transform type indicating a type of a transform to be selected.
또한, 변환 및 양자화기는, 잔여 서브블록을 16x16 화소 잔여블록으로 분할하고, 분할된 16x16 화소 잔여블록을 다시 16 개의 4x4 화소 잔여블록으로 분할하며, 각 4x4 화소 잔여블록을 4x4 변환을 이용하여 변환하여 16개의 변환 블록을 생성하고, 16 개의 변환 블록의 DC 성분으로 구성되는 DC 성분 블록을 4x4 변환을 이용하여 변환할 수 있다.In addition, the transform and quantizer divides the remaining subblocks into 16x16 pixel residual blocks, divides the divided 16x16 pixel residual blocks into 16 4x4 pixel residual blocks, and converts each 4x4 pixel residual block by using 4x4 transform. 16 transform blocks may be generated, and a DC component block composed of DC components of the 16 transform blocks may be transformed using a 4 × 4 transform.
또한, 4x4 화소 잔여블록을 변환하는 4x4 변환과 상기 DC 성분 블록을 변환하는 4x4 변환은 서로 다른 변환 방식을 이용할 수 있다.In addition, the 4x4 transform for transforming the 4x4 pixel residual block and the 4x4 transform for transforming the DC component block may use different transform schemes.
또한, 변환 및 양자화기는, 매크로블록이 인터 매크로블록인 경우, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나의 변환을 선택하여 잔여 서브블록을 변환할 수 있다.Also, when the macroblock is an inter macroblock, the transform and quantizer may select one of 4x4 transform, 8x8 transform, 8x16 transform, 16x8 transform, and 16x16 transform to transform the remaining subblocks.
또한, 변환 및 양자화기는, 서브블록의 크기가 8x8보다 작은 경우에는 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 서브블록의 크기가 8x8인 경우에는 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 8x16인 경우에는 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x8인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x16 이상인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환할 수 있다.Also, the transform and quantizer converts the remaining subblocks using 4x4 transform when the subblock size is smaller than 8x8, and encodes the residual subblocks during 4x4 transform and 8x8 transform when the subblock size is 8x8. The smallest transform is used, and when the size of the subblock is 8x16, the remaining subblocks are transformed using the transform having the lowest encoding cost among the 4x4 transform, 8x8 transform, and 8x16 transform, and the subblock size is 16x8. In case of, the residual block of the subblock is transformed using the transform having the lowest encoding cost among 4x4 transform, 8x8 transform, and 16x8 transform.If the size of the subblock is 16x16 or more, the residual block of the subblock is 4x4 transform, 8x8 transform. And a transform having the lowest encoding cost among the 16x16 transforms.
또한, 변환 및 양자화기는, 서브블록의 크기가 8x8보다 작은 경우에는 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 서브블록의 크기가 8x8인 경우에는 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 8x16인 경우에는 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x8인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x16 이상인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환할 수 있다.Also, the transform and quantizer converts the remaining subblocks using 4x4 transform when the subblock size is smaller than 8x8, and encodes the residual subblocks during 4x4 transform and 8x8 transform when the subblock size is 8x8. The smallest transform is used, and when the size of the subblock is 8x16, the residual subblock is transformed using the transform having the lowest encoding cost among the 4x4 transform, the 8x8 transform, and the 8x16 transform, and the subblock has a size of 16x8. In case of, the residual block of the subblock is transformed using the transform having the lowest encoding cost among 4x4 transform, 8x8 transform, and 16x8 transform.If the size of the subblock is 16x16 or more, the residual block of the subblock is 4x4 transform, 8x8 transform. And a transform having the lowest encoding cost among the 16x16 transforms.
또한, 변환 및 양자화기는, 확장된 매크로블록이 인터 매크로블록인 경우, 선택되는 변환의 종류를 나타내는 변환타입을 부호화하여 변환타입 데이터를 생성할 수 있다.Also, when the extended macroblock is an inter macroblock, the transform and quantizer may generate transform type data by encoding a transform type indicating the type of transform to be selected.
전술한 목적을 달성하기 위한 본 발명의 실시예에 따른 영상 복호화 장치는, 부호화 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환 계수를 복원하는 복호화기; 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하는 역양자화기 및 역변환기; 복원되는 분할타입 정보에 따라 식별되는 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 예측기; 및 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원하는 가산기를 포함하는 것을 특징으로 한다.An image decoding apparatus according to an embodiment of the present invention for achieving the above object comprises: a decoder for decoding coded data to restore partition type information, motion information, transform type information, and quantized transform coefficients; An inverse quantizer and an inverse transformer for restoring the remaining subblocks by inverse quantization and inverse transformation of the quantized transform coefficients using a transform identified by the transformed type information to be recovered; A predictor for predicting a subblock identified according to the reconstructed partition type information by using the reconstructed motion information to generate a predicted subblock; And an adder for reconstructing the subblock by adding the prediction subblock and the residual subblock.
여기서, 역양자화기 및 역변환기는, 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용할 수 있다.Here, the inverse quantizer and the inverse transformer use a 4x4 transform if the size of the subblock is one of 4x4, 4x8, and 8x4, and the 8x8 transform if the size of the subblock is one of 8x8, 8x16, and 16x8, and the subblock If the size of is 16x16 or more, 16x16 conversion can be used.
전술한 목적을 달성하기 위한 본 발명의 실시예에 따른 영상 복호화 장치는, 부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하는 복호화기; 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 역 양자화기 및 역 변환기; 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 예측기; 및 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원하는 가산기를 포함하는 것을 특징으로 한다.An image decoding apparatus according to an embodiment of the present invention for achieving the above object comprises: a decoder for decoding coded data to restore partition type information, motion information, transform type information, and quantized transform coefficients; An inverse quantizer and an inverse transformer that inverse quantizes and inverse transforms quantized transform coefficients using a transform identified by the transformed type information to be recovered to recover a residual subblock; A predictor for predicting a subblock identified according to the reconstructed partition type information using the reconstructed motion information to generate a predicted subblock; And an adder for reconstructing the subblock by adding the prediction subblock and the residual subblock.
여기서, 역양자화기 및 역변환기는, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나를 이용할 수 있다.Here, the inverse quantizer and the inverse transformer may use one of a 4x4 transform, an 8x8 transform, an 8x16 transform, a 16x8 transform, and a 16x16 transform.
바람직하게는, 영상 복호화 장치는, 복원되는 서브블록 내의 상기 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행하는 필터를 더 포함할 수 있다.Preferably, the image decoding apparatus may further include a filter for performing deblocking filtering on a boundary between a left side and an upper side of the block according to the selected transform in the reconstructed subblock.
여기서, 복호화기는, 부호화 데이터로부터 추출되는 SKIP_N 플래그 데이터를 복호화하여 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 복원할 수 있다.Here, the decoder may restore the SKIP_N flag indicating whether the macroblock is a SKIP macroblock by decoding the SKIP_N flag data extracted from the encoded data.
또한, 복호화기는, 부호화 데이터로부터 추출되는 매크로블록 타입 플래그 데이터를 복호화하여 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 복원할 수 있다.In addition, the decoder may decode the macroblock type flag data extracted from the encoded data to restore a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock.
여기서, 영상 복호화 장치는, 분할 레이어별 분할 타입 번호에 의해 식별될 수 있다.Here, the image decoding apparatus may be identified by the division type number for each division layer.
또한, 영상 복호화 장치는, 부호화 데이터로부터 추출되는 CBP 데이터를 복호화하여 서브블록의 크기에 따른 CBPX 플래그와 CBP를 복원하되, CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이다.The apparatus for decoding an image decodes the CBP data extracted from the encoded data and restores the CBPX flag and the CBP according to the size of the subblock, wherein the CBPX flag indicates whether there is a non-zero quantized transform coefficient in the XxX pixel block. Flag and CBP is a flag indicating whether there is a non-zero quantized transform coefficient in a 16x16 pixel block.
전술한 목적을 달성하기 위한 영상 부호화/복호화 방법은, 매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하고, 서브블록과 상기 예측 서브블록을 감산하여 잔여 서브블록을 생성하며, 잔여 서브블록을 상기 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환계수를 생성하며, 양자화된 변환계수를 부호화하여 부호화된 영상 데이터를 생성하는 영상 부호화 단계; 및 부호화된 영상 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환계수를 복원하고, 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 복원되는 분할타입 정보에 따라 식별되는 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하고, 예측 서브블록과 상기 잔여 서브블록을 가산하여 서브블록을 복원하는 영상 복호화 단계를 포함하는 것을 특징으로 한다.A video encoding / decoding method for achieving the above object includes generating a prediction subblock by predicting a subblock in which a macroblock is divided, generating a residual subblock by subtracting the subblock and the prediction subblock, and remaining residual subblock. An image encoding step of transforming and quantizing a block using a transform selected according to the size of the subblock to generate a quantized transform coefficient, and generating encoded image data by encoding a quantized transform coefficient; And decoding the encoded image data to restore partition type information, motion information, transform type information, and quantized transform coefficients, and inversely quantize and inverse transform the quantized transform coefficients using transforms identified by the restored transform type information. Reconstruct the remaining subblocks, predict the subblocks identified according to the reconstructed partition type information using the reconstructed motion information, and generate a prediction subblock, and add the prediction subblocks and the residual subblocks to reconstruct the subblocks. And a video decoding step.
전술한 목적을 달성하기 위한 본 발명의 실시예에 따른 영상 부호화 방법은, 매크로블록으로부터 분할된 서브블록을 예측하여 예측 서브블록을 생성하는 단계; 서브블록과 예측 서브블록을 감산하여 잔여 서브블록을 생성하는 단계; 잔여 서브블록을 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환 계수를 생성하는 단계; 및 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성하는 단계를 포함하는 것을 특징으로 한다.In accordance with another aspect of the present invention, there is provided a method of encoding an image, the method comprising: generating a prediction subblock by predicting a subblock divided from a macroblock; Generating a residual subblock by subtracting the subblock and the prediction subblock; Transforming and quantizing the remaining subblocks using a transform selected according to the size of the subblock to generate quantized transform coefficients; And generating encoded image data by encoding the quantized transform coefficients.
여기서, 예측 서브블록 생성단계는, NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 상기 매크로블록에 대하여, 매크로블록 레이어 K(단, )의 화소 블록이 4개의 블록으로 분할되는 경우에 매크로블록 레이어 K+1의 서브블록들을 이용할 수 있다.Here, the prediction subblock generation step may include a macroblock layer K (where: )of When the pixel block is divided into four blocks, subblocks of the macroblock layer K + 1 may be used.
또한, 예측 서브블록 생성단계는, NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 매크로블록에 대하여, N이 16보다 큰 경우 16x16 화소 블록 단위로 분할하여 서브블록을 예측할 수 있다.The predicting subblock generation step may predict a subblock by dividing the macroblock having the size of an NxN pixel block (where N is an integer greater than or equal to 16) into units of 16x16 pixel blocks when N is greater than 16.
또한, 예측 서브블록 생성단계는, 매크로블록이 인트라 매크로블록인 경우, mxn 화소 단위로 서브블록을 예측하되, m과 n은 4, 8 및 16 중 하나이고 서로 동일하지 않은 경우이거나 16보다 크며 N(N은 NxN 화소 블록의 크기를 갖는 매크로블록의 화소 단위) 이하의 정수인 것이 바람직하다.In addition, when the macroblock is an intra macroblock, the predictive subblock generation step predicts a subblock in units of mxn pixels, wherein m and n are one of 4, 8, and 16, which are not equal to each other, or larger than 16, and N (N is a pixel unit of a macroblock having the size of an N × N pixel block).
또한, 예측 서브블록 생성단계는, 세 가지의 인트라 예측 모드 중에서 부호화 효율이 가장 좋은 예측 모드에 따른 예측 방향에 따라 상기 서브블록을 예측할 수 있다.In the prediction subblock generation step, the subblock may be predicted according to a prediction direction according to a prediction mode having the best encoding efficiency among three intra prediction modes.
또한, 양자화된 변환계수 생성단계는, 매크로블록이 인트라 매크로블록인 경우, 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용할 수 있다.In addition, when the macroblock is an intra macroblock, the quantized transform coefficient generation step uses 4x4 transform if the subblock size is one of 4x4, 4x8, and 8x4, and the subblock has one of 8x8, 8x16, and 16x8. In this case, 8x8 transform is used, and if the size of the subblock is 16x16 or more, 16x16 transform can be used.
또한, 양자화된 변환계수 생성단계는, 잔여 서브블록을 16x16 화소 잔여 블록으로 분할하고, 분할된 16x16 화소 잔여 블록을 다시 16 개의 4x4 화소 잔여 블록으로 분할하며, 각 4x4 화소 잔여 블록을 4x4 변환을 이용하여 변환하여 16 개의 변환 블록을 생성하며, 16 개의 변환 블록의 DC 성분으로 구성되는 DC 성분 블록을 4x4 변환을 이용하여 변환할 수 있다.In addition, the quantized transform coefficient generation step divides the remaining subblocks into 16x16 pixel residual blocks, divides the divided 16x16 pixel residual blocks into 16 4x4 pixel residual blocks, and uses each of the 4x4 pixel residual blocks using 4x4 transform. 16 transform blocks are generated by transforming the DC component block, and the DC component block composed of the DC components of the 16 transform blocks can be transformed using 4 × 4 transform.
또한, 4x4 화소 잔여 블록을 변환하는 4x4 변환과 상기 DC 성분 블록을 변환하는 4x4 변환은 서로 다른 변환 방식을 이용할 수 있다.In addition, the 4x4 transform for transforming the 4x4 pixel residual block and the 4x4 transform for transforming the DC component block may use different transform schemes.
또한, 양자화된 변환계수 생성단계는, 매크로블록이 인터 매크로블록인 경우, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나의 변환을 선택하여 잔여 서브블록을 변환할 수 있다.In the quantized transform coefficient generation step, when the macroblock is an inter macroblock, the residual subblock may be transformed by selecting one of 4x4 transform, 8x8 transform, 8x16 transform, 16x8 transform, and 16x16 transform.
또한, 양자화된 변환계수 생성단계는, 서브블록의 크기가 8x8보다 작은 경우에는 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 서브블록의 크기가 8x8인 경우에는 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 8x16인 경우에는 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x8인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 서브블록의 크기가 16x16 이상인 경우에는 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환할 수 있다.In the quantized transform coefficient generation step, when the size of the subblock is smaller than 8x8, the residual subblock is transformed using 4x4 transform. When the size of the subblock is 8x8, the residual subblock is 4x4 transformed and 8x8 transformed. The transform having the lowest encoding cost is transformed.If the size of the subblock is 8x16, the remaining subblocks are transformed using the transform having the lowest encoding cost among the 4x4, 8x8, and 8x16 transforms. If the size is 16x8, the residual block of the subblock is transformed using the 4x4 transform, the 8x8 transform, and the transform having the smallest encoding cost among the 16x8 transform.If the size of the subblock is 16x16 or more, the residual block of the subblock is 4x4 transform. Among the 8x8 and 16x16 transforms, the transform having the lowest encoding cost may be used.
바람직하게는, 영상 부호화 방법은, 매크로블록이 인터 매크로블록인 경우, 선택되는 변환의 종류를 나타내는 변환 타입을 부호화하여 변환 타입 데이터를 생성하는 단계를 더 포함할 수 있다.Preferably, the video encoding method may further include generating transform type data by encoding a transform type indicating a type of transform to be selected when the macroblock is an inter macroblock.
또한, 영상 부호화 방법은, 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계; 복원되는 잔여 서브블록과 상기 예측 서브블록을 가산하여 서브블록을 복원하는 단계; 및 복원되는 서브블록을 필터링하는 단계를 더 포함하되, 서브블록을 필터링하는 단계는 복원되는 서브블록 내의 상기 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행할 수 있다.In addition, the image encoding method may include recovering a residual subblock by inverse quantization and inverse transformation on the quantized transform coefficients; Reconstructing the subblock by adding the reconstructed residual subblock and the prediction subblock; And filtering the reconstructed subblock, wherein the subblock filtering may perform deblocking filtering on the left and upper boundaries of the block according to the selected transform in the reconstructed subblock.
또한, 영상 부호화 방법은, 매크로블록의 분할 타입 정보를 부호화하여 분할 타입 데이터를 생성하는 단계를 더 포함할 수 있다.The image encoding method may further include generating split type data by encoding split type information of a macroblock.
여기서, 분할 타입 정보는, 분할 레이어별 분할 타입 번호에 의해 식별되되, 분할 타입 데이터를 생성하는 단계는 분할 레이어별 분할 타입 번호를 분할 타입 번호 분호화 순서에 따라 순차적으로 부호화함으로써 분할 타입 정보를 부호화하는 것이 바람직하다.Here, the split type information is identified by the split type number for each split layer, and the step of generating split type data encodes the split type information by sequentially encoding the split type number for each split layer according to the split type number decoding order. It is desirable to.
또한, 전술한 영상 부호화 방법은, 서브블록의 크기에 따른 CBPX 플래그와 CBP를 부호화하여 CBP 데이터를 생성하는 단계를 더 포함하되, CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그인 것이 바람직하다.The above-described image encoding method may further include generating CBP data by encoding the CBPX flag and the CBP according to the size of the subblock, wherein the CBPX flag has a non-zero quantized transform coefficient in the XxX pixel block. And CBP is preferably a flag indicating whether there is a non-zero quantized transform coefficient in a 16x16 pixel block.
또한, 전술한 영상 부호화 방법은, 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 부호화하여 SKIP_N 플래그 데이터를 생성하는 단계를 더 포함할 수 있다.The image encoding method may further include generating SKIP_N flag data by encoding a SKIP_N flag indicating whether the macroblock is a SKIP macroblock.
또한, 영상 부호화 방법은, 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 부호화하여 매크로블록 타입 플래그 데이터를 생성하는 단계를 더 포함할 수도 있다.The video encoding method may further include generating macroblock type flag data by encoding a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock.
또한, 영상 부호화 방법은, 부호화된 영상 데이터를 포함하는 부호화 데이터를 생성하는 단계를 더 포함하되, 매크로블록이 포함되는 픽처가 인트라 픽처인 경우, 부호화 데이터는 분할 타입 필드, 인트라 예측 모드 필드, CBPX 플래그/CBP 필드 및 변환 계수 필드 중 하나 이상을 포함할 수 있다.The video encoding method may further include generating encoded data including the encoded image data. When the picture including the macroblock is an intra picture, the encoded data may include a partition type field, an intra prediction mode field, and a CBPX. It may include one or more of a flag / CBP field and a conversion coefficient field.
또한, 영상 부호화 방법은, 부호화된 영상 데이터를 포함하는 부호화 데이터를 생성하는 단계를 더 포함하되, 매크로블록이 포함되는 픽처가 인터 픽처인 경우, 부호화 데이터는 SKIP_N 플래그 필드, 매크로블록 타입 필드 및 분할 타입 필드 중 하나 이상을 포함하고, 매크로블록이 인트라 매크로블록인 경우에는 인트라 예측 모드 필드, CBPX 플래그/CBP 필드 및 변환 계수 필드 중 하나 이상을 추가로 포함하며, 매크로블록이 인터 매크로블록인 경우에는 SKIPX 플래그 필드, 차분 움직임 벡터/참조 픽처 인덱스 필드, CBPX 플래그 필드, 변환 타입 필드, CBP 필드 및 변환 계수 필드 중 하나 이상을 추가로 포함하는 것이 바람직하다.The video encoding method may further include generating encoded data including the encoded video data. When the picture including the macroblock is an inter picture, the encoded data may include a SKIP_N flag field, a macroblock type field, and a division. And at least one of an intra prediction mode field, a CBPX flag / CBP field, and a transform coefficient field if the macroblock is an intra macroblock, and if the macroblock is an inter macroblock. Preferably, the apparatus further includes one or more of a SKIPX flag field, a differential motion vector / reference picture index field, a CBPX flag field, a transform type field, a CBP field, and a transform coefficient field.
전술한 목적을 달성하기 위한 본 발명의 실시예에 따른 영상 복호화 방법은, 부호화 데이터를 복호화하여 분할 타입 정보, 인트라 예측 모드 및 양자화된 변환 계수를 복원하는 단계; 복원되는 분할 타입 정보에 따라 식별되는 서브블록의 크기에 따라 선택되는 변환을 이용하여 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계; 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 복원되는 인트라 예측 모드를 이용하여 예측하여 예측 서브블록을 생성하는 단계; 및 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원하는 단계를 포함하는 것을 특징으로 한다.An image decoding method according to an embodiment of the present invention for achieving the above object comprises the steps of: decoding coded data to reconstruct partition type information, intra prediction mode and quantized transform coefficients; Inverse quantizing and inverse transforming the quantized transform coefficients using a transform selected according to the size of the subblock identified according to the reconstructed partition type information to recover the remaining subblocks; Generating a predicted subblock by predicting a subblock identified according to the reconstructed partition type information using the reconstructed intra prediction mode; And reconstructing the subblock by adding the prediction subblock and the residual subblock.
여기서, 서브블록의 크기에 따라 선택되는 변환은, 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용할 수 있다.Here, the transform selected according to the size of the subblock uses a 4x4 transform if the size of the subblock is one of 4x4, 4x8 and 8x4, and uses an 8x8 transform if the size of the subblock is one of 8x8, 8x16 and 16x8. If the size of the subblock is 16x16 or more, 16x16 transform may be used.
전술한 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 영상 복호화 방법은, 부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하는 단계; 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계; 복원되는 분할 타입 정보에 따라 식별되는 서브블록으로 분할하고 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 단계; 및 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원하는 단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method of decoding an image, the method including: restoring partition type information, motion information, transform type information, and quantized transform coefficients by decoding encoded data; Inverse quantizing and inverse transforming the quantized transform coefficients using the transform identified by the transformed type information to be recovered to recover the remaining subblocks; Generating a prediction subblock by dividing the subblock into identified subblocks according to the reconstructed partition type information and predicting the subblock using the reconstructed motion information; And reconstructing the subblock by adding the prediction subblock and the residual subblock.
여기서, 변환 타입 정보에 의해 식별되는 변환은, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나일 수 있다.Here, the transform identified by the transform type information may be one of a 4x4 transform, an 8x8 transform, an 8x16 transform, a 16x8 transform, and a 16x16 transform.
전술한 영상 복호화 방법은, 복원되는 서브블록 내의 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행하는 단계를 더 포함할 수 있다.The above-described image decoding method may further include performing deblocking filtering on a boundary between a left side and an upper side of the block according to the selected transform in the reconstructed subblock.
또한, 영상 복호화 방법은, 부호화 데이터로부터 추출되는 SKIP_N 플래그 데이터를 복호화하여 상기 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 복원하는 단계를 추가로 포함할 수 있다. The video decoding method may further include decoding the SKIP_N flag data extracted from the encoded data to restore the SKIP_N flag indicating whether the macroblock is a SKIP macroblock.
또한 영상 복호화 방법은, 부호화 데이터로부터 추출되는 매크로블록 타입 플래그 데이터를 복호화하여 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 복원하는 단계를 더 포함할 수도 있다.The image decoding method may further include reconstructing a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock by decoding the macroblock type flag data extracted from the encoded data.
여기서, 분할 타입 정보는, 분할 레이어별 분할 타입 번호에 의해 식별되는 것이 바람직하다.Here, the division type information is preferably identified by the division type number for each division layer.
전술한 영상 복호화 방법은, 부호화 데이터로부터 추출되는 CBP 데이터를 복호화하여 서브블록의 크기에 따른 CBPX 플래그와 CBP를 복원하는 단계를 더 포함하되, CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그인 것이 바람직하다.The above-described image decoding method further includes reconstructing the CBPX flag and the CBP according to the size of the subblock by decoding the CBP data extracted from the encoded data, wherein the CBPX flag is a non-zero quantized transform coefficient in the XxX pixel block. Is a flag indicating whether or not there is a CBP is a flag indicating whether there is a non-zero quantized transform coefficient in the 16x16 pixel block.
이상에서 설명한 바와 같이 본 발명에 의하면, 확장된 매크로블록을 다양한 크기와 모양의 서브블록으로 분할하고 분할된 서브블록의 크기에 따라 다른 예측 단위와 변환 단위를 이용하여 영상을 부호화 및 복호화함으로써 압축 효율 및 복원효율을 향상시킬 수 있다.As described above, according to the present invention, compression efficiency is achieved by dividing an extended macroblock into subblocks of various sizes and shapes, and encoding and decoding an image using different prediction units and transformation units according to the sizes of the divided subblocks. And the recovery efficiency can be improved.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 간략하게 나타낸 블록 구성도이다.
도 2는 본 발명의 실시예에 따라 입력되는 이미지를 패딩하였을 경우의 부호화 및 복호화를 설명하기 위해 도시한 도면으로서, 입력 이미지와 현재 부호화할 확장된 매크로블록의 위치를 나타낸 도면이다.
도 3은 도 2의 현재 부호화할 대상인 확장된 매크로블록을 확대한 도면이다.
도 4는 본 발명의 일 실시예에 따라 인트라 예측 부호화와 인터 예측 부호화를 위여 매크로블록을 다양한 크기의 서브블록으로 분할하는 과정의 예를 나타낸 도면이다.
도 5는 본 발명의 다른 실시예에 따라 인트라 예측 부호화와 인터 예측 부호화를 위하여 매크로블록을 다양한 크기의 서브블록으로 분할하는 과정의 예를 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 인트라 픽처의 부호화 방법과 부호화 데이터를 통해 전송할 관련 데이터를 설명하기 위한 예시도이다.
도 7은 본 발명의 일 실시예에 따른 휘도 성분의 인트라 예측 모드에 따른 9 가지의 예측 방향과 예측 모드 번호를 나타낸 예시도이다.
도 8은 본 발명의 일 실시예에 따른 휘도 성분의 인트라 예측 모드에 따른 4 가지의 예측 방향과 예측 모드 번호를 나타낸 예시도이다.
도 9는 본 발명의 일 실시예에 따른 휘도 성분의 인트라 예측 모드에 따른 3 가지의 예측 방향과 예측 모드 번호를 나타낸 예시도이다.
도 10은 본 발명의 일 실시예에 따른 색차 성분의 4 가지의 인트라 예측 모드에 따른 예측 방향과 예측 모드 번호를 나타낸 예시도이다.
도 11은 본 발명의 일 실시예에 따른 64x64 화소의 확장된 매크로블록에 대한 다양한 서브블록 타입을 나타낸 예시도이다.
도 12는 본 발명의 일 실시예에 따른 인터 픽처의 부호화 방법과 부호화 데이터를 통해 전송할 관련 데이터를 설명하기 위한 예시도이다.
도 13은 본 발명의 일 실시예에 따라 예측 움직임 벡터를 결정하는 과정을 설명하기 위한 예시도이다.
도 14는 본 발명의 일 실시예에 따른 8x16 화소 블록과 16x8 화소 블록의 예측 움직임 벡터를 결정하는 과정을 설명하기 위한 예시도이다.
도 15는 본 발명의 일 실시예에 따른 서브블록 크기에 따른 사용 가능한 변환의 종류와 변환 타입이 부호화되는 단위를 나타낸 예시도이다.
도 16은 본 발명의 일 실시예에 따른 디블록킹 필터링을 수행할 블록 경계를 나타낸 예시도이다.
도 17은 본 발명의 일 실시예에 따른 인트라 픽처의 신택스를 나타낸 예시도이다.
도 18은 본 발명의 일 실시예에 따른 분할 타입별 번호를 나타낸 예시도이다.
도 19는 본 발명의 일 실시예에 따라 확장된 매크로블록을 다양한 크기의 서브블록으로 분할하는 경우의 분할 타입 번호 부호화 순서를 설명하기 위해 도시한 도면이다.
도 20은 본 발명의 일 실시예에 따라 매크로블록이 분할 레이어별로 분할되는 과정을 순차적으로 나타낸 예시도이다.
도 21은 매크로블록의 레이어별 분할 타입 번호를 순차적으로 부호화하는 과정을 설명하기 위한 예시도이다.
도 22는 본 발명의 일 실시예에 따른 인트라 예측 모드의 부호화 순서를 나타낸 예시도이다.
도 23은 본 발명의 일 실시예에 따라 매크로블록의 인트라 예측 모드를 부호화하는 과정의 일 예를 설명하기 위한 예시도이다.
도 24는 본 발명의 일 실시예에 따라 인트라 매크로블록에 대한 CBPX_플래그와 CBP를 부호화 과정을 설명하기 위한 예시도이다.
도 25는 본 발명의 일 실시예에 따른 CBP의 구조를 나타낸 예시도이다.
도 26은 본 발명의 일 실시예에 따라 CBPX 플래그와 CBP를 부호화하는 순서의 일 예를 나타낸 예시도이다.
도 27은 본 발명의 일 실시예에 따라 인트라 매크로블록에 대한 CBPX 플래그와 CBP를 부호화하는 순서의 다른 예를 나타낸 예시도이다.
도 28은 본 발명의 일 실시예에 따른 분할 타입별 양자화된 변환 계수의 부호화 순서를 나타낸 예시도이다.
도 29는 본 발명의 일 실시예에 따른 부호화 데이터의 신택스 구조를 나타낸 예시도이다.
도 30은 본 발명의 일 실시예에 따른 P-픽처(또는 P-슬라이스)에서 사용되는 신택스의 예를 설명하기 위해 도시한 도면이다.
도 31은 본 발명의 일 실시예에 따른 B-픽처(또는 B-슬라이스)에서 사용되는 신택스의 예를 설명하기 위해 도시한 도면이다.
도 32는 본 발명의 일 실시예에 따른 SKIPX 플래그의 부호화 과정을 설명하기 위한 예시도이다.
도 33 및 도 34는 본 발명의 일 실시예에 따라 인터 매크로블록에 대한 CBPX_플래그, 변환 타입과 CBP를 부호화 과정을 설명하기 위한 예시도이다.
도 35는 본 발명의 실시예에 따른 skipX_flag를 부호화/복호화하기 위한 ctx_inc의 예를 나타낸 도면이다.
도 36은 본 발명의 실시예에 따른 interX_flag를 부호화/복호화하기 위한 ctx_inc의 예를 나타낸 도면이다.
도 37은 본 발명의 실시예에 따른 directX_flag를 부호화/복호화하기 위한 ctx_inc의 예를 나타낸 도면이다.
도 38 및 도 39는 본 발명의 실시예에 따라 트리 구조를 이용하여 분할 타입 정보를 부호화하는 과정을 설명하기 위해 도시한 도면이다.
도 40은 본 발명의 실시예에 따른 분할 타입의 부호화의 일 예를 나타낸 도면이다.
도 41은 본 발명의 실시예에 따른 분할 타입 부호화의 다른 예를 나타낸 도면이다.
도 42는 본 발명의 실시예에 따른 B_pdir를 부호화/복호화하기 위한 ctx_inc의 예를 나타낸 도면이다.
도 43은 본 발명의 실시예에 따른 사용 가능한 변환의 종류가 2 가지인 경우에 변환 타입의 부호화/복호화를 위한 ctx_inc의 예를 나타낸 도면이다.
도 44는 본 발명의 실시예에 따른 사용 가능한 변환의 종류가 3 가지인 경우에 변환 타입의 부호화/복호화를 위한 ctx_inc의 예를 나타낸 도면이다.
도 45는 본 발명의 실시예에 따른 사용 가능한 변환의 종류가 3 가지인 경우에 변환 타입의 부호화/복호화를 위한 ctx_inc의 다른 예를 나타낸 도면이다.
도 46은 본 발명의 일 실시예에 따른 영상 복호화 장치를 간략하게 나타낸 블록 구성도이다.1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating encoding and decoding when an input image is padded according to an embodiment of the present invention. FIG. 2 illustrates an input image and positions of an extended macroblock to be currently encoded.
FIG. 3 is an enlarged view of an extended macroblock that is currently encoded in FIG. 2.
4 is a diagram illustrating an example of a process of dividing a macroblock into subblocks of various sizes for intra prediction encoding and inter prediction encoding according to an embodiment of the present invention.
5 is a diagram illustrating an example of a process of dividing a macroblock into subblocks of various sizes for intra prediction encoding and inter prediction encoding according to another embodiment of the present invention.
6 is an exemplary diagram for describing a method of encoding an intra picture and related data to be transmitted through encoded data, according to an embodiment of the present invention.
7 is an exemplary diagram illustrating nine prediction directions and prediction mode numbers according to intra prediction modes of luminance components according to an embodiment of the present invention.
8 is an exemplary diagram illustrating four prediction directions and prediction mode numbers according to intra prediction modes of luminance components according to an embodiment of the present invention.
9 is an exemplary diagram illustrating three prediction directions and prediction mode numbers according to intra prediction modes of luminance components according to an embodiment of the present invention.
10 is an exemplary diagram illustrating prediction directions and prediction mode numbers according to four intra prediction modes of a color difference component according to an embodiment of the present invention.
11 is an exemplary diagram illustrating various subblock types for an extended macroblock of 64x64 pixels according to an embodiment of the present invention.
12 is an exemplary diagram for describing an encoding method of an inter picture and related data to be transmitted through encoded data according to an embodiment of the present invention.
13 is an exemplary view for explaining a process of determining a predicted motion vector according to an embodiment of the present invention.
14 is an exemplary diagram for describing a process of determining a predicted motion vector of an 8x16 pixel block and a 16x8 pixel block according to an embodiment of the present invention.
FIG. 15 is an exemplary diagram illustrating types of usable transforms and units in which transform types are encoded according to subblock sizes according to an embodiment of the present invention.
16 is an exemplary diagram illustrating a block boundary to perform deblocking filtering according to an embodiment of the present invention.
17 is an exemplary diagram illustrating syntax of an intra picture according to an embodiment of the present invention.
18 is an exemplary view showing a number for each division type according to an embodiment of the present invention.
FIG. 19 is a diagram illustrating a split type number coding sequence in the case of dividing an expanded macroblock into subblocks of various sizes according to an embodiment of the present invention.
20 is an exemplary diagram sequentially illustrating a process of dividing a macroblock into divided layers according to an embodiment of the present invention.
21 is an exemplary diagram for describing a process of sequentially encoding a split type number for each layer of a macroblock.
22 is an exemplary diagram illustrating a coding order of an intra prediction mode according to an embodiment of the present invention.
FIG. 23 is an exemplary diagram for explaining an example of a process of encoding an intra prediction mode of a macroblock according to an embodiment of the present invention.
24 is an exemplary diagram for describing a process of encoding a CBPX_flag and a CBP for an intra macroblock according to an embodiment of the present invention.
25 is an exemplary view showing the structure of a CBP according to an embodiment of the present invention.
FIG. 26 is an exemplary diagram illustrating an example of a sequence of encoding a CBPX flag and a CBP according to an embodiment of the present invention. FIG.
27 is an exemplary diagram illustrating another example of a sequence of encoding a CBPX flag and a CBP for an intra macroblock according to an embodiment of the present invention.
28 is an exemplary diagram illustrating a coding order of quantized transform coefficients for each partition type according to an embodiment of the present invention.
29 is an exemplary diagram illustrating a syntax structure of encoded data according to an embodiment of the present invention.
30 is a diagram illustrating an example of syntax used in a P-picture (or P-slice) according to an embodiment of the present invention.
FIG. 31 is a diagram illustrating an example of syntax used in a B-picture (or B-slice) according to an embodiment of the present invention.
32 is an exemplary diagram for describing an encoding process of a SKIPX flag according to an embodiment of the present invention.
33 and 34 are exemplary diagrams for describing a CBPX_flag, a transform type, and a CBP encoding process for an inter macroblock according to an embodiment of the present invention.
35 is a diagram illustrating an example of ctx_inc for encoding / decoding skipX_flag according to an embodiment of the present invention.
36 illustrates an example of ctx_inc for encoding / decoding interX_flag according to an embodiment of the present invention.
37 illustrates an example of ctx_inc for encoding / decoding directX_flag according to an embodiment of the present invention.
38 and 39 are diagrams for describing a process of encoding split type information using a tree structure according to an embodiment of the present invention.
40 is a diagram illustrating an example of encoding of a partition type according to an embodiment of the present invention.
41 is a diagram illustrating another example of split type encoding according to an embodiment of the present invention.
42 illustrates an example of ctx_inc for encoding / decoding B_pdir according to an embodiment of the present invention.
43 is a diagram illustrating an example of ctx_inc for encoding / decoding a transform type when two types of transforms are available according to an embodiment of the present invention.
44 is a diagram illustrating an example of ctx_inc for encoding / decoding a transform type when there are three types of transforms available according to an embodiment of the present invention.
45 is a diagram illustrating another example of ctx_inc for encoding / decoding a transform type when there are three types of transforms available according to an embodiment of the present invention.
46 is a block diagram schematically illustrating an image decoding apparatus according to an embodiment of the present invention.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, some embodiments of the present invention will be described in detail through exemplary drawings. In adding reference numerals to the components of each drawing, it should be noted that the same reference numerals are assigned to the same components as much as possible even though they are shown in different drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.In addition, in describing the component of this invention, terms, such as 1st, 2nd, A, B, (a), (b), can be used. These terms are only for distinguishing the components from other components, and the nature, order or order of the components are not limited by the terms. If a component is described as being "connected", "coupled" or "connected" to another component, that component may be directly connected or connected to that other component, but between components It will be understood that may be "connected", "coupled" or "connected".
후술할 본 발명의 일 실시예에 따른 영상 부호화 장치(Video Encoding Apparatus)와 영상 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 이동통신 단말기(Mobile Communication Terminal), 스마트 폰(Smart Phone) 등일 수 있으며, 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하거나 복호화하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미한다.According to an embodiment of the present invention, a video encoding apparatus (Video Encoding Apparatus) and a video decoding apparatus (Video Decoding Apparatus) are a personal computer (PC), a notebook computer, a personal digital assistant (PDA). , A portable multimedia player (PMP: Portable Multimedia Player), a PlayStation Portable (PSP: PlayStation Portable), a mobile communication terminal (Mobile Communication Terminal), a smart phone (Smart Phone), etc., and communicates with various devices or wired and wireless communication networks. The present invention refers to various devices including a communication device such as a communication modem, a memory for storing various programs and data for encoding or decoding an image, a microprocessor for executing and operating a program, and the like.
또한, 영상 부호화 장치에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망, 유선 전화망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB: Universal Serial Bus) 등의 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 영상 복호화 장치에서 복호화되어 영상으로 복원되고 재생될 수 있다.Also, an image encoded in a bitstream by an image encoding apparatus may be connected to a wired / wireless communication network such as an internet, a local area wireless communication network, a wireless LAN network, a WiBro network, a mobile communication network, a wired telephone network, or the like using a cable or a universal serial bus. The device may be transmitted to an image decoding apparatus through a communication interface such as a universal serial bus (USB), and decoded by the image decoding apparatus to be restored and reproduced as an image.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 간략하게 나타낸 블록 구성도이다.1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상부호화 장치(100)는 예측기(110), 감산기(120), 변환기 및 양자화기(130), 부호화기(140), 역양자화기 및 역변환이기(150), 가산기(160), 필터(170) 및 픽처 버퍼(180)를 포함하여 구성될 수 있다.The
예측기(110)는 인트라 예측기(112)와 인터 예측기(114)를 포함할 수 있으며, 인터 예측기(114)는 다시 움직임 추정기(116)와 움직임 보상기(118)를 포함할 수 있다.The
입력 영상은 프레임 단위 또는 필드 단위로 도 1의 영상 부호화 장치(100)에 입력되거나, NxN(단, N은 16이상의 정수) 화소를 가지는 매크로블록들로 분할되어 영상 부호화 장치(100)에 입력될 수 있다. 즉, 입력 영상이 4Kx2K 영상과 같은 고해상도 영상인 경우, N이 16보다 큰 정수로 이루어진 매크로블록으로 분할하여 부호화를 수행함으로써 영상 압축의 효율 향상을 꾀할 수 있다. 여기서, N이 16보다 큰 정수로 이루어진 매크로블록을 확장된 매크로블록(EMB: Extended Macroback)이라고 명명한다. 예를 들어, 확장된 매크로블록은 64x64, 32x32 등과 같은 크기의 정방형의 화소 블록으로 이루어질 수 있다. 이하에 기재하는 매크로블록은 확장된 매크로블록과, 일반적인 16x16 화소 블록의 매크로블록을 포함하는 개념임에 유의한다.The input image may be input to the
한편, N이 16보다 큰 정수로 이루어진 확장된 매크로블록을 사용하여 영상 압축을 수행할 때, 입력 영상이 16화소의 배수가 아닌 경우에는 입력 영상에 대해 16화소의 배수가 되도록 패딩한 후 영상 압축을 수행할 수 있다. On the other hand, when image compression is performed using an extended macroblock having an integer greater than 16, N is padded to be a multiple of 16 pixels for the input image when the input image is not a multiple of 16 pixels. Can be performed.
도 2는 본 발명의 실시예에 따라 입력되는 영상을 패딩하였을 경우의 영상 부호화 및 복호화를 설명하기 위해 도시한 도면이며, 도 3은 도 2의 현재 부호화할 대상인 확장된 매크로블록을 확대한 도면이다. 16화소의 배수로 패딩이 수행된 입력 영상과 현재 부호화할 대상인 확장된 매크로블록의 위치가 도 2와 같을 경우, 현재의 확장된 매크로블록의 부호화는 16화소의 배수가 되도록 패딩한 입력 이미지 안에 속하는 화소값만을 이용하는 것이 바람직하다. 즉, 도 3에서 현재의 확장된 매크로블록 내의 패딩된 영역은 부호화에 사용하지 않는 것이 바람직하다. 또한, 비트스트림에 부호화하는 데이터도 16화소의 배수가 되도록 패딩한 입력 이미지 안에 속하는 화소값만을 이용하는 것이 바람직하다. 즉, 도 3에서 현재의 확장된 매크로블록 내의 패딩된 영역은 부호화에 사용하지 않는 것이 바람직하다. 또한, 비트스트림에 부호화하는 데이터도 16화소의 배수가 되도록 패딩한 입력 이미지 안에 속하는 화소값만을 이용하는 것이 바람직하다. 입력 이미지가 매크로블록 사이즈의 배수가 아닌 경우, 본 발명에 따른 실시예에서는 입력 이미지를 가장 가까운 16의 배수가 되도록 패딩(이 경우, 16의 배수로 패딩된 이미지는 도 3에 도시한 바와 같이 매크로블록 사이즈의 배수가 아닐 수도 있다)한 후, 16의 배수로 패딩된 영역만을 이용하여 부호화 모드를 결정한다. 여기서, 매크로블록 내의 16의 배수로 패딩된 이미지 영역이 매크로블록의 크기보다 작더라도 매크로블록 내의 사용 가능한 모든 블록모드가 적용될 수 있으나, 모드 결정시에는 16의 배수로 패딩된 영역만을 사용하는 것이 바람직하다. 그 이유는, 매크로블록의 크기가 16보다 큰 경우, 패딩된 영역이 실제 이미지 영역보다 커서 잘못된 모드 결정이 되는 것을 방지하기 위함이다.FIG. 2 is a diagram illustrating image encoding and decoding when an input image is padded according to an embodiment of the present invention. FIG. 3 is an enlarged view of an extended macroblock that is an object to be encoded in FIG. . If the location of the input macro padded with multiples of 16 pixels and the extended macroblock to be encoded currently is as shown in FIG. 2, the encoding of the current extended macroblock is a pixel belonging to the padded input image to be a multiple of 16 pixels. It is preferable to use only values. That is, in FIG. 3, the padded region in the current extended macroblock is preferably not used for encoding. It is also preferable to use only pixel values belonging to the input image padded so that the data encoded in the bitstream is a multiple of 16 pixels. That is, in FIG. 3, the padded region in the current extended macroblock is preferably not used for encoding. It is also preferable to use only pixel values belonging to the input image padded so that the data encoded in the bitstream is a multiple of 16 pixels. If the input image is not a multiple of the macroblock size, in the embodiment according to the present invention, the input image is padded to be the nearest multiple of 16 (in this case, an image padded with a multiple of 16 is a macroblock as shown in FIG. 3). The encoding mode may be determined using only regions padded with multiples of 16). Here, even if the image area padded with multiples of 16 in the macroblock is smaller than the size of the macroblock, all available block modes in the macroblock may be applied, but it is preferable to use only padded regions with multiples of 16 when determining the mode. The reason is that when the size of the macroblock is larger than 16, the padded area is larger than the actual image area to prevent erroneous mode determination.
이하에서 설명하는 영상 부호화 및 복호화 방법은, 도 2 및 도 3과 같이 입력되는 영상이 매크로블록의 일부에 걸치는 경우, 해당 영상에 대한 부호화 및 복호화와 동일하게 적용될 수 있다.The video encoding and decoding method described below may be applied in the same manner as the encoding and decoding on the corresponding video when the input video covers a part of the macroblock as shown in FIGS. 2 and 3.
입력 영상이 4:2:0 포맷(Format)의 영상의 경우, 매크로블록은 NxN 화소를 가지는 휘도 블록과 두 개의 화소를 가지는 색차 블록으로 이루어진다. 이와 같은 확장된 매크로블록에 의한 고해상도 영상의 압축 효율 향상은, 이하에서 설명하는 구체적인 실시예에 의해 달성된다.When the input image is a 4: 2: 0 format image, the macroblock includes a luminance block having NxN pixels and a color difference block having two pixels. The improvement of the compression efficiency of the high resolution image by such an extended macroblock is achieved by the specific embodiment described below.
본 발명의 일 실시예에 따른 확장된 매크로블록은 도 4에 도시한 바와 같이 내부적으로 더 작은 서브블록으로 분할되어 인트라 예측 부호화 또는 인터 예측 부호화가 수행될 수 있다.The extended macroblock according to an embodiment of the present invention may be internally divided into smaller subblocks as shown in FIG. 4 to perform intra prediction encoding or inter prediction encoding.
즉, 고해상도 영상의 부호화를 위하여 N이 16이상인 매크로블록을 사용하는 경우, 확장된 매크로블록은 보다 작은 화소 블록 단위로 분할하여 부호화를 수행할 수 있으며, 각각의 화소 블록은 더 작은 서브블록으로 분할하여 부호화를 수행할 수 있다. 또한, 확장된 매크로블록 또는 분할된 화소 블록의 일변의 길이가 16화소 보다 큰 경우에는 도 5에 도시한 바와 같이, 32x64, 64x32, 16x32 또는 32x16와 같은 직사각형 형상을 갖는 화소 블록으로의 분할을 생략하고 확장된 매크로블록을 정방형의 화소 블록으로 분할한 후 16x16 화소 블록 단위로 부호화를 수행할 수도 있다. 도 4 및 도 5에는 확장된 매크로블록에 대하여 최소 블록의 크기가 4x4인 각각의 서브블록을 예시적으로 나타내었다. 예를 들어, 확장된 매크로블록이 64x64 화소 블록인 경우, 도 4의 매크로블록 레이어(Layer) 0에는 서브블록인 64x64 화소 블록, 64x32 화소 블록, 32x64 화소 블록, 32x32 화소 블록이 속하고 매크로블록 레이어 1에는 서브블록인 32x32 화소 블록, 32x16 화소 블록, 16x32 화소 블록, 16x16 화소 블록이 속할 수 있다. 또한, 도 5와 같이 16x16 화소 블록보다 큰 서브블록들에 대해 64x32 화소블록, 32x64 화소블록, 32x16 화소블록, 16x32 화소블록과 같은 직사각형 형상의 서브블록의 분할을 생략할 수 있다. 이 경우, 매크로블록 레이어 0에는 서브블록인 64x64 화소 블록 및 32x32 화소 블록이 속하도록 하고 매크로블록 레이어 1에는 서브블록인 32x32 및 16x16 화소 블록이 속하게 된다. 여기서, 매크로블록 레이어 K(단, )의 서브블록 중 제일 큰 서브블록이 4 개의 블록으로 분할된 경우에만 매크로블록 레이어 K+1의 서브블록들을 사용할 수 있다. 즉, 도 5의 경우와 같이, 매크로블록 레이어 0의 64x64 서브블록이 4개의 서브블록으로 분할된 경우에만 매크로블록 레이어 1의 서브블록들을 사용할 수 있으며, 매크로블록 레이어 1의 32x32 서브블록이 4개의 16x16 서브블록으로 분할된 경우에만 매크로블록 레이어 2의 서브블록들을 사용할 수 있다.That is, in the case of using a macroblock having N equal to or greater than 16 for encoding a high resolution image, the expanded macroblock may be divided into smaller pixel block units to perform encoding, and each pixel block is divided into smaller subblocks. Encoding can be performed. In addition, when the length of one side of the extended macroblock or the divided pixel block is larger than 16 pixels, division into a pixel block having a rectangular shape such as 32x64, 64x32, 16x32, or 32x16 is omitted as shown in FIG. After dividing the expanded macroblock into square pixel blocks, encoding may be performed in units of 16 × 16 pixel blocks. 4 and 5 exemplarily show each subblock having a 4 × 4 minimum block size for the extended macroblock. For example, when the extended macroblock is a 64x64 pixel block, the
영상 부호화 장치(100)는 매크로블록을 서브블록으로 분할하여 부호화했을 경우의 각 서브블록에 대한 부호화 효율을 계산하고, 가장 부호화 효율이 높은 경우의 서브블록을 최종적인 인트라 예측 블록 또는 인터 예측 블록으로 결정한다. 부호화 효율은 수학식 1과 같은 율-왜곡 최적화(RDO: Rate-Distortion Optimizaion) 기법에 근거하여 측정할 수 있다.The
여기서 Distortion은 부호화 대상 블록과 복원 블록 사이의 에러(error) 값을 나타내고, 는 양자화 파라미터에 의해 결정되는 상수이며, Bit는 부호화 대상 블록을 부호화하는데 필요한 비트수를 나타낸다.Here, Distortion represents an error value between a block to be encoded and a reconstruction block, is a constant determined by a quantization parameter, and Bit represents the number of bits required to encode a block to be encoded.
블록의 모드는 가능한 블록들의 모든 타입에 대하여 각 블록의 최적의 예측 모드(인트라 예측모드, 움직임 데이터)를 결정한 후, 블록 타입을 결정하는 과정으로 나뉠 수 있으며, 보통 예측모드 결정시(인트라 예측모드나 움직임 벡터/참조픽처 선택시)에는 연산량을 줄이기 위해서 SAD(Sum of Absolute Difference) 또는 SATD(Sum of Absolute Transformed Difference)를 사용하고 Bit에는 변환 계수의 비트는 고려하지 않는다. 이를 정리하면 수학식 2와 같이 표현할 수 있다.The mode of a block can be divided into the process of determining the optimal prediction mode (intra prediction mode, motion data) of each block for all types of possible blocks, and then determining the block type, and usually in determining the prediction mode (intra prediction mode). In the case of selecting a motion vector / reference picture, SAD (Sum of Absolute Difference) or SATD (Sum of Absolute Transformed Difference) is used. Bits of transform coefficients are not considered in Bit. This can be summarized as in
수학식 2에서 SAD는 원 영상과 예측 영상 사이의 차분치에 절대값을 취하여 모두 더한 값을 말하고, SATD는 잔여블록을 변환을 수행한 후 그 값에 절대값을 취하여 모두 더한 값을 말한다.In
블록 타입 결정시에는 수학식 3을 이용하여 엄격하게 Rdcost를 계산하는 것이 바람직하다.In determining the block type, it is preferable to calculate Rdcost strictly using
수학식 3의 Distortion은 수학식 4로 나타낼 수 있다.Distortion of
수학식 2는 수학식 3을 이용하는 것보다 연산량은 적으나 움직임이 없는 영역 또는 복잡하지 않은 영역의 경우에는 Distortion이 거의 비슷하기 때문에 수학식 2를 사용해서는 최적의 모드를 결정하는 것이 힘들다. 반면에, 수학식 3은 수학식 2보다 정확한 부호화 효율을 계산할 수는 있으나 계산량이 많다는 단점이 있다. 그러므로, 본 발명의 실시예에서는 데이터의 중요도(참조픽처로 사용되는지의 여부 등) 또는 부호화하고자 하는 모드에 따라 수학식 2 또는 수학식 3을 선택하여 사용하는 것이 바람직하다. 예를 들어, 인트라 예측모드 결정시 및 블록의 움직임 벡터/참조픽처 결정시에는 수학식 3을 사용할 수 있다. 다만, 예외적으로 B 픽처의 16x16 이상 크기의 화소 블록의 예측 방향(L0 예측, L1 예측, 양방향 예측)과 움직임 벡터/참조 픽처 결정과정은 각 예측 방향에 따라 움직임 벡터와 참조 픽처는 수학식 3을 사용하여 결정하며, 예측 방향은 수학식 2를 사용하여 결정할 수 있다. 블록 타입 결정시에는 수학식 3을 사용할 수 있다. 또한, 서브블록의 크기가 설정된 화소블록의 크기 이상인 경우에는 수학식 3에 따라 부호화 비용을 결정하고, 설정된 화소블록의 크기보다 작은 경우에는 수학식 2에 따라 부호화 비용을 결정할 수 있다.Equation (2) is less than the equation (3), but since the distortion is almost the same in the case of a motionless or uncomplicated region, it is difficult to determine the optimal mode using the equation (2). On the other hand,
예를 들어, 부호화 비용의 선택 기준을 16x16 화소블록으로 설정한다고 가정하면, 16x16 화소블록이 가질 수 있는 부호화 모드는 16x16 SKIP 모드, 16x16 Direct 모드, L0 예측모드를 사용하는 16x16 블록(예를 들면, 움직임 정보와 잔차 데이터가 있을 수 있다), L1 예측모드를 사용하는 16x16 블록(예를 들면, 움직임 정보와 잔차 데이터가 있을 수 있다), L0 및 L1 예측모드를 모두 사용하는 16x16 블록(예를 들면, 움직임 정보와 잔차 데이터가 있을 수 있다), 16x16 인트라 블록 등이 있다. 16x16 이상의 화소블록들의 부호화 모드들에 대해서는 정밀한 부호화 비용을 사용하는 것이 바람직하다. 블록 타입이 16x16 이상의 크기를 가지는 경우는 주로 배경과 같은 평탄한 영역이기 때문에 근사화된 식으로는 최적의 모드결정이 어렵기 때문이다. 그러므로 16x16 이상의 블록들을 사용하는 경우에는 매크로블록 내 모드 결정시 블록 사이즈와 모드에 따라 부호화 비용을 선택적으로 사용하도록 한다. 또한, 부호화 비용을 구하는 식에서 고려하는 파라미터를 작은 블록들간의 모드결정에 사용하는 파라미터와 큰 블록들간의 모드결정에 사용하는 파라미터를 다르게 고려하도록 할 수도 있다.For example, assuming that the selection criterion of encoding cost is set to 16x16 pixelblocks, the encoding mode that a 16x16 pixelblock may have is a 16x16 block using a 16x16 SKIP mode, a 16x16 Direct mode, or a L0 prediction mode (for example, There may be motion information and residual data), 16x16 block using L1 prediction mode (e.g. there may be motion information and residual data), 16x16 block using both L0 and L1 prediction mode (e.g. , Motion information and residual data), 16x16 intra blocks, and the like. It is preferable to use a precise encoding cost for encoding modes of pixel blocks of 16 × 16 or more. If the block type has a size of 16x16 or more, it is mainly because of the flat area such as the background, so it is difficult to determine the optimum mode by the approximated equation. Therefore, when using blocks of 16x16 or more, the coding cost is selectively used according to the block size and mode when determining the mode in the macroblock. In addition, the parameters used in the equation for calculating the encoding cost may be considered differently from the parameters used for mode determination between small blocks and the parameters used for mode determination between large blocks.
최소 블록의 크기는 최대로 사용할 수 있는 레이어값인 최대 레이어값(MaxLayer)에 따라 결정된다. 예를 들어, NxN 화소의 매크로블록인 경우, 최소 블록의 크기는 N/(2MaxLayer)로 결정된다.The minimum block size is determined by the maximum layer value MaxLayer, which is the maximum usable layer value. For example, in the case of a macroblock of N × N pixels, the size of the minimum block is determined as N / (2 MaxLayer ).
영상 부호화 장치(100)의 각 구성 요소에 대해서는 후술하는 과정에서 관련 도면들과 함께 설명한다.Each component of the
영상 부호화 장치(100)는 영상을 부호화할 때, 동영상을 구성하는 픽처 단위로 픽처 타입을 구분하여 픽처 타입에 따라 다르게 예측 부호화한다. 예를 들어, 임의의 픽처가 인트라 픽처인 경우에는 인트라 픽처 내의 매크로블록들의 타입은 모두 인트라 매크로블록이 되며, 각 매크로블록을 인트라 예측 부호화한다. 또한, 임의의 픽처가 인터 픽처인 경우에는 인터 픽처 내의 매크로블록들의 매크로블록 타입은 인터 매크로블록 또는 인트라 매크로블록일 수 있으며, 매크로블록 타입에 따라 인트라 예측 부호화거나 인터 예측 부호화된다. 이와 같은 픽처 타입에 대한 정보는 그대로 또는 부호화되어 부호화 데이터의 픽처 헤더 또는 시퀀스 헤더 등에 삽입될 수 있으며, 후술할 영상 복호화 장치는 픽처 헤더 또는 시퀀스 헤더 등에서 픽처 타입에 대한 정보를 추출하거나 복원하여 복호화할 픽처의 픽처 타입을 결정할 수 있다.When encoding an image, the
이하에서는 본 발명의 일 실시예에 따른 부호화 방법과 그를 통해 생성되는 부호화 데이터를 픽처 타입에 따라 설명한다.Hereinafter, an encoding method and encoded data generated through the encoding method according to an embodiment of the present invention will be described according to a picture type.
도 6은 본 발명의 일 실시예에 따른 인트라 픽처의 부호화 방법과 부호화 데이터를 통해 전송할 관련 데이터를 설명하기 위한 예시도이다.6 is an exemplary diagram for describing a method of encoding an intra picture and related data to be transmitted through encoded data, according to an embodiment of the present invention.
예측기(110)의 인트라 예측기(112)는 현재 부호화하고자 하는 블록(이하 '현재 블록'이라 칭함)의 주변 화소를 이용하여 참조 블록을 생성하고 참조 블록과 현재 블록을 비교하여 인트라 예측 모드를 결정한다. 여기서, 주변 화소란 현재 블록 주위에 있는 블록 내에 있는 화소들을 말하며, 현재 블록과 인접한 블록들 내에서 현재 블록과 인접한 인접 화소를 포함하는 개념이다.The
확장된 매크로블록을 휘도 성분에 대한 4x4 화소 단위의 서브 블록으로 분할하여 인트라 예측을 수행하는 경우, 휘도 성분의 인트라 예측 모드에 따른 9 가지의 예측 방향과 예측 모드 번호를 예시적으로 나타낸 도 7을 참조하면, 9 가지의 예측 방향(예측 모드 0 내지 예측 모드 8에 따른 예측 방향) 중 가장 적절한 예측 방향을 4x4 화소 단위의 현재 블록마다 1 개씩 선택하고, 선택된 예측 방향을 이용하여 현재 블록을 인트라 예측 부호화한다. 예측 모드 2가 의미하는 평균값은 현재 블록의 왼쪽 블록의 4 개의 인접 화소와 현재 블록의 위쪽 블록의 4 개 인접 화소의 총 8 개의 인접 화소의 평균값을 구해 현재 블록의 4x4 화소 모두를 예측하는 방법이다.When intra prediction is performed by dividing the extended macroblock into 4x4 pixel sub-blocks for the luminance component, FIG. 7 illustrates nine prediction directions and prediction mode numbers according to the intra prediction mode of the luminance component. For reference, among the nine prediction directions (the prediction directions according to the
픽처의 좌측 경계에 위치하는 블록과 픽처의 윗쪽 경계에 위치하는 블록의 경우 왼쪽 블록과 윗쪽 블록이 각각 픽처 바깥쪽에 위치하게 된다. 이 경우, 픽처 경계를 벗어난 블록을 참조할 수 없기 때문에 예측 방향의 이용이 제한된다. 예를 들어, 픽처의 제일 위쪽에 위치한 블록에서는 윗쪽 블록의 화소를 참조하는 예측 모드 0, 예측 모드 3, 예측 모드 4, 예측 모드 5, 예측 모드 6, 예측 모드 7의 예측 방향을 이용할 수 없다. 예외적으로 DC 모드의 경우, 픽처의 경계를 벗어나지 않는 화소만을 참조해서 현재 블록의 예측을 수행한다. 만약, 현재 블록과 이웃한 왼쪽 블록과 윗쪽 블록을 이용할 수 없는 경우, DC 값은 128을 사용한다.In the case of a block located at the left boundary of the picture and a block located at the upper boundary of the picture, the left block and the upper block are located outside the picture, respectively. In this case, the use of the prediction direction is limited because the block outside the picture boundary cannot be referenced. For example, the prediction direction of the
선택된 현재 블록의 예측 방향과 현재 블록의 왼쪽 블록과 위쪽 블록 중 더 작은 예측 모드 번호를 가지는 블록의 예측 방향을 비교하여 두 예측 방향이 동일한 경우, 주변 블록으로부터 추정한 현재 블록의 예측 방향과 선택된 현재 블록의 예측 방향이 동일한지 여부를 나타내는 예측 모드 플래그(예를 들어, 1 비트로 표시될 수 있음)를 추정한 예측 방향과 같은 예측 방향임을 나타내도록 부호화한다.The prediction direction of the selected current block is compared with the prediction direction of the block having the smaller prediction mode number among the left block and the upper block of the current block, and when the two prediction directions are the same, the prediction direction of the current block estimated from the neighboring block and the selected current A prediction mode flag (for example, represented by 1 bit) indicating whether the prediction directions of the blocks are the same is encoded to indicate that the prediction direction is the same as the estimated direction.
만약, 주변 블록으로부터 추정한 현재 블록의 예측 방향과 선택된 현재 블록의 예측 방향이 다른 경우, 예측 모드 플래그를 선택된 현재 블록의 예측 방향이 추정한 현재 블록의 예측 방향과 다른 예측 방향임을 나타내도록 부호화하고 9 가지의 예측 모드에서 추정한 현재 블록의 예측 방향에 해당하는 예측 모드를 뺀 나머지 8 가지의 예측 모드 중 어떠한 예측 모드가 선택된 현재 블록의 예측 방향인지를 나타내기 위한 예측 모드 정보(예를 들어, 3 비트로 표시될 수 있음)를 부호화한다. If the prediction direction of the current block estimated from the neighboring block and the prediction direction of the selected current block are different, the prediction mode flag is encoded to indicate that the prediction direction of the selected current block is different from the estimated direction of the estimated current block. Prediction mode information for indicating which prediction mode among the eight prediction modes minus the prediction mode corresponding to the prediction direction of the current block estimated in the nine prediction modes is the prediction direction of the selected current block (for example, Can be represented by 3 bits).
확장된 매크로블록을 휘도 성분에 대한 8x8 화소 단위의 서브 블록으로 분할하여 인트라 예측을 수행하는 경우, 휘도 성분에 대한 8x8 화소 단위의 인트라 예측은 4x4 화소 단위의 인트라 예측과 같이 도 7에 도시한 바와 같은 9 가지 예측 방향을 이용하며, 예측 화소를 계산하는 방법도 블록의 크기(4x4 화소와 8x8 화소)의 차이를 제외하면 4x4 화소 단위의 인트라 예측 부호화의 경우와 동일하다.When intra prediction is performed by dividing the extended macroblock into subblocks of 8x8 pixel units for the luminance component, intra prediction of 8x8 pixel units for the luminance component is illustrated in FIG. 7 as in the intra prediction of 4x4 pixels. The same nine prediction directions are used, and the method of calculating the prediction pixels is the same as that of intra prediction coding in units of 4x4 pixels except for differences in block sizes (4x4 pixels and 8x8 pixels).
확장된 매크로블록을 휘도 성분에 대한 16x16 화소 단위의 서브 블록으로 분할하여 인트라 예측을 수행하는 경우, 도 8에 도시한 바와 같은 4 가지의 예측 방향 중에서 부호화 효율이 가장 좋은 예측 방향을 선택하고, 선택된 예측 방향에 따라 16x16 크기의 현재 블록의 위쪽에 위치한 16x16 화소 블록 내의 16 개의 인접 화소와 현재 블록의 왼쪽에 위치한 16x16 화소 블록 내의 16 개의 인접 화소의 총 32 개의 인접 화소로부터 16x16 화소 블록을 예측 부호화한다.When intra prediction is performed by dividing an extended macroblock into subblocks of 16x16 pixel units for a luminance component, a prediction direction having the best coding efficiency is selected from four prediction directions as shown in FIG. According to the prediction direction, a 16x16 pixel block is predictively encoded from 16 neighboring pixels in a 16x16 pixel block located above a 16x16 current block and 16 neighboring pixels in a 16x16 pixel block located to the left of the current block. .
도 8에서, 예측 모드 3인 평면(Plane) 예측의 경우, 현재 블록의 위쪽 블록 내의 인접 화소와 현재 블록의 왼쪽 블록 내의 인접 화소를 대각선 방향으로 보간(Interpolation)하여 예측한다. 예측 모드 2에 해당하는 평균값 예측의 경우, 평균값은 현재 블록의 윗쪽 블록 내의 16 개의 인접 화소와 왼쪽 블록의 16 개의 인접 화소의 평균값을 현재 블록의 16x16 화소 모두로 예측한다. 단, 현재 블록이 픽처 내에서 제일 위쪽에 위치하는 경우, 현재 블록의 왼쪽 블록 내의 16 개의 인접 화소의 평균값을 예측값으로 이용하며, 현재 블록이 픽처 내에서 가장 왼쪽에 위치하는 경우, 현재 블록의 위쪽 블록 내의 16 개 인접 화소의 평균값을 예측값으로 이용한다. 현재 블록의 왼쪽 블록과 윗쪽 블록을 이용할 수 없는 경우, 예측값으로 128을 사용한다. 16x16 화소 블록의 예측 모드는 예측 부호화되지 않고, 단순히 선택된 예측 모드의 번호가 예측 모드 정보(예를 들어, 2 비트로 표시됨)로서 부호화된다.In FIG. 8, in the case of plane prediction in the
확장된 매크로블록을 전술한 4x4 화소 블록, 8x8 화소 블록 또는 16x16 화소 블록을 제외한 서브 블록으로 분할하여 인트라 예측을 수행하는 경우, 휘도 성분의 인트라 예측 모드는 도 9와 같이 3가지의 예측 방향과 예측 모드 번호로 나타낼 수 있다. 4x4 화소 블록, 8x8 화소 블록 또는 16x16 화소 블록을 제외한 나머지 서브 블록으로 분할하여 인트라 예측을 수행하는 경우에 해당 서브 블록의 크기가 mxn이라고 하면, 도 9에 도시한 바와 같은 3 가지의 예측 방향 중에서 선택되는 부호화 효율이 가장 좋은 예측 방향에 따라 현재 블록의 위쪽 블록 내의 m 개의 인접 화소와 왼쪽 블록 내의 n 개의 인접 화소로부터 mxn 화소 블록을 인트라 예측 부호화한다.When intra prediction is performed by dividing an extended macroblock into sub blocks excluding the 4x4 pixel block, 8x8 pixel block, or 16x16 pixel block, the intra prediction mode of the luminance component has three prediction directions and predictions as shown in FIG. 9. Can be represented by the mode number. In the case of performing intra prediction by dividing the sub block into 4x4 pixel blocks, 8x8 pixel blocks, or 16x16 pixel blocks, the size of the subblock is mxn, and it is selected from three prediction directions as shown in FIG. An mxn pixel block is intra-predictively encoded from m neighboring pixels in the upper block of the current block and n neighboring pixels in the left block according to the prediction direction having the highest coding efficiency.
예측 모드 2에 해당하는 평균값 예측의 경우, 현재 블록의 위쪽 블록 내의 m 개의 인접 화소와 왼쪽 블록 내의 n 개 인접 화소의 평균값을 이용해서 현재 블록을 예측 부호화한다. 단, 현재 블록이 픽처 내에서 제일 위쪽에 위치하는 경우, 현재 블록의 왼쪽 블록의 n 개의 인접 화소의 평균값을 현재 블록의 예측값으로 이용하며, 현재 블록이 픽처 내의 제일 왼쪽에 위치하는 경우, 위쪽 블록 내의 m 개의 인접 화소의 평균값을 현재 블록의 예측값으로 이용한다. 현재 블록의 왼쪽 블록과 위쪽 블록을 이용할 수 없는 경우, 현재 블록의 예측값으로 128이 사용된다.In the mean value prediction corresponding to
선택된 현재 블록의 예측 방향과 현재 블록의 왼쪽 블록과 위쪽 블록 중 더 작은 예측 모드의 번호를 가지는 블록의 예측 방향이 같은 방향인 경우, 현재 블록의 주변 블록으로부터 추정한 현재 블록의 예측 방향과 선택된 현재 블록의 예측 방향이 동일한지 여부를 나타내는 예측 모드 플래그(예를 들어, 1 비트로 표시될 수 있다)를 추정한 현재 블록의 예측 방향과 같은 예측 방향이라는 정보를 부호화한다. mxn 화소 블록이 가질 수 있는 예측 모드의 번호는 0 내지 2이므로, 현재 블록의 왼쪽 블록과 위쪽 블록을 이용하여 예측한 현재 블록의 예측 모드 번호가 3 이상인 경우에는 현재 블록의 예측 방향은 예측 모드 번호 2(DC 모드)를 사용할 수 있다. 예를 들어, 주변 블록으로부터 예측한 현재 블록의 예측 모드 번호가 4인 경우, 현재 블록의 예측 모드 번호를 2로 하여 선택된 현재 블록의 예측 방향과 동일한지를 나타내는 예측 모드 플래그(예를 들어, 1 비트로 표시됨)를 부호화한다.When the prediction direction of the selected current block and the prediction direction of the block having the smaller prediction mode number among the left block and the upper block of the current block are the same direction, the prediction direction of the current block estimated from the neighboring blocks of the current block and the selected current Information about a prediction direction that is the same as the prediction direction of the current block in which a prediction mode flag (for example, one bit may be indicated) indicating whether or not the prediction directions of the blocks are the same is encoded. Since the number of prediction modes that an mxn pixel block can have is 0 to 2, when the prediction mode number of the current block predicted using the left block and the upper block of the current block is 3 or more, the prediction direction of the current block is the prediction mode number. 2 (DC mode) can be used. For example, when the prediction mode number of the current block predicted from the neighboring block is 4, a prediction mode flag (eg, 1 bit) indicating whether the prediction mode number of the current block is the same as the prediction direction of the current block selected. Coded).
여기서, 확장된 매크로블록에 대한 인트라 예측은 16x16 이하의 화소 블록 단위 즉, 4x4 화소 블록, 8x8 화소 블록, 16x16 화소 블록 또는 mxn(여기서, m≠n이며, m 및 n은 16보다 작은 수) 화소 블록 단위로 수행되는 것이 바람직하다.Here, the intra prediction for the extended macroblock is a pixel block unit of 16x16 or less, that is, a 4x4 pixel block, an 8x8 pixel block, a 16x16 pixel block, or an mxn (where m ≠ n and m and n are less than 16) pixels. It is preferable to perform block by block.
색차 성분의 인트라 예측은 화소 블록 단위로 수행될 수 있다. 예측 방향은 도 10에 나타낸 바와 같이, 평균치 예측, 수평 예측, 수직 예측, 평면 예측 4 가지의 예측 방향이 사용될 수 있다. 바람직하게는, 색차 성분의 인트라 예측은 8x8 화소 블록 단위로 수행된다.Intra prediction of chrominance components It may be performed in pixel block units. As shown in FIG. 10, four prediction directions may be used: average prediction, horizontal prediction, vertical prediction, and plane prediction. Preferably, intra prediction of the chrominance component is performed in units of 8x8 pixel blocks.
본 발명의 일 실시예에 따른 색차 성분의 4 가지의 인트라 예측 모드에 따른 예측 방향과 예측 모드 번호를 예시적으로 나타낸 도 10을 참조하면, 예측 모드 3에 해당하는 평면 예측과 예측 모드 0에 해당하는 평균값 예측을 위한 예측값 계산 방법도 블록의 크기(16x16 화소와 8x8 화소)의 차이를 제외하고 휘도 성분의 16x16 화소 단위의 인트라 예측 부호화 방법과 동일하다. 색차 신호의 예측 모드는 휘도 신호의 예측 모드와는 독립적으로 선택할 수 있다. 색차 신호는 U, V의 두 종류가 있지만 예측 방법은 같다. 색차 신호의 예측 모드는 U, V 각각 1 개씩이며 각 색차 신호의 예측 모드는 예측 부호화하지 않고 단순히 선택된 예측 모드 번호를 2 비트를 사용하여 나타낸다.Referring to FIG. 10 exemplarily illustrating a prediction direction and a prediction mode number according to four intra prediction modes of a chrominance component according to an embodiment of the present invention, planar prediction corresponding to
다시 도 6을 참조하면, 인트라 예측기(112)는 도 7 내지 도 10을 통해 전술한 바와 같은 방식으로 4x4 화소 단위에 대한 9 가지 예측 방향으로 현재 블록을 예측하여 예측 부호화고 율-왜곡 최적화와 같은 방식으로 결정되는 인트라 예측 모드, 8x8 화소 단위에 대한 9 가지 예측 방향으로 현재 블록을 예측하여 예측 부호화고 율-왜곡 최적화와 같은 방식으로 결정되는 인트라 예측 모드, 16x16 화소 단위에 대한 4 가지 예측 방향으로 현재 블록을 예측하여 예측 부호화고 율-왜곡 최적화와 같은 방식으로 결정되는 인트라 예측 모드, mxn 화소 단위에 대한 3 가지 예측 방향으로 현재 블록을 예측하여 예측 부호화고 율-왜곡 최적화와 같은 방식으로 결정되는 인트라 예측 모드 중 율-왜곡 최적화를 이용하여 결정되는 하나의 인트라 예측 모드를 현재 블록의 인트라 예측 모드로서 결정한다. 이때 사용되는 율-왜곡 최적화 식은 전술한 수학식 3에 따르는 것이 바람직하다. 이와 같은 방법으로 인트라 예측 모드가 결정되면 그에 따라 서브블록의 크기도 함께 결정된다. Referring back to FIG. 6, the
전술한 바와 같이 결정되는 인트라 예측 모드에 따라, 인트라 예측기(112)는 현재 블록을 예측하여 예측 블록(Predicted Block)을 생성하고, 감산기(120)는 현재 블록과 예측 블록을 감산하여 잔여 블록(Residual Block)을 생성한다. 변환기 및 양자화기(130)는 잔여 블록을 변환 및 양자화하여 양자화된 변환 계수를 생성하고, 부호화기(140)는 양자화된 변환 계수를 엔트로피 부호화하여 부호화 데이터를 생성한다.According to the intra prediction mode determined as described above, the
변환기 및 양자화기(130)는 휘도 성분의 4x4, 4x8, 8x4 화소 단위의 인트라 예측이 선택된 현재 블록의 잔여 블록에 대해서는 4x4 변환을 수행하고, 8x8, 8x16, 16x8 화소 단위의 인트라 예측이 선택된 현재 블록의 잔여 블록에 대해서는 8x8 변환을 수행할 수 있다. 또한, 변환기 및 양자화기(130)는 16x16 화소 단위 이상의 인트라 예측이 선택된 현재 블록의 잔여 블록에 대해서는 16x16 변환을 수행할 수 있다. 이 경우, 인트라 예측의 단위와 서브블록의 크기가 동일하므로, 변환의 종류는 서브블록의 블록 크기에 따라 결정할 수 있다.The converter and
여기서, 각 16x16 변환이 수행되는 16x16 화소를 가지는 잔여 블록(이하 '16x16 화소 잔여 블록'이라 칭함)은 다시 16 개의 4x4 화소를 가지는 잔여 블록(이하 '4x4 화소 잔여 블록'이라 칭함)으로 분할되고, 각 4x4 화소 잔여 블록에 대해 4x4 변환이 수행될 수 있다. 이후, 각 4x4 화소 잔여 블록이 4x4 변환되어 생성되는 각 4x4 화소를 가지는 변환 블록(이하 '4x4 화소 변환 블록'이라 칭함)의 16 개 DC 성분들만이 모여 4x4 변환 계수를 가지는 변환 블록(이하 'DC 성분 블록'이라 칭함)이 구성되고, DC 성분 블록은 4x4 변환이 한번 더 수행된다. 이때, DC 성분 블록을 변환하는 데에는 잔여 블록을 변환할 때의 변환과 다른 종류의 변환이 사용될 수 있다. 즉, 4x4 화소 잔여 블록에 대해서는 4x4 이산 코사인 변환(DCT: Discrete Cosine Transform)이 수행되고, DC 성분 블록에 대해서는 4x4 하다마드 변환이 사용될 수 있다. 예를 들어, 16x32 화소 단위의 인트라 예측이 선택된 현재 블록에 대한 16x32 화소 잔여 블록은 두 개의 16x16 화소 잔여 블록으로 분할되고 분할된 각 16x16 화소 잔여 블록에 대해 4x4 화소 단위로 4x4 변환이 수행된다. 이후 16x16 크기의 화소 잔여 블록 내 각 4x4 변환 블록들의 DC 성분들이 모여 DC 성분 블록이 구성되고 DC 성분 블록에 대해서 4x4 변환이 한번 더 수행된다.Herein, a residual block having 16x16 pixels to which each 16x16 transform is performed (hereinafter, referred to as a 16x16 pixel residual block) is further divided into a residual block having 16 4x4 pixels (hereinafter referred to as a 4x4 pixel residual block). 4x4 transform may be performed on each 4x4 pixel residual block. Subsequently, only 16 DC components of a transform block (hereinafter, referred to as a 4x4 pixel transform block) having each 4x4 pixel generated by 4x4 pixel residual block 4x4 transform are collected to have a 4x4 transform coefficient (hereinafter, 'DC'). Component block '), and the 4x4 transform is performed once more. In this case, a transform different from the transform when the residual block is transformed may be used to transform the DC component block. That is, a 4x4 Discrete Cosine Transform (DCT) is performed on the 4x4 pixel residual block, and a 4x4 Hadamard transform may be used on the DC component block. For example, a 16x32 pixel residual block for the current block in which intra prediction is selected in units of 16x32 pixels is divided into two 16x16 pixel residual blocks, and 4x4 conversion is performed in 4x4 pixel units for each of the divided 16x16 pixel residual blocks. Thereafter, DC components of the 4x4 transform blocks in the 16x16 pixel residual block are gathered to form a DC component block, and 4x4 transform is performed once more on the DC component block.
만일, 32x32 화소 블록인 확장된 매크로블록의 위치가 도 2에 도시한 바와 같이 16화소의 배수로 패딩된 이미지와 패딩된 영역에 걸치는 경우, 해당 확장된 매크로블록이 인트라 모드이면 도 3에 도시한 바와 같이 실제의 이미지 영역(16x16 화소 블록)에 대해서만 부호화 모드를 결정하고 해당 영역의 분할 타입, 인트라 에측 모드, CBP, 변환 계수의 부호화를 수행한다.If the location of the extended macroblock, which is a 32x32 pixel block, spans the padded image and the padded region in multiples of 16 pixels as shown in FIG. 2, if the extended macroblock is an intra mode, as shown in FIG. Similarly, the encoding mode is determined only for the actual image region (16x16 pixel block), and the division type, the intra prediction mode, the CBP, and the transform coefficient of the corresponding region are encoded.
도 11은 본 발명의 일 실시예에 따른 64x64 화소의 확장된 매크로블록에 대한 서브 블록의 블록 타입을 나타낸 예시도이다.11 is an exemplary diagram illustrating a block type of a sub block for an extended macroblock of 64x64 pixels according to an embodiment of the present invention.
확장된 매크로블록이 64x64 화소 블록이고 인트라 예측 후 최적의 블록 타입이 도 11에 도시한 바와 같이 결정되었다고 가정하면, 블록 0 내지 블록 7에 대해서는 4x4 변환이 수행되고, 블록 8 내지 블록 12에 대해서는 8x8 변환이 수행되며, 블록 13 내지 블록 18에 대해서는 16x16 화소 블록 내에서 4x4 화소 단위로 4x4 변환이 수행되고 각 16x16 화소 블록 내 각 4x4 변환 블록들의 DC 성분들이 모여 구성되는 DC 성분 블록에 대하여 다시 변환이 수행된다.Assuming that the extended macroblock is a 64x64 pixel block and the optimal block type after intra prediction is determined as shown in FIG. 11, 4x4 transform is performed for
색차 신호의 경우, 16x16 화소 단위 이상의 인트라 예측의 경우와 마찬가지로 4x4변환이 수행된 후, DC 성분 블록에 대하여 4x4 변환이 한 번 더 수행된다. 단, 색차 성분의 매크로블록의 잔여 블록은 8x8 화소를 가지는 잔여 블록(이하 '8x8 화소 잔여 블록'이라 칭함)으로 분할되고 각 8x8 화소 잔여 블록 내의 4 개의 4x4 화소 잔여 블록에 대해서는 4x4 변환이 수행된다. 8x8 화소 잔여 블록 내 4 개의 4x4 변환 블록의 DC 성분들이 모여 2x2 변환 계수를 가지는 DC 성분 블록이 구성되고 DC 성분 블록에 대해 2x2 변환이 수행된다. 이 때도 마찬가지로, 8x8 화소 잔여 블록에 대한 4x4 변환과 DC 성분 블록에 대한 2x2 변환의 종류는 다를 수 있다.In the case of the chrominance signal, 4x4 transform is performed as in the case of intra prediction of 16x16 pixel unit or more, and then 4x4 transform is performed once more for the DC component block. However, the residual block of the macroblock of the chrominance component is divided into a residual block having 8x8 pixels (hereinafter referred to as an '8x8 pixel residual block'), and 4x4 transform is performed on four 4x4 pixel residual blocks in each 8x8 pixel residual block. . DC components of four 4x4 transform blocks in an 8x8 pixel residual block are gathered to form a DC component block having a 2x2 transform coefficient, and 2x2 transform is performed on the DC component block. In this case, the 4x4 transform for the 8x8 pixel residual block and the 2x2 transform for the DC component block may be different.
또는, 확장된 매크로블록에 대하여 최적의 블록 타입이 결정된 후 전술한 변환 타입에 따라 변환을 수행하는 대신에, 16x16 화소 블록의 단위로 인트라 예측에 사용된 서브 블록의 크기에 따라 효율이 좋은 변환 타입을 선택하여 사용할 수도 있다. 즉, 변환 및 양자화기(130)는 16x16 화소 블록의 단위로 하나 이상의 변환 및 양자화를 수행한 후 가장 효율이 좋은 변환의 종류를 선택하고, 선택된 변환의 종류에 따라 변환 및 양자화된 변환 계수를 생성할 수 있다. 이 경우, 부호화기(140)는 각 블록마다 선택된 변환의 종류를 식별하기 위한 변환 타입을 생성하고 부호화하여 변환 타입 데이터를 생성하는 것이 바람직하다. 변환 타입 데이터는 부호화 데이터에 포함된다. 단, 16x16 화소 블록 내에서는 서로 다른 변환을 사용할 수 없다.Alternatively, instead of performing a transform according to the above-described transform type after the optimal block type is determined for the extended macroblock, a transform type having good efficiency according to the size of the sub-block used for intra prediction in units of 16x16 pixel blocks. You can also select and use. That is, the transform and
이에 대하여 보다 상세하게 설명하면, 16x16 화소 블록이 8x8 화소 블록으로 분할되고 4 개의 8x8 화소 블록들 중 한 개 이상의 8x8 화소 블록이 8x8 화소보다 작은 서브블록으로 분할된 경우에는 16x16 화소 블록에 대해서 4x4 변환만이 사용될 수 있으며, 이 경우 변환 타입은 부호화되지 않는다. 또한, 16x16 화소 블록이 4 개의 8x8 화소 블록으로 분할된 경우에는 16x16 화소 블록에 대해서는 4x4 변환과 8x8 변환이 수행되어 부호화 비용이 작은 변환이 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트로 표시될 수 있다)이 부호화될 수 있다. 또한, 16x16 화소 블록이 2 개의 8x16 화소 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환, 8x8 변환과 8x16 변환이 수행되어 부호화 비용이 가장 작은 변환의 종류가 선택되고, 16x16 화소 서브블록이 2 개의 16x8 화소 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환, 8x8 변환과 16x8 변환이 수행되어 부호화 비용이 가장 작은 변환의 종류가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트 또는 2 비트로 표시될 수 있다)이 부호화될 수 있다. 16x16 화소 이상의 서브블록에 대해서는 4x4 변환, 8x8 변환과 16x16 변환이 수행되어 부호화 비용이 가장 작은 변환이 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트 또는 2 비트로 표시됨)이 부호화될 수 있다.In more detail, when a 16x16 pixel block is divided into 8x8 pixel blocks and one or more 8x8 pixel blocks of four 8x8 pixel blocks are divided into subblocks smaller than 8x8 pixels, 4x4 conversion is performed on the 16x16 pixel block. Only can be used, in which case the transform type is not encoded. In addition, when a 16x16 pixel block is divided into four 8x8 pixel blocks, a 4x4 transform and an 8x8 transform are performed on the 16x16 pixel block to select a transform having a low encoding cost, and a transform type (for example, a type of a transform selected) , May be represented by 1 bit). In addition, when a 16x16 pixel block is divided into two 8x16 pixel subblocks, a 4x4 transform, an 8x8 transform, and an 8x16 transform are performed on the remaining blocks of the 16x16 pixel subblock to select the type of the transform having the lowest encoding cost. When the pixel subblock is divided into two 16x8 pixel subblocks, the 4x4 transform, the 8x8 transform, and the 16x8 transform are performed on the remaining blocks of the 16x16 pixel subblock to select the type of transform having the lowest encoding cost. A transformation type (for example, may be represented by 1 bit or 2 bits) indicating the type may be encoded. For a subblock of 16x16 pixels or more, 4x4 transform, 8x8 transform, and 16x16 transform are performed, and the transform having the lowest encoding cost is selected, and a transform type (for example, represented by 1 bit or 2 bits) indicating the type of the selected transform is encoded. Can be.
도 12는 본 발명의 일 실시예에 따른 인터 픽처의 부호화 방법과 부호화 데이터를 통해 전송할 관련 데이터를 설명하기 위한 예시도이다.12 is an exemplary diagram for describing an encoding method of an inter picture and related data to be transmitted through encoded data according to an embodiment of the present invention.
P-픽처 또는 P-슬라이스의 경우, 도 4의 모든 블록 타입들이 움직임 추정에 사용될 수 있으며, 확장된 매크로블록 내에는 16x16 화소 블록 단위로 인트라 모드인지 또는 인터 모드인지를 선택할 수 있다. 즉, P-픽처 또는 P-슬라이스의 확장된 매크로블록 내에는 인트라 모드와 인터 모드가 모두 사용될 수 있다. In the case of a P-picture or a P-slice, all block types of FIG. 4 may be used for motion estimation, and within an extended macroblock, an intra mode or an inter mode may be selected in units of 16 × 16 pixel blocks. That is, both intra mode and inter mode may be used in an extended macroblock of a P-picture or a P-slice.
B-픽처 또는 B-슬라이스의 경우, 최대 두 장까지의 임의의 참조 픽처를 선택할 수 있는데, 그 두 장을 각각 L0 예측, L1 예측이라고 부르며, 이 두 장의 참조 픽처는 서로 다른 역할을 한다. 보통은 L0 예측(List 0 Prediction, 주로 순방향 예측에 사용됨)이 순방향 예측, L1 예측(List 1 Prediction, 주로 역방향 예측에 사용됨)이 역방향 예측으로 사용된다. P-픽처 및 B-픽처에 대한 각각의 보다 상세한 인터 픽처 부호화 방법은 후술한다.In the case of a B-picture or B-slice, up to two arbitrary reference pictures can be selected, which are called L0 prediction and L1 prediction, respectively, and these two reference pictures play different roles. Usually, L0 prediction (
확장된 매크로블록이 32x32 화소 블록인 경우, 32x32 화소 블록 단위로 부호화를 수행할지 또는 16x16 화소 블록 단위로 부호화를 수행할지는 확장된 매크로블록 플래그(extended_mb_flga)를 통해 나타낼 수 있다. 예를 들어, 확장된 매크로블록 플래그가 1인 경우에는 32x32 화소블록 단위로 부호화를 수행함을 의미하며, 확장된 매크로블록 플래그가 0인 경우에는 16x16 화소블록 단위로 부호화를 수행함을 의미할 수 있다. 확장된 매크로블록 플래그가 0인 경우, 확장된 매크로블록은 4개의 16x16 화소블록으로 분할되어 각 16x16 화소블록 단위로 인트라 모드인지 또는 인터 모드인지를 결정할 수 있다. 또한, 각각의 16x16 화소블록 단위는 더 작은 서브블록으로 분할되어 부호화가 수행될 수 있다.When the extended macroblock is a 32x32 pixel block, whether to perform encoding in units of 32x32 pixel blocks or encoding in units of 16x16 pixel blocks may be indicated through an extended macroblock flag (extended_mb_flga). For example, when the extended macroblock flag is 1, encoding may be performed in units of 32x32 pixel blocks, and when the extended macroblock flag is 0, encoding may be performed in units of 16x16 pixel blocks. When the extended macroblock flag is 0, the extended macroblock may be divided into four 16x16 pixelblocks to determine whether it is an intra mode or an inter mode for each 16x16 pixelblock. In addition, each 16x16 pixelblock unit may be divided into smaller subblocks to perform encoding.
다시 도 1을 참조하면, 예측기(110)의 인터 예측기(114)의 움직임 추정기(116)는 현재 픽처 내 현재 부호화 대상인 현재 블록과 가장 유사한 블록, 즉 참조 블록을 참조 픽처 내에서 찾아 현재 블록에 대한 참조 블록의 상대적인 위치를 나타내는 움직임 벡터(MV: Motion Vector)를 출력한다. 이러한 과정을 움직임 추정(Motion Estimation)이라 하는데, 움직임 추정은 매크로블록 내 서브블록을 픽처 버퍼(180)에 있는 하나 이상의 참조 픽처와 비교하여 움직임 벡터를 생성한다. 8x8 화소 블록은 서로 다른 참조 픽처를 이용할 수 있으나 8x8 화소 블록 내 서브블록들은 같은 참조 픽처를 이용한다.Referring back to FIG. 1, the
움직임 벡터는 부호화기(140)에 의해 부호화되어 부호화 데이터에 포함되는데, 부호화기(140)는 현재 블록의 주변 블록의 움직임 벡터들의 중앙값(Mean Value)을 예측 움직임 벡터(PMV: Predicted Motion Vector)로 이용하고 예측 움직임 벡터와 현재 블록의 움직임 벡터의 차이 벡터인 차분 움직임 벡터(DMV: Differential Motion Vector)만을 부호화하여 움직임 정보 데이터를 생성한다. 이때, 부호화기(140)는 차분 움직임 벡터뿐만 아니라 참조 픽처 인덱스(Reference Picture Index)를 추가로 부호화할 수 있다. 즉, 움직임 정보는 차분 움직임 벡터와 참조 픽처 인덱스를 포함할 수 있으며, 부호화기(140)는 움직임 정보를 부호화하여 움직임 정보 데이터를 생성하고 움직임 정보 데이터를 부호화 데이터에 포함시킬 수 있다.The motion vector is encoded by the
도 13은 본 발명의 일 실시예에 따라 예측 움직임 벡터를 결정하는 과정을 설명하기 위한 예시도이다.13 is an exemplary view for explaining a process of determining a predicted motion vector according to an embodiment of the present invention.
13A는 현재 블록과 주변 블록이 모두 64x64 화소 블록일 때, 현재 블록의 움직임 벡터와 예측 움직임 벡터를 결정하기 위해 이용되는 주변 블록의 움직임 벡터를 나타내었다. 현재 블록과 주변 블록이 모두 동일한 크기의 블록인 경우에는 기존의 방법과 같이 주변 블록의 움직임 벡터들의 중앙값을 예측 움직임 벡터로서 결정할 수 있다.13A illustrates the motion vector of the neighboring block used to determine the motion vector and the predictive motion vector of the current block when both the current block and the neighboring block are 64x64 pixel blocks. When both the current block and the neighboring block are blocks of the same size, the median of the motion vectors of the neighboring block may be determined as the predicted motion vector as in the conventional method.
13B는 현재 블록과 주변 블록의 크기가 다를 때, 현재 블록의 움직임 벡터와 예측 움직임 벡터를 결정하기 위해 이용되는 주변 블록의 움직임 벡터를 나타내었다. 현재 블록과 주변 블록의 크기가 다른 경우에는 어느 주변 블록을 이용하여 예측 움직임 벡터를 결정해야 할지를 선택해야 한다.13B illustrates the motion vector of the neighboring block used to determine the motion vector and the predictive motion vector of the current block when the sizes of the current block and the neighboring block are different. If the size of the current block and the neighboring block is different, it is necessary to select which neighboring block to determine the prediction motion vector.
본 발명의 일 실시예에서는 13B에 나타낸 바와 같이 현재 블록의 왼쪽에 있는 주변 블록이 여러 개의 블록으로 나뉘어 있을 경우 그 중 가장 위쪽 오른쪽에 위치한 블록 A의 움직임 벡터 mvA를 예측에 이용하고, 현재 블록의 위쪽에 있는 주변 블록이 여러 개로 나뉘어 있는 경우 그 중 가장 아래쪽 왼쪽에 위치한 블록 B의 움직임 벡터 mvB를 예측에 이용하며, 오른쪽 윗쪽에 위치한 주변 블록이 여러 개로 나뉘어 있는 경우 그 중 가장 아래쪽 왼쪽에 위치한 블록 C의 움직임 벡터 mvC를 예측에 이용한다. 단, 예외적인 경우로서, 블록 B와 블록 C가 모두 픽처의 경계 밖에 위치할 경우, 블록 B와 블록 C를 이용해서는 예측 움직임 벡터를 결정할 수 없기 때문에 블록 A의 움직임 벡터만을 이용하여 예측 움직임 벡터를 결정한다. 또한, 블록 A, 블록 B, 블록 C 중에 현재 블록과 참조 픽처의 번호가 같은 블록이 하나만 있는 경우, 해당 블록의 움직임 벡터를 예측 움직임 벡터를 결정하는 데 이용한다.According to an embodiment of the present invention, as shown in 13B, when the neighboring block on the left side of the current block is divided into several blocks, the motion vector mvA of the block A located on the upper right side is used for prediction, and The motion vector mvB of the lowermost left block B is used for prediction when the neighboring blocks at the top are divided into several, and the block at the bottom left of the upper right when the neighboring blocks are divided into several The motion vector mvC of C is used for prediction. However, in an exceptional case, when both the blocks B and C are located outside the boundary of the picture, the prediction motion vector may not be determined using the block B and the block C. Decide In addition, when only one block among blocks A, B, and C having the same reference picture number is used, the motion vector of the block is used to determine a predicted motion vector.
도 14는 본 발명의 일 실시예에 따른 8x16 화소 블록과 16x8 화소 블록의 예측 움직임 벡터를 결정하는 과정을 설명하기 위한 예시도이다.14 is an exemplary diagram for describing a process of determining a predicted motion vector of an 8x16 pixel block and a 16x8 pixel block according to an embodiment of the present invention.
또한, 현재 블록이 8x16 화소 블록 또는 16x8 화소 블록인 경우에는 중앙값을 이용하지 않는다. 즉, 현재 블록이 8x16 화소 블록인 경우, 왼쪽의 주변 블록으로서는 블록 A를, 오른쪽의 주변 블록으로서는 블록 C를 예측 움직임 벡터를 결정하는 데 이용한다. 현재 블록이 16x8 화소 블록인 경우, 윗쪽의 주변 블록은 블록 B를, 아랫쪽의 주변 블록은 블록 A를 예측 움직임 벡터를 결정하는 데 이용한다.In addition, when the current block is an 8x16 pixel block or a 16x8 pixel block, the median value is not used. In other words, when the current block is an 8x16 pixel block, block A is used as the neighboring block on the left side and block C is used to determine the predictive motion vector as the neighboring block on the right side. If the current block is a 16x8 pixel block, the upper neighboring block uses block B and the lower neighboring block uses block A to determine the predicted motion vector.
또한, 본 발명의 일 실시예에서는, 16x16 이상의 화소 블록인 매크로블록에 대하여 SKIP 모드를 사용한다. 16x16 이상의 화소 블록인 매크로블록이 SKIP 매크로블록인 경우에는 예측 움직임 벡터를 이용해서 움직임 추정 및 보상이 수행된다. 단, 예측 움직임 벡터를 결정하는 데 이용되는 움직임 벡터들 중 한 개 이상이 0인 경우 예측 움직임 벡터를 0으로 결정한다. 예를 들어, 주변 블록 A, B, C의 움직임 벡터가 각각 mvA (0,10)이고, mvB (1, 10)이며, mvC (2, 10)인 경우, 현재 블록의 예측 움직임 벡터는 (0, 10)이 된다.In addition, in one embodiment of the present invention, the SKIP mode is used for a macroblock that is a pixel block of 16x16 or more. When the macroblock, which is a 16x16 pixel block or more, is a SKIP macroblock, motion estimation and compensation are performed using the predicted motion vector. However, when one or more of the motion vectors used to determine the predictive motion vector is 0, the predictive motion vector is determined as 0. For example, when the motion vectors of neighboring blocks A, B, and C are mvA (0, 10), mvB (1, 10), and mvC (2, 10), the predicted motion vector of the current block is (0). , 10).
만일, 32x32 화소 블록인 확장된 매크로블록의 위치가 도 2에 도시한 바와 같이 16화소의 배수로 패딩된 이미지와 패딩된 영역에 걸치는 경우, 해당 확장된 매크로블록이 SKIP 모드이면 도 3에 도시한 바와 같이 실제의 이미지 블록(16x16 화소 블록)의 왼쪽 블록과 위쪽 블록을 이용하여 예측 움직임 벡터를 구하고, 그 예측 움직임 벡터를 사용해서 실제의 이미지 블록에 대한 움직임 예측 및 보상을 수행한다. 현재 부호화 대상인 확장된 매크로블록의 최적의 부호화 모드가 SKIP 모드인 경우, skip32_flag를 복호화하고 다음의 확장된 매크로블록에 대한 부호화를 수행한다.If the location of the extended macroblock, which is a 32x32 pixel block, spans the padded image and the padded region in multiples of 16 pixels as shown in FIG. 2, if the extended macroblock is in the SKIP mode, as shown in FIG. Similarly, a predictive motion vector is obtained using the left block and the upper block of an actual image block (16x16 pixel block), and motion prediction and compensation are performed on the actual image block using the predicted motion vector. If the optimal encoding mode of the extended macroblock that is the current encoding target is the SKIP mode, skip32_flag is decoded and the next extended macroblock is encoded.
다시 도 1을 참조하면, 감산기(120)는 움직임 추정기(116)에서 추정한 현재 블록의 움직임 벡터가 가리키는 참조 블록과 현재 블록을 감산하여 잔여 블록을 생성하고, 변환기 및 양자화기(130)는 감산기(120)에 의해 생성된 잔여 블록을 변환 및 양자화하며, 부호화기(140)는 양자화된 변환 계수를 엔트로피 부호화하여 부호화 데이터를 생성한다. 여기서, 변환기 및 양자화기(130)는 현재 블록의 크기에 따라 하나 이상의 변환 및 양자화를 수행한 후 가장 효율이 좋은 변환의 종류를 선택하고, 선택된 변환의 종류에 따라 변환 및 양자화된 변환 계수를 생성한다. 부호화기(140)에서는 각 블록마다 선택된 변환의 종류를 식별하기 위한 변환 타입을 생성하고 부호화하여 변환 타입 데이터를 생성한다. 변환 타입 데이터는 부호화 데이터에 포함된다. 단, 16x16 화소 블록 내에서는 서로 다른 변환을 사용할 수 없다.Referring back to FIG. 1, the
인트라 예측 블록에서 설명한 변환 방법과 마찬가지로, 16x16 화소 서브블록이 8x8 화소 블록으로 분할되고 4 개의 8x8 화소 서브블록들 중 한 개 이상의 8x8 화소 서브블록이 8x8 화소보다 작은 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환만이 사용될 수 있으며, 이 경우 변환 타입은 부호화되지 않는다. 16x16 화소 서브블록이 4 개의 8x8 화소 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환과 8x8 변환이 수행되어 부호화 비용이 작은 변환이 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트로 표시됨)이 부호화된다.Similar to the transform method described in the intra prediction block, 16x16 pixel subblocks are divided into 8x8 pixel blocks and 16x16 pixels when one or more 8x8 pixel subblocks of four 8x8 pixel subblocks are divided into subblocks smaller than 8x8 pixels. Only 4x4 transforms may be used for the remaining blocks of the subblock, in which case the transform type is not encoded. When a 16x16 pixel subblock is divided into four 8x8 pixel subblocks, a 4x4 transform and an 8x8 transform are performed on the remaining blocks of the 16x16 pixel subblock to select a transform having a low encoding cost, and a transform type indicating the type of the selected transform. (E.g., represented by 1 bit) is encoded.
16x16 화소 서브블록이 2 개의 8x16 화소 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환, 8x8 변환과 8x16 변환이 수행되어 부호화 비용이 가장 작은 변환의 종류가 선택되고, 16x16 화소 서브블록이 2 개의 16x8 화소 서브블록으로 분할된 경우에는 16x16 화소 서브블록의 잔여 블록에 대해서는 4x4 변환, 8x8 변환과 16x8 변환이 수행되어 부호화 비용이 가장 작은 변환의 종류가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트 또는 2 비트로 표시될 수 있다)이 부호화된다. 16x16 화소 이상의 서브블록에 대해서는 4x4 변환, 8x8 변환과 16x16 변환이 수행되어 부호화 비용이 가장 작은 변환이 선택되며, 선택된 변환의 종류를 나타내는 변환 타입(예를 들어, 1 비트 또는 2 비트로 표시됨)이 부호화된다.When the 16x16 pixel subblock is divided into two 8x16 pixel subblocks, the 4x4 transform, the 8x8 transform, and the 8x16 transform are performed on the remaining blocks of the 16x16 pixel subblock to select the type of transform having the lowest encoding cost. When the subblock is divided into two 16x8 pixel subblocks, the 4x4 transform, the 8x8 transform, and the 16x8 transform are performed on the remaining blocks of the 16x16 pixel subblock, and the type of transform having the lowest encoding cost is selected. A transform type (which may be represented by 1 bit or 2 bits, for example) is encoded. For a subblock of 16x16 pixels or more, 4x4 transform, 8x8 transform, and 16x16 transform are performed, and the transform having the lowest encoding cost is selected, and a transform type (for example, represented by 1 bit or 2 bits) indicating the type of the selected transform is encoded. do.
16x16 화소 블록이 4 개의 8x8 화소 서브블록으로 분할된 경우와 같이 선택 가능한 변환의 종류가 2가지인 경우, 변환 타입 부호화에 사용되는 부호화 비트는 표 1과 같이 구성될 수 있다.When there are two types of transforms that can be selected, such as when a 16x16 pixel block is divided into four 8x8 pixel subblocks, encoding bits used for transform type encoding may be configured as shown in Table 1 below.
또한, 16x16 화소 블록이 2개의 8x16 화소 블록으로 분할되거나, 2개의 16x8 화소 블록으로 분할되거나 또는 16x16 이상의 서브 블록과 같이 선택 가능한 변환의 종류가 3가지인 경우, 변환 타입 부호화에 사용되는 부호화 비트는 표 2와 같이 구성될 수 있다.In addition, when a 16x16 pixel block is divided into two 8x16 pixel blocks, two 16x8 pixel blocks, or three kinds of selectable transforms such as 16x16 or more subblocks, the encoding bit used for transform type encoding is It may be configured as shown in Table 2.
도 15는 본 발명의 일 실시예에 따른 서브블록 크기에 따른 사용 가능한 변환의 종류와 변환 타입이 부호화되는 단위를 나타낸 예시도이다.FIG. 15 is an exemplary diagram illustrating types of usable transforms and units in which transform types are encoded according to subblock sizes according to an embodiment of the present invention.
도 15에서는 확장된 매크로블록이 64x64 화소이고, 확장된 매크로블록이 다양한 크기의 서브블록으로 분할된 경우를 예시적으로 나타내었다. 전술한 바와 같이, 매크로블록의 첫 번째 16x16 화소 블록(1510)은 8x8 화소 블록보다 작은 4x4 화소 서브블록으로 분할되었으므로 사용 가능한 변환은 4x4 변환뿐이며, 이 경우 변환 타입은 부호화되지 않는다. 두 번째 16x16 화소 블록(1520)은 4 개의 8x8 화소 서브블록으로 분할되었으므로 4x4 변환 또는 8x8 변환 중 부호화 비용이 작은 하나가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입이 부호화된다. 세 번째 16x16 화소 블록(1530)은 2 개의 8x16 화소 서브블록으로 분할되었으므로 4x4 변환, 8x8 변환 또는 8x16 변환 중 부호화 비용이 작은 하나가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입이 부호화된다. 네 번째 16x16 화소 블록(1540)은 2 개의 16x8 화소 서브블록으로 분할되었으므로 4x4 변환, 8x8 변환 또는 16x8 변환 중 부호화 비용이 작은 하나가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입이 부호화된다. 다섯 번째 16x32 화소 블록(1550), 여섯 번째 16x32 화소 블록(1560), 일곱 번째 32x32 화소 블록(1570) 및 여덟 번째 32x32 화소 블록(1580)은 모두 16x16 화소 블록보다 크므로 4x4 변환, 8x8 변환 또는 16x16 변환 중 부호화 비용이 작은 하나가 선택되며, 선택된 변환의 종류를 나타내는 변환 타입이 부호화된다. 16x16 화소 보다 큰 블록에 대해서는 16x16 화소 블록 단위로 변환 타입을 선택할 수도 있다. 이 경우, 32x32 화소 블록과 같은 16x16 화소 블록보다 큰 화소 블록 내의 부호화된 블록 패턴이 0이 아닌 16x16 화소 블록에 대해서는 복수개의 변환 타입을 부호화한다.15 illustrates an example in which an extended macroblock is 64x64 pixels and an extended macroblock is divided into subblocks of various sizes. As described above, since the first
다시 도 1을 참조하면, 변환기 및 양자화기(130)에 의해 변환 및 양자화된 잔여 블록은 역양자화기 및 역변환이기(150)에 의해 역양자화 및 역변환되어 잔여 블록이 복원되고, 가산기(160)는 복원된 잔여 블록과 예측기(110)에 의해 예측된 예측 블록을 가산하여 현재 블록을 복원한다.Referring back to FIG. 1, the residual block transformed and quantized by the transformer and
필터(170)는 가산기(160)에 의해 복원된 현재 블록들이 누적되어 만들어지는 픽처를 디블록킹 필터 등을 사용하여 필터링을 수행하고, 필터링된 픽처는 픽처 버퍼(180)에 저장되어 다음 픽처의 참조 픽처로서 이용된다.The
도 16은 본 발명의 일 실시예에 따른 디블록킹 필터링을 수행할 블록 경계를 나타낸 예시도이다.16 is an exemplary diagram illustrating a block boundary to perform deblocking filtering according to an embodiment of the present invention.
16A 내지 16E는 각각 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환이 사용된 16x16 화소 블록에서 디블록킹 필터링을 수행할 블록 경계를 나타내었다. 16A에 나타낸 4x4 변환이 사용된 16x16 화소 블록은 각 4x4 화소 블록의 왼쪽과 위쪽의 블록 경계에 디블록킹 필터링이 수행되며, 16B에 나타낸 8x8 변환이 사용된 16x16 화소 블록은 각 8x8 블록의 왼쪽과 위쪽의 블록 경계에 디블록킹 필터링이 수행되며, 16C에 나타낸 8x16 변환이 사용된 16x16 화소 블록은 각 8x16 화소 블록의 왼쪽과 위쪽의 블록 경계에 디블로킹 필터링이 수행되며, 16D에 나타낸 16x8 변환이 사용된 16x16 화소 블록은 각 16x8 화소 블록의 왼쪽과 위쪽의 블록 경계에 디블로킹 필터링이 수행되며, 16E에 나타낸 16x16 변환이 사용된 16x16 화소 블록은 16x16 화소 블록의 왼쪽과 위쪽의 블록 경계에 디블로킹 필터링이 수행된다.16A to 16E represent block boundaries for deblocking filtering in 16x16 pixel blocks using 4x4 transform, 8x8 transform, 8x16 transform, 16x8 transform, and 16x16 transform, respectively. 16x16 pixel blocks using the 4x4 transform shown in 16A are deblocked filtered at the block boundaries on the left and top of each 4x4 pixel block, and 16x16 pixel blocks using the 8x8 transform shown in 16B are used to the left and top of each 8x8 block. Deblocking filtering is performed at the block boundary of the 16x16 pixel block using the 8x16 transform shown in 16C, and deblocking filtering is performed at the left and top block boundaries of each 8x16 pixel block, and the 16x8 transform shown in 16D is used. 16x16 pixel blocks are deblocked filtered at the left and top block boundaries of each 16x8 pixel block, and 16x16 pixel blocks using the 16x16 transform shown in 16E are deblocked filtered at the left and top block boundaries of the 16x16 pixel block. Is performed.
도 17은 본 발명의 일 실시예에 따른 인트라 픽처의 신택스(Syntax)를 나타낸 예시도이다.17 is an exemplary diagram illustrating syntax of an intra picture according to an embodiment of the present invention.
확장된 매크로블록에 대한 서브 블록의 형태가 도 4에 도시한 바와 같이 직사각형 타입(예를 들어, 32x16 화소 블록, 16x32 화소 블록 등)을 포함하는 경우에 영상 부호화 장치(100)는 영상 복호화 장치에 분할된 서브 블록의 타입 정보를 전송하여야 하므로, 인트라 픽처의 부호화 데이터는 분할 타입(Partition Type), 인트라 예측 모드(Intra Prediction Mode), CBPX_flag/CBP(Coded Block Pattern X-flag/Coded Block Pattern) 및 변환 계수(Transform Coefficient) 등과 같은 필드들로 구성될 수 있다. 영상 부호화 장치(100)의 부호화기(140)는 분할 타입 정보, 인트라 예측 모드, CBPX_플래그/CBP 및 변환 계수 등을 부호화하여 각 필드에 할당하여 부호화 데이터를 생성한다.When the shape of the sub block for the extended macroblock includes a rectangular type (for example, a 32x16 pixel block, a 16x32 pixel block, etc.) as shown in FIG. 4, the
다만, 도 17에서 도시한 인트라 픽처에 대한 부호화 데이터의 신택스는 예시적인 것일 뿐, 인트라 픽처에 대한 부호화 데이터의 신택스가 반드시 도 17에 도시한 바와 같이 구성되어야 하는 것은 아니다. 즉, 인트라 픽처에 대한 부호화 데이터의 신택스 중 일부 또는 전부의 순서가 도 17에 도시한 바와는 다르게 변경될 수도 있으며, 일부의 신택스는 생략될 수도 있음을 인식해야 할 것이다.However, the syntax of the encoded data for the intra picture shown in FIG. 17 is merely exemplary, and the syntax of the encoded data for the intra picture is not necessarily configured as shown in FIG. 17. That is, it should be appreciated that some or all of the syntax of the encoded data for the intra picture may be changed differently from that shown in FIG. 17, and some syntax may be omitted.
또는, 확장된 매크로블록에 대한 서브 블록의 형태가 도 5에 도시한 바와 같이 정방형의 화소 블록으로 분할된 후 16x16 화소 블록 단위로 인트라 예측 부호화가 수행되는 경우, CBPX_플래그에 대한 부호화는 생략되고 양자화 파라미터에 대한 증감정보(Δpq)가 부호화될 수 있다. 이때, 양자화 파라미터에 대한 증감정보는 확장된 매크로블록 단위로 부호화될 수 있으며, CBP 정보는 16x16 화소 블록 단위로 부호화되는 것이 바람직하다.Alternatively, when intra prediction encoding is performed in units of 16x16 pixel blocks after the subblock shape of the extended macroblock is divided into square pixel blocks as illustrated in FIG. 5, encoding for the CBPX_flag is omitted. The increase / decrease information Δpq for the quantization parameter may be encoded. In this case, the increase / decrease information on the quantization parameter may be encoded in extended macroblock units, and the CBP information may be encoded in units of 16 × 16 pixel blocks.
도 17에서 분할 타입 필드에는 매크로블록이 서브블록으로 분할된 모양을 나타내는 매크로블록의 분할 타입 정보가 부호화된 데이터인 분할 타입 데이터가 할당된다. 분할 타입 정보는 도 18에서 예시적으로 나타낸 분할 타입별 번호를 이용하여 생성될 수 있다.In FIG. 17, split type data, which is data in which split type information of a macroblock indicating a macroblock is divided into subblocks, is allocated to a split type field. The partition type information may be generated using the partition type number shown by way of example in FIG. 18.
도 18을 참조하면, 매크로블록 레이어 K의 화소 블록이 더 이상 분할되지 않는 경우에는 매크로블록 레이어 K의 화소 블록에 분할 타입 번호 0이 할당된다. 매크로블록 레이어 K의 화소 블록이 두 개의 화소 블록으로 분할된 경우에는 매크로블록 레이어 K의 화소 블록에 분할 타입 번호 1이 할당된다. 매크로블록 레이어 K의 화소 블록이 두 개의 화소 블록으로 분할된 경우에는 매크로블록 레이어 K의 화소 블록에 분할 타입 번호 2가 할당된다. 매크로블록 레이어 K의 화소 블록이 4 개의 로 분할되는 경우에는 매크로블록 레이어 K의 화소 블록에 분할 타입 번호 3이 할당된다. 도 18에서 각 매크로블록 레이어 K의 화소 블록 내의 분할된 서브블록에 표시된 0, 1, 2, 3 등의 숫자는 각 서브블록을 식별하기 위한 파티션 번호(Partition Number)이다. Referring to FIG. 18, macroblock layer K If the pixel block is no longer divided, the macroblock layer K The
도 18에는 분할 타입 별 번호를 작은 숫자에서 큰 순자의 순서로 할당하는 것으로 나타냈지만, 도 18의 분할 타입 번호는 일 예를 나타낸 것일 뿐이며, 발생순서로 큰 숫자에서 작은 숫자로 할당하여 사용할 수도 있다. 또한, 각각의 분할 타입의 발생 확률에 따라 분할 타입 번호를 할당할 수도 있으며, 적응적으로 분할 타입 번호를 바꾸어 사용할 수도 있다. 또한, 각각의 분할된 블록은 더 작은 블록으로 분할될 수도 있다. 예를 들어, 32x32 화소 블록이 분할 타입 번호 3에 의해 4개의 16x16 화소 블록으로 분할된 경우, 각각의 16x16 화소 블록은 도 18의 분할 타입 별 번호를 사용하여 더 작은 서브블록으로 분할될 수 있다. 또한, 16x16의 서브 블록이 더 작은 블록으로 분할되는 경우, 상위의 화소 블록의 분할 타입 번호 즉, 32x32 화소 블록의 분할 타입 번호와 다른 분할 타입 번호가 사용될 수도 있다. 확장된 매크로블록을 16x16 화소 블록 단위로 분할하여 부호화를 수행하는 경우에는 16x16 화소 블록보다 큰 서브 블록(예를 들면, 64x32 화소블록, 32x64 화소블록, 16x32 화소블록, 32x16 화소블록 등)에 대한 분할 타입 번호의 부호화는 생략될 수도 있다.In FIG. 18, the number of each partition type is assigned in the order of the smallest to the largest order. However, the partition type number of FIG. 18 is merely an example and may be allocated from the larger number to the smaller number in order of occurrence. . In addition, the partition type number may be allocated according to the occurrence probability of each partition type, or the partition type number may be adaptively changed. In addition, each divided block may be divided into smaller blocks. For example, when a 32x32 pixel block is divided into four 16x16 pixel blocks by
도 19는 본 발명의 일 실시예에 따라 확장된 매크로블록을 다양한 크기의 서브블록으로 분할하는 경우의 분할 타입 번호 부호화 순서를 설명하기 위해 도시한 도면이다.FIG. 19 is a diagram illustrating a split type number coding sequence in the case of dividing an expanded macroblock into subblocks of various sizes according to an embodiment of the present invention.
도 19에서는 확장된 매크로블록이 64x64 화소 블록이고 최대 분할 레이어의 개수가 4인 경우를 나타내었다. 확장된 매크로블록이 도 19와 같이 분할되었을 때, 본 발명의 일 실시예에 따르면 분할 레이어별 분할 타입 번호를 분할 타입 번호 부호화 순서에 따라 순차적으로 부호화하여 매크로블록의 분할 타입 정보를 부호화할 수 있다.In FIG. 19, the extended macroblock is a 64x64 pixel block and the maximum number of divided layers is four. When the extended macroblock is partitioned as shown in FIG. 19, according to an embodiment of the present invention, the partition type information of the macroblock may be sequentially encoded according to the partition type number encoding order in order to encode the partition type information of the macroblock. .
도 19에 도시한 매크로블록이 분할 레이어별로 분할되는 과정을 순차적으로 나타내면 도 20과 같이 나타낼 수 있다. 도 20을 참조하면, 매크로블록 레이어 0(L0)에서, 64x64 화소 서브블록은 4 개의 32x32 화소 서브블록으로 분할되며, 레이어 1(L1)에서, L1-P0(매크로블록 레이어 1의 파티션 번호 0)의 서브블록과 L1-P3(매크로블록 레이어 1의 파티션 번호 3)의 서브블록은 다시 4 개의 16x16 화소 서브블록으로 분할되고 L1-P1(매크로블록 레이어 1의 파티션 번호 1)의 서브블록과 L1-P2(레이어 1의 파티션 번호 2)의 서브블록은 각각 16x32 화소 서브블록과 32x16 화소 서브블록으로 분할된다. L1-P1과 L1-P2의 서브블록은 각각 2 개의 서브블록으로 분할된 후 더 이상 분할되지 않으므로 레이어별 파티션 번호를 나타내지 않았다. 레이어 2(L2)에서, L2-P0(매크로블록 레이어 2의 파티션 번호 0)의 서브블록은 다시 4 개의 8x8 화소 서브블록으로 분할되고 L2-P3(매크로블록 레이어 2의 파티션 번호 3)은 2 개의 16x8 화소 서브블록으로 분할된다. 다시, 매크로블록 레이어 3(L3)에서, L3-P0(매크로블록 레이어 3의 파티션 번호 0)의 서브블록과 L3-P1(매크로블록 레이어 3의 파티션 번호 1)의 서브블록은 각각 4 개의 4x4 화소 서브블록으로 분할된다. 이때, 확장된 매크로블록을 16x16 화소 블록 단위로 부호화를 수행하는 경우, L1-P1 블록과 L1-P2 블록은 각각 16x32 화소 서브블록 및 32x16 화소 서브블록으로 분할하는 대신에 L1-P3 블록과 같이 각각 4개의 16x16 화소 블록 단위로 부호화가 수행될 수 있다.A process of dividing the macroblocks shown in FIG. 19 for each of the divided layers may be shown as shown in FIG. 20. Referring to FIG. 20, in macroblock layer 0 (L0), a 64x64 pixel subblock is divided into four 32x32 pixel subblocks, and in layer 1 (L1), L1-P0 (
도 21은 매크로블록의 레이어별 분할 타입 번호를 순차적으로 부호화하는 과정을 설명하기 위한 예시도이다.21 is an exemplary diagram for describing a process of sequentially encoding a split type number for each layer of a macroblock.
도 19에 도시한 매크로블록의 분할 타입 정보를 부호화하면 도 21와 같이 부호화할 수 있다. 도 19에서, '□' 안에 기재된 숫자는 각 서브블록의 분할 타입 번호를 부호화하는 순서를 나타낸다. 확장된 매크로블록에 대한 레이어별 분할 타입 번호를 분할 타입 번호 부호화 순서에 따라 순차적으로 부호화하면, 도 21에 도시한 순서에 따라 레이어별 분할 타입 번호를 순차적으로 부호화할 수 있다.If the partition type information of the macroblock shown in FIG. 19 is encoded, it may be encoded as shown in FIG. 21. In Fig. 19, numerals written in '□' indicate an order of encoding division type numbers of respective subblocks. If the split type number for each layer for the extended macroblock is sequentially encoded according to the split type number encoding order, the split type number for each layer may be sequentially encoded in the order shown in FIG. 21.
먼저, 매크로블록 레이어 0의 64x64 화소 서브블록(L0-P0)은 4 개의 32x32 화소 서브블록들로 분할되었으므로, 분할 타입 번호 3을 부호화한다. 64x64 화소 서브블록 내 4 개의 32x32 화소 서브블록 중 첫 번째 32x32 화소 서브블록(L1-P0)도 4 개의 16x16 화소 서브블록으로 분할되었으므로 분할 타입 번호 3을 부호화한다. 레이어 1의 첫 번째 32x32 화소 서브블록(L1-P0) 내 4 개의 16x16 화소 서브블록 중 첫 번째 16x16 화소 서브블록(L2-P0)도 4 개의 8x8 화소 서브블록으로 분할되었으므로 분할 타입 3을 부호화하고 해당 16x16 화소 서브블록(L2-P0) 내 4 개의 8x8 화소 블록(L3-P0, L3-P1, L3-P2, L3-P3)은 더 이상 작은 서브블록으로 분할되지 않으므로 분할 타입 번호 {3, 3, 0, 0}을 각각 부호화한다. 레이어 3의 서브블록들은 더 작은 서브블록으로 분할될 수 없으므로 레이어 3에 속하는 서브블록들의 분할 타입 번호는 부호화하지 않는다.First, since the 64x64 pixel subblocks L0-P0 of the
매크로블록 레이어 3 내 서브블록들의 분할 타입 번호를 모두 부호화했으므로 매크로블록 레이어 2의 두 번째 16x16 화소 서브블록(L2-P1)과 세 번째 16x16 화소 서브블록(L2-P2)의 분할 타입 번호를 부호화하는데, 모두 더 이상 작은 블록으로 분할되지 않았으므로 분할 타입 번호 0을 부호화한다. 네 번째 16x16 화소 서브블록(L2-P3)은 16x8 화소 서브블록으로 분할되었지만 분할 타입 번호가 3이 아니므로 분할 타입 번호 1만을 부호화한다. 레이어 2 내의 4 개 서브블록들의 분할 타입 번호를 모두 부호화했으므로 레이어 1의 두 번째 32x32 화소 서브블록(L1-P1)의 분할 타입 번호를 부호화하는데, 레이어 1의 두 번째 32x32 화소 서브블록(L1-P1)은 16x32 화소 서브블록으로 분할되었고 분할된 각 서브블록은 더 이상 작은 서브블록으로 분할되지 않았으므로 분할 타입 번호 2를 부호화한다. 이와 같은 방식으로 매크로블록 레이어 1의 세 번째 32x32 화소 서브블록(L1-P2)와 매크로블록 레이어 1의 네 번째 32x32 화소 서브블록(L1-P3) 및 그 하위의 4 개의 16x16 화소 서브블록(L2-P0, L2-P1, L2-P2, L2-P3)의 분할 타입 번호를 차례로 부호화하면, {1, 3, 0, 0, 0, 0}을 부호화한다. Since the partition type numbers of the subblocks in the
전술한 바와 같은 부호화 방식에 따라 도 19에 도시한 매크로블록의 분할 타입 정보를 부호화하면, 도 21에 도시한 바와 같이 분할 타입 번호 {3, 3, 3, 3, 3, 0, 0, 0, 0, 1, 2, 1, 3, 0, 0, 0, 0}가 부호화 된다. 이때 분할 타입 번호는 이진 산술 부호화(Binary Arithmetic Coding) 또는 허프만 부호화(Huffman Coding) 등과 같은 무손실 압축 부호화를 이용하여 이진 비트 스트링(Bit String)으로 부호화될 수 있다.When the partition type information of the macroblock shown in FIG. 19 is encoded according to the above-described encoding method, as shown in FIG. 21, the partition type number {3, 3, 3, 3, 3, 0, 0, 0, 0, 0, 1, 2, 1, 3, 0, 0, 0, 0} is encoded. In this case, the split type number may be encoded into a binary bit string using lossless compression coding such as binary arithmetic coding or Huffman coding.
예를 들어, 이진 산술 부호화를 이용하는 경우, 각 분할 타입 번호는 현재 부호화할 분할 타입 번호의 레이어 번호에 따라 다른 이진값(Binary Value)을 이용할 수 있다. 레이어 번호가 이하인 경우에는 표 3을 이용하고 레이어 번호가 보다 큰 경우에는 표 4를 이용하여 부호화할 수 있다. 예를 들어 도 11의 서브블록(L1-P0)의 분할 타입 번호 3은 표 3을 참고하면 이진수 '01'로 표현될 수 있으므로 이진수 '0'과 '1'을 각각 산술 부호화하여 분할 타입 번호 3을 부호화할 수 있다. 그리고 서브블록(L2-P0)에 속하는 서브블록(L3-P2)의 분할 타입 번호 0은 표 4를 참고하면 이진수 '1'로 표현될 수 있으므로 이진수 '1'을 산술 부호화하여 분할 타입 번호 3을 부호화할 수 있다.For example, when binary arithmetic coding is used, each partition type number may use a different binary value according to the layer number of the partition type number to be currently encoded. Layer number If it is below, use Table 3 and the layer number is If larger, it can be encoded using Table 4. For example, since the
다시 도 17을 참조하면, 인트라 픽처에 대한 매크로블록의 분할 타입 정보를 부호화하여 분할 타입 데이터가 분할 타입 필드에 할당되면, 인트라 예측 모드 필드에 인트라 예측 모드에 대한 정보가 부호화된 데이터인 인트라 예측 모드 데이터가 할당된다.Referring back to FIG. 17, when split type data is encoded by encoding split type information of a macroblock for an intra picture and is allocated to a split type field, an intra prediction mode is data in which information about an intra prediction mode is encoded in an intra prediction mode field. The data is allocated.
도 22는 본 발명의 일 실시예에 따른 인트라 예측 모드의 부호화 순서를 나타낸 예시도이다.22 is an exemplary diagram illustrating a coding order of an intra prediction mode according to an embodiment of the present invention.
도 22는 도 19와 같이 확장된 매크로블록이 64x64 화소 블록이고 최대 분할 레이어의 개수가 4인 경우를 나타내었다. 확장된 매크로블록이 도 22와 같이 분할되었을 때, 확장된 매크로블록의 각 서브블록에 대한 인트라 예측 모드는 도 22에 도시한 인트라 예측 모드의 부호화 순서에 따라 순차적으로 부호화하여 인트라 예측 모드 데이터를 생성할 수 있다. 즉, 각 서브블록 내에 표시된 번호는 인트라 예측 모드를 부호화하기 위한 인트라 예측 모드의 부호화 순서를 나타낸 것이다. 만일, 64x64 화소의 확장된 매크로블록에 대하여 16x16 화소 블록 단위로 부호화를 수행하는 경우, 15번째 블록 및 16번째 블록, 또는 17번째 블록 및 18번째 블록에 해당하는 32x32 화소 블록은 16x32 화소 블록 또는 32x16 화소 블록으로 분할하는 대신에, 19번째 블록 내지 22번째 블록과 같이 각각 4개의 16x16 화소 블록 단위로 분할하여 부호화를 수행할 수 있다.FIG. 22 illustrates a case in which the expanded macroblock is a 64x64 pixel block and the number of maximum division layers is 4 as shown in FIG. 19. When the extended macroblock is divided as shown in FIG. 22, the intra prediction mode for each subblock of the extended macroblock is sequentially encoded according to the encoding order of the intra prediction mode shown in FIG. 22 to generate intra prediction mode data. can do. In other words, the number indicated in each subblock indicates the encoding order of the intra prediction mode for encoding the intra prediction mode. When encoding an extended macroblock of 64x64 pixels in units of 16x16 pixel blocks, a 32x32 pixel block corresponding to a 15th block and a 16th block, or a 17th block and an 18th block may be a 16x32 pixel block or a 32x16 pixel block. Instead of dividing into pixel blocks, encoding may be performed by dividing into four 16x16 pixel block units as in the 19th to 22nd blocks.
확장된 매크로블록의 휘도 성분의 서브블록이 16x16 화소 블록이 아닌 경우에는 주변 블록으로부터 추정한 현재 블록의 예측 방향과 선택된 현재 블록의 예측 방향이 동일한지 여부를 나타내는 예측 모드 플래그가 부호화되고, 예측 모드 플래그가 현재 부호화 대상인 블록의 예측 방향과 주변 블록으로부터 추정한 현재 블록의 예측 방향이 동일하지 않는 경우에는 현재 블록의 예측 방향과 주변 블록으로부터 추정한 현재 블록의 예측 방향이 동일하지 않음을 나타내는 예측 모드 플래그와 해당 서브블록의 크기에 따른 여러 가지 인트라 예측 방향 중에서 주변 블록으로부터 추정한 현재 블록의 예측 방향을 제외한 나머지 예측 방향 중에서 어떠한 예측 방향인지를 나타내는 예측 모드의 예측 모드 번호를 해당 블록의 인트라 예측 모드로서 부호화되어 인트라 예측 모드 데이터가 생성된다. 이때, 확장된 매크로블록을 4x4 화소 블록, 8x8 화소 블록 또는 16x16 화소 블록을 제외한 서브 블록으로 분할하여 인트라 예측을 수행하는 경우, 현재 블록의 왼쪽 블록과 위쪽 블록을 이용하여 예측한 현재 블록의 예측 모드 번호가 3 이상인 경우에는 현재 블록의 예측 방향은 도 9의 예측 모드 번호 2(DC 모드)를 사용할 수 있다.If the subblock of the luminance component of the extended macroblock is not a 16x16 pixel block, a prediction mode flag indicating whether the prediction direction of the current block estimated from the neighboring block and the prediction direction of the selected current block is the same is encoded, and the prediction mode If the prediction direction of the block whose flag is the current encoding target and the prediction direction of the current block estimated from the neighboring block are not the same, the prediction mode indicating that the prediction direction of the current block and the prediction direction of the current block estimated from the neighboring block are not the same. The prediction mode number of the prediction mode indicating the prediction direction among the remaining prediction directions except the prediction direction of the current block estimated from the neighboring block among the various intra prediction directions according to the size of the flag and the corresponding subblock, the intra prediction mode of the corresponding block. Encoded as The intra-prediction mode data is produced. In this case, when intra prediction is performed by dividing the expanded macroblock into subblocks other than 4x4 pixel blocks, 8x8 pixel blocks, or 16x16 pixel blocks, the prediction mode of the current block predicted using the left block and the upper block of the current block. If the number is 3 or more, the prediction direction of the current block may use prediction mode number 2 (DC mode) of FIG. 9.
만약, 주변 블록으로부터 추정한 현재 블록의 예측 방향과 현재 블록의 예측 방향이 동일한 경우에는 주변 블록으로부터 추정한 현재 블록의 예측 방향과 현재 블록의 예측 방향이 동일함을 나타내는 예측 모드 플래그를 인트라 예측 모드로서 부호화하여 인트라 예측 모드 데이터가 생성된다. 휘도 성분의 서브블록이 16x16 화소 블록이거나 색차 성분의 매크로블록의 예측모드는 해당 블록의 예측 모드의 번호 자체를 인트라 예측 모드로서 부호화하여 인트라 예측 모드 데이터가 생성된다. 이와 같이 도 22에 도시한 바와 같은 순서로 부호화되어 생성되는 매크로블록의 각 서브블록에 대한 인트라 예측 모드 데이터는 도 17에 도시한 인트라 예측 모드 필드에 할당된다.If the prediction direction of the current block estimated from the neighboring block and the prediction direction of the current block are the same, the prediction mode flag indicating that the prediction direction of the current block and the prediction direction of the current block estimated from the neighboring block is the same is intra prediction mode. As a result, intra prediction mode data is generated. In the prediction mode of the macroblock of the chrominance component or the subblock of the luminance component is an intra prediction mode, intra prediction mode data is generated by encoding the number of the prediction mode of the block as an intra prediction mode. In this way, the intra prediction mode data for each subblock of the macroblock generated by encoding in the order shown in FIG. 22 is allocated to the intra prediction mode field shown in FIG.
도 23은 본 발명의 일 실시예에 따라 매크로블록의 인트라 예측 모드를 부호화하는 과정의 일 예를 설명하기 위한 예시도이다.FIG. 23 is an exemplary diagram for explaining an example of a process of encoding an intra prediction mode of a macroblock according to an embodiment of the present invention.
23A에서는 현재 부호화하고자 하는 현재 매크로블록이 64x64 화소 블록이고 도시한 바와 같이 다양한 크기와 모양의 서브블록으로 분할되었으며, 현재 매크로블록의 왼쪽의 주변 블록은 64x64 화소 단위로 인트라 예측이 되어 왼쪽의 주변 블록의 예측 모드 번호는 0(수직 모드)이고, 현재 매크로블록의 위쪽 주변 블록은 64x64 화소 단위로 인트라 예측이 되어 왼쪽 주변 블록의 예측 모드 번호는 1(수평모드)인 경우를 예시적으로 나타내었다. 현재의 확장된 매크로블록 내의 각 서브블록 내에 표시되는 숫자는 각 서브블록의 예측 모드 번호를 나타낸다.In 23A, the current macroblock to be encoded is a 64x64 pixel block, and is divided into subblocks of various sizes and shapes as shown. The neighboring block on the left side of the current macroblock is intra predicted in units of 64x64 pixels, and thus the neighboring block on the left side. The prediction mode number of 0 is 0 (vertical mode), and the upper neighboring block of the current macroblock is intra predicted in units of 64x64 pixels, and the prediction mode number of the left neighboring block is 1 (horizontal mode). The number displayed in each subblock in the current extended macroblock indicates a prediction mode number of each subblock.
현재의 확장된 매크로블록의 첫 번째 4x4 화소 서브블록의 예측 모드 번호는 2(DC 모드)이고 왼쪽의 주변 블록과 위쪽의 주변 블록을 이용하여 추정되는 해당 서브블록의 예측 모드 번호는 0이다. 즉, 왼쪽의 주변 블록의 예측 모드 번호 0과 윗쪽의 주변 블록의 예측 모드 번호 1 중 0이 더 작기 때문에, 첫 번째 4x4 화소 서브블록의 예측 모드 번호는 0으로 추정된다. 첫 번째 4x4 화소 서브블록의 예측 모드와 주변 블록으로부터 추정되는 해당 서브블록의 예측 모드가 다르기 때문에, 해당 서브블록의 예측 방향과 주변 블록으로부터 추정되는 해당 서브블록의 예측 방향이 동일하지 않음을 나타내는 예측 모드 플래그와 해당 서브블록의 예측 모드 번호인 예측 모드 번호 2가 해당 서브블록의 인트라 예측 모드로서 부호화된다. 두 번째 4x4 화소 서브블록의 예측 모드 번호는 1이고 주변 블록으로부터 추정되는 해당 서브블록의 예측 모드 번호는 1이어서 해당 서브블록의 예측 방향과 주변 블록으로부터 추정되는 해당 서브블록의 예측 방향이 동일하므로, 예측 방향이 동일함을 나타내는 예측 모드 플래그만이 해당 서브블록의 인트라 예측 모드로서 부호화된다.The prediction mode number of the first 4x4 pixel subblock of the current extended macroblock is 2 (DC mode), and the prediction mode number of the corresponding subblock estimated using the neighboring block on the left side and the upper neighboring block is 0. That is, since 0 of the
다음으로는 도 22에 도시한 인트라 예측 모드의 부호화 순서에 따라 다음 서브블록의 인트라 예측 모드를 부호화하는데, 세 번째 4x4 화소 서브블록의 예측 모드 번호는 0이고 주변 블록으로부터 추정되는 해당 서브블록의 예측 모드 번호는 0이어서 해당 서브블록의 예측 방향과 주변 블록으로부터 추정되는 해당 서브블록의 예측 방향이 동일하므로, 예측 방향이 동일함을 나타내는 예측 모드 플래그만이 해당 서브블록의 인트라 예측 모드로서 부호화된다. 11 번째 16x16 화소 서브블록의 경우, 예측 플래그는 부호화되지 않고 해당 서브블록의 예측 모드 번호 1이 해당 서브블록의 인트라 예측 모드로서 부호화된다. 도 23에는 15번째 블록 및 16번째 블록을 16x32 화소 블록으로 분할하여 인트라 예측 모드로 부호화하고, 17번째 블록 및 18번째 블록을 32x16 화소 블록으로 분할하여 인트라 예측 모드로 부호화하는 경우를 도시하였다. 그러나, 확장된 매크로블록에 대하여 16x16 화소 블록 단위로 인트라 예측 부호화를 수행하는 경우, 16x16 화소 블록보다 큰 서브 블록에 대해서는 15번째 블록 및 16번째 블록, 또는 17번째 블록 및 18번째 블록과 같은 직사각형의 화소 블록 분할은 생략한다.Next, the intra prediction mode of the next subblock is encoded according to the encoding order of the intra prediction mode shown in FIG. 22. The prediction mode number of the third 4x4 pixel subblock is 0 and the prediction of the corresponding subblock estimated from the neighboring block is performed. Since the mode number is 0, the prediction direction of the subblock estimated from the neighboring block and the prediction direction of the corresponding subblock are the same, so that only the prediction mode flag indicating the same prediction direction is encoded as the intra prediction mode of the subblock. In the case of the eleventh 16x16 pixel subblock, the prediction flag is not encoded, and
23B에는 23A와 같이 현재 매크로블록의 인트라 예측 모드를 부호화하는 경우 인트라 예측 모드 필드에 포함되는 인트라 예측 모드 데이터를 예시적으로 나타내었다. 첫 번째 4x4 서브블록에 대해서는 예측 모드 플래그와 예측 모드 번호가 부호화되며, 두 번째, 세 번째, 네 번째 4x4 서브블록에 대해서는 예측 모드 플래그만이 부호화되는 등 도시한 바와 같이 부호화 순서에 따라 차례로 인트라 예측 모드 데이터가 인트라 예측 모드 필드에 할당된다.23B exemplarily shows intra prediction mode data included in an intra prediction mode field when encoding an intra prediction mode of a current macroblock as shown in 23A. The prediction mode flag and the prediction mode number are encoded for the first 4x4 subblock, and only the prediction mode flag is encoded for the second, third, and fourth 4x4 subblocks. Mode data is assigned to the intra prediction mode field.
확장된 매크로블록을 인트라 예측 부호화할 때, 도 4에 도시한 바와 같이 16x16 화소 블록보다 큰 직사각형의 서브 블록(예를 들면, 16x32, 32x16 등)으로 분할하여 인트라 예측 부호화를 수행하는 경우에는 서브블록의 크기를 고려한 부호화된 블록 패턴 플래그(CBPX_flag: Coded Block Pattern X_flag, 이하 'CBPX 플래그'라 칭함)와 CBP(CBP: Coded Block Pattern, 이하 'CBP'라 칭함)를 부호화하여, CBPX_플래그/CBP 필드에 할당할 수 있다. CBPX_플래그와 CBP 필드에 할당되는 CBP 데이터는 매크로블록의 서브블록 내에 0이 아닌 양자화된 변환 계수를 포함하는지 여부를 나타낸다. 그러나, 도 5에 도시한 바와 같이 확장된 매크로블록을 16x16 화소 블록 단위로 분할하여 인트라 예측 부호화를 수행하는 경우에는 블록 패턴 플래그의 부호화는 생략하고 양자화 파라미터에 대한 증감정보(Δpq)를 부호화할 수 있다. 이때, 양자화 파라미터에 대한 증감정보는 확장된 매크로블록 단위로 부호화될 수 있으며, CBP 데이터는 16x16 화소 블록 단위로 부호화되는 것이 바람직하다.When intra prediction encoding an extended macroblock, as shown in FIG. 4, when intra prediction encoding is performed by dividing into a rectangular subblock larger than a 16x16 pixel block (for example, 16x32, 32x16, etc.), the subblock is performed. Coded block pattern flag (CBPX_flag: Coded Block Pattern X_flag, hereinafter referred to as 'CBPX flag') and CBP (CBP: Coded Block Pattern, hereinafter referred to as 'CBP') by considering the size of CBPX_flag / CBP Can be assigned to a field. The CBP data allocated to the CBPX_flag and the CBP field indicates whether a non-zero quantized transform coefficient is included in a subblock of the macroblock. However, when performing intra prediction encoding by dividing the extended macroblock into units of 16x16 pixel blocks as shown in FIG. 5, the encoding of the block pattern flag is omitted and the increase / decrease information (Δpq) for the quantization parameter may be encoded. have. In this case, the increase / decrease information on the quantization parameter may be encoded in the extended macroblock unit, and the CBP data may be encoded in the 16 × 16 pixel block unit.
도 24는 본 발명의 일 실시예에 따라 인트라 매크로블록에 대한 CBPX_플래그와 CBP를 부호화 과정을 설명하기 위한 예시도이다.24 is an exemplary diagram for describing a process of encoding a CBPX_flag and a CBP for an intra macroblock according to an embodiment of the present invention.
도 24에서는 확장된 매크로블록이 64x64 화소 블록인 경우 CBPX_플래그와 CBP를 부호화하는 과정을 예를 들어 나타내었다. 영상 부호화 장치(100)의 부호화기(140)는 확장된 매크로블록의 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나인지 여부를 판단하며(S2410), 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나가 아닌 경우에는 서브블록의 크기가 32x32, 32x16 및 16x32 중 하나인지 여부를 판단한다(S2420). 이때, 확장된 매크로블록을 16x16 화소 단위로 분할하여 인트라 예측을 수행하는 경우, 단계 S2410에서는 서브 블록의 크기가 64x64 화소 블록인지 즉, 확장된 매크로블록 단위로 인트라 예측 부호화를 수행하는지 판단하며, 단계 S2420에서는 서브 블록의 크기가 64x64 화소 블록이 아닌 경우에 서브 블록의 크기가 32x32 화소 블록인지를 판단할 수 있다. 단계 S2420의 판단 결과, 그 서브블록의 크기가 32x32, 32x16 및 16x32 중 하나이거나 32x32 화소 블록인 경우, 서브블록 내 0이 아닌 변환 계수가 있는지 여부를 판단하며(S2430), 0이 아닌 변환 계수가 있는 경우에는 해당 서브블록 내에 0이 아닌 부호화할 계수가 있음을 나타내는 CBP32 플래그(예를 들어, '1'과 같이 1 비트로 표시될 수 있다)를 부호화하고(S2440), 서브블록 내에서 16x16 화소 블록 단위로 CBP를 부호화하며(S2450), 서브블록 내 0이 아닌 변환 계수가 없는 경우에는 서브블록 내에 0이 아닌 변환 계수가 없음을 나타내는 CBP32 플래그(예를 들어, '0'과 같이 1비트로 표시될 수 있다)를 부호화한다(S2460).24 illustrates an example of encoding a CBPX_flag and a CBP when an extended macroblock is a 64x64 pixel block. The
여기서, CBP64 플래그는 64x64 화소 블록 내 0이 아닌 부호화할 계수의 존재 유무를 나타내는 플래그이다. 마찬가지로, CBP32 플래그는 32x32 화소 블록 내 0이 아닌 부호화할 계수의 존재 유무를 나타내는 플래그이다. 이와 같은 CBPX 플래그(X는 32, 64 등)는 휘도 성분의 잔여 블록이 0이 아닌 변환계수를 가지지 않는 경우에는 변환 타입을 전송할 필요가 없으므로, 휘도 성분 블록들이 0이 아닌 변환계수를 가지는지를 나타내는 데 사용된다. CBP는 16x16 화소 블록 단위로 부호화되며, 16x16 화소 블록 내 각 8x8 화소 블록 당 0이 아닌 변환 계수가 있는지 여부를 8x8 화소 블록 당 1비트를 이용하여 나타내고, 색차 성분에 대해서는 두 개의 2x2 색차 성분 DC 블록 내 0이 아닌 변환 계수가 있는지 여부를 1 비트를 이용하여 나타내며, 두 개의 8x8 색차 성분 AC 블록 내 0이 아닌 변환 계수가 있는지 여부를 1 비트를 이용하여 나타낸다.Here, the CBP64 flag is a flag indicating the presence or absence of a coefficient to be encoded that is not zero in a 64x64 pixel block. Similarly, the CBP32 flag is a flag indicating the presence or absence of a non-zero coefficient to be encoded in a 32x32 pixel block. Such a CBPX flag (X is 32, 64, etc.) indicates whether the luminance component blocks have a non-zero transformation coefficient since the transform type does not need to be transmitted when the residual block of the luminance component does not have a nonzero transformation coefficient. Used to. The CBP is encoded in units of 16x16 pixel blocks, and indicates whether there is a non-zero transform coefficient for each 8x8 pixel block in the 16x16 pixel block using 1 bit per 8x8 pixel block, and two 2x2 chrominance component DC blocks for the color difference component. Indicates whether there is a non-zero transform coefficient using 1 bit, and indicates whether there are non-zero transform coefficients in two 8x8 color difference component AC blocks using 1 bit.
한편, 단계 S2420에서, 서브블록의 크기가 32x32, 32x16 및 16x32 중 하나가 아니거나 32x32 화소 블록이 아닌 경우에는, 단계 S2450으로 진행하여 CBP를 부호화한다. 이때, 서브 블록의 크기가 32x32, 32x16 또는 16x32 화소 블록이 아닌 경우에 서브 블록의 크기가 16x16, 16x8 또는 8x16 화소 블록인지를 판단할 수 있다. 서브 블록이 16x16, 16x8 또는 8x16 화소 블록인 경우, 해당 서브 블록 내에 0이 아닌 부호화할 계수가 있는 경우에는 CBP16 플래그(예를 들어, ‘1’과 같이 1 비트로 표시될 수 있음)를 부호화하며, 그 외의 경우에는 CBP 플래그를 사용하지 않고 16x16 화소 블록 단위로 CBP를 부호화할 수 있다.On the other hand, in step S2420, if the size of the subblock is not one of 32x32, 32x16 and 16x32 or is not a 32x32 pixel block, the process proceeds to step S2450 to encode the CBP. In this case, when the size of the sub block is not a 32x32, 32x16, or 16x32 pixel block, it may be determined whether the size of the subblock is a 16x16, 16x8, or 8x16 pixel block. If the subblock is a 16x16, 16x8, or 8x16 pixel block, if there is a non-zero coding coefficient in the subblock, the CBP16 flag (for example, may be represented by 1 bit such as '1') is encoded. In other cases, the CBP may be encoded in units of 16 × 16 pixel blocks without using the CBP flag.
또한, 단계 S2410에서, 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나 이거나 64x64 화소 블록인 경우에는 서브블록 내 0이 아닌 변환 계수가 있는지 여부를 판단하여(S2470), 서브블록 내 0이 아닌 변환 계수가 있는 경우에는 0이 아닌 변환 계수가 있음을 나타내는 CBP64 플래그(예를 들어, '1'과 같이 1 비트로 표시될 수 있다)를 부호화하고(S2480), 서브블록 내 0이 아닌 부호화할 계수가 없는 경우에는 0이 아닌 부호화할 계수가 없음을 나타내는 CBP64 플래그(예를 들어, '0'과 같이 1 비트로 표시될 수 있다)를 부호화한다(S2490). 여기서, CBP64 플래그는 64x64 화소 블록 내 0이 아닌 양자화된 변환 계수의 존재 유무를 나타내는 플래그이다.Further, in step S2410, if the size of the subblock is one of 64x64, 64x32, and 32x64 or is a 64x64 pixel block, it is determined whether there is a non-zero transform coefficient in the subblock (S2470), and the non-zero transform in the subblock. If there is a coefficient, a CBP64 flag (for example, may be represented by 1 bit such as '1') indicating that there is a non-zero transform coefficient is encoded (S2480), and a non-zero coefficient to be encoded in the subblock is encoded. If none, a CBP64 flag (for example, may be represented by 1 bit such as '0') indicating that there is no coefficient to encode other than 0 (S2490). Here, the CBP64 flag is a flag indicating whether a non-zero quantized transform coefficient exists in a 64x64 pixel block.
만일, 64x64 화소의 확장된 매크로블록에 대하여 16x16 화소 블록 단위로 인트라 예측 부호화를 수행하는 경우에는 전술한 바와 같이 CBP64 플래그 및 CBP32 플래그는 생략할 수 있으며, 양자화 파라미터에 대한 증감정보(Δpq)를 부호화할 수 있다. 이때, 양자화 파라미터에 대한 증감정보는 확장된 매크로블록 단위로 부호화하는 것이 바람직하다.If intra prediction coding is performed on an extended macroblock of 64x64 pixels in units of 16x16 pixel blocks, as described above, the CBP64 flag and the CBP32 flag may be omitted, and the increase / decrease information Δpq of the quantization parameter may be encoded. can do. In this case, it is preferable to encode the increase / decrease information for the quantization parameter in an extended macroblock unit.
CBP 플래그를 부호화하는 경우에 대하여, CBP 플래그가 0이 아닌 경우에 변환 타입을 부호화한다. 예외적으로, 16x16 화소 블록이 네 개의 8x8 화소 블록으로 분할된 경우에는 CBP를 부호화한 후 CBP가 0이 아닌 경우에 16x16 화소 블록 단위로 적용되는 변환 타입을 부호화한다.In the case of encoding the CBP flag, the conversion type is encoded when the CBP flag is not zero. Exceptionally, when the 16x16 pixel block is divided into four 8x8 pixel blocks, the CBP is encoded, and when the CBP is not 0, the transform type applied in units of 16x16 pixel blocks is encoded.
변환 타입을 부호화한 후에는 변환 타입에 따라 CBP를 부호화한다. 16x16 변환이 사용된 경우에는 색차 성분의 CBP 2비트만 부호화하며, 8x16 또는 16x8 변환이 사용된 경우에는 16x16 화소 블록 내의 두 개의 8x16 또는 16x8 화소 블록이 0이 아닌 변환 계수를 가지는지를 나타내는 CBP 2비트를 부호화한다. 다만, 예외적으로 두 개의 분할블록 중 첫 번째 분할블록의 CBP 비트가 0인 경우에는 두 번째 분할 블록의 CBP 비트는 부호화하지 않을 수 있다.After encoding the transform type, the CBP is encoded according to the transform type. If 16x16 transform is used, only the CBP 2-bits of the chrominance component are encoded. If 8x16 or 16x8 transform is used, CBP 2-bit indicating whether two 8x16 or 16x8 pixel blocks within the 16x16 pixel block have a non-zero transform coefficient. Encode However, in exceptional cases, when the CBP bit of the first divided block of the two divided blocks is 0, the CBP bits of the second divided block may not be encoded.
도 25는 본 발명의 일 실시예에 따른 CBP의 구조를 나타낸 예시도이다.25 is an exemplary view showing the structure of a CBP according to an embodiment of the present invention.
도 25에서는 입력 영상이 4:2:0 포맷(Format)인 경우, CBP의 구조를 예시적으로 나타내었다. 휘도 성분의 첫 번째 8x8 화소 블록(Y0) 내에 0이 아닌 변환 계수가 없는 경우 CBP의 최하위 비트(LSB: Least Significant Bit)는 0이고, 두 번째 8x8 화소 블록(Y1) 내에 0이 아닌 양자화된 변환 계수가 있는 경우 CBP의 두 번째 최하위 비트는 1이다. 이와 같은 방식으로 세 번째 8x8 화소 블록(Y2)과 네 번째 8x8 화소 블록(Y3)에 대한 CBP가 할당되고, 두 개의 2x2 색차 성분 DC 블록(U(DC) 및 V(DC)) 내에 0이 아닌 양자화된 변환 계수가 있으므로 색차 DC(Chroma DC)에 대한 비트는 1이고, 두 개의 8x8 색차 성분 AC 블록(U-AC 및 V-AC) 내에 0이 아닌 양자화된 변환 계수가 없으므로 색차 AC(Chroma AC)에 대한 비트는 0이 된다.FIG. 25 exemplarily illustrates a structure of a CBP when an input image has a 4: 2: 0 format. If there is no nonzero transform coefficient in the first 8x8 pixel block (Y0) of the luminance component, the least significant bit (LSB) of the CBP is zero, and the nonzero quantized transform in the second 8x8 pixel block (Y1). If there is a coefficient, the second least significant bit of the CBP is one. In this way, the CBP for the third 8x8 pixel block (Y2) and the fourth 8x8 pixel block (Y3) are allocated, and nonzero in the two 2x2 chrominance component DC blocks (U (DC) and V (DC)). Since there is a quantized transform coefficient, the bit for chrominance DC is 1, and there are no nonzero quantized transform coefficients in the two 8x8 chrominance component AC blocks (U-AC and V-AC), so Chroma AC Bit is zero.
도 26은 본 발명의 일 실시예에 따라 CBPX 플래그와 CBP를 부호화하는 순서의 일 예를 나타낸 예시도이다.FIG. 26 is an exemplary diagram illustrating an example of a sequence of encoding a CBPX flag and a CBP according to an embodiment of the present invention. FIG.
도 26에서는 확장된 매크로블록이 64x64 화소 블록이고 현재 부호화 대상인 서브블록의 크기가 64x64, 64x32, 또는 32x64인 경우, CBP64 플래그, CBP32 플래그와 CBP의 부호화 순서를 예시적으로 나타내었다. 도 26에서, 일점 쇄선의 화살표는 CBPX 플래그가 0인 경우 진행되는 순서를 나타내며, 점선의 화살표는 CBPX 플래그가 1인 경우 진행되는 순서를 나타내며, 실선의 화살표는 아무런 조건이 없이 진행되는 순서를 나타낸다.FIG. 26 exemplarily illustrates a coding sequence of a CBP64 flag, a CBP32 flag, and a CBP when an extended macroblock is a 64x64 pixel block and a size of a subblock currently being encoded is 64x64, 64x32, or 32x64. In FIG. 26, the dashed-dotted arrow indicates the order of progression when the CBPX flag is 0, the dashed arrow indicates the order of progression when the CBPX flag is 1, and the solid arrow indicates the order of progressing without any condition. .
확장된 매크로블록인 64x64 화소 블록 내에 양자화된 변환 계수가 모두 0인 경우, CBP64 플래그는 0이 부호화되고 한 개 이상의 양자화된 변환 계수가 0이 아닌 경우 CBP64 플래그는 1이 부호화된다. CBP64 플래그가 0인 경우, 더 이상 부호화할 CBP가 없으므로 다음 매크로블록의 CBPX 플래그와 CBP를 부호화한다. CBP64 플래그가 1인 경우, 64x64 화소 블록 내 각 32x32 화소 서브블록의 CBP32 플래그가 부호화되며, CBP32 플래그가 1인 경우 32x32 화소 서브블록 내 4 개의 16x16 화소 블록의 CBP가 부호화된다.If all of the quantized transform coefficients are 0 in the 64x64 pixel block, which is an extended macroblock, the CBP64 flag is coded 0, and if the at least one quantized transform coefficient is not 0, the CBP64 flag is coded 1. If the CBP64 flag is 0, since there are no more CBPs to encode, the CBPX flag and CBP of the next macroblock are encoded. If the CBP64 flag is 1, the CBP32 flag of each 32x32 pixel subblock in the 64x64 pixel block is encoded. If the CBP32 flag is 1, the CBP of four 16x16 pixel blocks in the 32x32 pixel subblock is encoded.
도 27은 본 발명의 일 실시예에 따라 인트라 매크로블록에 대한 CBPX 플래그와 CBP를 부호화하는 순서의 다른 예를 나타낸 예시도이다.27 is an exemplary diagram illustrating another example of a sequence of encoding a CBPX flag and a CBP for an intra macroblock according to an embodiment of the present invention.
도 27에서는 부호화 대상이 32x32인 화소 블록이고 현재 부호화 대상인 서브블록의 크기가 32x32, 32x16, 또는 16x32인 경우, CBP32 플래그와 CBP의 부호화 순서를 예시적으로 나타내었다. 도 27에서, 일점 쇄선의 화살표는 CBPX 플래그가 0인 경우 진행되는 순서를 나타내며, 점선의 화살표는 CBPX 플래그가 1인 경우 진행되는 순서를 나타내며, 실선의 화살표는 아무런 조건이 없이 진행되는 순서를 나타낸다.In FIG. 27, when the encoding target is a 32x32 pixel block and the size of the subblock currently encoding target is 32x32, 32x16, or 16x32, the encoding order of the CBP32 flag and the CBP is exemplarily illustrated. In FIG. 27, the dashed-dotted arrow indicates the order of progression when the CBPX flag is 0, the dashed arrow indicates the order of progression when the CBPX flag is 1, and the solid arrow indicates the order of progressing without any condition. .
다시 도 1을 참조하면, 영상 부호화 장치(100)의 부호화기(140)는 CBPX(단, X: 32 이상의 정수) 플래그와 CBP를 부호화한 후에는 0이 아닌 양자화된 변환 계수가 있는 블록들에 대해서만 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성한다. 부호화 대상 블록의 크기가 변환의 크기보다 큰 경우, 블록 내에서 래스터 스캔(Raster-Scan) 순서로 블록의 양자화된 변환 계수를 부호화한다.Referring back to FIG. 1, the
도 28은 본 발명의 일 실시예에 따른 분할 타입별 양자화된 변환 계수의 부호화 순서를 나타낸 예시도이다.28 is an exemplary diagram illustrating a coding order of quantized transform coefficients for each partition type according to an embodiment of the present invention.
도 28에서는 부호화 대상 블록이 32x32 화소 블록인 경우 양자화된 변환 계수를 부호화하는 순서를 예시적으로 나타내었다. 16x16 화소 크기 이상의 블록에 대해서는 16x16 변환(16x16블록 내 16 개의 4x4 블록을 4x4 변환한 후 16 개의 DC 계수에 대해서 4x4 변환을 수행하므로 16x16 화소 단위로 변환이 수행된다고 할 수 있으며, 설명의 편의를 위해 16x16 변환이라 명명한다)이 수행되기 때문에, 32x32 화소 블록의 경우 4 번의 16x16 변환이 수행된다. 32x16 화소 블록인 경우, 각 32x16 화소 블록마다 두 번의 16x16 변환이 수행된다. 16x32 화소 블록인 경우, 각 16x32 화소 블록마다 두 번의 16x16 변환이 수행된다. 16x16 화소 블록인 경우, 각 16x16 화소 블록마다 16x16 변환이 수행된다.FIG. 28 exemplarily illustrates a procedure of encoding quantized transform coefficients when an encoding target block is a 32x32 pixel block. For blocks larger than 16x16 pixels, 16x16 transform (4x4 transforms of 16 4x4 blocks in 16x16 blocks and 4x4 transforms are performed for 16 DC coefficients. Therefore, the conversion is performed in units of 16x16 pixels. Since 16x16 conversion is performed), four 16x16 transforms are performed in the case of a 32x32 pixel block. In the case of a 32x16 pixel block, two 16x16 transforms are performed for each 32x16 pixel block. In the case of a 16x32 pixel block, two 16x16 transforms are performed for each 16x32 pixel block. In the case of a 16x16 pixel block, 16x16 conversion is performed for each 16x16 pixel block.
도 29는 본 발명의 일 실시예에 따른 인터 픽처에 대한 부호화 데이터의 신택스 구조를 나타낸 예시도이다.29 is an exemplary diagram illustrating a syntax structure of encoded data for an inter picture according to an embodiment of the present invention.
도 29에서는 입력 영상이 인터 픽처인 경우에 대해 본 발명의 일 실시예에 따라 부호화하여 생성되는 부호화 데이터의 신택스 구조를 예시적으로 나타내었다. 본 발명의 일 실시예에 따른 인터 픽처에 대한 부호화 데이터는 도시한 바와 같이, SKIP_N 플래그, 매크로 블록 타입 및 분할 타입 중 하나 이상의 필드를 포함하며, 확장된 매크로블록이 인트라 매크로블록인 경우에는 인트라 예측 모드, CBPX 플래그/CBP 및 변환 계수 중 하나 이상의 필드를 추가로 포함하며, 확장된 매크로블록이 인터 매크로블록인 경우에는 SKIPX 플래그, 차분 움직임 벡터/참조 픽처 인덱스, CBPX 플래그, 변환 타입, CBP 및 변환 계수 중 하나 이상의 필드를 추가로 포함하여 구성될 수 있다.FIG. 29 exemplarily illustrates a syntax structure of encoded data generated by encoding according to an embodiment of the present invention when the input image is an inter picture. As shown, the encoded data for the inter picture according to an embodiment of the present invention includes one or more fields of a SKIP_N flag, a macroblock type, and a partition type, and is intra prediction when the extended macroblock is an intra macroblock. It further includes one or more fields of Mode, CBPX Flag / CBP, and Transform Coefficient, and if the extended macroblock is an inter macroblock, SKIPX flag, differential motion vector / reference picture index, CBPX flag, transform type, CBP, and transform It may be configured to further include one or more fields of the coefficients.
다만, 도 29에서 도시한 인터 픽처에 대한 부호화 데이터의 신택스는 예시적인 것일 뿐, 인터 픽처에 대한 부호화 데이터의 신택스가 반드시 도 29에 도시한 바와 같이 구성되어야 하는 것은 아니다. 즉, 인터 픽처에 대한 부호화 데이터의 신택스 중 일부 또는 전부의 순서가 도 29에 도시한 바와는 다르게 변경될 수도 있으며, 일부의 신택스는 생략될 수도 있음을 인식해야 할 것이다.However, the syntax of the encoded data for the inter picture shown in FIG. 29 is merely exemplary, and the syntax of the encoded data for the inter picture is not necessarily configured as shown in FIG. 29. That is, it should be appreciated that some or all of the syntax of the encoded data for the inter picture may be changed differently from those shown in FIG. 29, and some syntax may be omitted.
다시 도 1을 참조하면, 영상 부호화 장치(100)의 부호화기(140)는 현재 부호화 대상인 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIPN 플래그를 부호화한다. 여기서, N은 매크로블록의 크기를 나타낸다. 예를 들어, 매크로블록이 64x64 화소 블록이면 64x64 화소 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP64 플래그가 부호화되며, 매크로블록이 32x32 화소 블록이면 32x32 화소 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP32 플래그가 부호화되며, 16x16 화소 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP16 플래그가 부호화된다.Referring back to FIG. 1, the
만약, 매크로블록이 SKIP 매크로블록인 경우, 현재 매크로블록은 부호화할 데이터가 없으므로 다음 매크로블록이 부호화된다. 매크로블록이 SKIP 매크로블록이 아닌 경우, 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 전송한다. 예를 들어, 현재 부호화하고자 하는 입력 영상이 P 픽처인 경우, 사용 가능한 매크로블록 타입은 I-매크로블록과 P-매크로블록이고, 현재 부호화하고자 하는 입력 영상이 B 픽처의 경우, 사용 가능한 매크로블록 타입은 I-매크로블록과 B-매크로블록이다.If the macroblock is a SKIP macroblock, since the current macroblock has no data to be encoded, the next macroblock is encoded. If the macroblock is not a SKIP macroblock, a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock is transmitted. For example, when the input image to be encoded is a P picture, the available macroblock types are I-macroblocks and P-macroblocks, and when the input image to be encoded is the B picture, the macroblock type is usable. Are I- and B-macroblocks.
분할 타입 필드와 인트라 픽처에 대한 인트라 예측 모드, CBPX 플래그/CBP, 변환 계수 등의 필드에 대해서는 도 17을 통해 전술하였으므로, 이하에서는 인터 픽처에 대한 SKIPX 플래그, 차분 움직임 벡터/참조 픽처 인덱스, CBPX 플래그, 변환 타입, CBP, 변환 계수 등과 같은 필드에 대해 설명한다.Since the split type field and the fields such as intra prediction mode, CBPX flag / CBP, and transform coefficient for the intra picture have been described above with reference to FIG. 17, the following descriptions describe SKIPX flag, differential motion vector / reference picture index, and CBPX flag for inter picture. Fields such as, transform type, CBP, transform coefficient, and the like are described.
P-픽처 또는 P-슬라이스의 경우, 도 4의 모든 블록 타입들이 움직임 추정에 사용될 수 있으며, 확장된 매크로블록 내에서 16x16 화소 블록 단위로 인트라 모드인지 또는 인터 모드인지를 선택할 수도 있다. 즉, P-픽처 또는 P-슬라이스의 확장된 매크로블록 내에는 인트라 모드와 인터 모드가 모두 사용될 수 있다. In the case of a P-picture or a P-slice, all block types of FIG. 4 may be used for motion estimation, and may be selected to be intra mode or inter mode in units of 16 × 16 pixel blocks within an extended macroblock. That is, both intra mode and inter mode may be used in an extended macroblock of a P-picture or a P-slice.
부호화할 대상이 32x32 화소 블록인 경우, 32x32 화소 블록 단위로 부호화를 수행할지 또는 16x16 화소 블록 단위로 부호화를 수행할지는 확장된 매크로블록 플래그(extended_mb_flag)를 통해 나타낼 수 있다. 예를 들어, 확장된 매크로블록 플래그가 1인 경우에는 32x32 화소블록 단위로 부호화를 수행함을 의미하며, 확장된 매크로블록 플래그가 0인 경우에는 16x16 화소블록 단위로 부호화를 수행함을 의미할 수 있다. 확장된 매크로블록 플래그가 0인 경우, 확장된 매크로블록은 4개의 16x16 화소블록으로 분할되어 각 16x16 화소블록 단위로 인트라 모드인지 또는 인터 모드인지를 결정할 수 있다. 또한, 각각의 16x16 화소블록 단위는 더 작은 서브블록으로 분할되어 부호화가 수행될 수 있다.When the object to be encoded is a 32x32 pixel block, whether to perform encoding in units of 32x32 pixel blocks or encoding in units of 16x16 pixel blocks may be indicated by an extended macroblock flag (extended_mb_flag). For example, when the extended macroblock flag is 1, encoding may be performed in units of 32x32 pixel blocks, and when the extended macroblock flag is 0, encoding may be performed in units of 16x16 pixel blocks. When the extended macroblock flag is 0, the extended macroblock may be divided into four 16x16 pixelblocks to determine whether it is an intra mode or an inter mode for each 16x16 pixelblock. In addition, each 16x16 pixelblock unit may be divided into smaller subblocks to perform encoding.
도 30은 본 발명의 일 실시예에 따른 P-픽처(또는 P-슬라이스)에서 사용되는 신택스의 예를 설명하기 위해 도시한 도면이다. 설명을 간단하게 하기 위해 확장된 매크로블록은 32x32 화소 블록이라고 가정한다.30 is a diagram illustrating an example of syntax used in a P-picture (or P-slice) according to an embodiment of the present invention. For simplicity, it is assumed that the expanded macroblock is a 32x32 pixel block.
엔트로피 부호화에 있어 문맥기반 적응적 이진 산술 부호화(CABAC: Context-Adaptive Binary Arithmetic Coding)를 하는 경우, skipX_flag와 interX_flag는 X값에 따라 다른 컨텍스트 테이블(context table)을 가질 수 있다. 예를 들어, skip32_flag와 skip16_flag는 서로 다른 컨텍스트 테이블을 가질 수 있다. 이에 대한 상세한 설명은 후술한다. In case of context-based adaptive binary arithmetic coding (CABAC) in entropy coding, skipX_flag and interX_flag may have different context tables according to X values. For example, skip32_flag and skip16_flag may have different context tables. Detailed description thereof will be described later.
skipX_flag는 부호화하고자 하는 현재 블록이 SKIP 모드인지의 여부를 나타내는 플래그이며, 표 5에 나타낸 바와 같이 1비트로 SKIP 모드 여부를 표시할 수 있다. 예를 들어, skipX_flag의 부호화 비트가 1인 경우에 현재 블록이 SKIP 모드인 것으로 나타낼 수 있다. 여기서, X는 확장된 매크로블록의 범위 내에서 16 이상인 수를 의미한다.The skipX_flag is a flag indicating whether or not the current block to be encoded is in the SKIP mode. As shown in Table 5, the skipX_flag may indicate whether or not the SKIP mode is in one bit. For example, when the encoding bit of skipX_flag is 1, this may indicate that the current block is in the SKIP mode. Here, X means a number greater than or equal to 16 within the range of the extended macroblock.
현재 블록이 SKIP 모드가 아닌 경우에 interX_flag를 부호화한다. 여기서, interX_flag는 부호화하고자 하는 현재 블록이 인트라 모드인지 또는 인터 모드인지의 여부를 나타내는 플래그이며, 표 6에 나타낸 바와 같이 1비트 또는 2비트로 확장된 매크로블록 내의 분할된 화소 블록들이 인트라 모드인지 또는 인터 모드인지를 나타낼 수 있다.If the current block is not in the SKIP mode, interX_flag is encoded. Here, interX_flag is a flag indicating whether the current block to be encoded is intra mode or inter mode, and as shown in Table 6, whether the divided pixel blocks in the macroblock extended to 1 or 2 bits are intra mode or inter mode. It may indicate whether the mode.
예를 들어, interX_flag가 ‘00’인 경우, 확장된 매크로블록 내의 분할된 모든 서브 블록들이 인트라 모드임을 의미한다. 이 경우, 확장된 매크로블록인 32x32 화소 블록은 4개의 16x16 화소 블록으로 분할되며, 각각의 16x16 화소 블록은 전술한 인트라 예측 부호화 방법으로 부호화된다. 따라서, 확장된 매크로블록 내의 모든 서브 블록들이 인트라 모드인 경우, 분할된 서브 블록의 블록 타입, 휘도 성분과 색차 성분의 인트라 예측 모드, CBP, 양자화 파라미터, 변환 계수 등이 부호화될 수 있다.For example, when interX_flag is '00', this means that all the divided subblocks in the extended macroblock are in intra mode. In this case, the 32x32 pixel block, which is an extended macroblock, is divided into four 16x16 pixel blocks, and each 16x16 pixel block is encoded by the above-described intra prediction encoding method. Therefore, when all subblocks in the extended macroblock are intra modes, the block type of the divided subblock, the intra prediction mode of the luminance component and the chrominance component, the CBP, the quantization parameter, the transform coefficient, and the like may be encoded.
도 30에 나타낸 바와 같이 확장된 매크로블록인 32x32 화소 블록에 대하여 skip32_flag가 0이고 inter32_flag가 1인 경우, 이것은 확장된 매크로블록 내의 분할된 모든 서브 블록들이 인터 모드임을 의미하며, 이후 1비트 플래그인 ‘extended_mb_flag’를 전송한다. 이때, extended_mb_flag가 1인 경우, 이것은 확장된 매크로블록 단위로 움직임 보상을 수행함을 의미하며, 움직임 벡터가 1개이므로 1개의 MVD/ref_idx를 부호화한다. 여기서, MVD/rex_idx는 확장된 매크로블록에 포함되는 움직임벡터 정보/참조 인덱스를 의미한다. extended_mb_flag가 0인 경우, 이것은 확장된 매크로블록이 16x16 화소 블록으로 분할되어 부호화되었음을 의미하며, 각각의 16x16 화소 블록에 대하여 각각의 16x16 화소 블록이 SKIP 모드인지를 나타내는 skip16_flag를 부호화한다. 이 경우, 각각의 16x16 화소 블록에 대하여 SKIP 모드가 아닌 16x16 화소 블록에 대해서만 블록 타입과 MVD/ref_idx를 부호화한다. skip16_flag는 표 5를 이용하여 부호화할 수 있다. 이때, skip32_flag와 skip16_flag를 문맥기반 적응적 이진 산술 부호화(CABAC)하는 경우, 전술한 바와 같이 각각의 신택스는 서로 다른 컨텍스트 테이블을 가질 수 있다.As shown in FIG. 30, when skip32_flag is 0 and inter32_flag is 1 for a 32x32 pixel block which is an extended macroblock, this means that all of the divided subblocks in the extended macroblock are inter mode. transmit extended_mb_flag '. In this case, when extended_mb_flag is 1, this means that motion compensation is performed in units of extended macroblocks. Since one motion vector is encoded, one MVD / ref_idx is encoded. Here, MVD / rex_idx means motion vector information / reference index included in an extended macroblock. When extended_mb_flag is 0, this means that the extended macroblock is divided into 16x16 pixel blocks and encoded, and skip16_flag indicating whether each 16x16 pixel block is in SKIP mode for each 16x16 pixel block. In this case, the block type and MVD / ref_idx are encoded only for the 16x16 pixel block, not the SKIP mode, for each 16x16 pixel block. skip16_flag can be encoded using Table 5. In this case, when skip32_flag and skip16_flag are context-based adaptive binary arithmetic coding (CABAC), as described above, each syntax may have a different context table.
확장된 매크로블록에 대하여 skip32_flag가 0이고 inter32_flag가 01인 경우, 이것은 확장된 매크로블록 내에 인터 모드와 인트라 모드가 모두 사용되었음을 의미한다. 이 경우, ‘extended_mb_flag’는 필요하지 않으며, 확장된 매크로블록은 16x16 화소 블록으로 분할되어 부호화되었음을 의미하므로, 각각의 16x16 화소 블록이 인트라 모드인지 또는 인터 모드인지를 나타내는 표 7을 이용하여 부호화할 수 있다.If skip32_flag is 0 and inter32_flag is 01 for the extended macroblock, this means that both inter mode and intra mode are used in the extended macroblock. In this case, 'extended_mb_flag' is not necessary, and since the extended macroblock is divided into 16x16 pixel blocks and encoded, it can be encoded using Table 7 indicating whether each 16x16 pixel block is intra mode or inter mode. have.
이때, 확장된 매크로블록 내에 인트라 모드와 인터 모드가 함께 존재하는 경우, 각각의 16x16 화소 블록은 각각의 16x16 화소 블록 내의 서브 블록들이 모두 인터 모드이거나 모두 인트라 모드인 경우가 대부분이며, 16x16 화소 블록 내에 인트라 모드의 서브 블록과 인터 모드의 서브 블록이 동시에 존재하는 경우는 무시할 수 있다. 따라서, 각각의 16x16 화소 블록의 분할 타입을 부호화한 후, inter16_flag가 0인 즉, 인트라 모드인 16x16 화소 블록 내의 서브 블록들은 휘도 성분과 색차 성분을 인트라 예측 모드로 부호화한다. 또한, inter16_flag가 1인 즉, 인터 모드인 16x16 화소 블록들에 대해서는 표 5를 이용하여 skip16_flag를 부호화한다. 여기서, 분할 타입을 부호화 한 후 skip16_flag를 부호화하는 이유는, 확장된 매크로블록 내에 인트라 모드와 인터 모드가 동시에 존재한다는 것은 텍스처(Texture)가 어느 정도 있는 영역임을 의미하기 때문에 인트라 모드 주변에 존재하는 인터 모드는 작은 블록으로 분할되었을 가능성이 높으며, 따라서 분할 타입을 먼저 전송하고 블록의 크기가 16x16인 화소 블록에 대해서만 skip16_flag를 부호화하는 것이 바람직하기 때문이다. 그러나 부호화의 순서는 이에 한정된 것이 아니며, skip16_flag를 먼저 부호화한 후 분할 타입을 부호화할 수도 있다.In this case, when the intra mode and the inter mode exist together in the extended macroblock, each of the 16x16 pixel blocks is mostly an inter mode or all intra modes in each 16x16 pixel block. The case where the sub block of the intra mode and the sub block of the inter mode exist at the same time can be ignored. Therefore, after encoding the division type of each 16x16 pixel block, subblocks in the 16x16 pixel block in which inter16_flag is 0, that is, the intra mode, encode the luminance component and the chrominance component in the intra prediction mode. In addition, skip16_flag is encoded by using Table 5 for 16 × 16 pixel blocks having inter16_flag of 1, that is, inter mode. Here, the reason of encoding skip16_flag after encoding the partition type is that the intra mode and the inter mode are present in the extended macroblock at the same time, which means that the texture exists in the inter mode. The mode is likely to be divided into small blocks, and therefore, it is preferable to transmit the split type first and to encode skip16_flag only for pixel blocks having a block size of 16x16. However, the encoding order is not limited to this, and skip16_flag may be encoded first, and then the partition type may be encoded.
이후의 CBPX_flag, 변환 타입, CBP/양자화 파라미터, 변환 계수 등에 대한 부호화는 전술한 바와 동일하므로 그 설명을 생략한다. 다만, 인트라 픽처/슬라이스 또는 인트라 EMB의 경우에는 CBPX_flag를 부호화하지 않을 수 있다. Subsequent encoding of CBPX_flag, transform type, CBP / quantization parameter, transform coefficient, etc. is the same as described above, and thus description thereof is omitted. However, in case of intra picture / slice or intra EMB, CBPX_flag may not be encoded.
만일, 확장된 매크로블록이 64x64 화소 블록이라고 하면, 확장된 매크로블록이 32x32 화소 블록인 경우와 마찬가지로, 부호화하고자 하는 현재 블록의 분할 타입 정보가 부호화된 후 16x16 크기 이상인 서브블록들에 대해서만 skipX_flag가 부호화된다. 이 경우, X는 16 또는 32 등 서브블록의 크기를 나타낸다. 예를 들어, 매크로블록이 64x64 화소 블록이고 SKIP 모드가 아니며 확장된 매크로블록의 서브블록의 크기가 64x32, 32x64 및 32x32 중 하나인 경우, 각 서브블록에 대해 skip32_flag가 부호화된다. 64x64 화소인 확장된 매크로블록의 서브블록의 크기가 64x32 또는 32x64인 경우, 두 개의 skip32_flag가 부호화된다. 만약, 서브블록의 크기가 32x32보다 작은 경우에는 skip32_flag는 부호화되지 않는다. 그리고 서브블록의 크기가 32x16, 16x32 및 16x16 중 하나인 경우에는 각 서브블록의 skip16_flag가 부호화된다.If the extended macroblock is a 64x64 pixel block, the skipX_flag is encoded only for subblocks having a size of 16x16 or more after the split type information of the current block to be encoded is encoded, similarly to the case where the extended macroblock is a 32x32 pixel block. do. In this case, X represents the size of a subblock such as 16 or 32. For example, when the macroblock is a 64x64 pixel block and is not in the SKIP mode and the size of the subblock of the extended macroblock is one of 64x32, 32x64, and 32x32, skip32_flag is encoded for each subblock. When the size of the subblock of the extended macroblock that is 64x64 pixels is 64x32 or 32x64, two skip32_flag are encoded. If the size of the subblock is smaller than 32x32, skip32_flag is not encoded. When the size of the subblock is one of 32x16, 16x32, and 16x16, skip16_flag of each subblock is encoded.
도 31은 본 발명의 일 실시예에 따른 B-픽처(또는 B-슬라이스)에서 사용되는 신택스의 예를 설명하기 위해 도시한 도면이다.FIG. 31 is a diagram illustrating an example of syntax used in a B-picture (or B-slice) according to an embodiment of the present invention.
B-픽처에서는 최대 두 장까지의 임의의 참조 픽처를 선택할 수 있는데, 그 두 장을 각각 L0 예측, L1 예측이라고 하며, 각각의 참조 픽처는 서로 다른 역할을 한다. 일반적으로, L0 예측(List0 Prediction)이 순방향 예측에 사용되며, L1 예측이 역방향 예측에 사용된다. 즉, B-픽처는 현재 부호화 대상 픽처 이전의 픽처와 현재 부호화 대상 픽처 이후의 픽처들을 참조 픽처로 사용할 수 있으며, 그 두 장의 참조 픽처를 동시에 사용(양방향 예측)하여 움직임 추정 및 보상을 할 수 있다. 움직임 추정에 사용되는 블록 타입은 도 2의 모든 블록 타입이 사용될 수 있으며, P-픽처 방식과 동일하게 확장된 매크로블록 내에서 16x16 화소블록 단위로 인트라 모드인지 인터 모드인지를 선택할 수 있다. 본 발명에 따른 실시예에서는, 두 장의 픽처를 순서대로 현재 픽처 이전에 나오는 픽처와 이후에 나오는 픽처로 한정하지 않고, 전후에 상관없이 임의의 두 장을 참조 픽처로 사용할 수 있으며, 이와 같은 두 장의 참조 픽처를 사용하여 움직임 추정/보상(양방향 예측)을 수행할 수 있다.In a B-picture, up to two arbitrary reference pictures can be selected. The two sheets are called L0 prediction and L1 prediction, respectively, and each reference picture plays a different role. In general, L0 prediction is used for forward prediction and L1 prediction is used for backward prediction. In other words, the B-picture can use a picture before the current picture to be encoded and a picture after the picture to be encoded as a reference picture, and can use the two reference pictures at the same time (bidirectional prediction) to perform motion estimation and compensation. . As the block type used for the motion estimation, all block types of FIG. 2 may be used, and whether the intra mode or the inter mode is selected in units of 16 × 16 pixel blocks within an extended macroblock in the same manner as the P-picture method. In the embodiment according to the present invention, two pictures are not limited to the picture before the current picture and the picture after the picture, and any two pictures can be used as the reference picture regardless of before and after. The motion picture / compensation (bidirectional prediction) may be performed using the reference picture.
본 발명의 실시예에 따른 B-픽처에서 사용할 수 있는 부호화 모드로는 인트라 모드, SKIP 모드, 다이렉트(Direct) 모드, L0 예측, L1 예측 및 양방향 등이 있다.Coding modes that can be used in a B-picture according to an embodiment of the present invention include intra mode, SKIP mode, direct mode, L0 prediction, L1 prediction, and bidirectional.
인트라 모드는 전술한 인트라 부호화 방법과 동일한 방법을 사용하여 부호화를 수행하며, 확장된 매크로블록 단위로 인트라 모드를 선택하거나 확장된 매크로블록 내 16x16 화소 블록 단위로 인트라 모드를 선택할 수 있다.The intra mode may be encoded using the same method as the above-described intra encoding method, and may select an intra mode in units of extended macroblocks or an intra mode in units of 16 × 16 pixel blocks within the extended macroblocks.
SKIP 모드는 부호화할 현재 블록이 SKIP 모드임을 나타내는 플래그만 전송한다. 이때, 16x16 화소 블록, 32x32 화소 블록 등과 같은 16x16 화소 이상의 블록에 대하여 SKIP 모드를 사용할 수 있으며, 예측된 B_pred_dir, 예측 움직임 벡터 MVD, 예측 ref_idx 등을 사용하여 움직임 보상을 수행하고 움직임 보상을 통해 얻은 참조 블록이 복원된 블록이 된다. 여기서, B_pred_dir은 B-픽처의 예측방향으로서, L0 및 L1의 양방향을 의미한다.The SKIP mode transmits only a flag indicating that the current block to be encoded is a SKIP mode. In this case, the SKIP mode may be used for blocks of 16x16 pixels or more such as 16x16 pixel blocks and 32x32 pixel blocks, and the motion compensation is performed using the predicted B_pred_dir, the predicted motion vector MVD, the predicted ref_idx, and the reference obtained through the motion compensation. The block becomes a restored block. Here, B_pred_dir is a prediction direction of the B-picture, and means both directions of L0 and L1.
다이렉트 모드는 다이렉트 모드임을 나타내는 플래그와 변환계수 부호화와 관련된 데이터(예를 들면, CBPX_flag/CBP, 양자화 파라미터, 변환 타입, 변환 계수 등)들만을 부호화한다. 즉, 다이렉트 모드는 움직임 정보의 부호화를 생략한 부호화 모드로서, 8x8, 16x16, 32x32 등과 같이 8x8 화소 블록 이상의 블록에 대하여 다이렉트 모드를 사용할 수 있으며, NxN 다이렉트 모드인 경우에 움직임 추정 및 보상은 화소블록 단위로 움직임 추정 및 보상을 수행한다. 예를 들어, 8x8 다이렉트 모드의 경우, 4x4 화소 블록 단위로 움직임 추정 및 보상을 수행한다.The direct mode encodes only the flag indicating the direct mode and data related to transform coefficient encoding (for example, CBPX_flag / CBP, quantization parameter, transform type, transform coefficient, etc.). In other words, the direct mode is an encoding mode in which motion information is omitted, and the direct mode may be used for blocks of 8x8 pixel blocks or more, such as 8x8, 16x16, 32x32, and the like. In the case of NxN direct mode, motion estimation and compensation may be performed. Motion estimation and compensation are performed in pixel block units. For example, in the 8x8 direct mode, motion estimation and compensation are performed in units of 4x4 pixel blocks.
L0 예측은 L0의 움직임 정보만을 사용하는 한 방향 예측을 의미하며, L1 예측은 L1의 움직임 정보만을 사용하는 한 방향 예측을 의미한다. 양방향 예측은 L0와 L1의 두 개의 움직임 정보를 사용하여 두 픽처의 평균치를 참조 픽처로 사용하는 예측을 의미한다.L0 prediction means one direction prediction using only L0 motion information, and L1 prediction means one direction prediction using only L1 motion information. Bidirectional prediction means prediction using two motion information of L0 and L1 using a mean value of two pictures as a reference picture.
B-픽처의 움직임 추정방법으로는 직접예측 모드의 움직임 추정/보상 방법, SKIP 모드의 움직임 추정/보상 방법, 한 방향 예측(L0 예측 또는 L1 예측)의 움직임 추정/보상 방법, 양방향 예측의 움직임 추정/보상 방법 등이 있다.Motion estimation methods for B-pictures include motion estimation / compensation in direct prediction mode, motion estimation / compensation in SKIP mode, motion estimation / compensation in one-way prediction (L0 prediction or L1 prediction), and motion estimation in bidirectional prediction. / Compensation method.
먼저, 직접예측 모드의 움직임 추정/보상 방법을 살펴보면, Direct 모드는 시간방향의 움직임 정보 상관도를 사용하는 시간 직접예측 모드의 움직임 추정/보상 방법과, 공간방향(픽처 내 수평 수직 2차원 공간)의 움직임 정보 상관도를 사용하는 공간 직접예측 모드의 움직임 추정/보상 방법의 두 가지 방법이 있다. 시간 직접예측 모드나 공간 직접예측 모드는 매크로블록 단위나 블록 단위로 선택하지 않고 슬라이스 단위로 한 가지를 선택하여 사용한다. 직접예측 모드에서는 L1 예측의 가장 작은 참조번호를 가지는 참조픽처가 중요하며 이를 ‘앵커픽처’라고 부른다. 표시 순서상(display order) 대상 픽처의 역방향으로 가장 가까운 참조픽처가 앵커픽처가 되며, 앵커픽처 내 대상 블록과 같은 공간 위치에 있는 블록을‘앵커블록’이라고 한다.First, the motion estimation / compensation method of the direct prediction mode is described. In the direct mode, the motion estimation / compensation method of the temporal direct prediction mode using the motion information correlation in the time direction, and the spatial direction (horizontal and vertical two-dimensional space) There are two methods of the motion estimation / compensation method in the spatial direct prediction mode using the motion information correlation of. The temporal direct prediction mode or the spatial direct prediction mode is used by selecting one slice unit rather than a macroblock unit or a block unit. In the direct prediction mode, a reference picture having the smallest reference number of L1 prediction is important and is called an anchor picture. In the display order, the nearest reference picture in the reverse direction of the target picture becomes an anchor picture, and a block at the same spatial location as the target block in the anchor picture is called an anchor block.
시간 직접예측 모드는 우선 앵커블록의 움직임 정보를 조사하고 앵커블록의 L0 움직임 벡터를 mvCol(MV of the Co-located block, 동일 블록의 움직임 벡터)로 한다. 만일 앵커블록의 L0 움직임 벡터가 없고 L1 움직임 벡터를 가지고 있다면, L1의 움직임 벡터를 mvCol로 사용한다. 시간 직접예측 모드의 L0 참조픽처는 mvCol이 참조하는 픽처로서 시간 직접예측 모드의 L1 참조픽처가 앵커픽처가 된다. 앵커블록이 화면내 부호화된 움직임 정보를 가지지 않는 경우, 움직임 벡터의 크기는 0이 되고 시간 직접예측 모드의 L0 참조픽처는 참조 픽처번호가 0이 된다. 또한, 움직임 벡터 mvCol로부터 L0의 움직임 벡터 mvL0와 L1의 움직임 벡터 mvL1을 구한다. 참조 픽처, 대상 픽처 및 앵커 픽처 사이의 움직임 속도가 일정하다고 가정하면 mvL0와 mvL1의 크기는 참조 픽처, 대상 픽처, 앵커 픽처의 간격에 비례하게 되고 따라서 비례배분에 의해 구해진다. 즉, 참조 픽처와 대상 픽처의 간격 tb와, 참조 픽처와 앵커 픽처의 간격 td를 이용한 수학식 5를 이용하여 mvL0를 구할 수 있다.In the direct temporal prediction mode, first, the motion information of the anchor block is examined and the L0 motion vector of the anchor block is mvCol (MV of the Co-located block). If there is no L0 motion vector of the anchor block and it has an L1 motion vector, the motion vector of L1 is used as mvCol. The L0 reference picture in temporal direct prediction mode is a picture referred to by mvCol, and the L1 reference picture in temporal direct prediction mode is an anchor picture. When the anchor block does not have intra-picture coded motion information, the size of the motion vector is 0, and the reference picture number is 0 for the L0 reference picture in the temporal direct prediction mode. Further, the motion vector mvL0 of L0 and the motion vector mvL1 of L1 are obtained from the motion vector mvCol. Assuming that the moving speed between the reference picture, the target picture, and the anchor picture is constant, the sizes of mvL0 and mvL1 are proportional to the intervals of the reference picture, the target picture, and the anchor picture, and are thus obtained by proportional allocation. That is, mvL0 can be obtained by using
또한, mvL1은 mvCol과 같은 역방향이기 때문에 수학식 6을 이용하여 구할 수 있다.In addition, since mvL1 is in the same reverse direction as mvCol, it can be obtained using
공간 직접예측 모드의 경우에도 L1 예측에서 가장 작은 참조번호의 참조 픽처인 앵커픽처와, 앵커픽처와 같은 공간위치에 있는 앵커블록이 움직임 벡터를 구하는데 사용된다. 공간 직접예측 모드에서는 대상 픽처 내에 부호화한 움직임 벡터로부터 대상블록의 움직임 벡터를 예측한다. 공간 직접예측 모드에서도 시간 직접예측 모드의 개념을 일부 도입하여 앵커블록의 움직임 정보가, i) 앵커블록의 움직임 벡터 크기가 수평, 수직 모두 ±1 화소 이하, ii) 앵커블록 참조픽처의 참조번호가 0, iii) L0에서 최소 참조번호의 참조픽처가 단기 참조픽처인 조건을 모두 만족하는 경우에 L0 움직임 벡터 mvL0와 L1 움직임 벡터 mvL1을 0으로 만들고, L0 예측에서 가장 작은 참조번호를 가지는 픽처를 L0 예측픽처, L1에서 가장 작은 참조번호를 가지는 픽처를 L1 예측픽처로 한다. 이와 같은 조건을 만족할 경우, 대상 픽처 내의 부호화된 움직임 벡터로부터 대상 블록의 움직임 벡터 mvL0와 mvL1, 그리고 참조픽처인 L0 픽처와 L1 픽처를 구한다.Even in the spatial direct prediction mode, the anchor picture which is the reference picture of the smallest reference number in the L1 prediction and the anchor block at the same spatial location as the anchor picture are used to obtain the motion vector. In the spatial direct prediction mode, the motion vector of the target block is predicted from the motion vector encoded in the target picture. Even in the spatial direct prediction mode, the motion block information can be obtained by introducing a part of the concept of temporal direct prediction mode, i) the motion vector size of the anchor block is ± 1 pixel or less both horizontally and vertically, and ii) 0, iii) L0 motion vector mvL0 and L1 motion vector mvL1 are set to 0 when the reference picture with the minimum reference number at L0 satisfies the condition that both are short-term reference pictures, and the picture with the lowest reference number in L0 prediction is L0. The picture having the smallest reference number in the prediction picture and L1 is referred to as the L1 prediction picture. When such conditions are satisfied, the motion vectors mvL0 and mvL1 of the target block, and the L0 picture and the L1 picture, which are reference pictures, are obtained from the encoded motion vectors in the target picture.
L0 예측에서는 좌측, 상단, 좌측 상단에 위치하는 L0 예측 움직임 벡터 mvA, mvB, mvC를 가지고 수평과 수직 성분의 중앙값을 계산하고 그것을 mvL0로 한다. 마찬가지로, L1 예측에서는 좌측, 상단, 우측 상단의 L1 예측 움직임 벡터 mvA, mvB, mvC를 가지고 수평과 수직 성분의 중앙값을 계산하여 그것을 mvL1으로 한다. 만일, 주변 블록이 단방향 예측이거나 화면 내 부호화된 L0 예측인 경우 또는 L1 예측의 움직임 벡터가 존재하지 않을 경우에는 0 벡터로 대체한다. 참조번호를 구할 경우, 좌측, 상단, 우측 상단의 움직임 벡터 mvA, mvB, mvC의 참조번호 최소값을 계산하고 그것을 NxN 블록의 참조번호로 한다. 이 참조번호를 구하는 처리도 L0 예측, L1 예측과 독립적으로 수행된다. 또한, 주변블록이 단방향 예측이거나, 화면 내 예측 부호화되는 L0 또는 L1 예측의 움직임 벡터가 존재하지 않는 경우, 그 블록은 참조번호를 구할 때 제외된다. 여기서 주의해야 할 점은 NxN 화소 블록의 직접예측 모드를 수행하는 경우 mvL0, mvL1, L0 참조픽처 및 L1 참조픽처를 구하는 과정은 NxN 화소블록 단위로 수행되지만, 주변블록을 통해 구한 예측 움직임 벡터(mvL0, mvL1)를 사용할지 0 벡터를 사용할지는 블록단위로 결정된다는 것이다.In the L0 prediction, the median value of the horizontal and vertical components is calculated using the L0 prediction motion vectors mvA, mvB, and mvC located at the left, top, and left upper corners, and the value is mvL0. Similarly, in the L1 prediction, the median values of the horizontal and vertical components are calculated using the L1 prediction motion vectors mvA, mvB, and mvC of the left, top, and right upper corners, and the values are mvL1. If the neighboring block is a unidirectional prediction or an intra coded L0 prediction, or there is no motion vector of the L1 prediction, it is replaced with a zero vector. When the reference number is obtained, the minimum reference number of the motion vectors mvA, mvB, and mvC of the left, upper, and upper right corners is calculated, and the reference number of the NxN block is calculated. The process of obtaining this reference number is also performed independently of the L0 prediction and the L1 prediction. In addition, when the neighboring block is unidirectional prediction or when there is no motion vector of L0 or L1 prediction that is intra prediction coded, the block is excluded when obtaining a reference number. It should be noted that when performing the direct prediction mode of the NxN pixel block, the process of obtaining the mvL0, mvL1, L0 reference picture and the L1 reference picture is performed in units of NxN pixel blocks, but the prediction motion vector (mvL0) obtained through the neighboring block is performed. , mvL1) or 0 vector is determined by block unit.
다음에 SKIP 모드의 움직임 추정/보상 방법을 설명한다.Next, the motion estimation / compensation method of the SKIP mode will be described.
SKIP 모드는 예측 움직임 벡터를 사용해서 움직임 예측 및 보상을 수행한다는 점은 P-픽처의 SKIP 모드와 동일하지만, B-픽처 내 SKIP 모드에 사용되는 움직임 벡터와 참조 픽처의 Direct 모드의 예측 움직임 벡터, 참조 픽처와 동일하다. 즉, SKIP 모드의 움직임 추정/보상 방법은 전술한 직접예측 모드의 움직임 추정/보상 방법과 동일하다. Direct 모드와 SKIP 모드의 차이점은, SKIP 모드는 움직임 정보와 변환계수도 없는 모드이고, Direct 모드는 움직임 정보만 없는 모드라는 점이다.Although the SKIP mode performs motion prediction and compensation using the predicted motion vector, it is the same as the SKIP mode of the P-picture, but the motion vector used for the SKIP mode in the B-picture and the predicted motion vector of the Direct mode of the reference picture, Same as the reference picture. That is, the motion estimation / compensation method of the SKIP mode is the same as the motion estimation / compensation method of the aforementioned direct prediction mode. The difference between the direct mode and the SKIP mode is that the SKIP mode has no motion information and no conversion coefficient, and the direct mode has no motion information only.
한 방향 예측(L0 예측 또는 L1 예측)의 움직임 추정/보상 방법은, 참조픽처가 L0 및 L1 중의 하나라는 점을 제외하고 P-픽처의 움직임 추정 및 보상 방법과 동일하므로 이에 대한 설명은 생략한다.Since the motion estimation / compensation method of one direction prediction (L0 prediction or L1 prediction) is the same as the motion estimation and compensation method of the P-picture except that the reference picture is one of L0 and L1, the description thereof is omitted.
마지막으로, 양 방향 예측의 움직임 추정/보상 방법에 대하여 설명한다.Finally, a motion estimation / compensation method of bidirectional prediction will be described.
움직임 정보를 가지는 B-픽처 내 8x8 이상의 크기를 갖는 화소 블록들에 대해서는 전술한 P-픽처의 움직임 추정/보상 방법을 이용하여 L0 참조픽처와 mvL0를 구하여 L0 예측을 수행하며, L1 참조픽처와 mvL1를 구하여 L1 예측을 수행한다. 또한, L0 예측 수행과정을 통해 얻은 L0 참조픽처 내 mvL0 이 가리키는 참조블록과, L1 예측 수행과정을 통해 얻은 L1 참조픽처 내 mvL1이 가리키는 참조블록의 평균치 블록을 참조블록으로 사용하여 mvL0 및 mvL1에 대한 양방향 예측을 수행할 수 있다. 또한, L0 예측의 움직임 정보에 대한 L1 예측을 수행하여 mvL0/L0 참조픽처에 대한 최적의 mvL1, L1 참조픽처를 선택하고, 선택된 L1 참조픽처 내 mvL1이 가리키는 참조블록과 L0 예측 수행과정을 통해 얻은 L0 참조픽처 내 mvL0이 가리키는 참조블록의 평균치 블록을 참조블록으로 사용하여 양방향 예측을 수행할 수 있다. 또한, L1 예측의 움직임 정보에 대한 L0 예측을 수행하여 mvL1/L1 참조픽처에 대한 최적의 mvL0, L0 참조픽처를 선택하고, 선택된 L0 참조픽처 내 mvL0이 가리키는 참조블록과 L1 예측 수행과정을 통해 얻은 L1 참조픽처 내 mvL1이 가리키는 참조블록의 평균치 블록을 참조블록으로 사용하여 양방향 예측을 수행할 수 있다. 바람직하게는, 움직임 정보를 가지는 B-픽처 내 8x8 이상의 크기를 갖는 화소 블록들에 대하여 이와 같은 양방향 예측 모드의 부호화 효율을 비교하여 부호화 효율이 가장 좋은 하나의 양방향 예측 모드를 선택한다. 16x16 이상의 크기를 갖는 화소 블록에 대해서는 전술한 양방향 예측 모드들의 움직임 정보를 찾은 후, 최적의 부호화 모드를 결정할 때 변환, 양자화, 엔트로피 변환계수 부호화를 수행하여 해당 모드에 소요되는 실제 부호화 비트와 예측오차(Distortion)를 이용하여 양방향 예측 모드를 결정하는 것이 바람직하다.L0 reference pictures and mvL0 are obtained by using the motion estimation / compensation method of the above-described P-picture for pixel blocks having a size of 8x8 or more in a B-picture having motion information, and L0 reference pictures and mvL1 are performed. L1 prediction is performed. Also, the reference block indicated by mvL0 in the L0 reference picture obtained through the L0 prediction process and the average block of the reference block indicated by mvL1 in the L1 reference picture obtained through the L1 prediction process are used as reference blocks for mvL0 and mvL1. Bidirectional prediction can be performed. In addition, L1 prediction is performed on the motion information of L0 prediction to select the optimal mvL1 and L1 reference pictures for the mvL0 / L0 reference picture, and the reference block indicated by mvL1 in the selected L1 reference picture and the L0 prediction are obtained. Bidirectional prediction may be performed using an average block of the reference block indicated by mvL0 in the L0 reference picture as a reference block. In addition, by performing L0 prediction on the motion information of the L1 prediction, an optimal mvL0 and L0 reference picture is selected for the mvL1 / L1 reference picture, and the reference block indicated by mvL0 in the selected L0 reference picture and L1 prediction are obtained. Bidirectional prediction may be performed using an average block of the reference block indicated by mvL1 in the L1 reference picture as a reference block. Preferably, one bidirectional prediction mode having the best encoding efficiency is selected by comparing the encoding efficiency of the bidirectional prediction mode with respect to pixel blocks having a size of 8x8 or more in the B-picture having the motion information. For the pixel block having a size of 16x16 or larger, the motion information of the above-described bidirectional prediction modes is found, and then the transform, quantization, and entropy transform coefficient encoding are performed to determine the optimal encoding mode, and the actual coding bits and prediction errors required for the corresponding mode are determined. It is desirable to determine the bidirectional prediction mode using (Distortion).
L0 예측, L1 예측 및 양방향 예측에 대하여, 8x8 이상의 각각의 화소 블록들은 서로 다른 참조영상을 사용할 수 있으나, 8x8 화소블록 내의 서브 블록들은 동일한 참조영상을 사용한다. For the L0 prediction, the L1 prediction, and the bidirectional prediction, each pixel block of 8x8 or more may use a different reference picture, but subblocks in the 8x8 pixelblock use the same reference picture.
도 1을 참조하면, 감산기(120)는 움직임 추정기(116)에서 추정한 현재 블록의 움직임 벡터가 가리키는 참조 블록과 현재 블록을 감산하여 잔여 블록을 생성하고, 생성된 잔여 블록은 변환기 및 양자화기(130)에 의해 변환 및 양자화된 후, 양자화된 변환 계수가 부호화기(140)에 의해 엔트로피 부호화되어 부호화 데이터가 생성된다. 여기서, B-픽처에 대한 변환 방법은 전술한 P-픽처에 대한 변환 방법과 동일하므로, 그에 대한 상세한 설명은 생략한다.Referring to FIG. 1, the
도 31에는 확장된 매크로블록이 32x32 화소 블록인 것으로 가정하여 B-픽처(또는 B-슬라이스)의 비트스트림을 통해 전송할 데이터를 나타내었다. 일반적으로, B-픽처(또는 B-슬라이스)의 전송 신택스는 도 30에서 설명한 P-픽처(또는 B-슬라이스)의 전송 신택스와 유사하며, 여기서는 P-픽처의 신택스에 추가되는 부분만을 설명한다.FIG. 31 shows data to be transmitted through a bitstream of a B-picture (or B-slice) assuming that the expanded macroblock is a 32x32 pixel block. In general, the transmission syntax of the B-picture (or B-slice) is similar to the transmission syntax of the P-picture (or B-slice) described with reference to FIG. 30, and only a part added to the syntax of the P-picture is described here.
directX_flag는 SKIP 모드가 아닌 인터 블록들 중에서 확장된 매크로블록, 16x16 이상의 화소 블록 및 8x8 화소 블록에 대해서만 direct 모드인지의 여부를 나타내는 플래그로서 표 8과 같이 1비트로 이루어질 수 있다.The directX_flag is a flag indicating whether the extended macroblock, the 16x16 pixel block or more, and the 8x8 pixel block are in the direct mode among the interblocks not in the SKIP mode.
Direct 모드인 경우에 움직임 정보는 부호화하지 않으며, 변환 계수와 관련된 정보들을 부호화한다. 또한, 확장된 매크로블록이 Direct 모드가 아닌 경우, 움직임 정보(예를 들어, B_pdir, MVD, ref_idx 등)의 데이터를 부호화한다. 여기서, B_pdir는 현재 블록의 예측 방향(L0 예측, L1 예측, 양방향 예측)을 나타내는 정보로서, SKIP 또는 direct 모드가 아닌 인터 블록들에 대해서만 부호화하며 표 9와 같이 3가지 모드가 있다.In the direct mode, motion information is not encoded, and information related to transform coefficients is encoded. In addition, when the extended macroblock is not in the direct mode, data of motion information (for example, B_pdir, MVD, ref_idx, etc.) is encoded. Here, B_pdir is information indicating the prediction direction (L0 prediction, L1 prediction, bidirectional prediction) of the current block. The B_pdir is encoded only for inter blocks, not in SKIP or direct mode, and has three modes as shown in Table 9 below.
양방향 예측인 경우, L0 예측을 위한 움직임 정보(mvL0, ref_idx_L0)와 L1 예측을 위한 움직임 정보(mvL1, ref_idx_L1)가 모두 부호화되고, L0 예측인 경우 L0 예측을 위한 움직임 정보(mvL0, ref_idx_L0)만 부호화된다. 또한, L1 예측인 경우, L1 예측을 위한 움직임 정보(mvL1, ref_idx_L1)만 부호화된다.In the bidirectional prediction, both the motion information (mvL0, ref_idx_L0) for the L0 prediction and the motion information (mvL1, ref_idx_L1) for the L1 prediction are encoded, and only the motion information (mvL0, ref_idx_L0) for the L0 prediction is encoded in the L0 prediction. do. In addition, in the case of L1 prediction, only motion information mvL1 and ref_idx_L1 for L1 prediction is encoded.
도 32는 본 발명의 일 실시예에 따른 SKIPX 플래그의 부호화 과정을 설명하기 위한 예시도이다.32 is an exemplary diagram for describing an encoding process of a SKIPX flag according to an embodiment of the present invention.
도 32에서는 매크로블록이 64x64 화소 블록인 경우 다양한 크기와 모양의 서브블록으로 분할된 매크로블록의 분할 타입과 각 서브블록의 부호화 순서를 예시적으로 나타내었다. 도 32와 같이 매크로블록이 분할된 경우, 11 번째 16x16 화소 서브블록에 대해 SKIP16 플래그가 부호화되고, 12 번째 16x16 화소 서브블록의 SKIP16 플래그가 부호화되며, 15 번째 16x32 화소 서브블록의 SKIP16 플래그가 부호화되며, 16 번째 16x32 화소 서브블록의 SKIP16 플래그가 부호화되며, 17 번째 32x32 화소 서브블록의 SKIP32 플래그가 부호화되며, 18 번째 32x32 화소 서브블록의 SKIP32 플래그가 순서대로 부호화된다.In FIG. 32, when a macroblock is a 64x64 pixel block, a split type of a macroblock divided into subblocks of various sizes and shapes and an encoding order of each subblock are illustrated. 32, the SKIP16 flag is encoded for the 11th 16x16 pixel subblock, the SKIP16 flag of the 12th 16x16 pixel subblock is encoded, and the SKIP16 flag of the 15th 16x32 pixel subblock is encoded. The SKIP16 flag of the 16th 16x32 pixel subblock is encoded, the SKIP32 flag of the 17th 32x32 pixel subblock is encoded, and the SKIP32 flag of the 18th 32x32 pixel subblock is encoded in order.
SKIP 매크로블록이 아닌 매크로블록의 서브블록들에 대해서는 해당 서브블록의 움직임 벡터와 해당 서브블록의 주변 블록을 이용하여 추정한 예측 움직임 벡터 간의 차이 벡터인 차분 움직임 벡터(DMV: Differential Motion Vector)와 참조 픽처 인덱스를 포함하는 움직임 정보가 부호화된다.For subblocks of a macroblock that are not SKIP macroblocks, refer to a differential motion vector (DMV), which is a difference vector between a motion vector of the subblock and a predicted motion vector estimated using the neighboring blocks of the subblock. Motion information including the picture index is encoded.
도 33 및 도 34는 본 발명의 일 실시예에 따라 인터 매크로블록에 대한 CBPX_플래그, 변환 타입과 CBP를 부호화 과정을 설명하기 위한 예시도이다.33 and 34 are exemplary diagrams for describing a CBPX_flag, a transform type, and a CBP encoding process for an inter macroblock according to an embodiment of the present invention.
도 33과 도 34에서는 매크로블록이 64x64 화소 블록인 경우 CBPX_플래그, 변환 타입(Transform Type)과 CBP를 부호화하는 과정을 예를 들어 나타내었다. 영상 부호화 장치(100)의 부호화기(140)는 확장된 매크로블록의 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나인지 여부를 판단하여(S3302), 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나가 아닌 경우에는 서브블록의 크기가 32x32, 32x16 및 16x32 중 하나인지 여부를 판단한다(S3304).33 and 34 illustrate a process of encoding a CBPX_flag, a transform type, and a CBP when the macroblock is a 64x64 pixel block. The
단계 S3304의 판단 결과, 서브블록의 크기가 32x32, 32x16 및 16x32 중 하나인 경우, 해당 서브블록 내 0이 아닌 양자화된 변환 계수가 있는지 여부를 판단하여(S3306), 0이 아닌 양자화된 변환 계수가 있는 경우에는 해당 서브블록 내에 0이 아닌 양자화된 변환 계수가 있음을 나타내는 CBP32 플래그(예를 들어, '1'과 같이 1 비트로 표시될 수 있음)를 부호화한다(S3308).As a result of the determination in step S3304, if the size of the subblock is one of 32x32, 32x16, and 16x32, it is determined whether there is a non-zero quantized transform coefficient in the corresponding subblock (S3306), and the non-zero quantized transform coefficient is determined. If present, the CBP32 flag (for example, may be represented by 1 bit such as '1') indicating that there is a non-zero quantized transform coefficient in the corresponding subblock (S3308).
단계 S3308에서 CBP32 플래그를 부호화한 후, 서브블록 내의 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 판단하여(S3310), 0이 아닌 양자화된 변환 계수가 있는 경우에는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있음을 나타내는 CBP16 플래그를 부호화한다(S3312).After encoding the CBP32 flag in step S3308, it is determined whether there is any non-zero quantized transform coefficient in the 16x16 pixel block in the subblock (S3310), and if there is a non-zero quantized transform coefficient, 0 in the 16x16 pixel block. The CBP16 flag indicating that there is a quantized transform coefficient is encoded (S3312).
이와 같이 CBPX 플래그를 부호화한 후에는 0이 아닌 양자화된 변환 계수를 가지는 블록들에 대해서만 변환 타입을 부호화한다(S3316). 이때, 서브블록의 크기가 16x16이상이면 서브블록마다 변환 타입를 부호화하며, 16x16보다 작은 경우에는 16x16마다 하나의 변환플래그를 부호화한다. 변환은 16x16 화소 단위로 선택되기 때문이다. 예를 들어, 64x64 화소 매크로블록이 두 개의 64x32 화소 서브블록으로 분할되고 CBP64 플래그가 0이 아닌 경우, 각 64x32 화소 서브블록 내 두 개의 CBP32 플래그가 0이 아닌 64x32 화소 서브블록에 대해 변환 타입를 부호화한다.After encoding the CBPX flag as described above, the transform type is encoded only for blocks having a non-zero quantized transform coefficient (S3316). In this case, if the size of the subblock is 16x16 or more, the transform type is encoded for each subblock. If the size of the subblock is smaller than 16x16, one transform flag is encoded for each 16x16. This is because the conversion is selected in units of 16x16 pixels. For example, if a 64x64 pixel macroblock is divided into two 64x32 pixel subblocks and the CBP64 flag is nonzero, two CBP32 flags in each 64x32 pixel subblock encode a transform type for a 64x32 pixel subblock that is not zero. .
여기서, 서브블록의 크기가 16x16이상이며 서브블록에 속한 CBPX 플래그가 모두 0이 아닌 경우, 표 3을 이용하여 각 서브블록의 변환 타입을 부호화한다.Here, when the size of the subblock is 16x16 or more and the CBPX flags belonging to the subblock are not all zeros, the transformation type of each subblock is encoded using Table 3.
또한, CBP16 플래그가 0이 아니며 16x16 화소 블록이 두 개의 8x16 화소 블록 또는 16x8 화소 블록으로 분할된 경우 표 4를 이용하여 16x16 화소 블록 단위로 변환 타입을 부호화한다.In addition, when the CBP16 flag is not 0 and the 16x16 pixel block is divided into two 8x16 pixel blocks or 16x8 pixel blocks, the conversion type is encoded in units of 16x16 pixel blocks using Table 4.
CBP16 플래그가 0이 아니며 16x16 화소 블록이 4 개의 8x8 화소 블록으로 분할되고, 4x4 변환이 선택된 경우에는 0을 변환 타입으로서 부호화하고, 8x8 변환이 선택된 경우에는 1을 변환 타입으로서 부호화하며, 그 외의 경우에는 변환 타입을 부호화하지 않는다.If the CBP16 flag is not 0 and the 16x16 pixel block is divided into four 8x8 pixel blocks, if 4x4 transform is selected, 0 is encoded as the transform type; if 8x8 transform is selected, 1 is encoded as the transform type; otherwise Do not encode the conversion type.
단계 S3316에서 변환 타입을 부호화한 후에는, 변환 타입에 따라 CBP를 부호화한다. 이를 위해, 변환 타입이 16x16 변환인지 여부를 판단하여(S3318), 16x16 변환인 경우에는 색차 성분(Chroma Component)의 CBP 2 비트만을 부호화하며(S3320), 16x16 변환이 아닌 경우에는 변환 타입이 8x16 변환 또는 16x8 변환인지 여부를 판단하여(S3322), 8x16 변환 또는 16x8 변환인 경우에는 휘도 성분(Luma Component)의 CBP 2비트와 색차 성분의 CBP 2비트를 부호화하며(S3324), 8x16 변환 또는 16x8 변환이 아닌 경우에는 변환 타입이 8x8 변환 또는 4x4 변환인지 여부를 판단하여(S3326), 8x8 변환 또는 4x4 변환인 경우에는 휘도 성분의 CBP 4 비트와 색차 성분의 CBP 2 비트를 부호화한다(S3328). 단계 S3320, S3324, S3328에서는, 입력 영상이 4:2:0 포맷인 경우의 휘도 성분의 CBP와 색차 성분의 CBP를 부호화하는 예를 설명한 것이므로, 입력 영상의 포맷이 변경되는 경우에는 그에 따라 휘도 성분의 CBP와 색차 성분의 CBP를 부호화하는 방법이 달라질 수 있다.After encoding the transform type in step S3316, the CBP is encoded according to the transform type. To this end, it is determined whether the transform type is a 16x16 transform (S3318). In the case of the 16x16 transform, only the
한편, 단계 S3306에서의 판단 결과, 서브블록 내 0이 아닌 양자화된 변환 계수가 없는 경우에는, 서브블록 내 0이 아닌 양자화된 변환 계수가 없음을 나타내는 CBP32 플래그를 부호화한다(S3330). 서브블록 내 0이 아닌 양자화된 변환 계수가 없으므로 변환 타입과 CBP는 부호화하지 않는다.On the other hand, when there is no non-zero quantized transform coefficient in the subblock as a result of the determination in step S3306, the CBP32 flag indicating that there is no non-zero quantized transform coefficient in the subblock is encoded (S3330). Since there are no nonzero quantized transform coefficients in the subblock, the transform type and the CBP are not encoded.
또한, 단계 S3302에서의 판단 결과, 서브블록의 크기가 64x64, 64x32 및 32x64 중 하나인 경우에는 서브블록 내 0이 아닌 양자화된 변환 계수가 있는지 여부를 판단하여(S3330), 0이 아닌 양자화된 변환 계수가 있는 경우에는 해당 서브블록 내에 0이 아닌 양자화된 변환 계수가 있음을 나타내는 CBP64 플래그를 부호화하고(S3334), 단계 S3306으로 진행하며, 0 이 아닌 양자화된 변환 계수가 없는 경우에는 해당 서브블록 내에 0이 아닌 양자화된 변환 계수가 없음을 나타내는 CBP64 플래그를 부호화한다(S3336). 서브블록 내 0이 아닌 양자화된 변환 계수가 없으므로 변환 타입과 CBP는 부호화하지 않는다.In addition, if the size of the subblock is one of 64x64, 64x32, and 32x64 as a result of the determination in step S3302, it is determined whether there is a non-zero quantized transform coefficient in the subblock (S3330), and the non-zero quantized transform. If there is a coefficient, a CBP64 flag indicating that there is a non-zero quantized transform coefficient in the corresponding subblock is encoded (S3334), and the flow proceeds to step S3306, and if there is no non-zero quantized transform coefficient, it is in the corresponding subblock. The CBP64 flag indicating that there is no non-quantized transform coefficient is encoded (S3336). Since there are no nonzero quantized transform coefficients in the subblock, the transform type and the CBP are not encoded.
이와 같이, CBPX(단, X는 32 이상의 정수임) 플래그, 변환 타입과 CBP를 부호화한 후, 영상 부호화 장치(100)의 부호화기(140)는 0이 아닌 양자화된 변환계수가 있는 블록들에 대해서만 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성하고 변환 계수 필드에 할당한다. 양자화된 변환 계수의 부호화 방법은 전술한 인트라 매크로블록에 대한 양자화된 변환 계수의 부호화 방법과 동일하다.As such, after encoding the CBPX (where X is an integer greater than or equal to 32) flag, transform type, and CBP, the
본 발명에 따른 실시예에서는 가변길이 부호화 방법으로 CABAC(Context-based Adaptive Variable Length Code)을 사용할 수 있으며, CABAC 부호화는 이진 산술 부호화부와 문맥 계산부로 이루어져 있다.In the embodiment according to the present invention, CABAC (Context-based Adaptive Variable Length Code) may be used as a variable length coding method, and CABAC coding includes a binary arithmetic coding unit and a context calculating unit.
이진 산술 부호화부는 이진신호(0과 1의 신호)로 변환하는 이진화부이며, 문맥 계산부는 부호화해야 하는 이진 신호의 발생확률을 복수로 유지해주고(context table) 현재 부호화 대상과 주위의 상황에 따라 이진 신호의 발생확률을 바꾸어가며 이진 산술 부호화부에 전달한다. 이때, 컨텍스트 테이블(context table)은 슬라이스 부호화/복호화를 시작할 때 초기화되고 슬라이스 내에서 업데이트 된다. 각각의 신택스는 ctxIdx(컨텍스트 번호)에 따라 다른 table(발생확률)을 가지며, ctxIdx는 수학식 7에 의해 구해진다.The binary arithmetic encoder is a binarizer that converts binary signals (signals of 0 and 1), and the context computation unit maintains a plurality of probability of generating binary signals to be encoded (context table) and binary according to the current encoding target and surroundings. The probability of occurrence of the signal is changed and transmitted to the binary arithmetic encoder. At this time, the context table is initialized at the start of slice encoding / decoding and updated in the slice. Each syntax has a different table (probability) according to ctxIdx (context number), and ctxIdx is obtained by equation (7).
[수학식 7][Equation 7]
ctxIdx = ctxIdx_offset + ctx_incctxIdx = ctxIdx_offset + ctx_inc
여기서, ctx_offset은 픽처 타입과 신택스의 종류에 의해 결정된다. 이때, interX_flag는 X값에 따라 다른 테이블을 사용하는 것이 바람직하지만, 같은 테이블을 사용할 수도 있다. ctx_inc는 대상 신택스를 부호화할 때 주위 상황에 따라 결정되는 값이며 신택스 별 ctx_inc의 예는 도 35 내지 도 37에 도시한 바와 같다. 예를 들어, skipX_flag의 경우 도 35에 나타낸 바와 같이, ctx_inc = 0은 주변의 상단 블록 및 좌측 블록이 모두 SKIP 모드가 아닌 경우를 나타내며, ctx_inc = 1은 주변의 상단 블록 또는 좌측 블록이 SKIP 모드인 경우를 나타내고, ctx_inc = 2는 주변의 상단 블록 및 좌측 블록이 모두 SKIP 모드인 경우를 나타낼 수 있다. 각각의 ctx_inc에 따라 컨텍스트 테이블을 다르게 사용할 수 있다. 마찬가지로, interX_flag의 경우 도 36에 나타낸 바와 같이, ctx_inc가 0 내지 5인 경우는 32x32 화소 블록인 확장된 매크로블록에 대한 컨텍스트 테이블의 예측 타입의 예를 나타내며, ctx_inc가 7 내지 9인 경우는 16x16 화소블록에 대한 컨텍스트 테이블의 예측 타입의 예를 나타내고, 각각의 ctx_inc에 따라 컨텍스트 테이블을 다르게 사용할 수 있다. 마찬가지로, directX_flag의 부호화/복호화를 위한 ctx_inc는 도 37에 나타낸 바와 같다. 전술한 표 8에서 설명한 바와 같이 directX_flag의 부호화 비트는 1비트로 나타낼 수 있으며, 부호화할 대상 블록의 상단 블록 및 좌측 블록이 모두 direct 모드가 아닌 경우와, 모두 direct 모드인 경우, 그리고 상단 블록 또는 좌측 블록 중 어느 한 블록만 direct 모드인 경우에 따라 컨텍스트 테이블을 다르게 결정할 수 있다. 또한, extended_flag의 부호화/복호화를 위한 ctx_inc의 경우에도 도 37과 유사하게 부호화할 대상 블록의 주변 블록이 확장된 매크로블록 단위로 부호화가 수행되었는지(이 경우, extended_mb_flag를 이진비트 1로 설정할 수 있다) 또는 16x16 화소블록으로 분할되어 부호화가 수행되었는지(이 경우, extended_mb_flag를 이진비트 1로 설정할 수 있다)에 따라 컨텍스트 테이블을 다르게 사용할 수 있다. 이와 같이, interX_flag의 경우 X의 값, 픽처 타입, 참조 픽처로 사용되는지의 여부, 이웃 블록들의 데이터에 따라 다른 컨텍스트 테이블을 사용할 수 있다.Here, ctx_offset is determined by picture type and syntax type. At this time, although it is preferable to use different tables according to the X value, interX_flag may use the same table. ctx_inc is a value determined according to surrounding conditions when encoding the target syntax, and examples of ctx_inc for each syntax are shown in FIGS. 35 to 37. For example, in the case of skipX_flag, as shown in FIG. 35, ctx_inc = 0 indicates that both the upper and left blocks are not in SKIP mode, and ctx_inc = 1 indicates that the upper or left block is in the SKIP mode. In this case, ctx_inc = 2 may represent a case where both the upper block and the left block are in SKIP mode. The context table can be used differently for each ctx_inc. Similarly, in the case of interX_flag, as shown in FIG. 36, an example of prediction type of a context table for an extended macroblock that is 32x32 pixel blocks when ctx_inc is 0 to 5 is 16x16 pixels when ctx_inc is 7 to 9 An example of a prediction type of a context table for a block is shown. The context table may be used differently according to each ctx_inc. Similarly, ctx_inc for encoding / decoding of directX_flag is as shown in FIG. 37. As described in Table 8, the encoding bit of directX_flag may be represented by 1 bit, and the upper block and the left block of the target block to be encoded are not in the direct mode, the both are in the direct mode, and the upper block or the left block. The context table can be determined differently according to the case where only one block is in direct mode. Also, in the case of ctx_inc for encoding / decoding of extended_flag, similarly to FIG. 37, whether encoding is performed in units of macroblocks in which neighboring blocks of the target block to be encoded are extended (in this case, extended_mb_flag may be set to binary bit 1). Alternatively, the context table may be used differently depending on whether the encoding is performed by being divided into 16 × 16 pixel blocks (in this case, extended_mb_flag may be set to binary bit 1). As such, in the case of interX_flag, a different context table may be used according to a value of X, a picture type, whether it is used as a reference picture, and data of neighboring blocks.
도 38 및 도 39는 본 발명의 일 실시예에 따라 분할 타입 정보를 부호화하는 과정을 설명하기 위한 예시도이다. 38 and 39 are exemplary diagrams for describing a process of encoding split type information according to an embodiment of the present invention.
도 38에서는 트리 구조를 이용하여 분할 타입 정보를 부호화하기 위해 부호화하고자 하는 확장된 매크로블록 내 각 16x16 화소 블록에 대한 분할 타입 값을 나타낸다.FIG. 38 illustrates a partition type value for each 16x16 pixel block in an extended macroblock to be encoded in order to encode partition type information using a tree structure.
38A에서 Mx(a,b)는, 부호화하고자 하는 확장된 매크로블록 내의 (a,b)의 위치에 해당하는 16x16 화소 블록의 분할 타입 값을 나타낸다. 즉, Mx(0,0)은 부호화하고자 하는 확장된 매크로블록 내의 (0,0)의 위치 즉, 부호화하고자 하는 확장된 매크로블록 내에서 래스터 스캔 방향으로 첫 번째의 16x16 화소 블록의 분할 타입 값을 나타내며, Mx(0,1)은 부호화하고자 하는 확장된 매크로블록 내의 (0,1)의 위치 즉, 부호화하고자 하는 블록 내에서 래스터 스캔 방향으로 두 번째의 16x16 화소 블록의 분할 타입 값을 나타낸다.In 38A, Mx (a, b) represents a partition type value of a 16x16 pixel block corresponding to the position of (a, b) in the extended macroblock to be encoded. That is, Mx (0,0) represents the position of (0,0) in the extended macroblock to be encoded, that is, the partition type value of the first 16x16 pixel block in the raster scan direction in the extended macroblock to be encoded. Mx (0,1) represents the position of (0,1) in the extended macroblock to be encoded, that is, the partition type value of the second 16x16 pixel block in the raster scan direction in the block to be encoded.
38A에 나타낸 16x16 화소 블록에 대한 분할 타입 값들을 일정한 영역 단위 예를 들면, KxL 개의 분할 타입 값들을 포함하는 영역 단위로 그룹화하고, 그룹화된 영역 내의 분할 타입 값들 중 최소값을 선택하여 그룹화된 영역에 대한 분할 타입 값으로 할당한다. 그룹화된 영역에 대한 분할 타입 값을 Mx-1(c, d)라고 하면, c=a/K이며, d=b/L이 된다. 여기서, Mx-1은 Mx의 상위 노드이며, 상위 노드의 값을 선택하는 방법으로 가장 큰 값을 선택할 수도 있다. 또한, 상위 노드 값을 선택하는 방법을 부호화하여 적응적으로 사용할 수도 있다. The division type values for the 16x16 pixel block shown in 38A are grouped into a certain area unit, for example, an area unit including KxL division type values, and the minimum value among the division type values in the grouped area is selected for the grouped area. Assign as a partition type value. If the split type value for the grouped region is Mx-1 (c, d), then c = a / K and d = b / L. Here, Mx-1 is an upper node of Mx, and the largest value may be selected by selecting a value of the upper node. In addition, a method of selecting an upper node value may be encoded and used adaptively.
38B는 38A에 나타낸 16x16 화소블록들에 대한 분할 타입 값들을 2x2 개의 분할 타입 값들을 포함하는 영역 단위로 그룹화하고, 각각의 그룹 내의 분할 타입 값들 중 최소값을 그룹화된 영역에 대한 분할 타입 값으로 할당한 결과를 나타내었다. 즉, 38A에서 나타낸 16x16 화소 블록 (0,0), (0,1), (1,0), (1,1)을 포함하는 화소 블록들의 분할 타입 값을 2x2개의 영역 단위로 그룹화하고, 그룹화된 영역 내에 포함된 각 16x16 화소 블록들의 분할 타입 값 MX(0,0), MX(0,1), MX(1,0), MX(1,1) 중 최소값을 선택하여 그룹화된 영역에 대한 분할 타입 값 MX - 1(0,0)으로 할당하였다. 다시, 16x16 화소블록 (0,2), (0,3), (1,2), (1,3)을 포함하는 화소 블록들의 분할 타입 값을 2x2개의 영역 단위로 그룹화하고, 그룹화된 영역 내에 포함된 각 16x16 화소 블록들의 분할 타입 값 MX(0,2), MX(0,3), MX(1,2), MX(1,3) 중 최소값을 선택하여 그룹화된 영역에 대한 분할 타입 값 MX -1(0,1)의 분할 타입 값으로 할당하였다. 이와 같은 방식으로 나머지 16x16 화소 블록들에 대해서도 동일한 과정을 수행한다. 38A에 나타낸 16x16 화소 블록들의 분할 타입 값을 38B에 나타낸 그룹화된 영역의 분할 타입 값으로 할당하는 과정을 MX -2, MX -3 … M1 레이어(Layer)까지 반복적으로 수행하면 36C와 같이 그룹화된 영역의 분할 타입 값을 할당할 수 있으며, 다시 M0 레이어까지 반복하면 38D와 같이 하나의 그룹화된 영역의 분할 타입 값을 가지도록 그룹화할 수 있다.38B groups the partition type values for the 16x16 pixelblocks shown in 38A into area units including 2x2 partition type values, and assigns the minimum value of the partition type values in each group to the partition type values for the grouped areas. The results are shown. That is, the division type values of the pixel blocks including the 16x16 pixel blocks (0,0), (0,1), (1,0), and (1,1) shown in 38A are grouped and grouped into 2x2 area units. Select and group the minimum value among the partition type values M X (0,0), M X (0,1), M X (1,0), and M X (1,1) of each of the 16x16 pixel blocks included in the included region. The partition type value M X - 1 (0,0) for the allocated area. Again, the division type values of the pixel blocks including the 16x16 pixelblocks (0,2), (0,3), (1,2), and (1,3) are grouped into 2x2 area units, and within the grouped area. The minimum value among the division type values M X (0,2), M X (0,3), M X (1,2), and M X (1,3) of each of the 16x16 pixel blocks included in the grouped region. A partition type value M x -1 (0,1) was assigned. In the same manner, the same process is performed on the remaining 16x16 pixel blocks. The process of allocating the partition type values of the 16x16 pixel blocks shown in 38A to the partition type values of the grouped areas shown in 38B is performed by M X -2 , M X -3 . Repeatedly performing up to M 1 layer can assign the segmentation type value of the grouped region like 36C, and repeating up to M 0 layer again grouped to have the segmentation type value of one grouped region like 38D. can do.
다만, 도 38에서는 2x2개의 영역 단위로 인접한 16x16 화소 블록들에 대한 분할 타입 값들을 그룹화하는 것으로 설명했지만, 반드시 이에 한정되지 않고 4x2개, 2x4개 등과 같이 다양한 크기의 영역 단위로 인접한 16x16 화소 블록들에 대한 분할 타입 값들을 그룹화하거나, 인접하지 않은 16x16 화소 블록들에 대한 분할 타입 값들을 일정한 영역 단위로 그룹화하여 분할 타입 값을 할당할 수도 있다.In FIG. 38, the division type values for adjacent 16x16 pixel blocks are grouped into 2x2 area units, but the present disclosure is not limited thereto, and 16x16 pixel blocks that are adjacent to each other in various sizes such as 4x2 and 2x4 areas. Subdivision type values may be assigned by grouping the subdivided type values with respect to the subdivided type values, or by grouping the subdivided type values with respect to non-adjacent 16 × 16 pixel blocks in a predetermined area unit.
도 38에 도시한 바와 같이 부호화하고자 하는 블록의 16x16 화소 블록들의 분할 타입 값을 그룹화된 영역의 분할 타입 값으로 할당한 것을 트리 구조로 나타내면 도 39와 같이 나타낼 수 있다.As shown in FIG. 38, the allocation of the partition type values of the 16x16 pixel blocks of the block to be encoded as the partition type values of the grouped regions may be represented in a tree structure as illustrated in FIG. 39.
도 39에서는 레이어별로 그룹화된 영역에 대한 분할 타입 값을 트리 구조로 예시적으로 나타내었다. 레이어별 그룹화된 영역에 대한 분할 타입 값을 노드값(Node Value)이라고 가정하면, 도 39에 도시된 트리 구조의 노드값들은 상위 노드(Node)의 노드값과의 차이값을 부호화함으로써 부호화될 수 있다.39 exemplarily illustrates a split type value for regions grouped by layers in a tree structure. Assuming that the split type value for the layered region for each layer is a node value, the node values of the tree structure illustrated in FIG. 39 may be encoded by encoding a difference value with a node value of an upper node. have.
노드값들과 상위 노드의 노드값의 차이값을 부호화하는 방법은 차이값만큼의 이진 비트 0을 부호화하고 마지막에 이진 비트 1을 부호화한다. 만약, 현재 부호화할 노드의 노드값과 상위 노드의 노드값의 차이가 0인 경우에는 이진 비트 1을 부호화한다. 0과 1의 이진 비트를 부호화할 때 예를 들어 산술 부호화 방법을 이용할 수 있는데, 이때 각 레이어별로 다른 컨텍스트(Context)를 이용할 수 있다.A method of encoding a difference value between node values and a node value of an upper node encodes
이와 같이, 트리 구조를 이용하여 분할 타입 값 즉, 노드값을 부호화할 때, 최상위 노드의 노드값(이하 '최상위 노드값'이라 칭함)은 0과의 차이값을 전술한 바와 같이 0과 1의 이진 비트를 이용하여 부호화될 수 있다. 또는, 도 18에서 설명한 분할 타입 번호를 할당함에 있어서 발생 빈도수가 높은 순서로 큰 분할 타입 번호를 할당한 경우, 최상위 노드값은 가장 큰 분할 타입 번호와의 차이값을 0과 1의 이진 비트를 이용하여 부호화될 수 있다. 또는, 도 18에서 설명한 분할 타입 번호를 할당함에 있어서 발생 빈도수가 높은 순서로 작은 분할 타입 번호를 할당한 경우, 최상위 노드값은 가장 작은 분할 타입 번호와의 차이값을 0과 1의 이진 비트를 이용하여 부호화할 수 있다.As described above, when encoding a split type value using a tree structure, that is, a node value, a node value (hereinafter, referred to as a 'top node value') of a top node has a difference value between 0 and 0 as described above. It can be encoded using binary bits. Alternatively, in the case of allocating the partition type number described with reference to FIG. 18 when the large partition type number is assigned in the order of high frequency of occurrence, the highest node value uses a binary bit of 0 and 1 as a difference value from the largest partition type number. Can be encoded. Alternatively, in the case of allocating the partition type numbers described with reference to FIG. 18, when the partition type numbers are assigned in the order of high frequency of occurrence, the highest node value uses a binary bit of 0 and 1 as a difference value from the smallest partition type number. Can be encoded.
최상위 노드를 제외한 나머지 노드값들은 부호화하고자 하는 노드의 노드값과 해당 노드의 상위 노드의 노드값의 차이값을 이진 비트 0과 1을 이용하여 부호화할 수 있다. 즉, 차이값만큼의 개수의 이진 비트 0을 부호화하고 마지막에 이진 비트 1을 부호화함으로써 각 노드값들이 부호화될 수 있다. 만약, 부호화하고자 하는 노드의 노드값과 상위 노드의 노드값의 차이가 0인 경우에는 이진 비트 1을 부호화한다. 또한, 이와는 반대로, 차이값만큼의 개수의 이진 비트 1을 부호화하고 마지막에 이진 비트 0을 부호화함으로써 각 노드값들이 부호화될 수도 있으며, 이때 차이값이 0인 경우, 이진 비트 0을 부호화할 수 있다.The remaining node values except for the highest node may be encoded using
다만, 각 노드값을 부호화할 때 상위 노드값이 분할 타입 번호가 가질 수 있는 최대값인 경우, 해당 상위 노드의 하위 노드들의 노드값들은 부호화되지 않는다. 예를 들어, M1(0,0) 노드의 노드값이 3인 경우, M1(0,0) 노드의 하위 노드인 M2(0,0), M2(0,1), M2(1,0), M2(1,1) 노드의 노드값은 부호화되지 않는다. 즉, M1(0,0)은 M2(0,0), M2(0,1), M2(1,0), M2(1,1)의 최소값이므로 M2(0,0), M2(0,1), M2(1,0), M2(1,1)은 모두 3이상의 값을 가진다. 하지만, 도 18에서 분할 타입 값의 최대값은 3이므로 M2(0,0), M2(0,1), M2(1,0), M2(1,1)은 3 이외의 다른 값을 가질 수 없기 때문에 부호화할 필요가 없다.However, when the upper node value is the maximum value that the split type number may have when encoding each node value, the node values of the lower nodes of the upper node are not encoded. For example, if the node value of node M 1 (0,0) is 3, M 2 (0,0), M 2 (0,1), and M 2 which are subordinate nodes of node M 1 (0,0) The node values of the (1,0) and M 2 (1,1) nodes are not encoded. That is, M 1 (0,0) is the minimum of M 2 (0,0), M 2 (0,1), M 2 (1,0), and M 2 (1,1), so M 2 (0,0) ), M 2 (0,1), M 2 (1,0), and M 2 (1,1) all have a value of 3 or more. However, since the maximum value of the split type value in FIG. 18 is 3, M 2 (0,0), M 2 (0,1), M 2 (1,0), and M 2 (1,1) are different from 3. There is no need to encode because it cannot have a value.
또한, 부호화하고자 하는 노드와 상위 노드의 차이값을 부호화할 때, 부호화하고자 하는 현재 노드의 노드값이 분할 타입 번호가 가질 수 있는 최대값인 경우, 차이값만큼의 개수의 이진 비트 0만을 부호화하고, 마지막에 이진 비트 1을 부호화하지 않는다. 예를 들어, 부호화하고자 하는 현재 노드의 상위 노드의 노드값 M1(0,0)와 부호화하고자 하는 현재 노드의 노드값 M2(0,0), M2(0,1), M2(1,0), M2(1,1)이 각각 1, 2, 3, 3, 2라고 가정하면, 노드값 M2(0,0)와 M2(1,1)은 이진 비트 01을 부호화하고 노드값 M2(0,1)과 M2(1,0)은 이진 비트 001이 아니라 00을 부호화한다.Also, when encoding the difference value between the node to be encoded and the higher node, if the node value of the current node to be encoded is the maximum value that the partition type number can have, only the number of
또한, 같은 상위 노드를 가지는 노드들 중 마지막 노드의 노드값을 부호화하는 경우, 마지막 노드를 제외한 노드들의 노드값이 상위 노드의 노드값보다 모두 큰 경우 마지막 노드의 노드값은 부호화하지 않는다. 예를 들어, 부호화하고자 하는 노드의 상위 노드의 노드값 M1(0,0)과 부호화하고자 하는 노드의 노드값 M2(0,0), M2(0,1), M2(1,0), M2(1,1)이 각각 1, 2, 3, 3, 1이라고 가정하면, 노드값 M2(0,0), M2(0,1), M2(1,0)이 모두 노드값 M1(0,0)보다 크므로, 제일 마지막 노드의 노드값 M2(1,1)는 부호화하지 않는다.In addition, in the case of encoding the node value of the last node among the nodes having the same higher node, the node value of the last node is not encoded when the node values of the nodes except the last node are all larger than the node value of the upper node. For example, the node value M 1 (0,0) of the higher node of the node to be encoded and the node value M 2 (0,0), M 2 (0,1), M 2 (1, 0), assuming that M 2 (1,1) is 1, 2, 3, 3, 1, respectively, node values M 2 (0,0), M 2 (0,1), M 2 (1,0) Since both of these are larger than the node value M 1 (0,0), the node value M 2 (1,1) of the last node is not encoded.
한편, 최상위 노드를 제외한 나머지 노드값들은 전술한 바와 같이 부호화하고자 하는 노드의 노드값과 해당 노드의 상위 노드의 노드값의 차이값을 이진 비트 0과 1을 이용하여 부호화함으로써 부호화될 수도 있지만, 이와는 달리 각 노드의 노드값과 분할 타입의 발생 빈도수가 가장 높은 분할 타입값의 차이값을 부호화함으로써 부호화될 수 있다. 여기서 발생 빈도수가 가장 높은 분할 타입값은 고정값을 사용할 수도 있고 고정값이 아닐 수도 있다. 고정값이 아닌 경우, 부호화하여 복호화기에 전송할 수도 있고 또는 전송하지 않을 수도 있는데 전송하지 않는 경우 현재 블록 이전에 부호화화된 블록들의 통계를 누적하여 현재까지 발생 빈도수가 가장 높은 모드를 사용할 수도 있다. 트리 구조를 이용하여 분할 타입 정보를 부호화하는 또 다른 실시예로 38A에 나타낸 서브블록들의 분할 타입값들을 그룹화하여 38B의 그룹화된 영역의 분할 타입값을 정할 때 발생빈도수가 높은 순서로 큰 분할 타입 번호가 할당된 경우, 그룹화된 영역의 값들 중 최대값을 그룹화된 영역의 분할 타입값으로 사용할 수 있다.Meanwhile, the remaining node values except for the top node may be encoded by encoding the difference between the node value of the node to be encoded and the node value of the upper node of the corresponding node using
본 발명의 실시예에서는 도 18에 나타낸 바와 같은 분할 타입 값을 사용하며 확장된 매크로블록을 16x16 화소 블록으로 분할하는 경우(즉, extended_mb_flag = 0인 경우), 전술한 방법을 이용하여 분할 타입을 부호화/복호화한다. 이 경우, 가장 하위 노드의 값은 확장된 매크로블록 내의 16x16 화소 블록의 분할 타입 값이며, 하위 노드들의 값들의 최대값을 상위노드의 대표값으로 이용할 수 있다. 예를 들어, 도 40에서와 같이, 32x32 화소 블록의 확장된 매크로블록이 16으로 패딩된 이미지에 속하고 16x16 화소 블록으로 분할된 경우, 최상위 노드의 대표값은 0이므로 최상위 노드의 부호화는 분할 타입의 최대값 3과 대표값 0의 차이값인 3을 나타내는 이진비트‘000’부호화한다. 다른 예로, 도 41에서와 같이 32x32 화소 블록의 확장된 매크로블록이 16으로 패딩된 이미지에 속하고 3개의 16x16 화소 블록은 8x8 이하의 화소 블록으로 분할되어 부호화되며 하나의 16x16 화소 블록은 16x16 화소 블록으로 부호화되는 경우, 최상위 노드의 대표값은 3이므로 최상위 노드의 대표값 3과 분할 타입의 최대값 3의 차이값을 나타내는 이진비트 1을 부호화하며, 하위 노드들의 값과 상위 노드의 값 사이의 차이값이 0인 경우는 ‘이진비트 ‘1’을 부호화하고 차이값이 3인 경우는 이진비트 ‘000’을 부호화한다.In an embodiment of the present invention, when the extended macroblock is divided into 16x16 pixel blocks by using a split type value as shown in FIG. 18 (that is, when extended_mb_flag = 0), the split type is encoded using the aforementioned method. / Decrypt In this case, the value of the lowest node is a partition type value of the 16x16 pixel block in the extended macroblock, and the maximum value of the values of the lower nodes may be used as the representative value of the upper node. For example, as shown in FIG. 40, when an extended macroblock of a 32x32 pixel block belongs to a 16-padded image and is divided into 16x16 pixel blocks, the encoding of the most significant node is a partition type because the representative value of the most significant node is 0. The binary bit '000' is coded to represent 3, which is the difference between the
인트라 예측 모드의 부호화는 도 6 내지 도 10에서 설명한 바와 같이, 휘도 성분의 4x4, 8x8 화소 블록의 인트라 예측 모드는 주변블록을 이용해서 예측한 예측 인트라 모드와 같은지를 나타내는 1비트 플래그를 부호화하고, 예측 인트라 모드와 다른 경우 9가지 예측 모드 중 예측한 예측방향을 뺀 나머지 8가지의 예측 모드 중 어떤 모드인지를 3비트를 사용하여 나타낸다. 또한, 16x16 화소 블록은 4가지 예측모드 중 어떤 모드를 사용하는지 2비트를 사용하여 나타낸다. 또한, 4x4 화소 블록, 8x8 화소 블록 및 16x16 화소 블록을 제외한 나머지 mxn 화소 블록의 인트라 예측 모드는 주변 블록을 이용해 예측한 예측 인트라 모드와 같은지를 나타내는 1비트 플래그를 부호화하고, 예측 인트라 모드와 다른 경우 3가지 예측 모드 중 예측한 예측 방향을 뺀 나머지 2가지의 예측 모드 중 어떤 모드인지를 1비트를 사용하여 나타낸다. 또한, 색차 성분의 16x16 화소 블록은 4가지 예측 모드 중 어떤 모드인지를 사용하는지를 2비트를 사용하여 나타낸다. 여기서, 휘도 성분의 4x4, 8x8, 16x16, mxn 화소 블록과 색차 성분은 다른 컨텍스트 테이블을 사용하는 것이 바람직하다.As described in FIGS. 6 to 10, encoding of the intra prediction mode encodes a 1-bit flag indicating whether the intra prediction mode of the 4x4 and 8x8 pixel blocks of the luminance component is the same as the prediction intra mode predicted using the neighboring block, When the prediction intra mode is different, 3 bits are used to indicate which of the eight prediction modes minus the prediction direction among the nine prediction modes. In addition, the 16x16 pixel block is represented by using two bits of which of the four prediction modes is used. In addition, the intra prediction mode of the remaining mxn pixel blocks except for the 4x4 pixel block, the 8x8 pixel block, and the 16x16 pixel block encodes a 1-bit flag indicating whether the prediction intra mode is the same as that predicted using the neighboring block, and when the intra prediction mode is different from the prediction intra mode. 1 bit is used to indicate which of the two prediction modes except the predicted prediction direction among the three prediction modes. In addition, the 16x16 pixel block of the color difference component indicates which of four prediction modes is used using two bits. Here, it is preferable to use different context tables for the 4x4, 8x8, 16x16, and mxn pixel blocks of the luminance component and the chrominance component.
도 42는 양방향 예측의 부호화/복호화를 위한 ctx_inc의 예를 나타낸 도면이다. 전술한 바와 같이, ctx_inc는 대상 신택스를 부호화할 때 주위 상황에 따라 결정되는 값이며, 양방향 예측을 나타내는 B_pdir의 부호화 비트는 표 9에서 설명한 바와 같다. L0 예측인 주변 블록을 0, L1 예측인 주변 블록을 1, 그리고 양방향 예측인 주변블록을 2라고 할 경우, 대상 신택스는 주위 상황에 따라 도 42에 예시한 바와 같이 결정할 수 있다. 이때, 좌측 또는 상단 블록을 사용할 수 없을 경우, 사용 불가능한 블록의 예측방향으로 L0 예측(0)을 사용할 수 있다. 도 43에 예시한 바와 같은 각각의 ctx_inc에 대해서는 다른 컨텍스트 테이블을 사용하는 것이 바람직하다.42 shows an example of ctx_inc for encoding / decoding of bidirectional prediction. As described above, ctx_inc is a value determined according to surrounding conditions when encoding target syntax, and the encoding bits of B_pdir indicating bidirectional prediction are as described in Table 9. When the neighboring block that is the L0 prediction is 0, the neighboring block that is the L1 prediction is 1, and the neighboring block that is the bidirectional prediction is 2, the target syntax may be determined as illustrated in FIG. 42 according to the surrounding situation. In this case, when the left or the upper block is not available, the L0 prediction (0) may be used in the prediction direction of the unavailable block. It is preferable to use a different context table for each ctx_inc as illustrated in FIG. 43.
CBPX_flag의 부호화/복호화를 위한 ctx_inc는 도 37의 경우와 유사하게 컨텍스트 테이블을 결정할 수 있다. 예를 들어, 인트라 픽처이거나 확장된 매크로블록이 인트라 모드인 경우에 CBPX_flag를 부호화하지 않으며, 부호화하고자 하는 현재 블록의 상단 블록 또는 좌측 블록이 인트라 모드인 경우를 0 인터 모드인 경우를 1이라고 하면, 대상 신택스는 주위 상황에 따라 컨텍스트 테이블을 결정하여 사용할 수 있다.Ctx_inc for encoding / decoding of CBPX_flag may determine a context table similarly to the case of FIG. 37. For example, if CBPX_flag is not encoded when an intra picture or an extended macroblock is an intra mode, and a case where 0 inter mode is 1 when the upper block or the left block of the current block to be encoded is intra mode is 1, The target syntax can determine and use the context table according to the surrounding situation.
도 43은 변환 타입의 부호화/복호화를 위한 ctx_inc의 예를 나타낸 도면이다. 여기서, 도 43은 사용 가능한 변환의 종류가 2가지인 경우의 예를 나타낸다. 표 1에서 설명한 바와 같이, 16x16 화소 블록이 4 개의 8x8 화소 서브블록으로 분할된 경우에는 선택 가능한 변환의 종류가 4x4 변환 및 8x8 변환 2가지이므로, 대상 신택스는 현재 블록의 상단 블록 및 좌측 블록이 모두 4x4 변환인 경우, 모두 8x8 변환인 경우, 또는 어느 하나의 블록은 4x4 변환이고 다른 하나의 블록은 8x8 변환인 경우에 따라 컨텍스트 테이블을 다르게 결정하여 사용할 수 있다.43 is a diagram illustrating an example of ctx_inc for encoding / decoding of a transform type. 43 shows an example in which there are two types of transforms that can be used. As described in Table 1, when a 16x16 pixel block is divided into four 8x8 pixel subblocks, there are two types of selectable transforms, 4x4 transform and 8x8 transform, so that the target syntax includes both the top block and the left block of the current block. In the case of 4x4 transform, all 8x8 transform, or one block is 4x4 transform and the other block is 8x8 transform, the context table may be determined and used differently.
도 44 및 도 45는 각각 사용 가능한 변환의 종류가 3가지인 경우의 변환 타입의 부호화/복호화를 위한 ctx_inc의 다른 예를 나타낸 도면으로서, 도 44는 첫 번째 비트 부호화에 사용되는 컨텍스트 테이블을 선택하기 위한 ctx_inc의 예를 나타내며, 도 45는 두 번째 비트 부호화에 사용되는 컨텍스트 테이블을 선택하기 위한 ctx_inc의 예를 나타낸다. 44 and 45 are diagrams illustrating another example of ctx_inc for encoding / decoding a transform type when three types of transforms are available, respectively. FIG. 44 is a diagram illustrating selecting a context table used for first bit encoding. 45 illustrates an example of ctx_inc. FIG. 45 illustrates an example of ctx_inc for selecting a context table used for second bit encoding.
전술한 바와 같이, 8x8 화소 블록보다 작은 화소 블록 즉, 4x4 화소 블록, 4x8 화소 블록 또는 8x4 화소 블록으로 분할된 경우에는 4x4 변환을 수행하고, 8x8 화소 블록 4x4 변환 및 8x8 변환 중 부호화 비용이 작은 변환을 수행하며, 8x16 화소 블록은 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 작은 변환을 수행하고, 16x8 화소 블록은 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 작은 변환을 수행하며, 16x16 화소 블록 이상의 블록은 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 작은 변환을 수행하므로, 도 44에 나타낸 바와 같이 첫 번째 비트 부호화에서는 현재 블록의 상단 블록 및 좌측 블록이 모두 4x4 변환된 블록인지, 좌측 블록 및 상단 블록 중 어느 하나의 블록만이 4x4 변환된 블록인지 또는 모두 4x4 변환된 블록이 아닌지에 따라 변환 타입의 부호화/복호화를 위한 ctx_inc를 다르게 사용할 수 있다. 마찬가지로, 두 번째 비트 부호화에서는 현재 블록의 상단 및 좌측 블록 중 적어도 어느 하나의 블록이 8x8 변환된 블록인지의 여부에 따라 도 45에 나타낸 바와 같이 변환 타입의 부호화/복호화를 위한 ctx_inc를 다르게 사용할 수 있다.As described above, when the pixel block smaller than the 8x8 pixel block is divided into 4x4 pixel blocks, 4x8 pixel blocks, or 8x4 pixel blocks, 4x4 transform is performed, and the transform having the smaller encoding cost among the 8x8 pixel block 4x4 transform and the 8x8 transform is performed. The 8x16 pixel block performs the transform with the lowest coding cost during the 4x4 transform, the 8x8 transform, and the 8x16 transform, and the 16x8 pixel block performs the transform with the lower encoding cost during the 4x4 transform, the 8x8 transform, and the 16x8 transform, and the 16x16 pixel. Since a block larger than a block performs a transform having a small encoding cost among 4x4 transform, 8x8 transform, and 16x16 transform, as shown in FIG. 44, in the first bit encoding, whether the upper block and the left block of the current block are 4x4 transformed blocks or the left block. Encoding of the transform type according to whether only one of the block and the upper block is a 4x4 transformed block or not all 4x4 transformed blocks You can use different ctx_inc for luxury. Similarly, in the second bit encoding, as shown in FIG. 45, ctx_inc for encoding / decoding of a transform type may be different depending on whether at least one of the upper and left blocks of the current block is an 8x8 transformed block. .
도 46은 본 발명의 일 실시예에 따른 영상 복호화 장치를 간략하게 나타낸 블록 구성도이다.46 is a block diagram schematically illustrating an image decoding apparatus according to an embodiment of the present invention.
본 발명의 일 실시예에 따른 영상 복호화 장치(4400)는 복호화기(Decoder, 4410), 역양자화기 및 역변환이기(4420), 예측기(4430), 가산기(4440), 필터(4450) 및 픽처 버퍼(4460)을 포함하여 구성될 수 있다.The image decoding apparatus 4400 according to an embodiment of the present invention includes a decoder 4410, an inverse quantizer and an inverse transformer 4420, a predictor 4430, an adder 4440, a filter 4450, and a picture buffer. 4440.
복호화기(4410)는 영상 부호화 장치(100)에 의해 부호화된 부호화 데이터를 엔트로피 복호화 등과 같은 다양한 부호화 또는 복호화 기법을 이용하여 복호화한다. 복호화기(4410)는 복호화할 픽처의 타입에 따라 복호화하는 데이터가 다르다. 이러한 픽처 타입에 대한 정보는 부호화 데이터의 픽처 헤더 또는 시퀀스 헤더로부터 추출되거나 추출되고 복호화되어 복원될 수 있다. 이때, 현재 복호화할 확장된 매크로블록이 도 2에 도시한 바와 같이 이미지 경계에 걸치는 경우(입력 이미지의 실제 사이즈는 시퀀스 파라미터로 전송된다), 확장된 매크로블록 내 이미지에 속하는 부분을 구하고 해당 영역의 텍스터 데이터와 예측모드를 엔트로피 복화화를 수행하여 얻을 수 있으며, 인트라 예측 또는 움직임 보상, 역변환/역양자화를 수행하여 실제 이미지에 속하는 부분을 복호화한다.The decoder 4410 decodes the encoded data encoded by the
복호화할 픽처가 인트라 픽처인 경우, 복호화기(4610)가 영상 부호화 데이터 내에서 복호화할 데이터의 종류와 순서는 도 17에서 예시적으로 도시한 바와 같다. 즉, 복호화기(4410)는 입력되는 비트스트림으로부터 추출되는 분할 타입 데이터를 복호화하여 분할 타입 정보를 복원하고, 복원되는 분할 타입 정보에 의해 식별되는 분할 타입을 이용하여 매크로블록을 분할하며, 인트라 예측 모드 데이터를 복호화하여 매크로블록내 분할된 각 서브블록의 개수만큼 인트라 예측 모드를 복원하고, 각 서브블록의 크기에 따라 도 24에 나타낸 순서와 동일 또는 유사한 순서로 CBPX 플래그/CBP에 할당된 CBP 데이터를 복호화하여 CBPX 플래그 또는 CBP를 복원한다. 이후, 복호화기(4610)는 CBP가 나타내는 0인 아닌 변환 계수가 있는 서브블록들에 대해서만 변환 계수 데이터를 복호화하여 변환 계수를 복원한다. 이때, 영상 부호화 장치(100)가 확장된 매크로블록에 대하여 16x16 화소 블록 단위로 인트라 예측 부호화를 수행한 경우에는 CBPX 플래그의 복호화는 생략될 수 있으며, 이 경우 확장된 매크로블록 단위로 부호화된 양자화 파라미터에 대한 복호화가 수행될 수 있다.When the picture to be decoded is an intra picture, the type and order of data to be decoded in the image encoded data by the
다만, 도 17에 도시한 영상 부호화 데이터의 신택스의 구조는 예시적인 것일 뿐, 본 발명의 일 실시예에 따른 영상 부호화 데이터의 신택스 구조가 도 17에 도시한 구조로 한정되는 것은 아니다. 또한, 도 24에 도시한 CBPX 플래그 또는 CBP의 부호화 순서는 예시적인 것일 뿐, 본 발명의 일 실시예에 따른 CBPX 플래그 또는 CBP의 복원 순서는 도 24에 도시한 순서로 한정되는 것은 아니다.However, the syntax of the video encoded data shown in FIG. 17 is merely an example, and the syntax structure of the video encoded data according to an embodiment of the present invention is not limited to the structure shown in FIG. 17. In addition, the coding order of the CBPX flag or CBP shown in FIG. 24 is merely an example, and the order of reconstruction of the CBPX flag or CBP according to an embodiment of the present invention is not limited to the order shown in FIG. 24.
여기서, 복호화기(4610)가 인트라 예측 모드를 복원화하는 방법은 서브블록의 크기에 따라 다르다. 즉, 서브블록의 크기가 4x4 또는 8x8과 같이 16x16이 아닌 경우, 복호화기(4610)는 비트스트림으로부터 추출되는 인트라 예측 모드 데이터 중 1 비트를 복호화하여 예측 모드 플래그를 복원하고, 복원되는 예측 모드 플래그가 해당 서브블록의 인트라 예측 모드에 따른 예측 방향이 주변 블록으로부터 추정되는 해당 서브블록의 인트라 예측 모드에 따른 예측 방향과 동일함을 나타내는 경우, 주변 블록으로부터 추정되는 해당 서브블록의 인트라 예측 모드를 현재 블록의 인트라 예측 모드로서 복원하고 다음 서브블록의 인트라 예측 모드를 복호화하며, 동일하지 않음을 나타내는 경우 인트라 예측 모드 데이터의 다음 3 비트를 복호화하여 복원되는 인트라 예측 모드를 현재 블록의 인트라 예측 모드로서 복원한다. 또한, 서브블록의 크기가 16x16인 경우, 복호화기(4610)는 비트스트림으로부터 추출되는 인트라 예측 모드 데이터 중 2 비트를 복호화하여 현재 블록의 인트라 예측 모드를 복원한다. 이와 같이 복원되는 인트라 예측 모드는 예측기(4630)의 인트라 예측기(4632)로 입력된다.Here, how the
또한, 32x32 화소 블록인 확장된 매크로블록이 인트라 모드인 경우, 확장된 매크로블록 내의 16 화소의 배수로 패딩된 이미지에 속하는 블록을 판단한 후, 해당 블록의 분할 타입을 엔트로피 복호화할 수 있다. 도 3의 경우, 32x32 화소 블록인 확장된 매크로블록 내의 패딩된 이미지에 속하는 블록은 첫 번째의 16x16 화소 블록만이 해당되며, 따라서 첫 번째의 16x16 화소 블록의 분할 타입을 엔트로피 복호화한다. 만약, 해당 16x16 화소 블록이 두 개의 16x8 화소 블록으로 분할된 경우를 가정하면, 두 개의 인트라 예측 모드를 엔트로피 복호화하고 16x16 화소 블록을 위한 CBP 1개와 16x16 변환 계수를 복호화한다. 엔트로피 복호화를 통해 얻은 서브 블록 타입과 인트라 예측 모드, 변환 계수를 이용하여 해당 16x16 화소 블록을 복호화한다.In addition, when the extended macroblock, which is a 32x32 pixel block, is an intra mode, after determining a block belonging to an image padded by a multiple of 16 pixels in the expanded macroblock, the partition type of the corresponding block may be entropy decoded. In the case of FIG. 3, only a first 16x16 pixel block corresponds to a block belonging to a padded image in an extended macroblock, which is a 32x32 pixel block, and thus entropy-decodes the partition type of the first 16x16 pixel block. If it is assumed that the corresponding 16x16 pixel block is divided into two 16x8 pixel blocks, two intra prediction modes are entropy decoded, and one CBP and 16x16 transform coefficients for the 16x16 pixel block are decoded. The 16x16 pixel block is decoded using the subblock type obtained through entropy decoding, an intra prediction mode, and a transform coefficient.
복호화할 픽처가 인터 픽처인 경우 복호화기(4610)가 영상 부호화 데이터 내에서 복호화할 데이터의 종류와 순서는 도 29에 도시한 바와 같다. 즉, 복호화기(4610)는 비트스트림으로부터 추출되는 SKIPN 플래그 데이터를 복호화하여 현재 복호화하고자 하는 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIPN 플래그를 복원한다. 복호화기(4610)는 복원되는 SKIPN 플래그에 의해 식별되는 매크로블록이 SKIP 매크로블록이 아닌 경우, 비트스트림으로부터 추출되는 매크로블록 타입 플래그 데이터와 분할 타입 데이터를 복호화하여 매크로블록 타입 플래그와 분할 타입 정보를 복원한다.When the picture to be decoded is an inter picture, the type and order of data to be decoded in the image encoded data by the
또한, 확장된 매크로블록이 32x32 화소 블록인 경우, 확장된 매크로블록 내의 16 화소의 배수로 패딩된 이미지에 속하는 블록을 판단한 후, skip32_flag를 복호화하고 현재 복호화할 확장된 매크로블록이 SKIP 모드인 경우에 해당 블록의 좌측 및 상단의 주변 블록을 이용하여 예측 움직임 벡터를 구하고 움직임 보상을 수행할 수 있다. 도 3의 경우, 32x32 화소 블록인 확장된 매크로블록 내의 패딩된 이미지에 속하는 블록은 첫 번째의 16x16 화소 블록만이 해당되며, skip32_flag를 복호화하고 현재 복호화할 확장된 매크로블록이 SKIP 모드인 경우에 첫 번째의 16x16 화소 블록의 좌측 및 상단의 주변 블록을 이용하여 예측 움직임 벡터를 구하며, 움직임 보상을 수행할 수 있다.In addition, when the extended macroblock is a 32x32 pixel block, after determining a block belonging to a padded image in multiples of 16 pixels in the extended macroblock, the extended macroblock is decoded and the extended macroblock to be currently decoded corresponds to a SKIP mode. By using the neighboring blocks on the left and top of the block, a prediction motion vector may be obtained and motion compensation may be performed. In the case of FIG. 3, the block belonging to the padded image in the extended macroblock, which is a 32x32 pixel block, corresponds to only the first 16x16 pixel block, and is the first case when the extended macroblock to be decoded and currently decoded skip32_flag is SKIP mode. The prediction motion vector may be obtained using the neighboring blocks at the left and the top of the first 16 × 16 pixel block, and motion compensation may be performed.
복원되는 매크로블록 타입 플래그에 의해 식별되는 매크로블록 타입이 인트라 매크로블록인 경우에는 전술한 바와 동일하며, 매크로블록 타입이 인터 매크로블록인 경우, 복호화기(4610)는 서브블록의 크기가 16x16 이상인 서브블록들에 대해서만 SKIPX 플래그 데이터를 복호화하여 SKIPX 플래그를 복원하고 복원되는 SKIPX 플래그에 의해 식별되는 SKIP 블록이 아닌 서브블록 또는 16x16보다 작은 크기를 가지는 서브블록들(SKIP이 아님을 의미함)에 대해서 MVD/ref_idx 데이터를 복호화하여 움직임 정보인 움직임 벡터와 참조 픽처 인덱스를 복원한다. 또한, 복호화기(4610)는 SKIP이 아닌 블록들에 대해서 도 33과 도 33에 도시한 바와 동일 또는 유사한 순서로 복호화하여 CBPX 플래그, 변환 타입, CBP를 복원하고, 복원되는 CBP에 의해 식별되는 0이 아닌 계수를 가지는 서브블록들에 대해서만 양자화된 변환 계수를 복원한다. 이와 같이 복원되는 움직임 정보는 인터 예측기(4634, 움직임 보상기로 구현될 수 있음)로 입력되고, 복원되는 CBPX 플래그, CBP, 변환 타입, 양자화된 변환 계수 등은 복호화하고자 하는 대상 매크로블록 또는 대상 매크로블록의 서브를록의 잔여 블록을 복원하기 위해 역양자화기 및 역변환이기(4620)로 입력된다.When the macroblock type identified by the macroblock type flag to be restored is an intra macroblock, the same as described above. When the macroblock type is an inter macroblock, the
역양자화기 및 역변환이기(4620)는 복호화기(4610)로부터 전달되는 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 블록을 복원한다. 이때, 역양자화기 및 역변환이기(4620)는 복호화기(4610)로부터 전달되는 CBPX 플래그, CBP, 변환 타입을 이용하여 양자화된 변환 계수를 역양자화 및 역변환할 수 있다.The inverse quantizer and
예측기(4630)는 복호화하고자 하는 대상 매크로블록 또는 그 서브블록을 예측하여 예측 블록을 생성한다. 이를 위해, 인트라 예측기(4632)는 복호화하고자 하는 대상 매크로블록 또는 그 서브블록을 복호화기(4610)에 의해 복원되는 인트라 예측 모드를 이용하여 인트라 예측함으로써 대상 매크로블록 또는 그 서브블록의 예측 블록을 생성하며, 인터 예측기(4634)는 복호화하고자 하는 대상 매크로블록 또는 그 서브블록을 복호화기(4610)에 의해 복원되는 움직임 정보를 이용하여 인터 예측함으로써 대상 매크로블록 또는 그 서브블록의 예측 블록을 생성한다.The
가산기(4640)는 예측기(4630)에 의해 생성된 예측 블록과 역양자화기 및 역변환이기(4620)에 의해 복원되는 잔여 블록을 가산하여 복호화하고자 하는 대상 매크로블록을 복원한다.The
가산기(4640)에 의해 복원되는 대상 매크로블록은 필터(4650)에서 디블로킹 필터링 등이 수행되어 픽처 단위로 누적된 후 복원 영상으로 출력되며, 픽처 버퍼(4660)에 저장되어 추후 인터 예측기(4634)에서 움직임 보상 예측하는 데 활용될 수 있다.The target macroblock reconstructed by the
인트라 예측기(4632), 인터 예측기(4634), 역양자화기 및 역변환이기(4620)의 동작 방법은 도 1을 통해 전술한 영상 부호화 장치(100)의 인트라 예측기(112), 인터 예측기(114), 역양자화기 및 역변환이기(150)의 동작 방법과 동일 또는 유사하므로 상세한 설명은 생략한다.The operations of the intra predictor 4452, the inter predictor 4462, the inverse quantizer, and the
이와 같은 영상 복호화 장치(4600)는 확장된 매크로블록이 인터 매크로블록인지 또는 인트라 매크로블록인지 여부에 따라 다음과 같이 구성될 수 있다.The
예를 들어, 매크로블록이 인트라 매크로블록인 경우, 복호화기(4610)는 부호화 데이터를 복호화하여 분할 타입 정보, 인트라 예측 모드 및 양자화된 변환 계수를 복원하고, 역양자화기 및 역변환이기(4620)는 복원되는 분할 타입 정보에 따라 식별되는 서브블록의 크기에 따라 선택되는 변환을 이용하여 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 예측기(4630)는 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 복원되는 인트라 예측 모드를 이용하여 예측하여 예측 서브블록을 생성하며, 가산기(4640)는 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원한다.For example, when the macroblock is an intra macroblock, the
다른 예로, 매크로블록이 인터 매크로블록인 경우, 복호화기(4610)는 부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하고, 역양자화기 및 역변환이기(4620)는 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 예측기(4630)는 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하며, 가산기(4640)는 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원한다.As another example, when the macroblock is an inter macroblock, the
본 발명의 일 실시예에 따른 영상 복호화 방법에 따르면, 영상 복호화 장치(4600)는 복호화하고자 하는 매크로블록이 인트라 매크로블록인 경우, 부호화 데이터를 복호화하여 분할 타입 정보, 인트라 예측 모드 및 양자화된 변환 계수를 복원하고, 복원되는 분할 타입 정보에 따라 식별되는 서브블록의 크기에 따라 선택되는 변환을 이용하여 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 복원되는 인트라 예측 모드를 이용하여 예측하여 예측 서브블록을 생성하며, 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원한다.According to an image decoding method according to an embodiment of the present invention, when the macroblock to be decoded is an intra macroblock, the
이때, 서브블록의 크기에 따라 선택되는 변환은 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용할 수 있다.In this case, the transform selected according to the size of the subblock uses a 4x4 transform if the size of the subblock is one of 4x4, 4x8, and 8x4, and uses an 8x8 transform if the size of the subblock is one of 8x8, 8x16, and 16x8. If the size of the subblock is 16x16 or more, 16x16 transform can be used.
또한, 본 발명의 일 실시예에 따른 영상 복호화 방법에 따르면, 영상 복호화 장치(3000)는 복호화하고자 하는 매크로블록이 인터 매크로블록인 경우, 부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하고, 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 복원되는 분할 타입 정보에 따라 식별되는 서브블록으로 분할하고 서브블록을 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하며, 예측 서브블록과 잔여 서브블록을 가산하여 서브블록을 복원한다.In addition, according to an image decoding method according to an embodiment of the present invention, when the macroblock to be decoded is an inter macroblock, the image decoding apparatus 3000 decodes the encoded data to thereby split type information, motion information, and transform type information. And reconstructing the quantized transform coefficients, inversely quantizing and inversely transforming the quantized transform coefficients by using the transform identified by the transformed type information to be recovered, and restoring the remaining subblocks, and the subblocks identified according to the recovered partition type information. The prediction subblocks are generated by partitioning the subblocks and predicting the subblocks using the reconstructed motion information, and reconstructing the subblocks by adding the prediction subblocks and the remaining subblocks.
이때, 변환 타입 정보에 의해 식별되는 변환은 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나일 수 있다. 또한, 영상 복호화 장치(4600)는 복원되는 서브블록을 필터링할 수 있는데, 복원되는 서브블록 내의 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행할 수 있다.In this case, the transform identified by the transform type information may be one of a 4x4 transform, an 8x8 transform, an 8x16 transform, a 16x8 transform, and a 16x16 transform. Also, the
또한, 영상 복호화 장치(4600)는 부호화 데이터로부터 추출되는 SKIP_N 플래그 데이터를 복호화하여 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 추가로 복원할 수 있다. 영상 복호화 장치(4600)는 복원되는 SKIP_N 플래그에 의해 SKIP 매크로블록이 아닌 것으로 식별되는 매크로블록에 대해서만 복호화 과정을 수행할 수 있다.The
또한, 영상 복호화 장치(4600)는 부호화 데이터로부터 추출되는 매크로블록 타입 플래그 데이터를 복호화하여 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 추가로 복원할 수 있다. 영상 복호화 장치(4600)는 복원되는 매크로블록 타입 플래그에 복호화하고자 하는 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 파악하고, 그에 따라 인트라 예측 복호화를 수행할지 또는 인터 예측 복호화를 수행할지 여부를 결정할 수 있다.The
한편, 매크로블록의 타입에 관계 없이, 분할 타입 정보는 분할 레이어별 분할 타입 번호에 의해 식별될 수 있으며, 영상 복호화 장치(4600)는 부호화 데이터로부터 추출되는 CBP 데이터를 복호화하여 서브블록의 크기에 따른 CBPX 플래그와 CBP를 추가로 복원할 수 있다. 여기서, CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그일 수 있다.On the other hand, regardless of the type of the macroblock, the split type information may be identified by the split type number for each split layer, and the
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.While the present invention has been described in connection with what is presently considered to be the most practical and preferred embodiment, it is to be understood that the invention is not limited to the disclosed embodiments. In other words, within the scope of the present invention, all of the components may be selectively operated in combination with one or more. In addition, although all of the components may be implemented in one independent hardware, each or all of the components may be selectively combined to perform some or all functions combined in one or a plurality of hardware. It may be implemented as a computer program having a. Codes and code segments constituting the computer program may be easily inferred by those skilled in the art. Such a computer program may be stored in a computer readable storage medium and read and executed by a computer, thereby implementing embodiments of the present invention. The storage medium of the computer program may include a magnetic recording medium, an optical recording medium, a carrier wave medium, and the like.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, the terms "comprise", "comprise" or "having" described above mean that the corresponding component may be inherent unless specifically stated otherwise, and thus excludes other components. It should be construed that it may further include other components instead. All terms, including technical and scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art unless otherwise defined. Terms used generally, such as terms defined in a dictionary, should be interpreted to coincide with the contextual meaning of the related art, and shall not be interpreted in an ideal or excessively formal sense unless explicitly defined in the present invention.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the equivalent scope should be interpreted as being included in the scope of the present invention.
100: 영상 부호화 장치
110: 예측기 120: 감산기
130: 변환기 및 양자화기 140: 부호화기
150: 역양자화기 및 역변환기 160: 가산기
170: 필터 180: 픽처 버퍼
4600: 영상 복호화 장치
4610: 복호화기 4620: 역양자화기 및 역변환기
4630: 예측기 4632: 인트라 예측기
4634: 인터 예측기 4640: 감산기
4650: 필터 4660: 픽처 버퍼100: video encoding apparatus
110: predictor 120: subtractor
130: converter and quantizer 140: encoder
150: inverse quantizer and inverse converter 160: adder
170: filter 180: picture buffer
4600: video decoding device
4610: decoder 4620: inverse quantizer and inverse transformer
4630: Predictor 4632: Intra Predictor
4634: inter predictor 4640: subtractor
4650: filter 4660: picture buffer
Claims (52)
매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하고, 상기 서브블록과 상기 예측 서브블록을 감산하여 잔여 서브블록을 생성하며, 상기 잔여 서브블록을 상기 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환계수를 생성하며, 상기 양자화된 변환계수를 부호화하여 부호화된 영상 데이터를 생성하는 영상 부호화부; 및
부호화된 상기 영상 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환계수를 복원하고, 상기 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 상기 양자화된 변환계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 상기 복원되는 분할타입 정보에 따라 식별되는 서브블록을 상기 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하고, 상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 영상 복호화부
를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치.In the video encoding / decoding device,
A prediction is performed by predicting a subblock in which a macroblock is divided to generate a prediction subblock, subtracting the subblock and the prediction subblock to generate a residual subblock, and converting the residual subblock according to the size of the subblock. An image encoder for generating quantized transform coefficients by transforming and quantizing the quantized transform coefficients, and generating encoded image data by encoding the quantized transform coefficients; And
Decode the encoded image data to restore partition type information, motion information, transform type information, and quantized transform coefficients, and dequantize the quantized transform coefficients using transforms identified by the restored transform type information. Reconstruct the residual subblocks by inverse transform, generate a prediction subblock by predicting the subblocks identified according to the reconstructed partition type information using the reconstructed motion information, and add the prediction subblocks and the residual subblocks. An image decoder to reconstruct the subblock
Image encoding / decoding apparatus comprising a.
매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하는 예측기;
상기 서브블록과 상기 예측 서브블록을 감산하여 잔여 서브블록을 생성하는 감산기;
상기 잔여 서브블록을 상기 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환 계수를 생성하는 변환 및 양자화기; 및
상기 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성하는 부호화기
를 포함하는 것을 특징으로 하는 영상 부호화 장치.In the apparatus for encoding a video,
A predictor for predicting a subblock in which the macroblock is divided to generate a predicted subblock;
A subtractor for generating a residual subblock by subtracting the subblock and the prediction subblock;
A transform and quantizer for transforming and quantizing the residual subblocks using a transform selected according to the size of the subblock to generate quantized transform coefficients; And
An encoder that encodes the quantized transform coefficients to generate encoded image data
An image encoding apparatus comprising a.
NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 상기 매크로블록에 대하여, 매크로블록 레이어 K(단, )의 화소 블록이 4개의 블록으로 분할되는 경우에 매크로블록 레이어 K+1의 서브블록들을 사용하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the predictor is
For the macroblock having the size of NxN (where N is an integer of 16 or more), the macroblock layer K ( )of And a subblock of the macroblock layer K + 1 when the pixel block is divided into four blocks.
NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 상기 매크로블록에 대하여, N이 16보다 큰 경우 16x16 화소 블록 단위로 분할하여 서브블록을 예측하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the predictor is
And predicting a subblock by dividing the macroblock having a size of NxN (where N is an integer greater than or equal to 16) pixel blocks in units of 16x16 pixel blocks when N is larger than 16.
상기 매크로블록이 인트라 매크로블록인 경우, mxn 화소 단위로 상기 서브블록을 예측하되, 상기 m과 n은 4, 8 및 16 중 하나이고 서로 동일하지 않은 경우이거나 16보다 크며 N(N은 NxN 화소 블록의 크기를 갖는 매크로블록의 화소 단위)이하인 정수인 것을 특징으로 하는 영상 부호화 장치.The method of claim 2,
When the macroblock is an intra macroblock, the subblock is predicted in units of mxn pixels, wherein m and n are one of 4, 8, and 16, which are not equal to each other, or greater than 16, and N (N is an N × N pixel block. And a pixel unit of a macroblock having a size of?).
상기 매크로블록은 64x64, 32x64, 64x32, 32x32, 16x32, 32x16 화소블록 중 적어도 하나를 포함하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2,
And the macroblock includes at least one of 64x64, 32x64, 64x32, 32x32, 16x32, and 32x16 pixel blocks.
상기 매크로블록이 인트라 매크로블록인 경우, 상기 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 상기 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
When the macroblock is an intra macroblock, if the size of the subblock is one of 4x4, 4x8, and 8x4, 4x4 transform is used; if the size of the subblock is one of 8x8, 8x16, and 16x8, 8x8 transform is used. And 16x16 transform if the size of the subblock is 16x16 or larger.
상기 확장된 매크로블록이 인트라 매크로블록인 경우, 상기 선택되는 변환의 종류를 나타내는 변환타입을 부호화하여 변환타입 데이터를 생성하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
And when the extended macroblock is an intra macroblock, transform type data is generated by encoding a transform type indicating the type of the selected transform.
상기 잔여 서브블록을 16x16 화소 잔여블록으로 분할하고, 상기 분할된 16x16 화소 잔여블록을 다시 16 개의 4x4 화소 잔여블록으로 분할하며, 각 4x4 화소 잔여블록을 4x4 변환을 이용하여 변환하여 16개의 변환 블록을 생성하고, 상기 16 개의 변환 블록의 DC 성분으로 구성되는 DC 성분 블록을 4x4 변환을 이용하여 변환하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
The remaining subblocks are divided into 16x16 pixel residual blocks, the divided 16x16 pixel residual blocks are further divided into 16 4x4 pixel residual blocks, and each 4x4 pixel residual block is transformed using 4x4 transform to convert 16 transform blocks. And a DC component block composed of DC components of the 16 transform blocks using 4x4 transform.
상기 4x4 화소 잔여블록을 변환하는 4x4 변환과 상기 DC 성분 블록을 변환하는 4x4 변환은 서로 다른 변환 방식을 이용하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 9,
And a 4x4 transform for transforming the 4x4 pixel residual block and a 4x4 transform for transforming the DC component block use different transform schemes.
상기 매크로블록이 인터 매크로블록인 경우, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나의 변환을 선택하여 상기 잔여 서브블록을 변환하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
And converting the residual subblock by selecting one of 4x4 transform, 8x8 transform, 8x16 transform, 16x8 transform, and 16x16 transform when the macroblock is an inter macroblock.
상기 서브블록의 크기가 8x8보다 작은 경우에는 상기 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x8인 경우에는 상기 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x16인 경우에는 상기 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x8인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x16 이상인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
When the size of the subblock is smaller than 8x8, the residual subblock is transformed using 4x4 transform. When the size of the subblock is 8x8, the encoding cost of the residual subblock is smallest among 4x4 transform and 8x8 transform. If the size of the subblock is 8x16, the residual subblock is transformed using a transform having the lowest coding cost among 4x4, 8x8, and 8x16 transforms, and the size of the subblock is 16x8. In case of, the residual block of the subblock is transformed using a transform having the smallest coding cost among 4x4 transform, 8x8 transform, and 16x8 transform. And the 8x8 transform and the 16x16 transform are transformed using the transform having the lowest encoding cost.
상기 서브블록의 크기가 8x8보다 작은 경우에는 상기 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x8인 경우에는 상기 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x16인 경우에는 상기 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x8인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x16 이상인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
When the size of the subblock is smaller than 8x8, the residual subblock is transformed using 4x4 transform. When the size of the subblock is 8x8, the encoding cost of the residual subblock is smallest among 4x4 transform and 8x8 transform. If the size of the subblock is 8x16, the residual subblock is transformed using a transform having the lowest coding cost among 4x4, 8x8, and 8x16 transforms, and the size of the subblock is 16x8. In case of, the residual block of the subblock is transformed using a transform having the smallest coding cost among 4x4 transform, 8x8 transform, and 16x8 transform. And the 8x8 transform and the 16x16 transform are transformed using the transform having the lowest encoding cost.
상기 확장된 매크로블록이 인터 매크로블록인 경우, 상기 선택되는 변환의 종류를 나타내는 변환타입을 부호화하여 변환타입 데이터를 생성하는 것을 특징으로 하는 영상 부호화 장치.The method of claim 2, wherein the transform and quantizer,
And when the extended macroblock is an inter macroblock, transform type data is generated by encoding a transform type indicating the type of the selected transform.
부호화 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환 계수를 복원하는 복호화기;
상기 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 상기 양자화된 변환 계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하는 역양자화기 및 역변환기;
상기 복원되는 분할타입 정보에 따라 식별되는 서브블록을 상기 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 예측기; 및
상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 가산기
를 포함하는 것을 특징으로 하는 영상 복호화 장치.In the apparatus for decoding an image,
A decoder which decodes the encoded data and restores partition type information, motion information, transform type information, and quantized transform coefficients;
An inverse quantizer and an inverse transformer for restoring residual subblocks by inverse quantization and inverse transformation of the quantized transform coefficients using a transform identified by the recovered transform type information;
A predictor for predicting a subblock identified according to the reconstructed partition type information using the reconstructed motion information to generate a predicted subblock; And
An adder for reconstructing the subblock by adding the prediction subblock and the residual subblock
Video decoding apparatus comprising a.
상기 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 상기 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용하는 것을 특징으로 하는 영상 복호화 장치.The method of claim 15, wherein the inverse quantizer and inverse transformer,
If the size of the subblock is one of 4x4, 4x8 and 8x4, 4x4 transform is used.If the size of the subblock is one of 8x8, 8x16 and 16x8, 8x8 transform is used. If the size of the subblock is 16x16 or more, 16x16 transform is used. And a video decoding apparatus.
부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하는 복호화기;
상기 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 상기 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 역 양자화기 및 역 변환기;
상기 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 상기 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 예측기; 및
상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 가산기
를 포함하는 것을 특징으로 하는 영상 복호화 장치.In the apparatus for decoding an image,
A decoder which decodes the encoded data to restore partition type information, motion information, transform type information, and quantized transform coefficients;
An inverse quantizer and an inverse transformer for reconstructing the remaining subblocks by inverse quantization and inverse transformation of the quantized transform coefficients using a transform identified by the recovered transform type information;
A predictor for predicting a subblock identified according to the reconstructed partition type information by using the reconstructed motion information to generate a predicted subblock; And
An adder for reconstructing the subblock by adding the prediction subblock and the residual subblock
Video decoding apparatus comprising a.
4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나를 이용하는 것을 특징으로 하는 영상 복호화 장치.The method of claim 17, wherein the inverse quantizer and inverse transformer,
And a 4x4 transform, an 8x8 transform, an 8x16 transform, a 16x8 transform, and a 16x16 transform.
상기 복원되는 서브블록 내의 상기 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행하는 필터
를 더 포함하는 것을 특징으로 하는 영상 복호화 장치.The method of claim 17,
A filter for performing deblocking filtering on a boundary between a left side and an upper side of the block according to the selected transform in the reconstructed subblock;
The video decoding apparatus further comprises.
상기 부호화 데이터로부터 추출되는 SKIP_N 플래그 데이터를 복호화하여 상기 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 복원하는 것을 특징으로 하는 영상 복호화 장치.The method of claim 17, wherein the decoder,
And decoding the SKIP_N flag data extracted from the encoded data to restore a SKIP_N flag indicating whether the macroblock is a SKIP macroblock.
상기 부호화 데이터로부터 추출되는 매크로블록 타입 플래그 데이터를 복호화하여 상기 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 복원하는 것을 특징으로 하는 영상 복호화 장치.The method of claim 17, wherein the decoder,
And decoding a macroblock type flag data extracted from the encoded data to restore a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock.
분할 레이어별 분할 타입 번호에 의해 식별되는 것을 특징으로 하는 영상 복호화 장치.The method of claim 17,
A video decoding apparatus characterized by being identified by a partition type number for each partition layer.
상기 부호화 데이터로부터 추출되는 CBP 데이터를 복호화하여 상기 서브블록의 크기에 따른 CBPX 플래그와 CBP를 복원하되, 상기 CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 상기 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그인 것을 특징으로 하는 영상 부호화 장치.The method of claim 17,
CBPX flag and CBP according to the size of the subblock are decoded by decoding CBP data extracted from the encoded data, wherein the CBPX flag is a flag indicating whether there is a non-zero quantized transform coefficient in an XxX pixel block and the CBP Is a flag indicating whether there is a non-zero quantized transform coefficient in a 16x16 pixel block.
매크로블록이 분할된 서브블록을 예측하여 예측 서브블록을 생성하고, 상기 서브블록과 상기 예측 서브블록을 감산하여 잔여 서브블록을 생성하며, 상기 잔여 서브블록을 상기 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환계수를 생성하며, 상기 양자화된 변환계수를 부호화하여 부호화된 영상 데이터를 생성하는 영상 부호화 단계; 및
부호화된 상기 영상 데이터를 복호화하여 분할타입 정보, 움직임 정보, 변환타입 정보 및 양자화된 변환계수를 복원하고, 상기 복원되는 변환타입 정보에 의해 식별되는 변환을 이용하여 상기 양자화된 변환계수를 역양자화 및 역변환하여 잔여 서브블록을 복원하며, 상기 복원되는 분할타입 정보에 따라 식별되는 서브블록을 상기 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하고, 상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 영상 복호화 단계
를 포함하는 것을 특징으로 하는 영상 부호화/복호화 방법.In the video encoding / decoding method,
A prediction is performed by predicting a subblock in which a macroblock is divided to generate a prediction subblock, subtracting the subblock and the prediction subblock to generate a residual subblock, and converting the residual subblock according to the size of the subblock. Converting and quantizing the quantized transform coefficient to generate quantized transform coefficients, and encoding the quantized transform coefficients to generate encoded image data; And
Decode the encoded image data to restore partition type information, motion information, transform type information, and quantized transform coefficients, and dequantize the quantized transform coefficients using transforms identified by the restored transform type information. Reconstruct the residual subblocks by inverse transform, generate a prediction subblock by predicting the subblocks identified according to the reconstructed partition type information using the reconstructed motion information, and add the prediction subblocks and the residual subblocks. Image decoding step of reconstructing the subblock
Image encoding / decoding method comprising a.
매크로블록으로부터 분할된 서브블록을 예측하여 예측 서브블록을 생성하는 단계;
상기 서브블록과 상기 예측 서브블록을 감산하여 잔여 서브블록을 생성하는 단계;
상기 잔여 서브블록을 상기 서브블록의 크기에 따라 선택되는 변환을 이용하여 변환하고 양자화하여 양자화된 변환 계수를 생성하는 단계; 및
상기 양자화된 변환 계수를 부호화하여 부호화된 영상 데이터를 생성하는 단계
를 포함하는 것을 특징으로 하는 영상 부호화 방법.In the method of encoding an image,
Predicting a subblock divided from the macroblock to generate a predictive subblock;
Generating a residual subblock by subtracting the subblock and the prediction subblock;
Transforming and quantizing the residual subblock using a transform selected according to the size of the subblock to generate quantized transform coefficients; And
Generating encoded image data by encoding the quantized transform coefficients.
Image encoding method comprising a.
NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 상기 매크로블록에 대하여, 매크로블록 레이어 K(단, )의 화소 블록이 4개의 블록으로 분할되는 경우에 매크로블록 레이어 K+1의 서브블록들을 이용하는 것을 특징으로 하는 영상 부호화 방법.26. The method of claim 25, wherein generating the prediction subblocks comprises:
For the macroblock having the size of NxN (where N is an integer of 16 or more), the macroblock layer K (where, )of And the subblocks of the macroblock layer K + 1 when the pixel block is divided into four blocks.
NxN(단, N은 16 이상의 정수) 화소 블록의 크기를 갖는 상기 매크로블록에 대하여, N이 16보다 큰 경우 16x16 화소 블록 단위로 분할하여 서브블록을 예측하는 것을 특징으로 하는 영상 부호화 방법.26. The method of claim 25, wherein generating the prediction subblocks comprises:
And predicting a subblock by dividing the macroblock having a size of NxN (where N is an integer greater than or equal to 16) pixel blocks in units of 16x16 pixel blocks when N is larger than 16.
상기 매크로블록이 인트라 매크로블록인 경우, mxn 화소 단위로 상기 서브블록을 예측하되, 상기 m과 n은 4, 8 및 16 중 하나이고 서로 동일하지 않은 경우이거나 16보다 크며 N(N은 NxN 화소 블록의 크기를 갖는 매크로블록의 화소 단위) 이하의 정수인 것을 특징으로 하는 영상 부호화 방법.26. The method of claim 25, wherein generating the prediction subblocks comprises:
When the macroblock is an intra macroblock, the subblock is predicted in units of mxn pixels, wherein m and n are one of 4, 8, and 16, which are not equal to each other, or greater than 16, and N (N is an N × N pixel block. And a pixel unit of a macroblock having a size of?).
세 가지의 인트라 예측 모드 중에서 부호화 효율이 가장 좋은 예측 모드에 따른 예측 방향에 따라 상기 서브블록을 예측하는 것을 특징으로 하는 영상 부호화 방법.26. The method of claim 25, wherein generating the prediction subblocks comprises:
And predicting the subblock according to a prediction direction according to a prediction mode having the best encoding efficiency among three intra prediction modes.
상기 매크로블록이 인트라 매크로블록인 경우, 상기 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 상기 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25, wherein the quantized transform coefficient generation step,
When the macroblock is an intra macroblock, if the size of the subblock is one of 4x4, 4x8, and 8x4, 4x4 transform is used; if the size of the subblock is one of 8x8, 8x16, and 16x8, 8x8 transform is used. And 16x16 transform if the size of the subblock is 16x16 or larger.
상기 잔여 서브블록을 16x16 화소 잔여 블록으로 분할하고, 상기 분할된 16x16 화소 잔여 블록을 다시 16 개의 4x4 화소 잔여 블록으로 분할하며, 각 4x4 화소 잔여 블록을 4x4 변환을 이용하여 변환하여 16 개의 변환 블록을 생성하며, 상기 16 개의 변환 블록의 DC 성분으로 구성되는 DC 성분 블록을 4x4 변환을 이용하여 변환하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25, wherein the quantized transform coefficient generation step,
The remaining subblocks are divided into 16x16 pixel residual blocks, the divided 16x16 pixel residual blocks are further divided into 16 4x4 pixel residual blocks, and each 4x4 pixel residual block is transformed using 4x4 transform to convert 16 transform blocks. And converting a DC component block composed of DC components of the 16 transform blocks using 4x4 transform.
상기 4x4 화소 잔여 블록을 변환하는 4x4 변환과 상기 DC 성분 블록을 변환하는 4x4 변환은 서로 다른 변환 방식을 이용하는 것을 특징으로 하는 영상 부호화 방법.32. The method of claim 31,
And a 4x4 transform that transforms the 4x4 pixel residual block and a 4x4 transform that transforms the DC component block using different transform schemes.
상기 매크로블록이 인터 매크로블록인 경우, 4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나의 변환을 선택하여 상기 잔여 서브블록을 변환하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25, wherein the quantized transform coefficient generation step,
And when the macroblock is an inter macroblock, transforming the residual subblock by selecting one of 4x4 transform, 8x8 transform, 8x16 transform, 16x8 transform, and 16x16 transform.
상기 서브블록의 크기가 8x8보다 작은 경우에는 상기 잔여 서브블록을 4x4 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x8인 경우에는 상기 잔여 서브블록을 4x4 변환 및 8x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 8x16인 경우에는 상기 잔여 서브블록을 4x4 변환, 8x8 변환 및 8x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x8인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x8 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하며, 상기 서브블록의 크기가 16x16 이상인 경우에는 상기 서브블록의 잔여 블록을 4x4 변환, 8x8 변환 및 16x16 변환 중 부호화 비용이 가장 작은 변환을 이용하여 변환하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25, wherein the quantized transform coefficient generation step,
When the size of the subblock is smaller than 8x8, the residual subblock is transformed using 4x4 transform. When the size of the subblock is 8x8, the encoding cost of the residual subblock is smallest among 4x4 transform and 8x8 transform. If the size of the subblock is 8x16, the residual subblock is transformed using a transform having the lowest coding cost among 4x4, 8x8, and 8x16 transforms, and the size of the subblock is 16x8. In case of, the residual block of the subblock is transformed using a transform having the smallest coding cost among 4x4 transform, 8x8 transform, and 16x8 transform. And the 8x8 transform and the 16x16 transform are transformed using the transform having the lowest encoding cost.
상기 매크로블록이 인터 매크로블록인 경우, 상기 선택되는 변환의 종류를 나타내는 변환 타입을 부호화하여 변환 타입 데이터를 생성하는 단계
를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
If the macroblock is an inter macroblock, generating transform type data by encoding a transform type indicating a type of the selected transform;
The video encoding method further comprises.
상기 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계;
상기 복원되는 잔여 서브블록과 상기 예측 서브블록을 가산하여 서브블록을 복원하는 단계; 및
상기 복원되는 서브블록을 필터링하는 단계
를 더 포함하되, 상기 서브블록을 필터링하는 단계는 상기 복원되는 서브블록 내의 상기 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Inverse quantization and inverse transformation of the quantized transform coefficients to recover a residual subblock;
Reconstructing a subblock by adding the reconstructed residual subblock and the prediction subblock; And
Filtering the reconstructed subblock
The method of claim 1, wherein the filtering of the subblocks comprises performing deblocking filtering on a boundary between a left side and an upper side of a block according to the selected transform in the reconstructed subblock.
상기 매크로블록의 분할 타입 정보를 부호화하여 분할 타입 데이터를 생성하는 단계
를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating partition type data by encoding partition type information of the macroblock;
The video encoding method further comprises.
분할 레이어별 분할 타입 번호에 의해 식별되되,
상기 분할 타입 데이터를 생성하는 단계는 상기 분할 레이어별 분할 타입 번호를 분할 타입 번호 분호화 순서에 따라 순차적으로 부호화함으로써 상기 분할 타입 정보를 부호화하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25, wherein the split type information,
Identified by the division type number per division layer,
The generating of the partition type data may include encoding the partition type information by sequentially encoding the partition type number for each partition layer according to a partition type number encoding order.
상기 서브블록의 크기에 따른 CBPX 플래그와 CBP를 부호화하여 CBP 데이터를 생성하는 단계
를 더 포함하되,
상기 CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 상기 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그인 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating CBP data by encoding a CBPX flag and a CBP according to the size of the subblock;
Include more,
The CBPX flag is a flag indicating whether there is a non-zero quantized transform coefficient in an XxX pixel block, and the CBP is a flag indicating whether there is a non-zero quantized transform coefficient in a 16x16 pixel block. .
상기 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 부호화하여 SKIP_N 플래그 데이터를 생성하는 단계
를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating SKIP_N flag data by encoding a SKIP_N flag indicating whether the macroblock is a SKIP macroblock;
The video encoding method further comprises.
상기 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 부호화하여 매크로블록 타입 플래그 데이터를 생성하는 단계
를 더 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating macroblock type flag data by encoding a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock;
The video encoding method further comprises.
상기 부호화된 영상 데이터를 포함하는 부호화 데이터를 생성하는 단계
를 더 포함하되,
상기 매크로블록이 포함되는 픽처가 인트라 픽처인 경우, 상기 부호화 데이터는 분할 타입 필드, 인트라 예측 모드 필드, CBPX 플래그/CBP 필드 및 변환 계수 필드 중 하나 이상을 추가로 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating encoded data including the encoded image data
Include more,
When the picture including the macroblock is an intra picture, the encoded data further includes one or more of a division type field, an intra prediction mode field, a CBPX flag / CBP field, and a transform coefficient field. .
상기 부호화된 영상 데이터를 포함하는 부호화 데이터를 생성하는 단계
를 더 포함하되,
상기 매크로블록이 포함되는 픽처가 인터 픽처인 경우, 상기 부호화 데이터는 SKIP_N 플래그 필드, 매크로블록 타입 필드 및 분할 타입 필드 중 하나 이상을 포함하고, 상기 매크로블록이 인트라 매크로블록인 경우에는 인트라 예측 모드 필드, CBPX 플래그/CBP 필드 및 변환 계수 필드 중 하나 이상을 추가로 포함하며, 상기 매크로블록이 인터 매크로블록인 경우에는 SKIPX 플래그 필드, 차분 움직임 벡터/참조 픽처 인덱스 필드, CBPX 플래그 필드, 변환 타입 필드, CBP 필드 및 변환 계수 필드 중 하나 이상을 추가로 포함하는 것을 특징으로 하는 영상 부호화 방법.The method of claim 25,
Generating encoded data including the encoded image data
Include more,
When the picture including the macroblock is an inter picture, the encoded data includes at least one of a SKIP_N flag field, a macroblock type field, and a split type field, and when the macroblock is an intra macroblock, an intra prediction mode field. And at least one of a CBPX flag / CBP field and a transform coefficient field, and if the macroblock is an inter macroblock, a SKIPX flag field, a differential motion vector / reference picture index field, a CBPX flag field, a transform type field, And at least one of a CBP field and a transform coefficient field.
부호화 데이터를 복호화하여 분할 타입 정보, 인트라 예측 모드 및 양자화된 변환 계수를 복원하는 단계;
상기 복원되는 분할 타입 정보에 따라 식별되는 서브블록의 크기에 따라 선택되는 변환을 이용하여 상기 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계;
상기 복원되는 분할 타입 정보에 따라 식별되는 서브블록을 상기 복원되는 인트라 예측 모드를 이용하여 예측하여 예측 서브블록을 생성하는 단계; 및
상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 단계
를 포함하는 것을 특징으로 하는 영상 복호화 방법.In the method of decoding an image,
Decoding encoded data to recover partition type information, an intra prediction mode, and a quantized transform coefficient;
Inversely quantizing and inversely transforming the quantized transform coefficients using a transform selected according to a size of a subblock identified according to the partition type information to be restored to recover a residual subblock;
Generating a prediction subblock by predicting a subblock identified according to the reconstructed partition type information using the reconstructed intra prediction mode; And
Reconstructing the subblock by adding the prediction subblock and the residual subblock
Image decoding method comprising a.
상기 서브블록의 크기에 따라 선택되는 변환은,
상기 서브블록의 크기가 4x4, 4x8 및 8x4 중 하나이면 4x4 변환을 이용하고, 상기 서브블록의 크기가 8x8, 8x16 및 16x8 중 하나이면 8x8 변환을 이용하며, 서브블록의 크기가 16x16 이상이면 16x16 변환을 이용하는 것을 특징으로 하는 영상 복호화 방법.The method of claim 44,
The transform selected according to the size of the subblock,
If the size of the subblock is one of 4x4, 4x8 and 8x4, 4x4 transform is used.If the size of the subblock is one of 8x8, 8x16 and 16x8, 8x8 transform is used. If the size of the subblock is 16x16 or more, 16x16 transform is used. Image decoding method characterized in that using.
부호화 데이터를 복호화하여 분할 타입 정보, 움직임 정보, 변환 타입 정보 및 양자화된 변환 계수를 복원하는 단계;
상기 복원되는 변환 타입 정보에 의해 식별되는 변환을 이용하여 상기 양자화된 변환 계수를 역 양자화 및 역 변환하여 잔여 서브블록을 복원하는 단계;
상기 복원되는 분할 타입 정보에 따라 식별되는 서브블록으로 분할하고 상기 서브블록을 상기 복원되는 움직임 정보를 이용하여 예측하여 예측 서브블록을 생성하는 단계; 및
상기 예측 서브블록과 상기 잔여 서브블록을 가산하여 상기 서브블록을 복원하는 단계
를 포함하는 것을 특징으로 하는 영상 복호화 방법.In the method of decoding an image,
Decoding encoded data to recover partition type information, motion information, transform type information, and quantized transform coefficients;
Inversely quantizing and inversely transforming the quantized transform coefficients using a transform identified by the recovered transform type information to recover a residual subblock;
Generating a prediction subblock by dividing the subblock into identified subblocks according to the reconstructed partition type information and predicting the subblock using the reconstructed motion information; And
Reconstructing the subblock by adding the prediction subblock and the residual subblock
Image decoding method comprising a.
4x4 변환, 8x8 변환, 8x16 변환, 16x8 변환 및 16x16 변환 중 하나인 것을 특징으로 하는 영상 복호화 방법.47. The method of claim 46, wherein the transform identified by the transform type information is:
And a 4x4 transform, an 8x8 transform, an 8x16 transform, a 16x8 transform, and a 16x16 transform.
상기 복원되는 서브블록 내의 상기 선택되는 변환에 따른 블록의 왼쪽과 위쪽의 경계에 디블로킹 필터링을 수행하는 단계
를 더 포함하는 것을 특징으로 하는 영상 복호화 방법.The method of claim 46,
Performing deblocking filtering on a boundary between a left side and an upper side of the block according to the selected transform in the reconstructed subblock;
The video decoding method further comprising.
상기 부호화 데이터로부터 추출되는 SKIP_N 플래그 데이터를 복호화하여 상기 매크로블록이 SKIP 매크로블록인지 여부를 나타내는 SKIP_N 플래그를 복원하는 단계를 추가로 포함하는 것을 특징으로 하는 영상 복호화 방법.The method of claim 46,
And restoring a SKIP_N flag indicating whether the macroblock is a SKIP macroblock by decoding SKIP_N flag data extracted from the encoded data.
상기 부호화 데이터로부터 추출되는 매크로블록 타입 플래그 데이터를 복호화하여 상기 매크로블록이 인트라 매크로블록인지 또는 인터 매크로블록인지 여부를 나타내는 매크로블록 타입 플래그를 복원하는 단계를 추가로 포함하는 것을 특징으로 하는 영상 복호화 방법.The method of claim 46,
Decoding the macroblock type flag data extracted from the encoded data, and restoring a macroblock type flag indicating whether the macroblock is an intra macroblock or an inter macroblock. .
분할 레이어별 분할 타입 번호에 의해 식별되는 것을 특징으로 하는 영상 복호화 방법.47. The method of claim 44 or 46, wherein the partition type information is
A video decoding method characterized by being identified by a partition type number for each partition layer.
상기 부호화 데이터로부터 추출되는 CBP 데이터를 복호화하여 상기 서브블록의 크기에 따른 CBPX 플래그와 CBP를 복원하는 단계
를 더 포함하되,
상기 CBPX 플래그는 XxX 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그이고 상기 CBP는 16x16 화소 블록 내에 0이 아닌 양자화된 변환 계수가 있는지 여부를 나타내는 플래그인 것을 특징으로 하는 영상 복호화 방법.
47. The method of claim 44 or 46,
Restoring a CBPX flag and a CBP according to the size of the subblock by decoding the CBP data extracted from the encoded data;
Include more,
The CBPX flag is a flag indicating whether there is a non-zero quantized transform coefficient in an XxX pixel block, and the CBP is a flag indicating whether there is a non-zero quantized transform coefficient in a 16x16 pixel block. .
Priority Applications (12)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510427911.7A CN104954799B (en) | 2009-10-21 | 2010-10-21 | Method for video coding |
PCT/KR2010/007252 WO2011049392A2 (en) | 2009-10-21 | 2010-10-21 | Image encoding and decoding apparatus and method |
CN201510428013.3A CN104935935B (en) | 2009-10-21 | 2010-10-21 | Method for video coding, video encoding/decoding method and video decoder |
CN201510427905.1A CN104935934B (en) | 2009-10-21 | 2010-10-21 | Video coding apparatus |
US13/503,169 US9137545B2 (en) | 2009-10-21 | 2010-10-21 | Image encoding and decoding apparatus and method |
KR1020100103075A KR101534049B1 (en) | 2009-10-21 | 2010-10-21 | Video Coding and Decoding Method and Apparatus |
CN201080058670.9A CN102668565B (en) | 2009-10-21 | 2010-10-21 | Image coding and decoding apparatus and method |
CN201510060983.2A CN104661026B (en) | 2009-10-21 | 2010-10-21 | Image coding and decoding apparatus and method |
KR1020140183580A KR101673028B1 (en) | 2009-10-21 | 2014-12-18 | Video Coding and Decoding Method and Apparatus |
HK15106125.8A HK1205610A1 (en) | 2009-10-21 | 2015-06-26 | Image encoding and decoding apparatus and method |
US14/808,916 US9344731B2 (en) | 2009-10-21 | 2015-07-24 | Image encoding and decoding apparatus and method |
US14/808,993 US9344732B2 (en) | 2009-10-21 | 2015-07-24 | Image encoding and decoding apparatus and method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20090100443 | 2009-10-21 | ||
KR1020090100443 | 2009-10-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110043407A true KR20110043407A (en) | 2011-04-27 |
Family
ID=44048685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100035536A KR20110043407A (en) | 2009-10-21 | 2010-04-16 | Video coding and decoding method and apparatus |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20110043407A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130059015A (en) * | 2011-11-28 | 2013-06-05 | 한국전자통신연구원 | Method and apparatus for encoding adaptive intra prediction based on mode of valuable size partition in a macro block |
WO2013109115A1 (en) * | 2012-01-20 | 2013-07-25 | 삼성전자 주식회사 | Method and apparatus for entropy-encoding capable of parallel processing, and method and apparatus for entropy-decoding capable of parallel processing |
KR101357842B1 (en) * | 2011-09-30 | 2014-02-06 | 브로드콤 코포레이션 | Video coding sub-block sizing based on infrastructure capabilities and current conditions |
KR101427229B1 (en) * | 2011-09-20 | 2014-08-18 | 한양대학교 산학협력단 | Apparatus and Method for Video Encoding/Decoding using Adaptive Coding Order |
KR101484057B1 (en) * | 2011-11-07 | 2015-01-20 | 제닙 피티이.엘티디. | Image decoding apparatus |
CN112422973A (en) * | 2020-10-28 | 2021-02-26 | 西安万像电子科技有限公司 | Encoding method and device |
CN114513657A (en) * | 2016-07-05 | 2022-05-17 | 株式会社Kt | Method and apparatus for decoding video and method for encoding video |
WO2023132532A1 (en) * | 2022-01-07 | 2023-07-13 | 엘지전자 주식회사 | Feature encoding/decoding method and device, and recording medium in which bitstream is stored |
-
2010
- 2010-04-16 KR KR1020100035536A patent/KR20110043407A/en unknown
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101427229B1 (en) * | 2011-09-20 | 2014-08-18 | 한양대학교 산학협력단 | Apparatus and Method for Video Encoding/Decoding using Adaptive Coding Order |
KR101357842B1 (en) * | 2011-09-30 | 2014-02-06 | 브로드콤 코포레이션 | Video coding sub-block sizing based on infrastructure capabilities and current conditions |
KR101484057B1 (en) * | 2011-11-07 | 2015-01-20 | 제닙 피티이.엘티디. | Image decoding apparatus |
KR20130059015A (en) * | 2011-11-28 | 2013-06-05 | 한국전자통신연구원 | Method and apparatus for encoding adaptive intra prediction based on mode of valuable size partition in a macro block |
WO2013109115A1 (en) * | 2012-01-20 | 2013-07-25 | 삼성전자 주식회사 | Method and apparatus for entropy-encoding capable of parallel processing, and method and apparatus for entropy-decoding capable of parallel processing |
CN114513657A (en) * | 2016-07-05 | 2022-05-17 | 株式会社Kt | Method and apparatus for decoding video and method for encoding video |
CN114513657B (en) * | 2016-07-05 | 2024-06-04 | 株式会社Kt | Method and apparatus for decoding video and method for encoding video |
CN112422973A (en) * | 2020-10-28 | 2021-02-26 | 西安万像电子科技有限公司 | Encoding method and device |
WO2023132532A1 (en) * | 2022-01-07 | 2023-07-13 | 엘지전자 주식회사 | Feature encoding/decoding method and device, and recording medium in which bitstream is stored |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101868290B1 (en) | Video Coding and Decoding Method and Apparatus | |
KR101791242B1 (en) | Video Coding and Decoding Method and Apparatus | |
KR101874840B1 (en) | Video coding/decoding apparatus and method | |
US11889052B2 (en) | Method for encoding video information and method for decoding video information, and apparatus using same | |
KR101635830B1 (en) | Video Coding/Decoding Apparatus and Method Using Variable Size Macroblock | |
KR101316060B1 (en) | Decoding method of inter coded moving picture | |
KR101939699B1 (en) | Video Coding and Decoding Method and Apparatus | |
KR101479129B1 (en) | Video Coding Method and Apparatus Using Variable size Macroblock | |
US20160234497A1 (en) | Method of constructing merge list | |
KR20110043407A (en) | Video coding and decoding method and apparatus | |
KR20130067280A (en) | Decoding method of inter coded moving picture | |
KR20140135855A (en) | Method and apparatus for processing moving image | |
KR20140073430A (en) | Method and apparatus for image encoding/decoding | |
KR20150008337A (en) | Video decoding method and apparatus using the same |