KR20160106348A - 비디오 부호화 방법 및 그 장치 - Google Patents
비디오 부호화 방법 및 그 장치 Download PDFInfo
- Publication number
- KR20160106348A KR20160106348A KR1020150029137A KR20150029137A KR20160106348A KR 20160106348 A KR20160106348 A KR 20160106348A KR 1020150029137 A KR1020150029137 A KR 1020150029137A KR 20150029137 A KR20150029137 A KR 20150029137A KR 20160106348 A KR20160106348 A KR 20160106348A
- Authority
- KR
- South Korea
- Prior art keywords
- mode
- candidates
- rate
- encoder
- present
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 영상 부호화 방법 및 그 장치에 관한 것이다.
이에 따른 본 발명은, 이미 부호화가 완료된 주변 블록의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 결정하는 단계, 상기 결정된 후보 수가 기 설정된 후보 수 보다 적으면, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용(Rate-Distortion cost)을 계산하는 단계, 상기 선택된 후보의 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산하는 단계 및 상기 계산된 율-왜곡 비용을 기초로 선택된 부호화 모드에 따라 부호화된 영상을 출력하는 단계를 포함하는 것을 특징으로 하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
이에 따른 본 발명은, 이미 부호화가 완료된 주변 블록의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 결정하는 단계, 상기 결정된 후보 수가 기 설정된 후보 수 보다 적으면, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용(Rate-Distortion cost)을 계산하는 단계, 상기 선택된 후보의 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산하는 단계 및 상기 계산된 율-왜곡 비용을 기초로 선택된 부호화 모드에 따라 부호화된 영상을 출력하는 단계를 포함하는 것을 특징으로 하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
Description
본 발명은 비디오 부호화 방법 및 그 장치에 관한 것이다.
최근 ISO/IEC MPEG 및 ITU-T VCEG 표준화 그룹에서 공동으로 결성한 JCT-VC는, 차세대 비디오 표준으로 HEVC(High Efficiency Video Coding) 기술에 대한 표준화를 완료하였다. 영상 압축 기술은 HEVC를 통하여 기존에 최고의 압축률을 제공하던 H.264/AVC에 대비하여 약 50% 이상의 주관적 화질 향상을 달성하였으며, 이를 위해 압축 효율을 향상시킬 수 있는 정교한 부호화(Coding) 툴이 새롭게 제안되었다.
HEVC는 종래의 영상 압축 방식과 유사하게, 시간상으로 이전 또는 이후의 참조 화면(picture)으로부터 현재 화면에 포함된 픽셀 값을 예측하는 화면간(inter) 예측 부호화 기술, 현재 화면 내의 참조 픽셀 정보를 이용하여 현재 화면에 포함된 픽셀 값을 예측하는 화면내(Intra) 예측 부호화 기술, 출연 빈도가 높은 심볼(Symbol)에 짧은 부호를 할당하고, 출현 빈도가 낮은 심볼에 긴 부호를 할당하는 엔트로피 부호화 기술을 이용한다.
다만, 기존의 비디오 코덱들은 매크로 블록(16×16) 단위로 부호화를 수행한 반면, HEVC에서는 고해상도 비디오에 대한 최적의 압축 효율을 높이기 위해 CU(Coding Unit), PU(Prediction Unit), TU(Transform Unit) 별 최적의 압축 효율을 낼 수 있는 부호화 구조(Block Structure)를 지원한다.
HEVC는 부호화 예측 모드로써, 화면간 모드, 화면내 모드를 허용한다. 또한, HEVC는 잔차 신호 부호화 모드에 대하여, 스킵 모드 및 병합(MERGE) 모드를 허용한다.
스킵 모드는 현재 부호화하려는 블록의 움직임 정보와 동일한 움직임 정보를 갖는 후보가 존재하고 잔차 신호(Residual Signal)가 0인 경우에 적용된다. 즉, 스킵 모드에서는 움직임 정보 및 잔차 신호를 부호화하지 않는다.
병합 모드는 현재 부호화하려는 블록의 움직임 정보와 동일한 움직임 정보를 갖는 후보가 존재하고 잔차 신호가 존재하는 경우에 적용된다. 병합 모드는 스킵 모드와 동일하게 움직임 정보를 부호화하지 않지만, 잔차 신호(Residual Signal)를 부호화함으로써 화면간 압축 대비 압축 효율을 향상시킨다.
현재 HEVC를 포함한 대부분의 비디오 표준은 현재 부호화하려는 블록에 대한 율-왜곡 비용(Rate-Distortion cost)을 계산하여 최적의 부호화 모드를 결정한다. 즉, 현재의 비디오 표준에서는, 현재 부호화하려는 블록에 대한 스킵/병합 모드, 화면내/화면간 모드 각각의 율-왜곡 비용을 모두 구한 후, 율-왜곡 비용이 가장 작은 부호화 모드를 최적의 부호화 모드로 결정한다.
이러한 종래의 방식은, 부호화 효율을 향상시킬 수 있지만, 부호화기의 연산 복잡도가 상대적으로 높아져서 실시간 부호화기를 개발하기 어렵다는 단점을 갖는다.
현재 HEVC에서는 스킵 모드 및 병합 모드의 후보 수를 5개로 제안하고 있으며, 그에 따라 최적의 부호화 모드를 결정할 때, 5개의 후보에 모두에 대한 스킵/병합 모드의 율-왜곡 비용을 모두 계산하여야 한다. 특히, 병합 모드는 잔차 신호를 고려하여 율-왜곡 비용 계산하여야 하므로, 부호화기 복잡도가 증가되는 단점을 갖는다.
본 발명은 상기한 문제점을 해결하기 위한 것으로, 이미 부호화가 완료된 주변 블록(Neighboring Blocks)의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 선택하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
본 발명은, 스킵/병합 모드의 후보 수가 기 설정된 수(예를 들어, 5)보다 작은 경우, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용을 먼저 계산하고, 선택된 후보 중 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
본 발명은 상기한 문제점을 해결하기 위한 것으로, 이미 부호화가 완료된 주변 블록(Neighboring Blocks)의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 선택하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
본 발명은, 스킵/병합 모드의 후보 수가 기 설정된 수(예를 들어, 5)보다 작은 경우, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용을 먼저 계산하고, 선택된 후보 중 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산하는 비디오 부호화 방법 및 그 장치에 관한 것이다.
본 발명에 따른 비디오 부호화 방법 및 그 장치는, 스킵/병합 모드의 후보 수를 감소시킴으로써, 종래기술 보다 적은 수의 후보에 대한 율-왜곡 비용을 계산할 수 있으므로, 부호화기 복잡도를 감소시킬 수 있다.
도 1은 본 발명에 따른 비디오 부호화 방법을 나타낸 순서도이다.
도 2는 본 발명에 따른 최적의 부호화 모드 선택 방법을 나타낸 순서도이다.
도 3은 본 발명에 따른 스킵/병합 모드의 후보 수 결정 방법을 나타낸 순서도이다.
도 4는 이미 부호화가 완료된 주변 블록의 블록 배열을 나타낸 도면이다.
도 5는 공간상 후보의 블록 배열을 나타낸 도면이다.
도 6은 본 발명의 제1 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
도 7은 본 발명의 제1 실시 예에 후보 선택 방법의 일 예를 나타낸 도면이다.
도 8은 본 발명의 제2 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
도 9는 본 발명에 따른 부호화기의 구조를 나타낸 블록도이다.
도 2는 본 발명에 따른 최적의 부호화 모드 선택 방법을 나타낸 순서도이다.
도 3은 본 발명에 따른 스킵/병합 모드의 후보 수 결정 방법을 나타낸 순서도이다.
도 4는 이미 부호화가 완료된 주변 블록의 블록 배열을 나타낸 도면이다.
도 5는 공간상 후보의 블록 배열을 나타낸 도면이다.
도 6은 본 발명의 제1 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
도 7은 본 발명의 제1 실시 예에 후보 선택 방법의 일 예를 나타낸 도면이다.
도 8은 본 발명의 제2 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
도 9는 본 발명에 따른 부호화기의 구조를 나타낸 블록도이다.
본 명세서의 실시 예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우, 그 상세한 설명은 생략될 수 있다.
본 명세서에서 사용되는 용어로써, 부호화 유닛(Coding Unit)은 비디오 부호화 및 복호화의 기본 단위를 의미한다. 기본 단위는 하나의 화면을 분할하여 부호화 또는 복호화할 때 분할된 단위를 말하는 것으로, 유닛, 블록, 매크로 블록, 예측 단위(Prediction Unit; PU), 변환 단위(Transform Unit; TU) 등으로 명명될 수 있다. 하나의 부호화 유닛은 크기가 더 작은 하위 부호화 유닛으로 분할될 수 있다.
본 명세서에서 사용되는 용어로써, 블록(Block)은 샘플의 M×N 배열을 의미한다. M과 N은 임의의 양의 정수 값을 가지며, 본 발명에서 기술하는 블록의 의미는 부호화 유닛을 의미할 수 있다.
본 명세서에서 어떤 구성 요소가 다른 구성 요소에 “연결되어 있다.”거나 “접속되어 있다.”라고 언급된 때에는, 해당 구성 요소가 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있는 경우뿐만 아니라, 해당 구성 요소와 다른 구성 요소의 사이에 다른 구성 요소가 존재하는 경우도 포함하는 것으로 이해되어야 할 것이다.
본 명세서에서 사용되는 "포함한다," "포함할 수 있다." 등의 표현은 개시된 해당 기능, 동작, 구성 요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작, 구성 요소 등을 제한하지 않는다. 또한, 본 명세서에서, "포함하다." 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명의 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시 예 및 분리된 실시 예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
본 명세서에서 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
이하, 첨부된 도면을 참조하여 본 발명을 설명한다.
비디오 부호화기는 높은 부호화 효율을 제공하기 위하여, 부호화 유닛의 크기(예측 유닛 크기, 변환 유닛 크기를 더 포함하거나, 이와 동등한 의미일 수 있다), 부호화 모드(예측 모드를 더 포함하거나, 이와 동등한 의미일 수 있다), 움직임 정보 등의 조합을 최적화한다. 비디오 부호화기는 상기한 요소들에 대한 최적의 조합을 선택하기 위하여 율-왜곡 최적화(Rate-Distortion Optimization) 방식을 사용한다. 일반적으로, 율-왜곡 최적화 방식에서 최적의 조합은 율-왜곡 비용이 최소가 되는 조합으로 선택된다.
율-왜곡 최적화 방식은 최적의 조합을 선택하기 위해 율-왜곡 비용(Rate-Distortion cost)(율 왜곡)을 계산한다. 율-왜곡 비용 J는 다음의 수학식 1에 따라 계산될 수 있다.
상기 수학식 1에서 D는 해당 블록 내에서 원본 영상과 복원 영상의 SSD(Sum of Distortion), 즉 원본 변환 계수들과 복원된 변환 계수들 간의 차이 값들의 제곱에 대한 평균(mean square error)을 의미한다. R은 해당 블록을 부호화하는 데 필요한 비트 수, 즉 관련된 문맥 정보를 이용한 비트율을 의미한다. R은 예측 모드, 움직임 정보, 부호화 블록 플래그(coded block flag) 등의 부호화 파라미터 정보뿐만 아니라, 변환 계수를 부호화했을 때 발생되는 비트(bit)도 포함한다. λ는 라그랑지안 계수(Lagrangian multiplier)를 의미한다.
영상 부호화기에서는 정확한 D와 R을 계산하기 위해 화면내/화면간 예측, 변환, 양자화, 엔트로피 부호화, 역양자화, 역변환 등의 과정을 거치는데, 이러한 과정은 영상 부호화기의 복잡도를 크게 증가시킨다.
상기한 율-왜곡 최적화 방식의 복잡도 문제를 해결하기 위하여, 본 발명에서는 이미 부호화가 완료된 주변 블록(Neighboring Blocks)의 부호화 관련 정보를 기초로 스킵/병합 모드의 후보 수를 선택하고, 스킵/병합 모드의 후보 수가 기 설정된 수(예를 들어, 5)보다 작은 경우, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용을 먼저 계산한 후, 선택된 후보 중 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산함으로써, 최적의 부호화 모드 결정을 빠르게 할 수 있도록 한다.
이하에서는 상기한 본 발명에 따른 부호화 방법을 보다 구체적으로 설명한다.
도 1은 본 발명에 따른 비디오 부호화 방법을 나타낸 순서도이다.
도 1을 참조하면, 본 발명에 따른 부호화기는 스킵 모드 및 병합 모드 각각의 율-왜곡 비용을 계산한다(101). 또한, 부호화기는 화면내/화면간 모드의 율-왜곡 비용을 계산한다(102).
부호화기는 계산된 율-왜곡 비용을 기초로 최적의 부호화 모드를 선택한다(103). 부호화기는 계산된 율-왜곡 비용이 최저가 되는 모드를 최적의 부호화 모드로 선택할 수 있다. 이후에 부호화기는 선택된 부호화 모드에 따라 비디오 부호화를 수행한다(104).
이하에서는, 본 발명에 따라 최적의 부호화 모드를 선택하는 방법을 구체적으로 설명한다.
도 2는 본 발명에 따른 최적의 부호화 모드 선택 방법을 나타낸 순서도이다.
도 2를 참조하면, 본 발명에 따른 부호화기는 이미 부호화가 완료된 주변 블록의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 결정한다(201). 부호화 관련 정보는, 최종 부호화 모드, 스킵-병합 모드 선택 시 선택된 후보에 관한 정보 등을 포함할 수 있다. 본 발명에서 부호화기가 후보 수를 결정하는 방법은 이하에서 도 3을 참조하여 구체적으로 설명한다.
부호화기는 결정된 후보 수가 기 설정된 후보 수보다 작은지 여부를 판단한다(202). 이하의 실시 예들에서는, HEVC에서 제안된 바에 따라, 기 설정된 후보 수가 5인 경우를 예로 들어 설명하나 이에 한정되지 않으며, 본 발명의 기술적 사상이 변경되지 않는 범위 내에서 적용 분야 및 적용 분야에 대응하는 표준에 따라 다양한 변형이 가능하다.
결정된 후보 수가 기 설정된 후보 수보다 작지 않으면, 부호화기는 도 6의 실시 예에 따라 율-왜곡 비용을 계산한다(203). 반대로, 결정된 후보 수가 기 설정된 후보 수보다 작으면, 부호화기는 도 8의 실시 예에 따라 율-왜곡 비용을 계산한다(204). 구체적인 율-왜곡 비용의 계산 방법은, 이하에서 도 6 및 도 8을 각각 참조하여 설명한다.
이후에, 부호화기는 화면내/화면간 모드의 율-왜곡 비용을 계산하고(205), 부호화기는 계산된 율-왜곡 비용을 기초로 최적의 부호화 모드를 선택한다(206).
이하에서는, 상술한 본 발명에서, 스킵/병합 모드의 후보 수를 결정하는 방법을 구체적으로 설명한다.
도 3은 본 발명에 따른 스킵/병합 모드의 후보 수 결정 방법을 나타낸 순서도이다.
본 발명의 다양한 실시 예에서, 부호화기는 이미 부호화가 완료된 주변 블록의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 결정한다. 일반적으로, 도 4에 도시된 바와 같이 현재 부호화하려는 블록을 기준으로 좌측 및 상단의 블록은 이미 부호화가 완료된 블록이다. 따라서, 부호화기는 도 4에 도시된 바와 같이, 이미 부호화가 완료된 2개의 주변 블록의 부호화 관련 정보를 기초로 후보 수를 결정한다. 부호화 관련 정보는, 최종 부호화 모드, 스킵-병합 모드 선택 시 선택된 후보에 관한 정보 등을 포함할 수 있다.
이하에서는, 이미 부호화가 완료된 주변 블록으로 좌측 및 상단의 2개 블록을 예로 들어 설명하나 이에 한정되지 않으며, 본 발명의 기술적 사상이 변경되지 않는 범위 내에서 비디오 부호화 로직에 따라 다양한 변형이 가능하다.
일 실시 예에서, 부호화기는 이미 부호화가 완료된 주변 블록 중 적어도 하나의 최종 부호화 모드가 화면내 모드인지 여부를 판단한다(301). 이미 부호화가 완료된 주변 블록 중 적어도 하나의 최종 부호화 모드가 화면내 모드인 경우, 부호화기는 후보 수를 기 설정된 후보 수로 결정한다(302). 상술한 바와 같이 이하의 실시 예들에서는, 기 설정된 후보 수는 5로, 부호화기는 후보 수를 5로 결정한다.
일 실시 예에서, 부호화기는 이미 부호화가 완료된 주변 블록의 스킵/병합 모드 선택 시 선택된 후보가 공간적 후보군으로부터 선택되었는지 여부를 판단한다(303). 부호화기는 2개의 주변 블록의 스킵-병합 모드 선택 시 선택된 후보가, 도 5에 도시된 공간적 후보군으로부터 선택되었는지 여부를 판단한다.
이미 부호화가 완료된 주변 블록의 스킵-병합 모드 선택 시 선택된 후보가 공간적 후보군으로부터 선택되지 않은 경우, 부호화기는 후보 수를 기 설정된 후보 수로 결정한다(302).
이미 부호화가 완료된 주변 블록의 스킵-병합 모드 선택 시 선택된 후보가 공간적 후보군으로부터 선택된 경우, 부호화기는 후보 수를 기 설정된 수보다 작게 설정한다.
일 실시 예에서, 이미 부호화가 완료된 주변 블록의 스킵-병합 모드 선택 시 선택된 후보가 공간적 후보군으로부터 선택된 경우, 부호화기는 이미 부호화가 완료된 주변 블록의 최종 부호화 모드가 스킵 또는 병합 모드인지 여부를 판단한다(304). 부호화기는 2개의 주변 블록의 최종 부호화 모드가 스킵 또는 병합 모드인지 여부를 판단한다.
이미 부호화가 완료된 주변 블록의 최종 부호화 모드가 스킵 또는 병합 모드인 경우, 부호화기는 후보 수를 3으로 설정한다(305). 반면, 이미 부호화가 완료된 주변 블록의 최종 부호화 모드가 스킵 또는 병합 모드가 아닌 경우, 부호화기는 후보 수를 4로 설정한다(306). 상기한 후보 수 3 또는 4는 일 실시 예에 지나지 않으며 이에 한정되지 않고, 기 설정된 수보다 작은 임의의 수로 후보 수가 결정될 수 있다.
이하에서는, 결정된 후보 수에 따라, 스킵/병합 모드의 율-왜곡 비용을 계산하는 방법을 구체적으로 설명한다.
도 6은 본 발명의 제1 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
본 발명의 제1 실시 예는, 결정된 후보 수가 기 설정된 후보 수와 동일한 경우의 율-왜곡 비용 계산 방법에 관한 것이다. 이하의 실시 예에서는, 상술한 바와 같이 HEVC에서 제안된 바에 따라, 기 설정된 후보 수가 5인 경우를 예로 들어 설명한다.
도 6을 참조하면, 부호화기는 후보 수에 대응하는 후보를 선택한다(601). 부호화기는 현재 부호화하려는 블록의 5개 주변 블록 중 최대 4개의 후보를 선택할 수 있다. 이때, 부호화기는 도 5에 도시된 공간상 후보군(A0, A1, B0, B1, B2) 중 최대 4개의 후보를 선택할 수 있다. 일 실시 예에서, 부호화기는 도 7에 도시된 바와 같이, 이미 부호화가 완료된 이전 화면 내에서, 현재 부호화하려는 블록과 동일한 위치의 블록에 대한 2개의 블록(A, B) 중 최대 1개의 후보를 선택할 수도 있다.
부호화기는 선택된 후보에 대한 움직임 정보를 획득하고(602), 선택된 후보 각각에 대한 스킵 모드 및 병합 모드의 율-왜곡 비용을 계산한다(603).
이후에, 부호화기는 화면내/화면간 모드의 율-왜곡 비용을 계산하고, 계산된 율-왜곡 비용을 비교하여 최적의 부호와 모드를 선택한다.
도 8은 본 발명의 제2 실시 예에 따른 율-왜곡 비용 계산 방법을 나타낸 순서도이다.
본 발명의 제2 실시 예는, 결정된 후보 수가 기 설정된 후보 수보다 적은 경우의 율-왜곡 비용 계산 방법에 관한 것이다.
도 8을 참조하면, 부호화기는 후보 수에 대응하는 후보를 선택한다(801). 부호화기는 선택된 후보에 대한 움직임 정보를 획득하고(802), 선택된 후보 각각에 대한 스킵 모드 율-왜곡 비용을 계산한다(803).
다음으로, 부호화기는 선택된 후보 중 적어도 일부에 대한 병합 모드 율-왜곡 비용을 계산한다(804). 부호화기는 이미 부호화가 완료된 주변 블록의 부호화 관련 정보 및 예측 움직임 벡터(Predicted Motion Vector; PMV) 중 적어도 하나를 기초로, 선택된 후보 중 적어도 일부를 결정할 수 있다. 부호화 관련 정보는, 최종 부호화 모드 등을 포함할 수 있다.
일 실시 예에서, 부호화기는 이미 부호화가 완료된 주변 블록의 최종 부호화 모드가 모두 스킵 모드인 경우, 선택된 후보 중 1개의 후보에 대한 병합 모드 율-왜곡 비용을 계산할 수 있다. 여기서 이미 부호화가 완료된 주변 블록은 도 4에 도시된 블록일 수 있다.
HEVC는 64x64, 32x32, 16x16, 8x8 단위의 블록 사이즈에 대해 부호화 유닛(Coding Unit)이라 명명하고, 64x64 부호화 유닛부터 쿼드트리 구조로 블록 사이즈에 따라 율-왜곡 비용을 계산한다. 일례로, 현재 부호화하려는 블록(부호화 유닛과 동일 개념) 사이즈가 16x16이라면, 이미 32x32 블록에 대한 부호화 최적모드가 결정된 상태이며 이때 32x32 블록의 최적 모드가 스킵 모드일 경우, 현재 블록의 최적모드 역시 스킵 모드로 판정될 확률이 높아진다. 따라서, 이미 부호화가 완료된 주변 블록의 최종 부호화 모드가 모두 스킵 모드인 경우, 현재 부호화하려는 모드가 병합 모드로 선택될 확률이 낮을 것으로 예상되기 때문에, 선택된 후보 중 1개의 후보에 대해서만 병합 모드 율-왜곡 비용을 계산할 수 있다.
또는, 일 실시 예에서, 부호화기는 현재 부호화하려는 블록의 화면간 예측을 위한 PMV가 Zero Vector로 결정된 경우, 선택된 후보 중 1개의 후보에 대한 병합 모드 율-왜곡 비용을 계산할 수 있다.
이후에, 부호화기는 화면내/화면간 모드의 율-왜곡 비용을 계산하고, 계산된 율-왜곡 비용을 비교하여 최적의 부호와 모드를 선택한다.
도 9는 본 발명에 따른 부호화기의 구조를 나타낸 블록도이다.
도 9를 참조하면, 본 발명에 따른 비디오 부호화기(900)는 입력부(901), 제어부(902) 및 저장부(905)를 포함하여 구성될 수 있다.
입력부(901)는 부호화하고자 하는 비디오를 입력받을 수 있다. 비디오는 소정의 크기를 가진 부호화 블록 단위로 입력될 수 있으며, HEVC 표준이 적용된 경우, CU, PU, TU 크기의 블록으로 입력될 수 있다.
제어부(902)는 입력되는 비디오의 부호화를 수행한다. 제어부(902)는 본 발명에 따른 부호화 방법에 따라, 이미 부호화가 완료된 주변 블록(Neighboring Blocks)의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 선택하고, 스킵/병합 모드의 후보 수가 기 설정된 수(예를 들어, 5)보다 작은 경우, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용을 먼저 계산하고, 선택된 후보 중 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산한다. 제어부(902)의 구체적인 동작은 상술한 바와 같다.
다양한 실시 예에서, 제어부(902)는 논리적으로 예측부, 부호화부, 복호화부, 임계값 판단부, 최적 모드 판단부, 필터부, 감/가산부 등으로 세분화될 수 있으나, 본 명세서에서는 부호화기의 물리적 구조만을 도시하였다. 그러나 설명하기에 따라서 제어부(902)는 다양한 형태의 논리적/물리적 구조를 가질 수 있으며, 제어부(902)가 본 발명의 기술 사상에 따른 부호화 동작을 수행하는 한, 어떠한 형태로 구현되더라도 본 발명의 권리 범위에 속함은 자명하다 할 것이다.
저장부(903)는 제어부(902)에 의하여 판단된 율-왜곡 비용, 임계값 등을 저장하거나, 제어부(903)에 의하여 부호화/복호화된 데이터들을 임시 또는 영구적으로 저장할 수 있다.
본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 그리고 본 명세서와 도면에 개시된 실시 예들은 본 발명의 내용을 쉽게 설명하고, 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서 본 발명의 범위는 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
900: 부호화기
901: 입력부
902: 제어부 903: 저장부
902: 제어부 903: 저장부
Claims (1)
- 이미 부호화가 완료된 주변 블록의 부호화 관련 정보를 기초로, 스킵/병합 모드의 후보 수를 결정하는 단계;
상기 결정된 후보 수가 기 설정된 후보 수 보다 적으면, 선택된 후보에 대한 스킵 모드의 율-왜곡 비용(Rate-Distortion cost)을 계산하는 단계;
상기 선택된 후보의 적어도 일부에 대한 병합 모드의 율-왜곡 비용을 계산하는 단계; 및
상기 계산된 율-왜곡 비용을 기초로 선택된 부호화 모드에 따라 부호화된 영상을 출력하는 단계를 포함하는 것을 특징으로 하는 비디오 부호화 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150029137A KR20160106348A (ko) | 2015-03-02 | 2015-03-02 | 비디오 부호화 방법 및 그 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150029137A KR20160106348A (ko) | 2015-03-02 | 2015-03-02 | 비디오 부호화 방법 및 그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20160106348A true KR20160106348A (ko) | 2016-09-12 |
Family
ID=56950203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150029137A KR20160106348A (ko) | 2015-03-02 | 2015-03-02 | 비디오 부호화 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20160106348A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018117334A1 (ko) * | 2016-12-21 | 2018-06-28 | 전자부품연구원 | 고효율 비디오 부호화 모드 결정방법 및 결정장치 |
CN117692648A (zh) * | 2024-02-02 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、设备、存储介质和计算机程序产品 |
-
2015
- 2015-03-02 KR KR1020150029137A patent/KR20160106348A/ko unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018117334A1 (ko) * | 2016-12-21 | 2018-06-28 | 전자부품연구원 | 고효율 비디오 부호화 모드 결정방법 및 결정장치 |
CN117692648A (zh) * | 2024-02-02 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、设备、存储介质和计算机程序产品 |
CN117692648B (zh) * | 2024-02-02 | 2024-05-17 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、设备、存储介质和计算机程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101903602B1 (ko) | 영상 복호화 방법 및 장치 | |
US20180376137A1 (en) | Method and apparatus for image encoding/decoding | |
KR102412934B1 (ko) | 인트라 예측 방법 및 그 장치 | |
WO2010004939A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
KR20110018188A (ko) | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
KR20130085392A (ko) | 인트라 예측 처리 속도 향상을 위한 비디오의 부호화 방법 및 장치, 비디오의 복호화 방법 및 장치 | |
US11962803B2 (en) | Method and device for intra-prediction | |
CN113810686B (zh) | 一种编解码方法、装置及其设备 | |
JP2008271127A (ja) | 符号化装置 | |
KR101603887B1 (ko) | Hevc에서의 고속 cu 결정을 통한 부호화방법 | |
KR20160106348A (ko) | 비디오 부호화 방법 및 그 장치 | |
KR20140043015A (ko) | 영상 부호화 방법 및 장치 | |
KR101475286B1 (ko) | 인트라 예측 방법 및 장치, 그리고 영상 처리 장치 | |
JP4697802B2 (ja) | 動画像予測符号化方法および装置 | |
KR20130049604A (ko) | 엔트로피 부호화에서 모드 전환 방법 | |
KR20240122241A (ko) | 영상 부호화/복호화 방법 및 장치 | |
KR20160108958A (ko) | 비디오 부호화 방법 및 그 장치 | |
KR20160092816A (ko) | 비디오 부호화 방법 및 그 장치 | |
KR20130055316A (ko) | 화면내 예측 부호화를 위한 영상 부호화/복호화 방법 및 장치 | |
KR20140079519A (ko) | 평균 양자화 파라메터를 이용한 양자화 파라메터 부호화 방법 |