DE69227185T2 - Bilddatenkodier/dekodierverfahren und -vorrichtung - Google Patents
Bilddatenkodier/dekodierverfahren und -vorrichtungInfo
- Publication number
- DE69227185T2 DE69227185T2 DE69227185T DE69227185T DE69227185T2 DE 69227185 T2 DE69227185 T2 DE 69227185T2 DE 69227185 T DE69227185 T DE 69227185T DE 69227185 T DE69227185 T DE 69227185T DE 69227185 T2 DE69227185 T2 DE 69227185T2
- Authority
- DE
- Germany
- Prior art keywords
- frame
- image data
- field
- coding
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 98
- 230000033001 locomotion Effects 0.000 claims abstract description 103
- 239000013598 vector Substances 0.000 claims abstract description 39
- 238000001514 detection method Methods 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims 1
- 239000000872 buffer Substances 0.000 abstract description 40
- 230000015654 memory Effects 0.000 abstract description 39
- 230000009466 transformation Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 45
- 238000013139 quantization Methods 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 12
- 238000010276 construction Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
- H04N9/8047—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/112—Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
- H04N7/52—Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
- H04N7/54—Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal the signals being synchronous
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die Erfindung betrifft ein Codierverfahren und eine Codiervorrichtung zur hocheffektiven Codierung von Bildsignalen durch Orthogonaltransformation, ein Bilddatendecodierverfahren und eine Bilddatendecodiervorrichtung zur Decodierung von Bilddaten resultierend aus hocheffizienter Codierung und ein Bildaufzeichnungsmedium.
- Gemäß einem Entwurf zur Standardisierung für ein hocheffizientes Codiersystem für Bildsignale wie sie durch die Bewegtbildexpertengruppe (MPEG) vorgeschlagen wird, wird ein hocheffizientes Codiersystem für Bildsignale für ein sogenanntes digitales Speichermedium beschrieben. Das folgende ist das Prinzip des hocheffizienten Codiersystems durch die MPEG.
- D. h. bei diesem hocheffizienten Codiersystem wird zuerst eine Differenz zwischen Bildern herangenommen, um die Redundanz entlang des Zeitmaßstabes zu verringern. Anschließend wird eine Diskret-Cosinustransformation (DCT) und eine Variabellängencodierung (VLC) ausgeführt, um die Redundanz entlang der Raumachse zu verringern.
- Die Redundanz entlang der Zeitskala wird zunächst erläutert.
- Im allgemeinen zeigt ein bestimmtes Bild in einer aufeinanderfolgenden Folge von Bewegtbildern, d. h. ein Bild an einem gegebenen Zeitpunkt eine große Ähnlichkeit zu zeitlich vorangehenden und zeitlich nachfolgenden Bildern. Durch Herannehmen einer Differenz zwischen einem jetzt zu codierenden Bild und einem zeitlich späteren Bild und durch Übertragung der Differenz, wie in Fig. 1 gezeigt ist, wird es daher möglich, die Redundanz entlang der Zeitskala zu verringern und damit die Menge der zu übertragenden Information. Das auf diese Weise codierte Bild wird als ein prädiktiv codiertes Bild, P-Bild oder P-Vollbild bezeichnet, wie später erläutert wird.
- Ähnlich wird es durch Herannehmen einer Differenz zwischen einem jetzt zu codierenden Bild und einem zeitlich späteren Bild, einem zeitlich früheren Bild oder einem aus dem zeitlich späteren und zeitlich früheren Bildern erzeugten interpolierten Bild und durch Übertragung der kleinsten der Differenzen möglich, die Redundanz entlang der Zeitskala zu verringern und damit die zu übertragende Information. Das auf diese Weise codierte Bild wird ein bidirektional prädiktiv codiertes Bild, B-Bild oder B- Vollbild bezeichnet, wie später erläutert wird. In Fig. 1 ist ein durch I bezeichnetes Bild ein intra-codiertes Bild, wie später erläutert werden wird, während durch P und B in der Figur bezeichnete Bilder die oben erwähnten P-Bilder bzw. B-Bilder sind.
- Zur Erzeugung von Vorhersagebildern wird eine sogenannte Bewegungskompensation ausgeführt. Bei der Bewegungskompensation wird ein Block von 16 · 16 Pixeln, später als Makroblock bezeichnet, und bestehend aus Einheitsblöcken jeweils bestehend aus 8 · 8 Pixeln, vorbereitet, wobei einer dieser Makroblöcke des vorangehenden Bildes, der in der Nähe des betreffenden Makroblockes ist und die geringsten der Differenzen aufweist, aufgefunden wird und eine Differenz zwischen dem betreffenden Makroblock und dem so aufgefundenen Makroblock herangenommen wird, um die zu übertragende Datenmenge zu verringern. Beispielsweise wird bei dem oben erwähnten prädiktiv codierten Bild oder P-Bild eines der durch Herannehmen einer Differenz des Vorhersagebildes und des bewegungskompensierten Vorhersagebildes erzeugten Bilddaten und der nicht durch Herannehmen einer Differenz zwischen dem Vorhersagebild und dem bewegungskompensierten Vorhersagebild erzeugten Bilddaten ausgewählt, welches jeweils eine kleinere Datenmenge aufweist, und auf Basis des 16 · 16-Pixel-Makroblockes als Einheit codiert.
- Jedoch muß in einem solchen Fall eine größere Datenmenge für einen Bildabschnitt übertragen werden, der hinter einem bewegten Objekt aufgetaucht ist. Unter Berücksichtigung dieses wird bei dem oben erwähnten bidirektional codierten Bild oder B-Bild eines der Bilddaten entsprechend der Differenz zwischen den jetzt zu codierenden Bilddaten und den decodierten und bewegungskompensierten zeitlich späteren Bilddaten, der Bilddaten entsprechend der Differenz zwischen den jetzt zu codierenden Bilddaten und den decodierten und bewegungskompensierten zeitlich früheren Bilddaten, der Bilddaten entsprechend der Differenz zwischen den jetzt zu codierenden und interpolierten Bilddaten, die durch Addition der decodierten und bewegungskompensierten zeitlich früheren und zeitlich späteren Bilddaten vorbereitet wurden, und den Bilddaten für die die Differenz nicht herangenommen wird, d. h. der jetzt zu codierenden Bilddaten codiert, welche jeweils die kleinste Datenmenge aufweisen.
- Die Redundanz entlang der räumlichen Achse wird im folgenden erläutert.
- Die Differenz der Bilddaten wird nicht direkt übertragen, sondern durch Diskret- Cosinustransformation (DCT) von einem 8 · 8-Pixel-Einheitsblock zu einem anderen verarbeitet. Die DCT repräsentiert ein Bild anstelle des Pixel-Pegels in Abhängigkeit davon, welche Frequenzkomponenten einer Cosinustransformation in einem Bild enthalten sind und in welchem Umfang diese Frequenzkomponenten enthalten sind, Beispielsweise werden durch zweidimensionale DCT Bilddaten des 8 · 8- Einheitsblockes in einen 8 · 8-Koeffizientenblock der Komponenten der Cosinusfunktion umgewandelt. Beispielsweise repräsentieren Bildsignale einer Naturszene, wie sie durch eine Fernsehkamera aufgenommen wird, häufig sanfte Signale. In einem solchen Fall kann die Bilddatenmenge durch Verarbeitung der Bildsignale mit DCT effizient verringert werden.
- Die durch das oben erwähnte Codiersystem gehandhabte Datenstruktur ist in Fig. 2 gezeigt. Die in Fig. 2 gezeigte Datenstruktur enthält, angefangen von dem unteren Ende, eine Blockschicht, eine Makroblock-Schicht, eine Rahmen(Slice)-Schicht, eine Bildschicht, eine Bildgruppen(GOP)-Schicht und eine Videosequenz-Schicht. Die Datenstruktur wird nun angefangen von der unteren Schicht unter Bezugnahme auf Fig. 2 erläutert.
- Zunächst besteht als Blockschicht jeder Block der Blockschicht aus 8 · 8 benachbarten Pixeln, d. h. 8 Pixeln von 8 Zeilen Luminanz oder Farbdifferenz. Die oben erwähnte DCT wird für jede dieser Einheitblöcke angewandt.
- Die Makroblöcke der Makroblockschicht bestehen aus linken und rechten oberen und unteren vier benachbarten Luminanzblöcken oder Einheits-Luminanzblöcken Y0, Y1, Y2 und Y3 und Farbdifferenzblöcken oder Einheits-Farbdifferenzblöcken Cr, Cb, die an den gleichen Positionen auf dem Bild wie die Luminanzblöcke sind, wie unter E in Fig. 2 gezeigt ist. Diese Blöcke werden in der Reihenfolge Y0, Y1, Y2, Y3, Cr und Cb übertragen. Welches Bild als Vorhersagebild, d. h. als Referenzbild zur Differenzermittlung oder ob eine Differenz nicht übertragen zu werden braucht, wird auf der Makroblockbasis entschieden.
- Die oben erwähnte Rahmen-Schicht besteht aus einem oder mehreren in der Bildabtastsequenz angeordneten Makroblöcken, wie unter D in Fig. 2 gezeigt ist. An einem Kopfabschnitt des Rahmens wird die Differenz der Gleichstromkomponente und des Bewegungsvektors im Bild zurückgesetzt. Andererseits enthält der erste Makroblock Daten, die die Position innerhalb des Bildes angeben, so daß eine Umsetzung im Falle des Auftretens eines Fehlers gemacht werden kann. Daher ist die Länge oder Startposition des Rahmens zufällig und kann in Abhängigkeit von dem Fehlerzustand oder dem Übertragungskanal geändert werden.
- In der Bildschicht besteht jedes Bild aus wenigstens einem oder mehreren Rahmen, wie unter C in Fig. 2 gezeigt ist. Jedes Bild kann in ein intra-codiertes Bild (I-Bild oder I- Volbild), ein prädiktiv codiertes Bild (P-Bild oder P-Vollbild), ein bidirektional codiertes Bild (B-Bild oder B-Vollbild) oder DC-intra-codiertes Bild (DC-codiertes (D) Bild) klassifiziert werden.
- Es sei erwähnt, daß zur Codierung des intracodierten Bildes oder I-Bildes nur die Information, die innerhalb jedes Bildes eingeschlossen ist, verwendet wird. In anderen Worten wird zur Codierung des I-Bildes nur die in dem betreffenden Bild enthaltene Information verwendet. Daher wird zur Codierung eines Bildes durch Intra-Codierung das Bild direkt ohne Heranziehung einer Differenz diskret-cosinustransformiert. Obwohl dieses Codiersystem gewöhnlich eine schlechte Effizienz aufweist, wird ein beliebiger Zugriff oder eine Hochgeschwindigkeitswiedergabe durch Einfügung dieser Bilder an beliebigen Positionen ermöglicht.
- Bei dem prädiktiv codierten Bild (P-Bild) wird das zeitlich vorher positionierte und an einem Eingang schon decodierte I-Bild oder P-Bild als ein Vorhersagebild verwendet (Referenzbild bei der Differenzerstellung). So wird die Codierung der Differenz zwischen dem Vorhersagebild und dem bewegungskompensierten Vorhersagebild oder die direkte Codierung des Vorhersagebildes, d. h. ohne Heranziehung der Differenz, auf Makroblockbasis ausgewählt, was jeweils effizienter ist.
- Bei dem bidirektional codierten Bild oder B-Bild werden drei Typen von Bildern, d. h. ein zeitlich vorher positioniertes und schon decodiertes I-Bild, ein zeitlich vorher positioniertes und schon decodiertes P-Bild und ein aus diesen drei Bildern erhaltenes interpoliertes Bild als Vorhersagebild verwendet. Auf diese Weise kann die Codierung der Differenz zwischen dem Vorhersagebild und dem bewegungskompensierten Bild und die Intra-Codierung auf Makroblockbasis ausgewählt werden, was jeweils effizienter ist.
- Das DC-intracodierte Bild ist das intracodierte Bild, das nur aus den Gleichstromkomponenten (DC-Komponenten) bei der DCT besteht und welches nicht in der gleichen Sequenz wie die verbleibenden drei Bilder existieren kann.
- Die Bildgruppen-Schicht (GOP-Schicht) besteht aus einem oder mehreren I-Bildern und keinem oder mehreren Nicht-I-Bildern, wie unter B in Fig. 2 gezeigt ist. Der Abstand zwischen den I-Bildern, wie 9, oder der Abstand zwischen I-Bildern oder B-Bildern, wie 3, ist beliebig. Daneben kann die Entfernung zwischen den I-Bilder oder den B- Bildern innerhalb der GOP-Schicht geändert werden.
- Die Videosequenzschicht besteht aus einem oder mehreren GOP-Schichten mit der gleichen Bildgröße oder der gleichen Bildrate, wie in Fig. 2 unter A gezeigt ist.
- Zur Übertragung der mit dem hocheffizienten Codiersystem durch MPEG, wie oben beschrieben, standardisierten Bewegtbilder werden durch Komprimierung eines Bildes in sich selbst erzeugte Bilddaten übertragen und anschließend eine Differenz zwischen dem Bild und dem bewegungskompensierten gleichen Bild übertragen.
- Jedoch wurde das Auftreten des folgenden Problems beobachtet, wenn das zu codierende Bild ein verschachteltes Bild aufgrund einer im Zeilensprungverfahren verschachtelten Abtastung ist.
- D. h. wenn ein aus einer Abtastung im Zeilensprungverfahren resultierendes Bild auf Teilbild-für-Teilbild-Basis codiert wird, tritt eine Differenz der Vertikalpositionen abwechselnd von Teilbild zu Teilbild auf. Wenn ein stationärer Teil eines Bewegtbildes übertragen wird, werden daher Differenzdaten an einem Rand zwischen den Teilbildern erzeugt, obwohl der Bildabschnitt stationär bleibt. Da die Differenzdaten übertragen werden müssen, wird die Codiereffizienz an dem stationären Abschnitt des Bewegtbildes verringert.
- Auch wenn ein durch Abtastung im Zeilensprungverfahren erzeugtes Bild auf Teilbildfür-Teilbild-Basis codiert wird, wird, da jeder Block auf Teilbild-für-Teilbild-Basis gebildet wird, das Intervall zwischen Bildern größer als wenn der Block auf Vollbildfür-Vollbild-Basis gebildet wird, mit dem Ergebnis, daß die Korrelation und daher die Codiereffizienz verringert ist.
- Wenn andererseits aus verschachtelter Abtastung resultierende Bilder auf Vollbild-für- Vollbild-Basis codiert werden, ist der bewegende Abschnitt in dem Vollbild kammförmig verschwommen. Wenn beispielsweise ein sich bewegendes Objekt, wie ein Motorfahrzeug, vor einem stationären Objekt vorhanden ist, wird das Motorfahrzeug, das der sich bewegende Abschnitt ist, aufgrund der Bewegung zwischen den Teilbildern verschwommen, wenn er als Vollbild betrachtet wird, wie unter KS in Fig. 4 gezeigt ist. Das Ergebnis ist, daß Hochfrequenzkomponenten, die in dem ursprünglichen Bild nicht vorhanden sind, übertragen werden, wodurch die Codiereffizienz verringert wird. Da außerdem die Vollbild-für-Vollbild-Codierung auf Basis von zwei aufeinanderfolgenden Teilbildern, die ein Vollbild als Einheit bilden, ausgeführt wird, kann eine Vorhersagecodierung (prädiktive Codierung) nicht zwischen den zwei aufeinanderfolgenden Teilbildern ausgeführt werden. So wird der Minimalabstand der prädiktiven Codierung ein Vollbild oder zwei Teilbilder. Daher ist im Vergleich mit der Teilbild-für-Teilbild-Codierung bezüglich der minimalen Codierdistanz von einem Teilbild, die Vollbild-für-Vollbild-Codierung nachteilig bei einem Bild mit einer schnellen oder plötzlichen Bewegung.
- Wie vorher diskutiert, treten Fälle auf, wenn die Teilbild-für-Teilbild-Codierung eine verringerte Codiereffizienz mit einer entsprechenden Erhöhung der Codiereffizienz der Vollbild-für-Vollbild-Codierung aufweist oder bei denen die Vollbild-für-Vollbild- Codierung eine verringerte Codiereffizienz mit einer entsprechend erhöhten Codiereffizienz der Teilbild-für-Teilbild-Codierung aufweist.
- Angesichts des oben beschriebenen Standes der Technik ist es eine Aufgabe der vorliegenden Erfindung, ein Bilddatencodierverfahren und eine Bilddatencodiervorrichtung vorzuschlagen, wobei ein durch verschachtelte Abtastung erzeugtes Bild effizient codiert werden kann, ob das Bild voll mit Bewegung ist, das Bild nur wenig Bewegung zeigt oder das Bild voll mit Bewegung und das Bild, das nur wenig Bewegung zeigt, koexistieren, und ein Bilddatendecodierverfahren und eine Bilddatendecodiervorrichtung zur Decodierung von durch das Codierverfahren und die Codiervorrichtung codierte Bilddaten vorzuschlagen.
- Ein erstes Bilddatencodierverfahren zur Codierung von im Zeilensprungverfahren verschachtelten Bildsignalen gemäß der vorliegenden Erfindung weist auf: die Entscheidung, ob die Codierung der Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis auszuführen ist, die Codierung der Bildsignale auf Teilbild- für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis basierend auf den Ergebnissen der Entscheidung zur Erzeugung von codierten Bilddaten, und die Anfügung eines Kennzeichens, das Unterscheidungsdaten repräsentiert, an die codierten Bilddaten basierend auf den Ergebnissen der Entscheidung, wobei die Unterscheidungsdaten angeben, ob die codierten Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild- für-Vollbild-Basis codiert wurden.
- Gemäß einem zweiten erfindungsgemäßen Bilddatencodierverfahren zur Codierung von Zeilensprung-Bildsignalen haben codierte Bilddaten eine hierarchische Struktur und die Unterscheidungsdaten sind an einem Abschnitt eines Kopfabschnitts einer hierarchischen Schicht der codierten Bilddaten vorgesehen.
- Gemäß einem dritten erfindungsgemäßen Bilddatencodierverfahren zur Codierung von Zeilensprung-Bildsignalen wird die Entscheidung in dem ersten Bilddatencodierverfahren basierend auf dem Bewegungsvektor für jeden Makroblock ausgeführt.
- Ein viertes erfindungsgemäßes Bilddatencodierverfahren zur Codierung von Zeilensprung-Bildsignalen weist die Codierung von Bildsignalen auf Teilbild-für- Teilbild-Basis zur Erzeugung von codierten Bilddaten und die Anfügung von Unterscheidungsdaten auf, die angeben, daß die codierten Bilddaten auf Teilbild-für- Teilbild-Basis in die codierten Bilddaten codiert wurden.
- Bei einem fünften erfindungsgemäßen Bilddatencodierverfahren zur Codierung von Bilddaten, haben die codierten Bilddaten eine hierarchische Struktur gemäß dem vierten Bilddatencodierverfahren und die Unterscheidungsdaten sind an einem Abschnitt eines Kopfabschnitts einer festgelegten hierarchischen Struktur der codierten Bilddaten vorgesehen.
- Ein sechstes erfindungsgemäßes Bilddatencodierverfahren zur Codierung von Zeilensprung-Bildsignalen weist die Codierung von Bildsignalen auf Vollbild-für- Vollbild-Basis zur Erzeugung von codierten Bilddaten und die Anfügung von Unterscheidungsdaten auf, die angeben, daß die codierten Bilddaten auf Vollbild-für- Vollbild-Basis in die codierten Bilddaten codiert wurden.
- Gemäß einem siebten erfindungsgemäßen Bilddatencodierverfahren zur Codierung von Bildsignalen haben die codierten Bilddaten eine hierarchische Struktur gemäß dem sechsten Bilddatencodierverfahren und die Unterscheidungsdaten sind an einem Abschnitt eines Kopfabschnitts einer festgelegten hierarchischen Schicht der codierten Bilddaten vorgesehen.
- Ein erstes Bilddatendecodierverfahren zur Decodierung von Bilddaten, die mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit codiert wurden, weist die Erfassung eines an einem Abschnitt eines Kopfabschnitts der Bilddaten vorgesehenen Kernzeichens zur Unterscheidung, ob die Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis codiert wurden, und die adaptive Umschaltung zwischen teilbildbasierter Decodierung und vollbildbasierter Decodierung basierend auf dem Kennzeichen auf.
- Gemäß einem zweiten erfindungsgemäßen Bilddatendecodierverfahren haben die Bilddaten eine hierarchische Struktur bei dem ersten Bilddatendecodierverfahren, das Kennzeichen wird von einem Kopfabschnitt einer festgelegten hierarchischen Schicht der Bilddaten erfaßt und die Umschaltung wird adaptiv zwischen einer teilbildbasierten Decodierung und einer vollbildbasierten Decodierung für jede der festgelegten hierarchischen Schichten basierend auf dem Kennzeichen ausgeführt.
- Ein drittes erfindungsgemäßes Bilddatendecodierverfahren zur Decodierung von Bilddaten, die mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit codiert wurden, weist die Erfassung eines an einem Abschnitt eines Kopfabschnitts der Bilddaten vorgesehenen Kennzeichens zur Unterscheidung, ob die Bilddaten auf Teilbild-für-Teilbild-Basis codiert wurden, und die Decodierung der Bilddaten basierend auf dem Kennzeichen auf Teilbild-für- Teilbild-Basis auf.
- Gemäß einem vierten erfindungsgemäßen Bilddatendecodierverfahren haben die Bilddaten bei dem dritten Bilddatendecodierverfahren eine hierarchische Struktur und das Kennzeichen wird von einem Kopfabschnitt einer festgelegten hierarchischen Schicht erfaßt.
- Ein fünftes erfindungsgemäßes Bilddatendecodierverfahren zur Decodierung von mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit codierten Bilddaten weist die Erfassung eines an einem Abschnitt eines Kopfabschnitts für die Bilddaten vorgesehenen Kennzeichens zur Unterscheidung auf, ob die Bilddaten auf Vollbild-für-Vollbild-Basis codiert wurden, und weist die Decodierung der Bilddaten basierend auf dem Kennzeichen auf Vollbild-für-Vollbild- Basis auf.
- Gemäß einem sechsten erfindungsgemäßen Bilddatendecodierverfahren haben die Bilddaten bei dem fünften Bilddatendecodierverfahren eine hierarchische Struktur und das Kennzeichen wird von einem Kopfabschnitt einer festgelegten hierarchischen Struktur der Bilddaten erfaßt.
- Ein erste Bilddatencodiervorrichtung zur Codierung von Bildsignalen mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit weist eine Entscheidungseinrichtung zur Entscheidung, ob eine Codierung der Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis auszuführen ist, eine Codiereinrichtung zur Codierung der Bildsignale auf Teilbild-für- Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis in Abhängigkeit von den Resultaten der Entscheidung zur Erzeugung von codierten Bilddaten und eine Anfügungseinrichtung zur Anfügung von Unterscheidungsdaten an die codierten Bilddaten basierend auf der Entscheidung auf, wobei die Unterscheidungsdaten angeben, ob die codierten Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbildfür-Vollbild-Basis codiert wurden.
- Bei einer zweiten erfindungsgemäßen Bilddatencodiervorrichtung enthält die Anfügungseinrichtung der ersten Bilddatencodiervorrichtung eine Variabellängencodierschaltung.
- Eine dritte erfindungsgemäße Bilddatencodiervorrichtung weist in der ersten Bilddatencodiervorrichtung ferner eine Bewegungsvektor-Erfassungseinrichtung zur Erfassung des Bewegungsvektors zwischen ersten und zweiten Teilbildern eines momentan zu codierenden Vollbildes auf, wobei die Entscheidungseinrichtung die Entscheidung basierend auf dem von der Bewegungsvektor-Erfassungseinrichtung erfaßten Bewegungsvektor ausführt.
- Eine vierte erfindungsgemäße Bilddatencodiervorrichtung zur Ausführung einer blockbasierten Codierung von Bildsignalen bestehend aus einer zweidimensionalen Anordnung von Pixeln im Zeilensprungverfahren zur Erzeugung von codierten Bilddaten mit einer hierarchischen Struktur weist eine Bewegungsvektor- Erfassungseinrichtung zur Erfassung eines Bewegungsvektors zwischen ersten und zweiten Teilbildern eines momentanen Vollbildes der von einem Makroblock zu einem anderen zu codierenden Bildsignale, eine Entscheidungseinrichtung zur Entscheidung, ob die Codierung der Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für- Vollbild-Basis basierend auf der Größe des Mittelwertes des Bewegungsvektors von der Bewegungsvektorerfassungseinrichtung, aufgefunden für eine festgelegte hierarchische Struktur, auszuführen ist, eine Codiereinrichtung zur Codierung der Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis basierend auf den Ergebnissen der Entscheidung durch die Entscheidungseinrichtung und eine Variabellängencodiereinrichtung zur Variabellängencodierung der codierten Bilddaten und der Entscheidungsdaten auf, die angeben, daß die codierten Bilddaten auf Teilbildfür-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis basierend auf den Ergebnissen der Entscheidung von der Entscheidungseinrichtung codiert wurden, und um zu veranlassen, daß die Unterscheidungsdaten an einem Kopfabschnitt einer festgelegten hierarchischen Schicht der Bilddaten angefügt werden.
- Eine erste erfindungsgemäße Bilddatendecodiervorrichtung zur Decodierung von Bilddaten, die mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit codiert wurden, weist eine Erfassungseinrichtung zur Erfassung eines an einem Abschnitt eines Kopfabschnitts einer hierarchischen Schicht der Bilddaten vorgesehenen Kennzeichens zur Angabe, ob die in der hierarchischen Schicht enthaltenen Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für- Vollbild-Basis codiert wurden, und eine Entscheidungseinrichtung zur Entscheidung basierend auf dem Kennzeichen von der Erfassungseinrichtung auf, ob die Decodierung der Bilddaten möglich ist.
- Eine zweite erfindungsgemäße Bildatendecodiervorrichtung weist bei der ersten Bilddatendecodiervorrichtung eine Anzeigevorrichtung zur Anzeige der Ergebnisse der Entscheidung der Entscheidungseinrichtung auf.
- Gemäß einer dritten erfindungsgemäßen Bilddatendecodiervorrichtung weist die erste Bilddatendecodiervorrichtung eine Variabellängencodierschaltung auf, wobei das Kennzeichen unterschieden werden kann.
- Eine vierte erfindungsgemäße Bilddatendecodiervorrichtung zur Decodierung von Bilddaten, die mit einem Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit codiert wurden, weist eine Erfassungeinrichtung zur Erfassung eines an einem Abschnitt einer festgelegten hierarchischen Struktur der Bilddaten vorgesehenen Kennzeichens zur Angabe, ob die in der hierarchischen Schicht enthaltenen Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild- Basis codiert wurden, und eine Decodiereinrichtung zur Decodierung der Bilddaten durch Auswahl eines der teilbildbasierten Decodierung oder ollbildbasierten Decodierung abhängig von dem Kennzeichen von der Erfassungseinrichtung auf.
- Bei einer fünften erfindungsgemäßen Bilddatendecodiervorrichtung weist die vierte Bilddatendecodiervorrichtung eine Variabellängencodierschaltung auf, wobei das Kennzeichen unterschieden werden kann.
- Ein erfindungsgemäßes Bildaufzeichnungsmedium weist darauf aufgezeichnete codierte Zeilensprung-Bilddaten auf, die auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für- Vollbild-Basis codiert wurden und Unterscheidungsdaten sind an einem Kopfabschnitt einer festgelegten hierarchischen Schicht angeordnet, um anzugeben, ob die codierten Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis codiert wurden.
- Im folgenden werden kurz die beiliegenden Zeichnungen beschrieben, in denen
- Fig. 1 die Beziehung zwischen Bildern gemäß MPEG zeigt;
- Fig. 2 die Konstruktion eines Video-Vollbildes gemäß MPEG zeigt;
- Fig. 3 ein konkretes Beispiel eines Bildes mit einem bewegten Objekt zeigt;
- Fig. 4 ein kammförmig verschwommenes Bild zeigt;
- Fig. 5 ein konkretes Beispiel einer Teilbild-für-Teilbild-Codierung zeigt;
- Fig. 6 ein weiteres konkretes Beispiel einer Teilbild-für-Teilbild-Codierung zeigt;
- Fig. 7 ein konkretes Beispiel einer Vollbild-für-Vollbild-Codierung zeigt;
- Fig. 8 ein konkretes Verfahren zur Bewegungsvorhersage für die in Fig. 5 gezeigte Teilbild-für-Teilbild-Codierung/Decodierung zeigt;
- Fig. 9 ein konkretes Verfahren zur Bewegungsvorhersage für die in Fig. 6 gezeigte Teilbild-für-Teilbild-Codierung/Decodierung zeigt;
- Fig. 10 ein konkretes Verfahren zur Bewegungsvorhersage für die in Fig. 7 gezeigte Vollbild-für-Vollbild-Codierung/Decodierung zeigt;
- Fig. 11 eine typische Blockkonstruktion in einem Makroblock für die Teilbild-für- Teilbild-Codierung/Decodierung zeigt;
- Fig. 12 eine typische Blockkonstruktion in einem Makroblock für die Vollbild-für- Vollbild-Codierung/Decodierung zeigt;
- Fig. 13 eine typische konkrete Konstruktion eines Pufferspeichers für eine erfindungsgemäße Bilddatencodiervorrichtung zeigt;
- Fig. 14 eine typische konkrete Konstruktion eines Pufferspeichers für die in Fig. 13 gezeigte Bilddatencodiervorrichtung zeigt;
- Fig. 15 ein Verfahren zeigt, das eine weitere konkrete Bewegungsvorhersage für die in Fig. 5 gezeigte Teilbild-für-Teilbild-Codierung/Decodierung zeigt;
- Fig. 16 ein Verfahren zeigt, das eine weitere konkrete Bewegungsvorhersage für die in fig. 6 gezeigte Teilbild-für-Teilbild-Codierung/Decodierung zeigt;
- Fig. 17 ein Beispiel für eine konkrete Kombination einer Vollbild-für-Vollbild- Codierung/Decodierung und einer Teilbild-für-Teilbild- Codierung/Decodierung zeigt;
- Fig. 18 ein Verfahren zur konkreten Bewegungsvorhersage eines P-Bildes bei der in Fig. 17 gezeigten Codierung/Decodierung zeigt;
- Fig. 19 ein Verfahren zur konkreten Bewegungsvorhersage eines B-Bildes bei der in Fig. 17 gezeigten Codierung/Decodierung zeigt;
- Fig. 20 ein weiteres Beispiel einer konkreten Kombination von Vollbild-für- Vollbild-Codierung/Decodierung und Teilbild-für-Teilbild- Codierung/Decodierung zeigt;
- Fig. 21 ein Verfahren zur konkreten Bewegungsvorhersage eines P-Bildes bei der in Fig. 20 gezeigten Codierung/Decodierung zeigt;
- Fig. 22 ein Verfahren zur konkreten Bewegungsvorhersage eines B-Bildes bei der in Fig. 20 gezeigten Codierung/Decodierung zeigt;
- Fig. 23 ein Blockdiagramm ist, das eine konkrete Schaltungsanordnung für eine erfindungsgemäße Datencodiervorrichtung zeigt;
- Fig. 24 die Beziehung von in die in Fig. 23 gezeigte Bilddatencodiervorrichtung eingegebenen Bildern zeigt;
- Fig. 25 ein Flußdiagramm ist, das einen Algorithmus einer Codiersystementscheidungsschaltung zeigt, die in der Fig. 23 gezeigten Bilddatencodiervorrichtung enthalten ist;
- Fig. 26 ein konkretes Format eines Kopfabschnitts von codierten Bilddaten zeigt;
- Fig. 27 ein Blockdiagramm ist, das eine konkrete Schaltungsanordnung einer erfindungsgemäßen Bilddatendecodiervorrichtung zeigt;
- Fig. 28 ein Blockdiagramm ist, das eine konkrete Schaltungsanordnung einer inversen VLC-Schaltung zeigt, die in der in Fig. 27 gezeigten Bilddatendecodiervorrichtung enthalten ist;
- Fig. 29 ein Flußdiagramm ist, das die Funktionsweise der erfindungsgemäßen Bilddatendecodiervorrichtung illustriert;
- Fig. 30 ein Flußdiagramm ist, das die Funktionsweise der erfindungsgemäßen Bilddatendecodiervorrichtung illustriert.
- Unter Bezugnahme auf die Zeichnungen werden nun konkrete Ausführungsbeispiele der Erfindung erläutert.
- Der Teilbild-für-Teilbild- und Vollbild-für-Vollbild-Codier-/Decodiervorgang gemäß der vorliegenden Erfindung wird nunmehr erläutert.
- Wenn das in Fig. 1 gezeigte Bild ein Teilbild-für-Teilbild-Bild ist, kann es wie in Fig. 5 gezeigt repräsentiert werden, wenn sein teilbildbasierter Aufbau berücksichtigt wird. In Fig. 5 bezeichnet die obere Zeile ein erstes Teilbild, wie ein ungeradzahliges Teilbild und die untere Zeile ein zweites Teilbild, wie ein geradzahliges Teilbild. Zwei zeitlich mit einem Intervall von 1/60 Sekunde benachbarte Teilbilder bilden ein Vollbild. Bei dem Teilbild-für-Teilbild-Codier-/Decodierverfahren wird jedes Bild auf Teilbild-für- Teilbild-Basis codiert/decodiert.
- Ein konkretes Beispiel, bei dem ein Muster des I-Bildes (intracodierten Bildes)/P-Bildes (prädiktiv codierten Bildes)/B-Bildes (bidirektional codierten Bildes) in der in Fig. 2B gezeigten GOP-Schicht gezeigt ist, ist in Fig. 6 gezeigt. In Fig. 5 und 6 wird nur das Aufbaumuster der Bilder in der GOP-Schicht geändert, während den Fig. 5 und 6 gemeinsam ist, daß der Codier-/Decodiervorgang auf Teilbild-für-Teilbild-Basis ausgeführt wird. Wenn währenddessen der Codiertyp zwischen den ersten und zweiten Teilbildern der gleiche ist, wie in Fig. 6, können erstes und zweites Teilbild zusammen codiert werden, in welchem Falle der Vorgang der Vollbild-für-Vollbild-Codier- /Decodiervorgang ist, der in Fig. 7 gezeigt ist.
- Ein Vielzahl von Bewegungsvorhersage- und -kompensationsvorgängen können für diese in den Fig. 6 und 7 gezeigten Codier-/Decodiervorgänge implementiert werden. Von diesen sind einfache konkrete Beispiele in den Fig. 8, 9 und 10 gezeigt. In diesen Figuren geben beispielsweise in Fig. 8 und Fig. 9 Pfeile mit fetten Strichlinien von Bild 12 zu Bild 15 und von Bild 13 zu Bild P6 eine Bewegungsvorhersage zu P-Bildern an. Andererseits geben Pfeile mit dünnen Linien von Bild 12 zu Bild B0 in den Fig. 8 und 9 eine Bewegungsvorhersage zu den B-Bildern an. In den Fig. 10A und 10B zeigen Pfeile mit durchgezogenen Linien die Bewegungsvorhersage für vollbildbasierte Makroblöcke, während Pfeile mit Strichlinien die Bewegungsvorhersage für teilbildbasierte Makroblöcke zeigen.
- Die Teilbild-für-Teilbild-Codierung/ Decodierung des P-Bildes, wie des in Fig. 8 gezeigten P-Bildes P5 verwendet ein Bild 12, das zeitlich vorher angeordnet und schon decodiert ist, als Vorhersagebild, d. h. als Referenzbild zur Ermittlung einer Differenz, während das Bild P8 ein Bild P5, das zeitlich vorher positioniert und schon decodiert ist, als Vorhersagebild verwendet. Das in Fig. 9 gezeigte Bild P6 verwendet ein Bild 13 als Vorhersagebild, während das Bild P7 ein Bild P6 als Vorhersagebild verwendet. Das B-Bild, wie das in Fig. 8 gezeigte Bild B4 verwendet drei Bilder, d. h. Bild 12, Bild P5 und ein interpoliertes Bild dieser Bilder als Vorhersagebild. Das B-Bild, wie das in Fig. 9 gezeigte Bild B4, verwendet drei Bilder, d. h. Bild 13, Bild P6 und ein aus diesen beiden Bildern interpoliertes Bild als Vorhersagebild.
- Andererseits verwendet bei der Vollbild-für-Vollbild-Codierung/Decodierung ein Vollbild bestehend aus P-Bildern oder Vollbildern wie den in Fig. 10A gezeigten Bildern P6 und P7 ein Vollbild bestehend aus den Bildern 12 und 13 als Vorhersagebild, während ein Vollbild bestehend aus den Bildern P10 und P11 ein Vollbild bestehend aus den Bildern P6 und P7 als Vorhersagebild verwendet. Andererseits verwendet ein Vollbild bestehend aus B-Bildern oder Vollbildern, wie in Fig. 10B gezeigte Bilder B4 und B5, drei Vollbilder, nämlich ein Vollbild bestehend aus den Bildern 12 und 13, die zeitlich vorher angeordnet und schon decodiert sind, ein Vollbild bestehend aus den Bildern P6 und P7 und ein aus diesen beiden Bildern erzeugtes interpoliertes Bild als Vorhersagebild.
- Wie oben diskutiert ist die Codier-/Decodierprozedur bei dem Teilbild-für-Teilbild- Codier-/Decodierverfahren und dem Vollbild-für-Vollbild-Codier-/Decodierverfahren gemeinsam. Jedoch unterscheiden sie sich in der Blockzusammensetzung und der Bewegungsvorhersage/-kompensation, wie im folgenden erläutert wird.
- Da erstes und zweites Teilbild bei den Vollbild-für-Vollbild-Codier- /Decodiervorgängen gemeinsam codiert und decodiert werden, ist es möglich, erstes und zweites Teilbild in einem gleichen Block zu kombinieren. Andererseits kann bei der Teilbild-für-Teilbild-Verarbeitung ein Block ein beliebiges dieser Teilbilder enthalten.
- Bei den Vollbild-für-Vollbild-Codier-/Decodiervorgängen werden die Codier- /Decodiervorgänge bezüglich der ersten und zweiten Teilbilder zusammen ausgeführt, so daß die Bewegungsvorhersage bezüglich des zu dem gleichen Vollbild gehörenden zweiten Teilbildes nicht ausgeführt wird. Bei der Teilbild-für-Teilbild-Verarbeitung wird eine Bewegunsvorhersage von dem ersten Teilbild zu dem zweiten Teilbild jedoch verwendet.
- Details der obigen Absätze (1) Blockzusammensetzung und (2) Bewegungsvorhersage/- kompensation werden erläutert.
- Fig. 11 zeigt die Zusammensetzung von inneren Blöcken des Makroblockes bei Teilbild-für-Teilbild-Codier-/Decodiervorgängen. Wie in Fig. 11 gezeigt ist, besteht bei den Teilbild-für-Teilbild-Codier-/Decodiervorgängen der Teilbild-für-Teilbild- Makroblock nur aus dem ersten Teilbild oder dem zweiten Teilbild.
- Andererseits zeigt Fig. 12 die Zusammensetzung von inneren Blöcken des Makroblocks bei den Vollbild-für-Vollbild-Codier-/Decodiervorgängen. Bei den Vollbild-für- Vollbild-Codier-/Decodiervorgängen kann ein in Fig. 12C gezeigter Vollbild-für- Vollbild-Makroblock zusätzlich zu den in Fig. 12A und 12B gezeigten Teilbild-für- Teilbild-Makroblöcken verwendet werden. D. h. es ist bei dem Teilbild-für-Teilbild- Makroblock möglich, zusätzlich zu den ersten beiden Teilbildern der Makroblockzusammensetzung, die die gleiche ist wie bei den in Fig. 11 gezeigten Teilbild-für-Teilbild-Codier-/Decodiervorgängen, einen Makroblock in obere und untere zwei Blöcke aufzuteilen, wobei die oberen beiden Blöcke alleine durch die ersten Teilbilder und die unteren beiden Blöcke alleine durch die zweiten Teilbilder gebildet werden. Andererseits besteht der Vollbild-für-Vollbild-Makroblock aus ersten und zweiten Teilbildern, wie in Fig. 12C gezeigt ist.
- Auf diese Weise kann bei den Vollbild-für-Vollbild-Codier-/Decodiervorgängen ein Vollbild-für-Vollbild-Makroblock zusätzlich zu den Teilbild-für-Teilbild-Makroblöcken bei den Teilbild-für-Teilbild-Codier-/Decodiervorgängen verwendet werden.
- Währenddessen kann ein Umschalten zwischen dem Teilbild-für-Teilbild-Makroblock und dem Vollbild-für-Vollbild-Makroblock wie oben beschreiben realisiert werden durch Steuerung der Ausleseadressen zum Zeitpunkt des Auslesens der Blöcke aus den Speichern 7 und 8 basierend auf der Unterscheidungsinformation zur Unterscheidung zwischen der Teilbild-für-Teilbild-Codierung und der Vollbild-für-Vollbild-Codierung, wie sie durch eine Codiersystem-Entscheidungsschaltung 21 (Fig. 23) der später erläuterten Bilddatencodiervorrichtung bestimmt wird. Bei der später erläuterten Bilddatencodiervorrichtung kann ein solches Umschalten auch realisiert werden durch Erfassung eines aufgezeichneten oder einem codierten Bitstrom überlagerten Kennzeichens, das durch eine Bilddatencodiervorrichtung usw. erfaßt wird, und Entscheidung basierend auf dem erfaßten Kennzeichen durch eine inverse Variabellängencodierschaltung 31 (Fig. 27), ob das Codiersystem ein Teilbild-für- Teilbild-Codiersystem oder ein Vollbild-für-Vollbild-Codiersystem ist, und Übertragung der entsprechenden Information zur Bewegungskompensierungsschaltung 42, 43, usw. zur Steuerung der Ausleseadressen aus den Pufferspeichern 37, 38.
- D. h. die Pufferspeicher 7, 8, 37, 38 werden gebildet durch Speicher mit jeweils einer Speicherkapazität von 480 · 780 Pixeln, wie in den Fig. 13 und 14 gezeigt ist. Wenn das Codiersystem auf Vollbild-für-Vollbild-Basis konstruiert ist, werden die Bilddaten auf Vollbild-für-Vollbild-Basis gespeichert, und wenn das Codiersystem auf Teilbildfür-Teilbild-Basis konstruiert ist, werden die Bilddaten auf Teilbild-für-Teilbild-Basis gespeichert, wie in Fig. 13 gezeigt ist. Währenddessen müssen in Fig. 14 zwei Teilbilder zeitlich nicht einander benachbart sein. Obwohl der Pufferspeicher in seiner Kapazität einem Vollbild entspricht, besteht keine Beschränkung der Speicherkapazität und diese kann größer sein als das Vollbild. So kann der Pufferspeicher ausgebildet sein, mehrere Vollbilder zu speichern. Obwohl zwei Pufferspeicher in dem Blockdiagrammen der Fig. 23 und 27 zur Ermöglichung einer Abstimmung der Codier- /Decodiervorgänge verwendet werden, besteht weiterhin keine Notwendigkeit zur Verwendung von zwei Pufferspeichern; diese können in einem einzigen Pufferspeicher kombiniert werden.
- Bei den Teilbild-für-Teilbild-Codier-/Decodiervorgängen kann eine Bewegungsvorhersage von einem ersten Teilbild zu einem zweiten Teilbild ein und desselben Vollbildes, wie eine Vorhersage von Bild 12 zu Bild B3, wie in Fig. 8 gezeigt, oder eine Vorhersage von Bild P6 zu Bild P7 wie in Fig. 9 gezeigt, zur Ausführung der Bewegungsvorhersage/-kompensation verwendet werden.
- Da bei der vollbildbasierten Codierung/Decodierung zwei Teilbilder zusammen codiert/decodiert werden, wie in Fig. 7 gezeigt ist, wird eine Bewegungsvorhersage von einem ersten Teilbild zu einem zweiten Teilbild, die zu dem gleichen Vollbild gehören, nicht eingesetzt.
- Da wie vorher diskutiert die Bewegungsvorhersage bei dem Teilbild-für-Teilbild- Codier-/Decodiervorgang die Bewegungsvorhersage von dem ersten Teilbild zu dem zweiten Teilbild ein und desselben Vollbildes nutzt, wird der Minimalabstand zwischen den Bildern, auf die die Bewegungsvorhersage angewandt wird, verringert, so daß die Bewegungsvorhersage eine Bewegungsvorhersage der Vollbild-für-Vollbild-Codier- /Decodiervorgänge umfaßt. Obwohl die Bewegungsvorhersage des vollbildbasierten Makroblockes in dem oben beschriebenen konkreten Ausführungsbeispiel gezeigt ist, wird die gleiche Bewegungsvorhersage für zwei Teilbilder innerhalb des Makroblockes verwendet, so daß die Bewegungsvorhersagevorgänge der teilbildbasierten Makroblöcke stattdessen verwendet werden können. Daneben ist die Vollbild-für-Vollbild- Bewegungsvorhersage keine bei den Vollbild-für-Vollbild-Codier-/Decodiergängen unverzichtbare Bewegungsvorhersage und die Teilbild-für-Teilbild- Bewegungsvorhersage reicht aus.
- Auf diese Weise sind bei den erfindungsgemäßen Codier-/Decodierverfahren für durch Zeilensprungabtastung erzeugte Bilder, die Codier-/Decodiervorgänge sowohl durch das Teilbild-für-Teilbild-Codier-/Decodierverfahren als auch durch das Vollbild-für- Vollbild-Codierverfahren durch Zuordnung der Blockzusammensetzungen und des Verfahrens zur Steuerung der Bewegungsvorhersage mit den beiden Codier- /Decodiervorgängen möglich.
- In einem solchen Fall ist es notwendig, der Bilddatendecodiervorrichtung Daten zu übertragen, die angeben, welches des Teilbild-für-Teilbild-Codierverfahrens und des Vollbild-für-Vollbild-Codierverfahrens ausgeführt wurde und in welchem Bereich der Codiervorgang ausgeführt wurde.
- Bezüglich dessen ist gemäß der vorliegenden Erfindung ein Kennzeichen (flag) an einem Abschnitt des codierten Bitstromes, d. h. der codierten Bilddaten vorgesehen, das angibt, ob ein Bereich eines codierten Bildes auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis verarbeitet wurde. Währenddessen meint dieser Bereich bespielsweise eine Sequenz, eine Gruppe von Bildern (GOP) oder ein Bild. Konkret werden bei der Bilddatencodiervorrichtung Unterscheidungsdaten zur Unterscheidung, ob ein Bereich von Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für- Vollbild-Basis codiert wurde, an einer festgelegten Position des codierten Bitstromes gesetzt oder überlagert. Die Bilddatendecodiervorrichtung entziffert eine solche festgelegte Position des codierten Bitstromes durch die inverse Variabellängencodierschaltung 31, wie oben beschrieben, zur Bestimmung des Typs der Einheit des Decodiervorgangs zur Ausführung eines entsprechenden Decodiervorgangs zur Bildwiedergabe.
- Es sei festgehalten, daß die Bewegungsvorhersage bei den teilbildbasierten und vollbildbasierten Codier-/Decodiervorgängen nicht auf das in den Fig. 8 bis 10 gezeigte konkrete Ausführungsbeispiel beschränkt ist. Beispielsweise kann bei den vollbildbasierten Codier-/Decodiervorgängen, die die in Fig. 15 und 16 gezeigte Bewegungsvorhersage verwenden, ein Umschalten für jede hierarchische Struktur des Bildes und der vollbildbasierten Codier-/Decodiervorgänge ausgeführt werden.
- Insbesondere zeigt Fig. 15A ein konkretes Beispiel unterschiedlich von dem P-Bild- Vorhersageverfahren für die Teilbild-für-Teilbild-Codier-/Decodiervorgänge, die in Fig. 8 gezeigt sind, bei dem in Fig. 5 gezeigten Aufbaumuster des I-/P-/B-Bildes in der GOP-Schicht. Fig. 15B zeigt ein konkretes Beispiel unterschiedlich von dem B-Bild- Vorhersageverfahren der Teilbild-für-Teilbild-Codier-/Decodiervorgänge. D. h. ein Bild P5 wird bei dem konkreten Beispiel von Fig. 8 als Vorhersagebild für Bild P8 verwendet, während ein Bild, wie ein Bild I2, ebenfalls verwendet werden kann, wie in Fig. 15A gezeigt ist. Während andererseits drei Bilder, insbesondere die Bilder I2, P5 und ein interpoliertes Bild dieser zwei Bilder in dem konkreten Beispiel von Fig. 8 als Vorhersagebild für Bild B4 verwendet wird, können die Bilder I2, P5, P8, P11 und interpolierte Bilder dieser Bilder ebenso verwendet werden, wie in Fig. 15B gezeigt ist.
- Fig. 16A zeigt ein konkretes Beispiel unterschiedlich von dem Vorhersageverfahren für das B-Bild bei den in Fig. 9 gezeigten teilbildbasierten Codier-/Decodiervorgängen, während Fig. 16 ein konkretes Beispiel unterschiedlich von dem in Fig. 9 gezeigten Vorhersageverfahren für das B-Bild bei den teilbildbasierten Codier- /Decodiervorgängen zeigt. D. h. während Bild I3 bei dem konkreten in Fig. 9 gezeigten Beispiel verwendet wird, kann beispielsweise Bild I2 ebenso verwendet werden, wie in Fig. 16A gezeigt ist. Während außerdem drei Bilder, insbesondere die Bilder I3 und P6 und ein interpoliertes Bild dieser beiden Bilder bei dem konkreten Beispiel von Fig. 9 als Vorhersagebild für Bild B4 verwendet werden, können die Bilder I2, I3, P6, P7 und interpolierte Bilder dieser Bilder ebenso verwendet werden, wie in Fig. 16B gezeigt ist.
- Zusätzlich können die teilbildbasierten Codier-/Decodiervorgänge auch mit den vollbildbasierten Codier-/ Decodiervorgängen kombiniert werden.
- Die Fig. 17 bis 20 zeigen konkrete Beispiele, bei denen mehrere Bilder auf Vollbildfür-Vollbild-Basis codiert/decodiert werden und die nächsten folgenden Bilder anschließend auf Teilbild-für-Teilbild-Basis codiert werden. Fig. 17 illustriert eine Kombination der vollbildbasierten Codier-/Decodiervorgänge von Fig. 7 und der in Fig. 5 gezeigten teilbildbasierten Codier-/Decodiervorgänge und Fig. 20 illustriert eine Kombination der in Fig. 7 gezeigten vollbildbasierten Codier-/Decodiervorgänge und der in Fig. 6 gezeigten teilbildbasierten Codier-/Decodiervorgänge.
- In Fig. 17 kann ein Vollbild bestehend aus den Bildern P6 und P7 ein Vollbild bestehend aus den Bildern I2 und I3 als Vorhersagebild verwenden, wie in Fig. 18 gezeigt ist, während ein Bild P10 beispielsweise Bild P6 als Vorhersagebild verwenden kann. Andererseits kann ein Vollbild bestehend aus den Bildern B4 und B5 ein Vollbild bestehend aus den Bildern I2 und I3, ein Vollbild bestehend aus den Bildern P6 und P7 und interpolierte Bilder dieser Vollbilder verwenden, wie in Fig. 19 gezeigt ist, während Bild P8 die Bilder P6, P7, P10 und interpolierte Bilder dieser Bilder verwenden kann.
- Daneben kann in Fig. 20 ein Vollbild bestehend aus den Bildern P6 und P7 ein Vollbild bestehend aus den Bildern I2 und I3 als Vorhersagebild verwenden, während ein Bild P10 beispielsweise Bild P6 als Vorhersagebild verwenden kann, wie in Fig. 21 gezeigt ist. Andererseits kann ein Vollbild bestehend aus den Bildern B4 und B5 ein Vollbild bestehend aus den Bildern I2 und I3, ein Vollbild bestehend aus den Bildern P6 und P7 und interpolierte Bilder dieser Vollbilder als Vorhersagebild verwenden, wie in Fig. 22 gezeigt ist, während Bild B8 beispielsweise die Bilder P6, P7, P10 und P11 und interpolierte Bilder dieser Bilder als Vorhersagebild verwenden kann, wie ebenfalls in Fig. 22 dargestellt ist.
- Auf diese Weise können, wie in Fig. 17 bis 22 gezeigt ist, vollbildbasierte Codier- /Decodiervorgänge mit teilbildbasierten Codier-/Decodiervorgängen ohne Schwierigkeiten kombiniert werden. Mit anderen Worten ist es mit dem erfindungsgemäßen Bilddatencodierverfahren und Bilddatendecodierverfahren möglich, eine effiziente Codierung für Bilder mit nur einer kleinen Bewegung, Bildern voll mit Bewegung und Mischbildern dieser Bilder durch Umschalten von vollbildbasierten Codier-/Decodiervorgängen auf teilbildbasierte Codier-/Decodiervorgänge und umgekehrt auszuführen, wenn Bilder als Ergebnis einer Zeilensprungabtastung erzeugt werden.
- Fig. 23 ist ein Blockdiagramm, das eine konkrete Schaltungsanordnung einer erfindungsgemäßen Bilddatencodiervorrichtung zeigt.
- Wie in Fig. 23 gezeigt ist, weist die Bilddatencodiervorrichtung (Codierer) eine lokale Decodierschaltung bestehend aus einer inversen Quantisierungsschaltung 2 zum Gate 17 auf, die die gleiche Schaltungsanordnung aufweist wie die später beschriebene Bilddatendecodiervorrichtung.
- Wenn Bilddaten eines Bildes (Vollbildes oder Teilbildes) am Anschluß 1 eingegeben werden, werden diese Bilddaten zunächst im Pufferspeicher 18 gespeichert. Insbesondere werden Bilddaten in der Reihenfolge I0, B1, B2, B3, ..., wie in Fig. 24A gezeigt ist, eingegeben und in der Reihenfolge umgeordnet, in welcher die Bilddaten durch den Codierer codiert werden, wie in Fig. 24B gezeigt ist. Bewegungsvorhersage wie in Fig. 1 gezeigt wird zwischen den so umgeordneten Bildern ausgeführt. Die Eingangsbilder I0, B1, B2, P3, ... sind als Teilbilder in Fig. 5 und 6 gezeigt, während sie in Fig. 7 als Vollbilder gezeigt sind.
- Die so umgeordneten Bilder werden durch eine Bewegungsvektorerfassungsschaltung 19 zur Erfassung eines Bewegungsvektors verwendet. Basierend auf dem/den vorher codierten Bild(ern) erfaßt die Bewegungsvektorerfassungsschaltung 19 den zur Erzeugung der/des Bilder(es) erforderlichen Bewegungsvektors zur Vorhersage. D. h. ein späteres Bild und ein früheres Bild werden durch den Pufferspeicher 18 gehalten und ein Bewegungsvektor zwischen diesen Bildern und einem momentanen Referenzbild wird erfaßt. Zur Erfassung des Bewegungsvektors wird solch ein Bewegungsvektor verwendet, der eine Minimalsumme der Absolutwerte der Differenzen zwischen den Bildern auf Makroblockbasis aufweist.
- Der Bewegungsvektor und die Summen der Absolutwerte der Differenzen zwischen den Bildern auf Makroblockbasis werden zu einer Codiersystem-Entscheidungsschaltung 21 übertragen. Durch Einsatz eines Algorithmus, der später erläutert wird, entscheidet die Codiersystem-Entscheidungsschaltung 21, ob das Codiersystem eines Bildes einer bestimmten hierarchischen Schicht ein teilbildbasiertes Codiersystem oder ein vollbildbasiertes Codiersystem ist. Die Information betreffend das Codiersystem, d. h. ob das Codiersystem ein teilbildbasiertes System oder ein vollbildbasiertes System ist, und der Bewegungsvektor werden zu den Bewegungskompensationsschaltungen 12, 13 und zu der Variabellängencodierschaltung 35 übertragen, um verwendet zu werden zur Steuerung der Pufferspeicher 7 und 8, während sie zu der Bilddatendecodiervorrichtung übertragen werden, wie später erläutert wird. Die Information betreffend das Codiersystem wird zu einer Steuerschaltung 16 übertragen, die Steuersignale ausgibt, die das Codiersystem zu den Gates 5, 17 und den Umschalteschaltern 6, 9, 10 und 15 steuert.
- Ferner werden der Bewegungsvektor und die Summen der Absolutwerte der Differenz zwischen Bildern auf Makroblockbasis zu einer Intrabild-/Prädiktiv-/Rückwärts- /Bidirektional-Vorhersageentscheidungsschaltung 20 übertragen, die als Vorhersageentscheidungsschaltung bezeichnet wird. Basierend auf diesen Werten entscheidet die Vorhersageentscheidungsschaltung den Vorhersagemodus für den Referenz-Makroblock.
- Der Vorhersagemodus wird zu der Steuerschaltung 16 übertragen. Basierend auf dem Vorhersagemodus gibt die Steuerschaltung 16 ein Steuersignal an die Gates 5 und 17 zur Ausführung einer Umchaltung zwischen Intrabild-/Prädiktiv-/Rückwärts- /Bidirektional-Vorhersage aus. Die Steuerschaltung überträgt den dem gewählten Vorhersagemodus zugehörigen Bewegungsvektor an die Pufferspeicher 7, 8 zur Erzeugung des Vorhersagebildes. Insbesondere wenn der Modus der Intrabild- Codiermodus ist, wird das Eingangsbild selbst erzeugt, während wenn der Modus der Vorhersage-/Rückwärts-/Bidirektional-Vorhersagemodus ist, werden entsprechende Vorhersagebilder erzeugt. Die Funktionsweise der Gates 5, 17 und der Umschalteschalter 6, 9, 10 und 15 ist die gleiche wie diejenige der Umschalteschalter 36, 39, 40 und 45, so daß die entsprechende Funktionsweise der Einfachheit halber weggelassen wird.
- Die Vorhersagebilder von den Pufferspeichern 7, 8 werden einer Differenzeinheit 22 zugeführt, die Differenzdaten zwischen dem Vorhersagebild und dem momentanen Bild erzeugt. Die Differenzdaten werden einer Diskretcosinustransformationsschaltung (DCT) 23 zugeführt.
- Die DCT-Schaltung 23 diskretcosinustransformiert die Eingangsbilddaten oder Differenzdaten für jeden Block unter Ausnutzung der zweidimensionalen Korrelation der Bildsignale, um die resultierenden DCT-Daten der Quantisierungsschaltung 24 zu übertragen.
- Die Quantisierungsschaltung 24 quantisiert die DCT-Daten mit einer Quantisierungsschrittweite (Maßstab), die für jeden Makroblock oder für jeden Rahmen bestimmt wird, um die Ergebnisse durch sogenannte Zickzack-Abtastung zu verarbeiten. Die Quantisierungsschaltung überträgt dann die resultierenden quantisierten Daten zu der Variabellängencodierschaltung 25 und zu einer Dequantisierungsschaltung 2.
- Die für die Quantisierung verwendete Quantisierungsschrittweite wird zu einem Wert gewählt, der keinen Ausfall (Überlauf) des Übertragungspufferspeichers 26 durch Zurückführung des verbleibenden Inhalts zu dem Übertragungspufferspeicher 26 hervorruft. Die Quantisierungsschrittweite wird ebenso wie die Quantisierungsdaten der VLC-Schaltung 25 und der Dequantisierungsschaltung 2 zugeführt.
- Die VLC-Schaltung 25 fährt fort, die Information einschließlich der Quantisierungsdaten, der Quantisierungsschrittweite, des Vorhersagemodus, des Bewegungsvektors und des Codiersystems durch Variabellängencodierung zu verarbeiten, fügt die Codiersysteminformation, d. h. die Information betreffend, ob das Codiersystem das Teilbild-für-Teilbild-Codiersystem oder das Vollbild-für-Vollbild- Codiersystem ist, einem Kopfabschnitt einer festgelegten hierarchischen Schicht an und überträgt die resultierenden Daten und die Übertragungsdaten an den Übertragungspufferspeicher 26.
- Der Übertragungspufferspeicher 26 speichert die Übertragungsdaten vorübergehend in einem Speicher und überträgt die gespeicherten Daten anschließend als Bitstrom mit einer festgelegten Zeitsteuerung. Daneben führt der Übertragungspufferspeicher 26 die makroblockbasierten Quantisierungssteuersignale zurück zu der Quantisierungsschaltung 24 in Abhängigkeit von der Menge der verbleibenden Daten in dem Speicher, um die Quantisierungsschrittweite zu steuern. Auf diese Weise steuert der Übertragungspufferspeicher 26 die als Bitstrom erzeugte Datenmenge, um eine angemessene Datenmenge beizubehalten, d. h. eine Datenmenge, die keine Unterauslastung und keinen Überlauf des Speichers erzeugt.
- Wenn beispielsweise die verbleibenden Datenmenge in dem Pufferspeicher 26 auf eine zulässige obere Grenze erhöht wird, erhöht der Übertragungspufferspeicher die Quantisierungsschrittweite der Quantisierungsschaltung 24 durch Quantisierungssteuersignale zur Verringerung der Datenmenge der quantisierten Daten.
- Wenn umgekehrt die verbleibende Datenmenge im Pufferspeicher 26 auf eine zulässige untere Grenze abgesenkt wird, wird die Menge der Quantisierungsdaten durch Verringerung der Quantisierungsschrittweite der Quantisierungsschaltung 24 durch Quantisierungssteuersignale erhöht.
- Aus dem obigen wird deutlich, daß der in seiner Datenmenge eingestellte Bitstrom von dem Übertragungspufferspeicher 26 mit den codierten Audiosignalen und Synchronisierungssignalen gemultiplext wird. Den gemultiplexten Signalen werden Fehlerkorrekturcodedaten hinzugefügt und sie werden vor der Aufzeichnung als Bits oder Vorsprünge und Ausnehmungen auf einer Master-Disk mittels eines Laserstrahls auf geeignete Weise moduliert. Ein Stempel wird aus der Master-Disk erzeugt und eine große Anzahl von duplizierten Platten (discs), beispielsweise Bildaufzeichnungsmedien, wie optische Platten werden mittels des Stempels erzeugt. Daneben wird der Bitstrom über einen Übertragungskanal zu einer Bilddatendecodiereinheit übertragen, wie später erläutert wird. Währenddessen ist das Bildaufzeichnungsmedium nicht auf die optische Platte beschränkt sondern kann beispielsweise ein Magnetband sein.
- Andererseits werden Ausgangsdaten von der Invers-DCT-Schaltung 3 zu dem Vorhersagebild durch die Anfügungsschaltung 4 hinzugefügt, um eine lokale Decodierung zu bewirken. Die Funktionsweise der lokalen Decodierung ist die gleiche wie derjenige einer Bilddecodiervorrichtung, die später erläutert wird, und der Einfachheit halber wird die entsprechende Erläuterung hier weggelassen.
- Es sei erwähnt, daß das Bildaufbaumuster nicht auf das in Fig. 3 gezeigte beschränkt ist und sich mit verschiedenen Codiersequenzen unterscheidet. Konkret gibt es eine Anzahl von Variationen der Codierverarbeitungssequenz der P-Bilder und B-Bilder, die zeitlich zwischen die P-Bilder eingefügt sind. Jedoch können diese einfach durch Änderung der Verarbeitungssequenz durch Änderung der Steuerung für die Pufferspeicher 7, 8 ausgeführt werden.
- Der konkrete Algorithmus für eine Codiersystementscheidungsschaltung 21 wird im folgenden unter Bezugnahme auf ein in Fig. 25 gezeigtes Flußdiagramm erläutert.
- Die Codiersystem-Entscheidungsschaltung 21 wählt das Codiersystem unter Ausnutzung des Bewegungsvektors von dem ersten Teilbild, beispielsweise einem ungeraden Teilbild zu dem zweiten Teilbild, beispielsweise einem geraden Teilbild aus.
- Konkret findet die Codiersystem-Entscheidungsschaltung 21 den Bewegungsvektor in einem Schritt ST1 für alle in einem zu codierenden Vollbild enthaltenen Makroblöcke vor dem Weitergehen zu Schritt ST2 heraus.
- In Schritt ST2 findet die Codiersystem-Entscheidungsschaltung 21 einen Mittelwert für jede der Horizontalkomponenten (x) und der Vertikalkomponenten (y) des Bewegungsvektors vor dem Weitergehen zu Schritt ST3 heraus. Konkret wird der Mittelwert (Median) der Horizontalkomponenten auf die folgende Art und Weise herausgefunden. Zunächst werden die Horizontallcomponenten des Bewegungsvektors in einer Reihenfolge abfallender Leistung angeordnet und der Wert der mittleren Daten wird als Median Mvx der Horizontalkomponenten angenommen. Der Medianwert Mvy wird auf ähnliche Weise herausgefunden.
- In Schritt ST3 findet die Codiersystem-Entscheidungsschaltung 21 die Größe R des in Schritt ST2 gefundenen Vektors MV als ein Parameter heraus, der die Größe der Bewegung des gesamten Schirmes angibt, da der Vektor MV der Parameter ist, der die Größe des gesamten Schirmes angibt. Die Entscheidungsschaltung geht dann weiter zu Schritt ST4. Die Größe R wird aufgefunden durch die folgende Formel 1:
- R = MVσ = sqrt(Mvx² + Mvy²) (1)
- In Schritt ST4 bewirkt die Codiersystem-Entscheidungsschaltung 21, daß das Codiersystem durch die in Schritt ST3 gefundene Größe R geschaltet wird. Da das Teilbild-für-Teilbild-Codiersystem (-Codiervorgang) bei Bildern mit schneller Bewegung bevorzugt ist, und das Vollbild-für-Vollbild-Codiersystem (-Codiervorgang) bei Bildern mit wenig Bewegung bevorzugt ist, geht die Codiersystem- Entscheidungsschaltung 21 weiter zu Schritt ST5, wenn die Größe R nicht größer als ein festgelegter Schwellenwert TH ist, um das vollbildbasierte Codiersystem auszuwählen. Andernfalls geht die Entscheidungsschaltung weiter zu Schritt ST6, um das teilbildbasierte Codiersystem auszuwählen.
- Aus dem obigen wird deutlich, daß die erfindungsgemäße Bilddatencodiervorrichtung in Abhängigkeit von der in dem Bild auftretenden Bewegung insbesondere des zwischen dem ersten und zweiten Teilbild des gleichen Vollbildes auftretenden Bewegungsvektors oder der Größe des Medianwertes des Bewegungsvektors entscheidet, ob das Codiersystem auf Teilbild-für-Teilbild-Basis oder Vollbild-für-Vollbild-Basis auszuführen ist, so daß eine effiziente Codierung nicht nur mit einem Bild mit viel Bewegung oder wenig Bewegung erreicht werden kann, sondern auch bei dem Bild mit sowohl viel Bewegung als auch wenig Bewegung.
- Konkrete Beispiele des von der vorliegenden Bilddatencodiervorrichtung ausgegebenen Bitstromes, d. h. des Bilddatenformates, werden im folgenden erläutert.
- Fig. 26A zeigt ein Beispiel, in dem Unterscheidungsdaten zur Unterscheidung, ob die Codierung auf Vollbild-für-Vollbild-Basis oder auf Teilbild-für-Teilbild-Basis ausgeführt wurde (die Information betreffend das Codiersystem) als Kennzeichen (flag) angefügt ist, wie in Fig. 26A gezeigt ist. In der Videosequenzschicht sind Startcode, Horizontalgröße, Vertikalgröße usw. mit einer festgelegten Anzahl von Bits aufgezeichnet, die durch Ziffern in der Figur dargestellt sind, wie in Fig. 26A gezeigt ist. Bei dem vorliegenden Ausführungsbeispiel werden die Unterscheidungsdaten zur Unterscheidung, ob die Codierung auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für- Vollbild-Basis ausgeführt wurde, nach der Vollbildfrequenz als 1-Bit-Kennzeichen angefügt. Das Kennzeichen kann auch an einer anderen Position angefügt werden.
- Das oben erwähnte Kennzeichen kann auch an einen Kopfabschnitt der GOP-Schicht angefügt werden, wie in Fig. 26B gezeigt. Im vorliegenden Fall werden Unterscheidungsdaten angefügt, die dem Zeitcode als ein 1-Bit-Kennzeichen folgen. Das Kennzeichen kann auch an einer anderen Position angefügt werden.
- Fig. 26 zeigt einen Fall, bei dem das Kennzeichen im MPEG-Standard angefügt ist. Solch ein Kennzeichen kann auch in Erweiterungsbereichen jeder Schicht geschrieben werden, die durch MPEG vorgeschrieben sind. Für die Videosequenzschicht kann es beispielsweise in den Erweiterungsbereich (Sequenzerweiterungsbytes) oder in die Benutzerdaten geschrieben werden. Konkret kann das Kennzeichen in den Erweiterungsbereich der Bildschicht gemäß MPEG-Standard geschrieben werden, wie in Fig. 26C gezeigt ist. 2-Bit-Kennzeichen werden zur Angabe des Codiersystems verwendet. Die 2-Bit-Kennzeichen bezeichnen den folgenden Inhalt:
- 00: Ein Bild codiert auf Vollbild-für-Vollbild-Basis.
- 01: Ein erstes Teilbild eines auf Teilbild-für-Teilbild-Basis codierten Bildes.
- 10: Ein zweites Teilbild eines auf Teilbild-für-Teilbild-Basis codierten Bildes.
- 11: Reserve.
- Fig. 27 ist ein Blockdiagramm, das eine konkrete Schaltungsanordnung eines erfindungsgemäßen Bilddatendecoders zeigt.
- Eine inverse Variabellängencodierschaltung (Invers-VLC-Schaltung) 31 codiert den Bitstrom von dem in Fig. 23 gezeigten Bilddatencodierer oder den bei Wiedergabe eines Bildaufzeichnungsmediums wie einer optischen Platte erhaltenen Bilddatenstrom durch inverse Variabellängencodierung und gibt die resultierenden Daten einer Dequantisierungsschaltung 23 aus. Gleichzeitig entziffert die Invers-VLC-Schaltung 31 durch Überlagerung auf die Bilddaten während der Codierung geschriebene Daten, wie einen Bewegungsvektor, Quantisierungsschrittweite oder Codierinformation.
- Daneben entziffert die Invers-VLC-Schaltung 31 die den Kopfabschnitten der Videosequenzschicht, GOP-Schicht oder Bildschicht angefügten Kennzeichen, um die Information zu erhalten, ob die Decodierung auf Vollbild-für-Vollbild-Basis oder auf Teilbild-für-Teilbild-Basis auszuführen ist. Solche Information wird einer Steuerschaltung 46 zugeführt, die dann Steuersignale für eine vollbildbasierte oder teilbildbasierte Verarbeitung erzeugt. Insbesondere ist die Steuerschaltung ausgebildet, in Abhängigkeit von dem Ausgangssignal der Invers-VLC-Schaltung 31 eine Mehrzahl von Steuersignalen zur Umschaltung von Gates 35 und 47 oder festen Kontakten der Umschalteschalter 36, 39, 40 und 45 zu erzeugen.
- D. h. wenn im Falle der vollbildbasierten Verarbeitung jedes Bild aus 480 Zeilen jeweils bestehend aus 720 Pixeln und jeder Makroblock aus 16 · 16 Pixeln besteht, wird die Bildverarbeitung durch 1350 Makroblöcke abgeschlossen und ein entsprechendes Steuersignal wird zur Verarbeitung des nächsten Bildes erzeugt. Andererseits wird im Falle der teilbildbasierten Verarbeitung die Bildverarbeitung durch 675 Makroblöcke abgeschlossen und ein entsprechendes Steuersignal wird zur Verarbeitung des nächsten Bildes erzeugt. Daneben wird die vollbildbasierte oder teilbildbasierte Codierung durch Steuerung der Aufteilung der Pufferspeicher 37, 38 gesteuert.
- Andererseits wird das Steuersignal, das angibt, ob die Decodierung vollbildbasiert oder teilbildbasiert ist, das durch die Invers-VLC-Schaltung 31 erzeugt wird, auch den Bewegungskompensationsschaltungen 42, 43 zugeführt und eine vollbildbasierte oder teilbildbasierte Decodierung wird durch die Bewegungskompensationsschaltung 42, 43 ausgeführt, die die Adressen der Pufferspeicher 37, 38, wie im Detail später erläutert wird, steuert.
- Die Dequantisierungsschaltung 32 tastet und dequantisiert die durch die Invers-VLC- Schaltung verarbeiteten Daten ab, um die resultierenden Daten einer Invers-DCT- Schaltung 33 zuzuführen. Die Invers-DCT-Schaltung 33 invers-diskretcosinustransformiert die eingegebenen Daten, um die resultierenden Daten einem Additionsknoten 34 zuzuführen. Dem Additionsknoten 34 werden über Gate 47 Vorhersagebilddaten zugeführt, die durch Schalten des Umschalteschalters 45 ausgewählt sind. Die Vorhersagebilddaten werden zu den Ausgangsdaten der Invers- DCT-Schaltung 33 summiert, um decodierte Bilddaten zu erzeugen.
- Wenn ein Ausgangssignal von dem Additionsknoten 34 ein I-Bild oder ein P-Bild ist, wird das Gate 35 geöffnet und die decodierten Bilddaten werden über den Umschalteschalter 36 den Pufferspeichern 37 oder 38 zugeführt, um darin gespeichert zu werden.
- Insbesondere wenn das Ausgangssignal von dem Additionsknoten 34 das I-Bild oder das P-Bild ist, werden die Umschalteschalter 39, 40 zu den festen Kontakten a umgeschaltet. Der Umschalteschalter 36 wird abwechselnd zu den Kontakten a und b geschaltet, so daß das Bild (I-Bild oder P-Bild), das von dem Additionsknoten 34 ausgegeben wird, abwechselnd in den Pufferspeichern 37 und 38 gespeichert wird.
- Wenn die in der Sequenz der Bilder I0, B1, B2, P3, B4, B5, P6, B7, B8, B9 wie unter A in Fig. 24 angeordneten Bilddaten durch den Bilddatencodierer in der Sequenz 10, P3, B1, B2, P6, B4, B5, P9, B7, B8 wie unter B in Fig. 24 verarbeitet werden, werden die Bilddaten der Invers-VLC-Schaltung 31 in der letzteren Sequenz der Bilder eingegeben, wie unter D in Fig. 24 gezeigt ist.
- Wenn die decodierten Daten des Bildes 10 in dem Pufferspeicher 37 gespeichert sind, wie unter E in Fig. 24 gezeigt ist, werden die decodierten Daten des Bildes P3 daher in dem Pufferspeicher 38 gespeichert, wie unter F in Fig. 24 gezeigt ist. Daneben werden die Daten des Bildes I0 des Pufferspeichers 37 zu den Daten des Bildes P6 aktualisiert, während die Daten des Bildes P3 von Pufferspeicher 38 zu den Daten des Bildes P9 aktualisiert werden, wie unter E und F in Fig. 24 gezeigt ist.
- Wenn die Daten der Bilder B1 oder B2 dem Additionsknoten 34 der Invers-DCT- Schaltung 33 unter Berücksichtigung der Bilder I0 und P3 eingegeben werden, werden die im Pufferspeicher 37 gespeicherten Daten des Bildes I0 von der Bewegungskompensationsschaltung 42 in Übereinstimmung mit dem Bewegungsvektor bewegungskompensiert, bevor sie einer Interpolationsschaltung 44 zugeführt werden. Andererseits werden die in Pufferspeicher 38 gespeicherten Daten von Bild P3 in der Bewegungskompensationsschaltung 43 in Übereinstimmung mit dem Bewegungsvektor bewegungskompensiert, bevor sie der Interpolationsschaltung 44 zugeführt werden. Die Interpolationsschaltung 44 verbindet die Eingangsdaten von den Bewegungskompensationsschaltungen 42, 43 mit einem festgelegten Verhältnis in Übereinstimmung mit den von der Invers-VLC-Schaltung 31 eingegebenen Daten. Die verbundenen Daten werden durch den Umschalteschalter 45 ausgewählt, um über dessen Kontakt b und Gate 47 dem Additionsknoten 34 zugeführt zu werden. Der Additionsknoten 34 summiert die Daten von der Invers-VLC-Schaltung 31 und durch die Umschalteschaltung 45 ausgewählte Daten zur Decodierung der Bilder B1 oder B2.
- Wenn die Bilder B1 oder B2 nur von dem vorangehenden Bild I0 decodiert werden, wird der Umschalteschalter 45 zu seinem Kontakt a umgeschaltet, während wenn die Bilder B1 oder B2 nur von dem späteren Bild P3 decodiert sind, wird der Umschalteschalter 45 zu seinem Kontakt c umgeschaltet. In jedem Fall werden Daten der Bilder I0 oder P3 dem Additionsknoten 34 zugeführt.
- Der Umschalteschalter 39 ist ausgebildet, daß er in umgekehrter Phase zu dem Umschalteschalter 36 geschaltet wird. D. h. wenn der Umschalteschalter 36 zu seinem Kontakt a oder b geschaltet wird, wird Umschalteschalter 39 zu seinem Kontakt b bzw. a geschaltet. Das Ergebnis ist, daß wenn, nachdem Bild I0 im Pufferspeicher 37 gespeichert wurde, der Umschalteschalter 36 zu seinem Kontakt b umgeschaltet wird und Bild P3 im Pufferspeicher 38 gespeichert wird, der Umschalteschalter 39 zu seinem Kontakt a umgeschaltet wird, der Umschalteschalter 40 dann zu seinem Kontakt a umgeschaltet wird und das Bild I0 aus dem Pufferspeicher 37 ausgelesen wird, wie bei g in Fig. 24 gezeigt ist, um über die Umschalteschalter 39, 40 einer Anzeige 41 zugeführt zu werden, wo das wiedergegebene Bild angezeigt wird. Wenn die Bilder B1 und B2 von dem Additionsknoten 34 ausgegeben werden, ist der Umschalteschalter 40 schon zu seinem Kontakt b umgeschaltet, so daß die Bilder B1 und B2 der Anzeige 41 zugeführt werden, wie unter G in Fig. 24 gezeigt ist. Der Umschalteschalter 39 wird dann zu seinem Kontakt b geschaltet, während der Umschalteschalter 39 zu seinem Kontakt a geschaltet wird, so daß das schon im Pufferspeicher 38 gespeicherte Bild P3 ausgelesen und der Anzeige 41 zugeführt wird.
- Ein konkrete Schaltungsanordnung der Invers-VLC-Schaltung wird im folgenden erläutert.
- Die Invers-VLC-Schaltung 31 enhält ein Tonnen-Schieberegister 31a (barrel shifter) und einen Codeentzifferungsabschnitt 31b, wie in Fig. 28 gezeigt ist. Eingangscodedaten werden von dem Tonnen-Schieberegister 31a dem Codeentzifferungsabschnitt 31b auf 16- oder 32-Bit-Basis zugeführt. Der Codeentzifferungsabschnitt 31b besteht aus einer nicht gezeigten Codetabelle oder Abgleichschaltungsanordung zur Abgleichung der Eingangscodedaten mit den in der Codetabelle gespeicherten Codedaten und zur Ausgabe der Daten und ihrer Codelänge CL basierend auf dem Codetyp im Falle einer Übereinstimmung zwischen den beiden Codedaten.
- Die Daten werden der nicht gezeigten anderen Schaltungsanordnung der Invers-VLC- Schaltung zugeführt, bevor sie der oben erwähnten Steuerschaltung 46, der Bewegungskompensationsschaltung 43, usw. zugeführt werden.
- Andererseits wird die Codelänge CL dem Tonnen-Schieberegister 31a als Verschiebegröße zum Verschieben beim nächsten Mal zugeführt. Das Tonnenschieberegister 31a gibt dann die nächsten Codedaten auf 16- oder 32-Bit-Basis an den Codeentzifferungsabschnitt 31b in Abhängigkeit von der Verschiebungsgröße aus.
- Entsprechend wird das Kennzeichen zur Angabe der vollbildbasierten Verarbeitung oder der teilbildbasierten Verarbeitung auch in die Codetabelle als Kopfabschnitt zusammen mit anderen Codedaten geschrieben.
- Aus dem Obigen wird deutlich, daß bei der erfindungsgemäßen Bilddatendecodiervorrichtung Bilddaten durch Erfassung des Kennzeichens wiedergegeben werden können, das in dem Abschnitt des Kopfabschnitts für die Vidoesequenzschicht, die GOP-Schicht oder die Bildschicht vorgesehen ist, das ausgebildet ist, anzugeben, ob die Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis verarbeitet wurden, und durch Decodierung der Bilddaten in Abhängigkeit von dem Kennzeichen wiedergegeben werden können.
- Währenddessen ist die Bilddatendecodiervorrichtung des illustrierten Ausführungsbeispiels in der Lage, eine Decodierung sowohl der teilbildbasierten Bilddaten als auch der vollbildbasierten Bilddaten auszuführen. Im Falle einer Einrichtung, bei der nur eine Art dieser Bilddaten decodiert werden kann, kann eine Entscheidung aufgrund des Kennzeichens getroffen werden, ob die Vorrichtung in der Lage ist, die teilbildbasierten Bilddaten oder die vollbildbasierten Bilddaten zu decodieren.
- Insbesondere ist eine Entscheidungsschaltung 51 zur Entscheidung basierend auf dem von der Invers-VLC-Schaltung 31 zugeführten Kennzeichen, ob eine Decodierung möglich ist und eine Anzeigeeinheit 52 zur Anzeige des Ergebnisses der Entscheidung vorgesehen, wie in Fig. 27 gezeigt ist.
- Im Falle einer Bilddatendecodiervorrichtung zur Decodierung nur von teilbildbasierten Bilddaten, wird ein Vorgang in Übereinstimmung mit einem in Fig. 29 gezeigten Flußdiagramm ausgeführt, während im Falle einer Bilddatendecodiervorrichtung zur Decodierung nur von vollbildbasierten Bilddaten, ein Vorgang in Übereinstimmung mit dem in Fig. 30 gezeigten Flußdiagramm ausgeführt wird.
- D. h. bei der Bilddatendecodierungvorrichtung zur Decodierung nur von teilbildbasierten Bilddaten, wird der Entscheidungsschaltung 51 vor dem Weitergehen zu Schritt ST2 in Schritt ST1 ein Kennzeichen eingegeben.
- In Schritt ST2 prüft die Entscheidungsschaltung 51, ob das Kennzeichen eine vollbildbasierte Verarbeitung angibt. Wenn das Ergebnis JA ist, geht die Entscheidungsschaltung weiter zu Schritt ST4 und anderenfalls geht die Entscheidungsschaltung 51 weiter zu Schritt ST3.
- In Schritt ST3 veranlaßt die Entscheidungsschaltung 51 die Anzeigeeinheit 52 anzuzeigen, daß die Decodierung unmöglich ist, bevor sie das Programm beendet.
- In Schritt ST4 veranlaßt die Entscheidungsschaltung 51 die Anzeigeeinheit 52 anzuzeigen, daß die Decodierung möglich ist, bevor sie das Programm beendet. Die Decodierung wird in Schritt ST5 ausgeführt.
- Bei der Bilddatendecodiervorrichtung zur Decodierung nur von vollbildbasierten Bilddaten, wird der Entscheidungsschaltung 51 in Schritt ST1 ein Kennzeichen eingegeben, bevor sie weitergeht zu Schritt ST2.
- In Schritt ST2 prüft die Entscheidungsschaltung 51, ob das Kennzeichen eine teilbildbasierte Verarbeitung angibt. Wenn das Ergebnis JA ist, geht die Entscheidungsschaltung weiter zu Schritt ST4 und anderenfalls geht die Entscheidungsschaltung weiter zu Schritt ST3.
- In Schritt ST3 veranlaßt die Entscheidungsschaltung 51 die Anzeigeeinheit 52 anzuzeigen, daß die Decodierung unmöglich ist, bevor das Programm beendet wird.
- In Schritt ST4 veranlaßt die Entscheidungsschaltung 51 die Anzeigeeinheit 52 anzuzeigen, daß die Decodierung möglich ist, bevor das Programm beendet wird. Die Decodierung wird in Schritt ST5 ausgeführt.
- Auf diese Weise kann der Benutzer einfach durch Prüfen der Anzeige auf dem Anzeigeabschnitt 52 den Grund erfassen, warum die Bilddaten durch die Vorrichtung nicht wiedergegeben werden können.
- Die Tabellen 1 und 2 illustrieren konkrete Beispiele von Unterscheidungsdaten, die nützlich sind zur Unterscheidung, ob die Codierung auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis ausgeführt wurde. Die darin gezeigten konkreten Beispiele entsprechen den Spezifikationen der Bildschichten im Teat-Modell 3, Draft Revision 1, als N-Schrift am 25. November 1992 durch die ISO/ICE JTC1/SC29/WG11 veröffentlicht. Tabelle 1
- 11 Vollbild-Bild
- 01 Teilbild 1 eines Teilbild-Bildes
- 10 Teilbild 2 eines Teilbild-Bildes
- 00 freigehalten
Claims (7)
1. Bilddatencodierverfahren zur Codierung von verschachtelten Bildsignalen,
aufweisend
die Entscheidung, ob die Codierung der Bildsignale auf Teilbild-für-Teilbild-
Basis oder auf Vollbild-für-Vollbild-Basis auszuführen ist,
Codierung der Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-
Vollbild-Basis basierend auf den Ergebnissen der Entscheidung zur Erzeugung von
codierten Bilddaten und
Anfügen eines Kennzeichens, das Unterscheidungsdaten repräsentiert, an die
codierten Bilddaten basierend auf den Ergebnissen der Entscheidung, wobei die
Unterscheidungsdaten angeben, ob die codierten Bilddaten auf Teilbild-für-Teilbild-
Basis oder auf Vollbild-für-Vollbild-Basis codiert wurden,
wobei die codierten Bilddaten eine hierarchische Struktur haben und wobei die
Unterscheidungsdaten an einem Abschnitt eines Kopfabschnitts einer festgelegten
hierarchischen Schicht der codierten Bilddaten vorgesehen sind.
2. Bilddatencodiervorrichtung gemäß Anspruch 1, wobei die Entscheidung
basierend auf einem Bewegungsvektor jedes Makroblockes in einem Vollbild ausgeführt
wird.
3. Bilddatendecodierverfahren zur Decodierung von Bilddaten, die mit einem Block
bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit
codiert wurden, aufweisend
Erfassung eines an einem Abschnitt eines Kopfabschnitts der Bilddaten
vorgesehenen Kennzeichens zur Unterscheidung, ob die Bilddaten auf Teilbild-für-
Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis codiert wurden, und
adaptive Umschaltung zwischen teilbildbasierter Decodierung und
vollbildbasierter Decodierung basierend auf dem Kennzeichen,
wobei die Bilddaten eine hierarchische Struktur haben, das Kennzeichen von
einem Kopfabschnitt einer festgelegten hierarchischen Schicht der Bilddaten erfaßt wird,
und wobei das Umschalten adaptiv zwischen teilbildbasierter Decodierung und
vollbildbasierter Decodierung für jede der festgelegten hierarchischen Schichten
basierend auf dem Kennzeichen ausgeführt wird.
4. Bilddatencodiervorrichtung zur Codierung von Bilddaten mit einem Block
bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als Codiereinheit,
aufweisend:
eine Entscheidungseinrichtung zur Entscheidung, ob eine Codierung der
Bildsignale auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis
auszuführen ist,
eine Codiereinrichtung zur Codierung der Bildsignale auf Teilbid-für-Teilbild-
Basis oder auf Vollbild-für-Vollbild-Basis in Abhängigkeit von den Resultaten der
Entscheidung durch die Entscheidungseinrichtung zur Erzeugung von codierten
Bilddaten,
eine Anfügungseinrichtung zur Anfügung eines Kennzeichens, das
Unterscheidungsdaten repräsentiert, an die codierten Bilddaten basierend auf den
Ergebnissen der Entscheidung, wobei die Unterscheidungsdaten angeben, ob die
codierten Bilddaten auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis
codiert wurden, wobei die codierten Daten eine hierarchische Struktur haben und wobei
die Unterscheidungsdaten an einem Abschnitt eines Kopfabschnitts einer festgelegten
hierarchischen Schicht der codierten Bilddaten vorgesehen sind.
5. Bilddatencodiervorrichtung gemäß Anspruch 4, aufweisend:
eine Bewegungsvektorerfassungseinrichtung zur Erfassung eines
Bewegungsvektors zwischen einem ersten und einem zweiten Teilbild eines
momentanen Vollbildes der zu codierenden Bildsignale von einem Makroblock zu einem
anderen,
wobei die Entscheidung auf dem Bewegungsvektor basiert.
6. Bilddatendecodiervorrichtung zur Decodierung von Bilddaten, die mit einem
Block bestehend aus einem zweidimensionalen Feld von mehreren Pixeln als
Codiereinheit codiert wurden, aufweisend:
eine Erfassungseinrichtung zur Erfassung eines an einem Abschnitt eines
Kopfabschnitts einer festgelegten hierarchischen Schicht der Bilddaten vorgesehenen
Kennzeichens zur Angabe, ob die in der hierarchischen Schicht enthaltenen Bilddaten
auf Teilbild-für-Teilbild-Basis oder auf Vollbild-für-Vollbild-Basis codiert wurden, und
eine Decodiereinrichtung zur Decodierung der Bilddaten durch Auswahl, für
jede der hierarchischen Schichten, eines der teilbildbasierten Decodierung oder der
vollbildbasierten Decodierung für jede der festgelegten hierarchischen Schichten in
Abhängigkeit von dem Kennzeichen von der Erfassungseinrichtung.
7. Bilddatendecodiervorrichtung gemäß Anspruch 6, ferner aufweisend eine Invers-
Variabellängencodierschaltung, wobei das Kennzeichen durch die Invers-
Variabellängencodierschaltung unterschieden wird.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34671891 | 1991-12-27 | ||
PCT/JP1992/001725 WO1993013626A1 (en) | 1991-12-27 | 1992-12-28 | Image data coding method, image data decoding method, image data coding device, image data decoding device, and image recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69227185D1 DE69227185D1 (de) | 1998-11-05 |
DE69227185T2 true DE69227185T2 (de) | 1999-04-01 |
Family
ID=18385347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69227185T Expired - Lifetime DE69227185T2 (de) | 1991-12-27 | 1992-12-28 | Bilddatenkodier/dekodierverfahren und -vorrichtung |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP0573665B1 (de) |
JP (1) | JP3331351B2 (de) |
KR (1) | KR100260475B1 (de) |
AT (1) | ATE171831T1 (de) |
DE (1) | DE69227185T2 (de) |
WO (1) | WO1993013626A1 (de) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3381077B2 (ja) * | 1992-12-04 | 2003-02-24 | ソニー株式会社 | 動画像復号装置 |
JP3257643B2 (ja) * | 1993-01-18 | 2002-02-18 | ソニー株式会社 | 画像符号化装置および画像復号化装置 |
US7558324B2 (en) | 1993-01-18 | 2009-07-07 | Sony Corporation | Apparatus for encoding and decoding header data in picture signal transmission |
US7075991B1 (en) | 1993-01-18 | 2006-07-11 | Sony Corporation | Apparatus for encoding and decoding header data in picture signal transmission |
KR960007947B1 (ko) | 1993-09-17 | 1996-06-17 | 엘지전자 주식회사 | 가라오케-콤팩트 디스크(karaoke-cd) 및 이를 이용한 오디오 제어장치 |
JP3050736B2 (ja) * | 1993-12-13 | 2000-06-12 | シャープ株式会社 | 動画像符号化装置 |
EP0675652B1 (de) * | 1994-03-30 | 2009-05-13 | Nxp B.V. | Verfahren und Schaltung zur Bewegungsschätzung zwischen Bildern mit zwei Zeilensprunghalbbildern, und Vorrichtung zur digitalen Signalkodierung mit einer solchen Schaltung |
US5703859A (en) * | 1995-09-01 | 1997-12-30 | Sony Corporation | Digital video copy protection system |
US6263024B1 (en) * | 1996-12-12 | 2001-07-17 | Matsushita Electric Industrial Co., Ltd. | Picture encoder and picture decoder |
KR100495100B1 (ko) * | 1998-04-28 | 2005-10-26 | 주식회사 팬택앤큐리텔 | 디지털 영상 처리 시스템의 이동 벡터 부호화/복호화 방법 |
KR100632106B1 (ko) * | 1998-06-27 | 2007-03-02 | 주식회사 팬택앤큐리텔 | 디지털 비월주사 인터픽쳐 부호화/복호화 방법 |
KR100632105B1 (ko) * | 1998-06-27 | 2007-03-02 | 주식회사 팬택앤큐리텔 | 디지털 비월주사 인트라픽쳐 부호화/복호화 방법 |
JP3496926B2 (ja) * | 1999-07-30 | 2004-02-16 | ソニー株式会社 | 画像データ復号化方法 |
EP1107609A1 (de) * | 1999-12-02 | 2001-06-13 | STMicroelectronics S.r.l. | Verfahren zur Verarbeitung von Bewegungsvektorenhistogrammen zur Detektierung von Zeilensprung- oder progressiven Bildstrukturen |
US6483876B1 (en) | 1999-12-28 | 2002-11-19 | Sony Corporation | Methods and apparatus for reduction of prediction modes in motion estimation |
KR100668302B1 (ko) | 2004-07-28 | 2007-01-12 | 삼성전자주식회사 | 비디오 디코더/엔코더에서의 메모리 맵핑 장치 및 그 방법 |
KR100667806B1 (ko) * | 2005-07-07 | 2007-01-12 | 삼성전자주식회사 | 영상 부호화 및 복호화 방법 및 장치 |
KR101670954B1 (ko) | 2009-07-28 | 2016-10-31 | 삼성전자주식회사 | 대용량의 영상을 효율적으로 전송하는 영상 부호화 장치 및 영상 복호화 장치 |
CN102165779B (zh) * | 2009-07-29 | 2015-02-25 | 松下电器(美国)知识产权公司 | 图像编码方法、图像编码装置、程序以及集成电路 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5555682A (en) * | 1978-10-20 | 1980-04-23 | Nec Corp | Coding unit for television signal |
JPS58137379A (ja) * | 1982-02-10 | 1983-08-15 | Nec Corp | 動き補償フレ−ム間・フイ−ルド間符号化装置 |
JPS61269475A (ja) * | 1985-05-23 | 1986-11-28 | Toshiba Corp | 動きベクトル検出装置 |
NL8700565A (nl) * | 1987-03-10 | 1988-10-03 | Philips Nv | Televisiesysteem waarin aan een transformatiekodering onderworpen gedigitaliseerde beeldsignalen worden overgebracht van een kodeerstation naar een dekodeerstation. |
JP2562499B2 (ja) * | 1989-05-29 | 1996-12-11 | 日本電信電話株式会社 | 高能率画像符号化装置およびその復号化装置 |
NL9000424A (nl) * | 1990-02-22 | 1991-09-16 | Philips Nv | Overdrachtsysteem voor gedigitaliseerde televisiebeelden. |
JPH03276987A (ja) * | 1990-03-27 | 1991-12-09 | Toshiba Corp | 動き適応型画像圧縮及び伸長方式 |
US5091782A (en) * | 1990-04-09 | 1992-02-25 | General Instrument Corporation | Apparatus and method for adaptively compressing successive blocks of digital video |
DE4026523A1 (de) * | 1990-08-22 | 1992-02-27 | Thomson Brandt Gmbh | Verfahren und vorrichtung zur bilddaten-transformation |
FR2670348A1 (fr) * | 1990-12-07 | 1992-06-12 | France Etat | Dispositif de codage d'images appartenant a une sequence d'images, a rearrangement des lignes avant transformation mathematique, systeme de transmission d'images, recepteur et procede de codage correspondants. |
NL9100234A (nl) * | 1991-02-11 | 1992-09-01 | Philips Nv | Codeerschakeling voor transformatiecodering van een beeldsignaal en decodeerschakeling voor het decoderen daarvan. |
US5347309A (en) * | 1991-04-25 | 1994-09-13 | Matsushita Electric Industrial Co., Ltd. | Image coding method and apparatus |
JP2991833B2 (ja) * | 1991-10-11 | 1999-12-20 | 松下電器産業株式会社 | インターレス走査ディジタルビデオ信号の符号化装置及びその方法 |
JP3276987B2 (ja) | 1992-07-07 | 2002-04-22 | 三菱レイヨン株式会社 | 中空糸膜モジュール |
-
1992
- 1992-12-28 WO PCT/JP1992/001725 patent/WO1993013626A1/ja active IP Right Grant
- 1992-12-28 KR KR1019930702555A patent/KR100260475B1/ko not_active IP Right Cessation
- 1992-12-28 AT AT93900405T patent/ATE171831T1/de active
- 1992-12-28 DE DE69227185T patent/DE69227185T2/de not_active Expired - Lifetime
- 1992-12-28 JP JP51156093A patent/JP3331351B2/ja not_active Expired - Lifetime
- 1992-12-28 EP EP19930900405 patent/EP0573665B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0573665A4 (en) | 1994-08-17 |
EP0573665A1 (de) | 1993-12-15 |
DE69227185D1 (de) | 1998-11-05 |
KR930703797A (ko) | 1993-11-30 |
JP3331351B2 (ja) | 2002-10-07 |
KR100260475B1 (ko) | 2000-07-01 |
WO1993013626A1 (en) | 1993-07-08 |
EP0573665B1 (de) | 1998-09-30 |
ATE171831T1 (de) | 1998-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69227185T2 (de) | Bilddatenkodier/dekodierverfahren und -vorrichtung | |
DE69323123T2 (de) | Kodierung und Dekodierung von Bildsignalen | |
DE69325220T2 (de) | Kodierung und Dekodierung von digitalen Bildsignalen gekennzeichnet durch doppelte Vollbilder mit Halbbildern erzeugt aus unterschiedlichen Filmquellenbildern | |
DE69323541T2 (de) | Verfahren und System zum Kodieren und/oder Dekodieren der Farbartsignale eines Bildsignals | |
DE69620160T2 (de) | Bildkodierungsgerät und Bilddekodierungsgerät | |
DE69524896T2 (de) | Wiedergabe von Videobildern mit erhöhter Geschwindigkeit | |
DE69529137T2 (de) | Szenenänderungsadaptiver Bildkodierer | |
DE69012405T2 (de) | Einrichtung zur adaptiven Zwischenbild-Vorhersagekodierung eines Videosignals. | |
DE69033797T2 (de) | Verfahren und Anordnung zum Kodieren/Dekodieren eines Videosignales | |
DE69839100T2 (de) | Verbesserte Videokodierung unter Verwendung von adaptiven Blockparametern für kodierte/unkodierte Blöcke | |
DE69228266T2 (de) | Gerät zur Aufzeichnung und Wiedergabe mit hoher Kodierwirksamkeit | |
DE69214638T2 (de) | Gerät zum komprimieren von video-daten | |
DE69324993T2 (de) | Verfahren und Vorrichtung zum Quantisieren und Dequantisieren von Bildsignalen | |
DE69424909T2 (de) | Verfahren und vorrichtung zur bildkodierung | |
DE69512548T2 (de) | Verfahren und Vorrichtung zur Vermeidung von wiederholenden Zufallsfehlern in Transformationskoeffizienten von Bewegtbildsignalen | |
DE69323338T2 (de) | Vorrichtung zum Aufzeichnen/Wiedergeben von Kodes mit variablen Längen für einen Videorekorder | |
DE69426280T2 (de) | Gerät zur Wiedergabe von Bildern und Gerät zur Dekodierung von Bildern | |
DE60104013T2 (de) | Transkodierung von progressiv-kodierten i-slice-aufgefrischten mpeg datenströmen für trickmodi | |
DE69824486T2 (de) | Kodier- und Dekodierverfahren für Videosignal mit Zwischenbild mit Konvertierung periodisch ausgewählter Videohalbbilder zu Videobildern mit progressiver Abtastung | |
DE69217767T2 (de) | Vorrichtung zum Aufzeichnen eines digitalen Videosignals | |
DE69323018T2 (de) | Vorrichtung und Verfahren zur Dekodierung einer Vielzahl von kodierten Bildsignalen | |
DE69430617T2 (de) | Dekoder und verfahren zur dekodierung | |
DE19755345C2 (de) | Umgekehrtes Abspielen von Videosignalen im MPEG-Standard | |
DE69328277T2 (de) | Bildsignalkodierung | |
DE69229229T2 (de) | Bildsignalkodierungsverfahren mit hoher wirkungsgrad |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8363 | Opposition against the patent | ||
8310 | Action for declaration of annulment | ||
8313 | Request for invalidation rejected/withdrawn | ||
8310 | Action for declaration of annulment | ||
8313 | Request for invalidation rejected/withdrawn | ||
R071 | Expiry of right |
Ref document number: 573665 Country of ref document: EP |