Anwendungsgebiet der Erfindung
-
Die Erfindung betrifft die Umwandlung eines Stereo-Audio-
Signals in ein Signal, welches bei der Reproduktion einem
Zuhörer als ein realistischeres Klangbild in drei Dimensionen
erscheint, als das originale Stereosignal. Solch eine Umwandlung
wird gemeinhin als Stereo-Erweiterung (Stereo-Expansion)
bezeichnet und wird nachfolgend als eine solche bezeichnet.
Hintergrund der Erfindung
-
Das Basis-Patent zu stereo, GB-A-394325 (EMT) beschreibt und
beansprucht ein System zum Erzeugen von Stereosignalen, wobei
die relative Lautstärke der Lautsprecher von der Richtung, aus
welcher die Töne an den linken und rechten Eingangs-Mikrophonen
ankommen, abhängig gemacht wird. Das System umfasst Summier- und
Differenzschaltungen, deren Ausgänge mit entsprechenden Filtern
verbunden sind. Solche Summier- und Differenzschaltungen haben
danach in vielen verschiedenen Typen von Stereosystemen,
insbesondere Stereo-Erweiterungs-Systemen, Verwendung gefunden.
-
Es gibt zahlreiche Stereo-Verbreiterungs-Verfahren, welche
mit unterschiedlichem Erfolg versuchen, das Stereo-Klangbild zu
verbreitern. Ein gemeinsames Element vieler dieser Verfahren ist
die Verwendung solcher Summier- und Differenzschaltungen, wobei
die linken und rechten Stereo-Eingangssignale auf eine Art
addiert und verarbeitet werden, und die Eingangssignale auch auf
andere Art subtrahiert und verarbeitet werden, wobei diese
beiden Wege zum Erzeugen des umgewandelten Ausgangssignals
wiedervereinigt werden. Diese Verfahren sind alle synthetisch in
dem Sinne, dass sie keine Grundlage in der genauen Modellierung
der theoretisch erforderlichen Verarbeitung zur Erweiterung des
Klangbildes besitzen. Zum Beispiel beschreibt US-A-4,748,669 Von
Klayman ein Stereo-Verbesserungssystem, welches Summier- und
Differenzsignale und -schaltungen einschließlich eines Spektrum-
Analysators zum selektiven Modifizieren der Signale erzeugt.
-
Ein besseres Verfahren besteht darin, sogenannte
Kopfbezogene Transfer-Funktionen (HRTFs) zu verwenden, also Filter,
welche das Ansprechen eines künstlichen oder menschlichen Kopfes
oder Ohren auf einen aus einer speziellen Richtung ankommenden
Ton repräsentieren. Durch die Verwendung von HRTFs kann ein
Konverter erzeugt werden, welcher die den Erweiterungsprozess
beschreibenden theoretischen Gleichungen akkurat modelliert. US-
A-5,371,799 von Lowe beschreibt zum Beispiel ein System für ein
auf einem Personal-Computer gespieltes Videospiel, wobei ein
Eingangs-Audiosignal an beide, linke und rechte HRTFs angelegt
wird, wobei die HRTFs entsprechend dem geforderten scheinbaren
Standort der Audiosignal-Quelle modifiziert werden. Diese
Verfahren werden manchmal als Erzeugen virtueller Sprecher oder
Quellen zum Positionieren zweier Sprecher scheinbar außerhalb
der aktuellen physikalischen Sprecher-Positionen bezeichnet. Das
Problem bei diesen Verfahren ist, dass eine Tonqualitäts-
Änderung besteht (manchmal als eine Entzerrungs-Änderung
bezeichnet), verbunden mit der Verwendung von HRTFs zum Erzeugen
virtueller Quellen oder Sprecher. Dieser Effekt ist unerwünscht
und bei vielen Anwendungsgebieten nicht akzeptabel.
-
Diese Tonänderung kann durch Angleichen beider, der linken
und rechten Eingangs- (oder Ausgangs)-Signale, als Ausgleich für
die von den HRTFs erzeugte Tonänderung korrigiert werden, aber,
wenn dies geschieht, ist die Positions-Genauigkeit der
virtuellen Tonquelle - Sprecher oder Lautsprecher -
beeinträchtigt, insbesondere, falls die virtuellen Sprecher weit
voneinander beabstandet sind.
-
WO 8903632 offenbart eine bekannte Stereo-Erweiterungs-
Vorrichtung.
Zusammenfassung der Erfindung
-
Gemäß der vorliegenden Erfindung wird eine Vorrichtung
vorgesehen, wie in den Ansprüchen beschrieben. Eine Aufgabe der
vorliegenden Erfindung ist es, ein Stereo-Erweiterungssystgem
zur Verfügung zu stellen, ohne eine Tonänderung zu verursachen.
-
Die Erfindung basiert auf der Tatsache, dass ein typisches
Paar von HRTFs (nahes Ohr und entferntes Ohr) eine nützliche
Eigenschaft besitzen; d. h. dass die Funktion des entfernteren
Ohrs sehr viel mehr in der Amplitude verringert ist als die
Funktion des näheren Ohrs, insbesondere bei höheren Frequenzen.
Das bedeutet, dass - wenn HRTF-Paare zum Erzeugen einer
virtuellen Quelle verwendet werden - die meiste Energie von der
virtuellen Quelle für das nahe gelegene Ohr bestimmt ist.
Dadurch nimmt der Zuhörer eine Tonqualität wahr, welche von der
HRTF des näheren Ohrs dominiert wird. Diese Eigenschaft kann man
sich zunutzte machen. Beide HRTFs, die des näheren Ohrs und die
des entfernteren Ohrs, können mit dem Inversen der HRTF des
näheren Ohrs entzerrt werden, wodurch die HRTF des näheren Ohrs
verflacht wird. Auf diese Weise nimmt das Ohr eine von der HRTF
des näheren Ohrs dominierte Tonqualität wahr, welche flach ist.
Die Wirkung besteht darin, dass das Gesamt-Frequenz-Ansprechen
im wesentlichen flach, und somit die Tonqualität korrekt ist. Es
hat sich jedoch herausgestellt, dass, wenn man tatsächlich so
verfährt, die Entzerrung des entfernteren Ohrs durch die gleiche
Entzerrungs-Funktion (entgegengesetzt zum näheren Ohr) die
Lokalisierungs-Genauigkeit beeinträchtigt und das Endresultat
nicht befriedigend ist.
-
Man hat jedoch herausgefunden, dass - wenn die HRTF des
entfernteren Ohrs NICHT modifiziert wird - und die HRTF des
näheren Ohrs mit ihrem eigenen Inversen entzerrt wird, wie oben
beschrieben, d. h. neutralisiert worden ist und einen,
abgeflachten Frequenzgang besitzt, der Stereo-Erweiterer die
Vorteile eines scheinbar flachen Frequenzganges genießt, d. h.
keine Tonänderung stattfindet, und trotzdem auch die volle
Lokalisierungs-Genauigkeit gegeben ist. Dies ist die Grundlage
der vorliegenden Erfindung. Ein flaches Ansprech-Filter ist
natürlich eine direkt durchgehende Verbindung; es ist keine
Filterung erforderlich.
-
Die vorliegende Erfindung stellt eine Stereo-Erweiterung-
Vorrichtung dar, umfassend erste und zweite Eingänge zum Empfang
entsprechender linker und rechter Stereosignale, wobei der erste
Eingang über einen ersten Kanal, welcher die Frequenz-
Charakteristik des Stereosignals nicht wesentlich ändert, mit
einem ersten Summiermittel verbunden ist, und wobei der erste
Eingang über ein Filter, das eine HRTF (Kopf-bezogene Transfer-
Funktion) des entfernteren Ohrs für einen Zuhörer repräsentiert,
mit einem zweiten Summiermittel verbunden ist, und wobei der
zweite Eingang über einen zweiten Kanal, welcher die Frequenz-
Charakteristik des Stereosignals nicht wesentlich ändert, mit
dem zweiten Summiermittel, und über ein Filter, das eine HRTF
des entfernteren Ohrs für einen Zuhörer repräsentiert, mit dem
ersten Summiermittel verbunden ist, wobei die Ausgänge der
Summiermittel erweiterte Stereoton-Signale ausgeben.
-
Die erfindungsgemäße Vorrichtung kann entweder zum Erzeugen
binauraler, für Kopfhörer geeigneter Signale, verwendet werden,
oder sie kann in eine Übersprech-Lösch-Vorrichtung eingespeist
werden, wie die in unserer gleichfalls schwebenden Anmeldung WO-
A-9515069 beschriebene Vorrichtung, zum Erzeugen von Signalen,
welche für die Wiedergabe über Lautsprecher geeignet sind.
-
Gemäß einem bevorzugten Merkmal der Erfindung wird ein
Entzerrer-Mittel zum Kompensieren irgendwelcher Durchschnitts-
Abweichungen verwendet. Vorzugsweise wird ein Entzerrer-Mittel
mit einer Charakteristik verwendet, welche beide, linke und
rechte Kanäle entzerrt, entweder vor oder nach der Stereo-
Erweiterung.
-
Im Sinne dieser Beschreibung bedeutet HRTF oder
Kopfbezogene Transfer-Funktion eine Funktion, welche den
Frequenzgang eines Weges zwischen einer Tonquelle und dem Ohr
eines Zuhörers repräsentiert, entweder dem Ohr näher am Ton
(nahe HRTF) oder dem Ohr weiter vom Ton entfernt (entfernte
HRTF). HRTFs können durch Messungen an einem realen
menschlichen, mit geeigneten Mikrophonen ausgestatteten Kopf
erlangt werden; alternativ können sie durch Verwendung eines
künstlichen Kopfmittels erhalten werden, welches - wie üblich -
ein präzises Modell eines menschlichen Kopfes und Rumpfes mit
Mikrophonen in den Ohrmuscheln sein kann; alternativ kann es
etwas weit weniger Präzises sein, zum Beispiel ein zwischen
einem Paar voneinander beabstandeter Mikrophone angeordneter
Block oder ein Brett aus Holz; es kann sogar eine elektrische
Synthese-Schaltung sein oder ein System, welches solch eine
Funktion erzeugt. Es versteht sich, dass HRTFs in weitem Maße
veröffentlicht sind, siehe beispielsweise "Measuring a dummy
head in search of pinna cues" (Messen eines Kunstkopfes auf der
Suche nach Ohrmuschel-Indikatoren) - HL Han, J. Audio Eng. Soc.,
Jan/Feb, T994, 42, (1/2), S. 15-36.
Kurze Beschreibung der Zeichnungen
-
Bevorzugte Ausführungsformen der Erfindung werden
nachfolgend mit Bezug auf die beigefügten Zeichnungen
beschrieben. In den Zeichnungen zeigen:
-
Fig. 1 ein Blockschaltbild einer ersten
Ausführungsform der Erfindung, geeignet zur
Verwendung bei Kopfhörern;
-
Fig. 2 ein Blockschaltbild einer zweiten
Ausführungsform der Erfindung, geeignet zur
Verwendung mit Lautsprechern; und
-
Fig. 3 ein Blockschaltbild einer dritten
Ausführungsform, ähnlich wie Fig. 1, jedoch
unter Verwendung von Entzerrungs-Stufen;
-
Fig. 4 bis 6 Graphen von Entzerrungs-Charakteristika
für das Ausführungsbeispiel von Fig. 3; und
-
Fig. 7 bis 9 Darstellungen von HRTFs des näheren
Ohrs und HRTFs des entfernteren Ohrs.
Beschreibung der bevorzugten Ausführungsformen.
-
In Fig. 1 ist eine Stereo-Erweiterungs-Vorrichtung umfassend
erste und zweite Eingänge 2, 4 für LINKE und RECHTE Stereo-
Eingangssignale gezeigt. Der linke Eingang ist über einen ersten
Kanal 6 mit einer ersten Summierschaltung 8 verbunden. Der erste
Kanal 6 ist als eine direkte Verbindung gezeigt und besitzt
einen flachen Frequenzgang, d. h. er erzeugt keine signifikante
Änderung in Bezug auf die Frequenz-Charakteristika des linken
Stereosignals. Er kann jedoch Verzögerungsschaltungen und
Dämpfungsglied-Schaltungen umfassen. Der Eingang 2 ist auch über
ein Filter 10 mit einer zweiten Summierschaltung 12 verbunden.
Das Filter 10 repräsentiert die HRTF (Kopf-bezogene Transfer-
Funktion) des entfernteren Ohrs, welche der Position jeder
"virtuellen Quelle" zugeordnet ist, und die HRTF schließt die
Zeitverzögerungen und durch die Anwesenheit des Zuhörer-Kopfes
verursachte Ablenkungs-Effekte ein.
-
Der zweite Eingang 4 ist über einen zweiten Kanal 14 mit
ähnlichen Charakteristika wie diejenigen von Kanal 6 an einen
zweiten Eingang einer zweiten Summierschaltung 12 angeschlossen.
Der Eingang 4 ist ebenfalls über ein Filter 16, welches auch
eine HRTF-Funktion des entfernteren Ohrs - verbunden mit der
Position jeder "virtuellen Quelle" - mit einem zweiten Eingang
der ersten Summierschaltung 8 verbindet. Die Ausgänge der
Summierschaltungen 8, 12 liefern linke und rechte biaurale
Ausgabesignale an Stereo-Kopfhörer.
-
Die Implementierung der HRTF des entfernteren Ohrs kann
analog (z. B. eine Filterschaltung) oder (z. B. ein FIR-Filter)
sein. Es sei bemerkt, dass die HRTF des entfernteren Ohrs eine
Zeitverzögerung einschließt, welche eine interaurale
Zeitverzögerung für den virtuellen Quellenwinkel darstellt. Die
ADD-Funktion kann digital sein (z. B. ein Akkumulator) oder
analog (z. B. eine Funktions-Verstärker-Schaltung). Es versteht
sich, dass bei einer praktischen Anwendung, z. B. einem
Videospiel auf einem Personal Computer, ein gespeichertes Archiv
von HRTFs für verschiedene Positionen virtueller Winkel bestehen
kann, und diese werden in die Schaltung von Fig. 1 geschaltet,
abhängig von der gewünschten darzustellenden Klangposition.
-
Fig. 2 zeigt eine zweite Ausführungsform der Erfindung, die
zur Verwendung mit Lautsprechern geeignet ist. Gleiche Teile wie
in Fig. 1 sind mit den gleichen Bezugszeichen bezeichnet. Die
Ausgänge der Summierschaltungen 8, 12 sind mit Übersprech-
Löschungs-Mitteln 20 verbunden. Dieses erzeugt in bekannter
Weise (siehe zum Beispiel die veröffentlichte internationale
Patentanmeldung Nr. WO A-95150679) Kompensation für Signale,
welche von Lautsprechern übertragen werden, so dass der
binaurale Effekt am Kopf des Zuhörers aufrechterhalten wird, und
die Ausgänge von den linken und rechten Lautsprechern erzeugen
kein Übersprechen, welches den binauralen Effekt zerstört.
-
Ein übliches Verfahren zum Erzeugen einer Art von Stereo-
Aufzeichnung ist die Panorama-Einstellung einer oder mehrerer
Mono-Quellen, was bedeutet, dass die Stereo-Effekte abgeleitet
werden durch Panorama-Einstellung jeder Mono-Quelle zwischen den
linken und rechten Kanälen, wodurch relative Amplituden-
Differenzen erzeugt werden. Dieses Verfahren kann beispielsweise
bei einem Videospiel für einen PC Verwendung finden, wo ein
Archiv von Mono-Tönen gespeichert ist und es erwünscht ist, eine
Stereo-Summe zu erzeugen. Es hat sich herausgestellt, dass solch
ein in die Ausführungsformen von Fig. 1 und 2 eingespeistes
Stereosignal tonal korrekt ist, wenn die Panorama-Einstellung
hart auf eine Seite positioniert ist, aber, dass eine
Tonungenauigkeit besteht, welche bei der Panorama-Einstellung in
die Mitten-(Mono)-Position graduell ansteigt. Dieser Effekt kann
wie folgt verstanden werden.
-
Wenn Monosignale durch ein Stereo-Paar von Lautsprechern (zu
einem Zuhörer in der üblichen Zuhör-Position) wiedergegeben
werden, werden identische Signale von beiden Lautsprechern zur
gleichen Zeit gesendet. Deshalb empfängt das rechte Ohr das
rechte Sprechersignal, kurz darauf gefolgt von einem gleichen
Signal von dem linken Sprecher (und umgekehrt). Bei niedrigen
Frequenzen sind die vom Kopf verursachten Ablenkungseffekte
gering, und deshalb empfängt jedes Ohr ein Primärsignal (rechtes
Ohr vom rechten Sprecher und linkes Ohr vom linken Sprecher),
gefolgt von einem Sekundärsignal (rechtes Ohr vom linken
Sprecher und linkes Ohr vom rechten Sprecher), wobei die
letzteren durch transaurales Übersprechen verursacht werden. Die
Sekundärsignale sind in Bezug auf die Primärsignale um etwa
0,227 ms verzögert, wegen der zusätzlichen Entfernung, die sie
um den Kopf herum zurücklegen müssen. Deshalb wird destruktive
und konstruktive Interferenz auftreten, wenn die primären und
sekundären Klangwellen bei gewissen periodisch wiederkehrenden
Frequenzen zusammentreffen, wodurch Kammfilterung bei dem ersten
Minimum von etwa 2,2 kHz entsteht. Wenn deshalb ein Monosignal
durch ein Paar von Stereo-Lautsprechern zu einem Zuhörer in der
üblichen Zuhörposition (Bilden eines gleichseitigen Dreiecks mit
den Lautsprechern) gespielt wird, wird das Signal durch
akustische Interferenz kammgefiltert. Wenn die Panorama-
Einstellung jedoch extrem nach, links oder rechts gerichtet ist,
wird der Ton nur von einem der beiden Lautsprecher emittiert,
und deshalb gibt es keine Wellenaddition und auch keinen
Kammfilter-Effekt.
-
Es hat sich herausgestellt, dass dieser Effekt ohne Verlust
von Positionsgenauigkeit durch Entzerren beider Eingangskanäle
oder beider Ausgangskanäle in geeigneter Weise kompensiert
werden kann: In diesem Zusammenhang soll Entzerren das Erzeugen
einer Transfer-Funktion bedeuten, welche den vorhergesehenen
Kammfilter-Effekt kompensiert, so dass ein Signal für den
Zuhörer erzeugt wird, welches nicht tonal verzerrt ist. Dies
trifft für beide binauralen und transauralen Arrangements zu:
Solch eine Entzerrung kann auf jede der drei folgenden Arten
angelegt werden:
-
1. Keine Entzerrung; in welchem Fall die Positionen mit
harter Panorama-Einstellung tonal korrekt sind, und die
Mittenposition am wenigsten genau ist;
-
2. vollkommenes Verflachen der Mittenposition; in welchem
Fall die linken und rechten Positionen mit harter
Panorama-Einstellung am wenigsten genau werden;
-
3. Verflachen einer Zwischen-Position; in welchem Fall
beides, die Mitte und die äußeren Enden fehlerhaft sind,
aber der Durchschnittsfehler geringer als derjenige in
den Fällen 1 oder 2 ist.
-
Das in Fig. 4 bis 6 gezeigte Ansprechen basiert auf einem
Expander, welcher + 80 Grad virtuelle Sprecher verwendet. Dies
bedeutet, dass eine Tonquelle mit harter, nach rechts
gerichteter Panorama-Einstellung (die normalerweise unter
Verwendung konventioneller Sprecherwinkel um 30 Grad nach rechts
liegen würde) bei Verwendung des Expanders um 80 Grad nach
rechts erscheinen würde, und die physikalischen Sprecher
befinden sich noch bei + 30 Grad. Fig. 4, 5 und 6 zeigen, was
geschieht, wenn ein Monosignal durch Panorama-Einstellung auf
Stereo expandiert wird. Jeder Graph zeigt ein verschiedenes
Panorama-Einstellungs-Verhältnis. Fig. 4 zeigt einen Graph bei
harter Panorama-Einstellung voll nach einer Seite. Fig. 5 zeigt
einen Graph, welcher eine mittige Panorama-Einstellung (mono)
darstellt. Fig. 6 zeigt einen Graph, welcher eine
Zwischenstellung darstellt, ungefähr in der Mitte zwischen
diesen Extremen. Die Graphen in Fig. 4, 5 und 6 stellen das
Verhältnis von Spektren dar, welche von einem Expander-System
der vorliegenden Erfindung erzeugt wurden, zu Spektren, welche
durch Panorama-Einstellung von einem Stereosignal erzeugt
werden. Dieses Verhältnis ist wichtig, da es den Eindruck von
Abweichungen im Ton von einem konventionellen Stereosignal, an
das ein Zuhörer gewöhnt ist, vermittelt. Auf diese Weise kann
man durch Hinzufügen von Entzerrung zur Kompensation der in Fig.
4 bis 6 gezeigten Funktion zu "Stereo-Hörqualität" zurückkehren,
jedoch mit dreidimensionalen Eindrücken.
-
Fig. 4 ist praktisch flach und zeigt, dass, wenn die Quelle
mit harter Panorama-Einstellung ganz nach einer Seite gerichtet
ist, der Expander tonal genau so klingt wie stereo, was für die
meisten Zwecke akzeptabel ist.
-
Fig. 5 zeigt den Mono-Fall (pan = 0,50), und zeigt, dass ein
Kamm-Effekt besteht, welcher eine Abweichung von Stereo bewirkt.
-
Fig. 4 und 5 sind die beiden Extreme. Die Durchschnitts-
Abweichung tritt in einer Position ungefähr in der Mitte
zwischen diesen beiden Extremen auf, wie in Fig. 6 (pan = 0,70)
gezeigt.
-
Gemäß einem bevorzugten Merkmal der Erfindung wird ein
Entzerrer zum Kompensieren der Durchschnitts-Abweichung
vorgsehen: Es wird ein Entzerrer mit einer zu Fig. 6 inversen
Charakteristik zum Entzerren beider linker und rechter Kanäle
(entweder vor oder nach der erfindungsgemäßen Stereo-
Erweiterung) verwendet, dann wird die Erweiterungs-Vorrichtung
bei der Panorama-Einstellungs-Position von Fig. 6 korrekt sein
und an jedem der beiden extremen Enden fehlerhaft.
-
Fig. 3 zeigt eine dritte Ausführungsform der Erfindung
einschließlich der oben genannten Ausführungen. Gleiche Teile
wie in Fig. 1 sind mit den gleichen Bezugszeichen versehen. Die
Schaltung umfasst Entzer rer-Schaltungen 30, 32 die jeweils
Kammfilter-Kompensations-Transfer-Funktionen (invers zu Fig. 6)
besitzen, welche zwischen Eingängen 2 und 4 und Kanälen 6 und 14
geschaltet sind. Die Ausgabesignale der Summierschaltungen 8, 12
sind an Stereo-Kopfhörer angelegt. Bei einer Modifikation sind
die Schaltungen 30, 32 an den Ausgängen der Summierschaltungen
8, 12 platziert.
-
Fig. 7 und 8 zeigen die OHR-FERNEN bzw. OHR-NAHEN HRTFs für
80 Grad. Es sei bemerkt, dass die Funktion des entfernten Ohrs
mit ansteigender Frequenz von etwa 1 kHz an markant abfällt. Bei
der vorliegenden Erfindung wird die HRTF des NAHE gelegenen Ohrs
natürlich nicht genutzt, da sie durch einen flachen Frequenzgang
ersetzt wird.
-
Es versteht sich, dass bei der vorliegenden Erfindung - bei
der Anwendung auf Toneffekte für ein Videospiel - die bei den
gezeigten Schaltungen verwendeten HRTFs aus einem Speicher mit
HRTF-Magazin ausgewählt werden, welches verschiedene scheinbare
Ton-Einfalls-Winkel am Ohr eines Zuhörers darstellt, abhängig
davon, welcher Ton-Einfalls-Winkel repräsentiert werden soll. In
Fig. 9 sind Darstellungen von HRTFs für verschiedene Hörwinkel
gezeigt.