JP6694755B2 - Channel number converter and its program - Google Patents
Channel number converter and its program Download PDFInfo
- Publication number
- JP6694755B2 JP6694755B2 JP2016103594A JP2016103594A JP6694755B2 JP 6694755 B2 JP6694755 B2 JP 6694755B2 JP 2016103594 A JP2016103594 A JP 2016103594A JP 2016103594 A JP2016103594 A JP 2016103594A JP 6694755 B2 JP6694755 B2 JP 6694755B2
- Authority
- JP
- Japan
- Prior art keywords
- downmix
- signal
- channel
- downmix coefficient
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 claims description 105
- 238000006243 chemical reaction Methods 0.000 claims description 86
- 238000004364 calculation method Methods 0.000 claims description 69
- 238000003860 storage Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、マルチチャンネルの音響信号から再生環境に応じた再生用音響信号を生成するチャンネル数変換装置およびプログラムに関する。 The present invention relates to a channel number conversion device and a program for generating a reproduction audio signal according to a reproduction environment from a multi-channel audio signal.
現在、22.2chなどのマルチチャンネル音響放送(非特許文献1)の実用化が進められている。また、近年、5.1chなどのマルチチャンネル音響システムが家庭等でも広がりつつある。しかし、家庭等の音響システムは、22.2chより少ないチャンネル数でのみ再生可能なシステムである場合が多いと想定される。一般に所定の数のチャンネル数で制作された番組の音響信号を、制作時よりも少ないチャンネル数で再生する場合、ダウンミックスと呼ばれるチャンネル数変換処理が行われる。ダウンミックスとは、制作時の音響信号の各チャンネルの信号にダウンミックス係数を乗じて加算することで、再生時のチャンネル数に応じた音響信号を算出する処理である。ダウンミックス係数は、規格において予め定められている場合がある(例えば、非特許文献2)。例えば、5.1chサラウンド(L,R,C,LFE,Ls,Rsの6チャンネル)からステレオ2ch(Lt, Rtの2チャンネル)へのダウンミックス係数は、ARIB STD−B32に以下のように規定されている。 Currently, practical application of multi-channel audio broadcasting (Non-Patent Document 1) such as 22.2 ch is in progress. In addition, in recent years, 5.1-channel multi-channel audio systems are spreading in homes and the like. However, it is assumed that home acoustic systems are often systems that can reproduce only with a channel number less than 22.2 ch. Generally, when an audio signal of a program produced with a predetermined number of channels is reproduced with a smaller number of channels than at the time of production, a channel number conversion process called downmix is performed. Downmix is a process of multiplying the signal of each channel of the acoustic signal at the time of production by a downmix coefficient and adding the signals to calculate an acoustic signal according to the number of channels at the time of reproduction. The downmix coefficient may be predetermined in the standard (for example, Non-Patent Document 2). For example, the downmix coefficient from 5.1ch surround (L, R, C, LFE, Ls, Rs 6 channels) to stereo 2ch (Lt, Rt 2 channels) is specified in ARIB STD-B32 as follows. Has been done.
ここで、サラウンドチャンネル(Ls,Rs)のレベルを規定する係数kには以下の値が用いられる。 Here, the following values are used for the coefficient k that defines the levels of the surround channels (Ls, Rs).
また、メタデータが伝送されない場合、デジタルテレビ受信機では、係数kに以下の値が用いられる。 When the metadata is not transmitted, the following value is used for the coefficient k in the digital television receiver.
また、放送では、番組ごとにメタデータを添付することで、番組内容に合わせて異なるダウンミックス係数を指定することが可能である。 Also, in broadcasting, by attaching metadata for each program, it is possible to specify different downmix coefficients according to the content of the program.
なお、近年、家庭やシアター等で利用される音響システムには、オブジェクトベース音響方式が採用されることも多い。オブジェクトベース音響方式では、様々なスピーカ配置が採用されており、再生環境は多様化している。 It should be noted that in recent years, an object-based audio system is often adopted in an audio system used at home, a theater, or the like. In the object-based audio system, various speaker arrangements are adopted, and the reproduction environment is diversified.
上記のとおり、4K/8K放送の22.2chなど、5.1chを上回るチャンネル数のマルチチャンネル音響放送が提案されている。しかし、家庭では、22.2chに対応するスピーカ数を所定のスピーカ位置に設置することができず、番組制作時に想定した数よりも少ないスピーカ数で再生される場合も多い。その場合、ダウンミックスが必要となるが、スピーカ数とその配置は、メーカーの製品の仕様に依存しており、全てのスピーカ配置に対するダウンミックス係数を規定するのは現実的ではない。また、ドキュメンタリーや音楽番組など番組によって最適なダウンミックス係数が異なる可能性があり、同じスピーカ配置であっても、番組ごとにスピーカ数、スピーカ配置に応じた適切なダウンミックス係数を規定することが望ましい。このような中、マルチチャンネル音響信号を、再生環境(スピーカ数、配置)や番組内容に応じて、最適にダウンミックスする技術に対するニーズが存在する。 As described above, multi-channel audio broadcasting having a number of channels exceeding 5.1 ch, such as 22.2 ch for 4K / 8K broadcasting, has been proposed. However, at home, the number of speakers corresponding to 22.2 ch cannot be set at a predetermined speaker position, and in many cases, reproduction is performed with a smaller number of speakers than the number assumed at the time of program production. In that case, downmixing is required, but the number of speakers and their arrangement depend on the manufacturer's product specifications, and it is not realistic to specify downmix coefficients for all speaker arrangements. Also, the optimal downmix coefficient may differ depending on the program such as documentary or music program, and even with the same speaker arrangement, it is possible to specify the number of speakers for each program and an appropriate downmix coefficient according to the speaker arrangement. desirable. Under such circumstances, there is a need for a technique for optimally downmixing a multi-channel audio signal according to a reproduction environment (number of speakers, arrangement) and program content.
そこでこの発明は、上述の課題を解決することのできるチャンネル数変換装置およびそのプログラムを提供することを目的としている。 Therefore, an object of the present invention is to provide a channel number conversion device and a program thereof that can solve the above problems.
本発明の一態様によれば、チャンネル数変換装置は、第一ダウンミックス係数を用いてマルチチャネル音響信号から所望の第一ダウンミックス信号を算出し、第二ダウンミックス係数を用いて前記第一ダウンミックス信号から参照信号と同じチャンネル数の第二ダウンミックス信号を算出するダウンミックス信号算出部と、前記第二ダウンミックス信号と参照信号との差分を算出する差分信号算出部と、前記差分信号算出部が算出した差分が、最小または所定の閾値以下となるように、前記第一ダウンミックス係数および前記第二ダウンミックス係数を更新するダウンミックス係数更新部と、を備える。 According to one aspect of the present invention, the channel number conversion device calculates a desired first downmix signal from the multi-channel acoustic signal using the first downmix coefficient, and uses the second downmix coefficient to calculate the desired first downmix signal. A downmix signal calculator that calculates a second downmix signal having the same number of channels as the reference signal from the downmix signal, a difference signal calculator that calculates the difference between the second downmix signal and the reference signal, and the difference signal. A downmix coefficient updating unit that updates the first downmix coefficient and the second downmix coefficient so that the difference calculated by the calculating unit becomes a minimum value or a predetermined threshold value or less.
本発明の一態様によれば、前記チャンネル数変換装置は、前記マルチチャネル音響信号を所定のダウンミックス係数を用いてダウンミックスし、前記参照信号を算出する参照信号算出部、をさらに備えてもよい。 According to an aspect of the present invention, the channel number conversion device may further include a reference signal calculation unit that downmixes the multi-channel acoustic signal using a predetermined downmix coefficient and calculates the reference signal. Good.
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記第二ダウンミックス係数を固定して、前記第一ダウンミックス係数のみを更新してもよい。 According to an aspect of the present invention, the downmix coefficient updating unit may fix the second downmix coefficient and update only the first downmix coefficient.
本発明の一態様によれば、前記チャンネル数変換装置は、前記第一ダウンミックス係数の初期値と前記第二ダウンミックス係数の初期値とのうち少なくとも一方を記憶するダウンミックス係数記憶部、をさらに備えてもよい。 According to an aspect of the present invention, the channel number conversion device includes a downmix coefficient storage unit that stores at least one of an initial value of the first downmix coefficient and an initial value of the second downmix coefficient. It may be further provided.
本発明の一態様によれば、前記ダウンミックス係数記憶部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第一ダウンミックス係数を記憶してもよい。 According to an aspect of the present invention, the downmix coefficient storage unit reproduces an audio signal of each channel included in the multi-channel audio signal and an audio signal of each channel included in the first downmix signal. The first downmix coefficient having an initial value determined based on the positional relationship with the position may be stored.
本発明の一態様によれば、前記ダウンミックス係数記憶部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第二ダウンミックス係数を記憶してもよい。 According to an aspect of the present invention, the downmix coefficient storage unit includes a reproduction position of an acoustic signal of each channel included in the first downmix signal and an acoustic signal of each channel included in the second downmix signal. The second downmix coefficient having an initial value determined based on the positional relationship with the reproduction position may be stored.
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第一ダウンミックス係数を更新してもよい。 According to an aspect of the present invention, the downmix coefficient updating unit reproduces an acoustic signal of each channel included in the multi-channel acoustic signal and an acoustic signal of each channel included in the first downmix signal. The first downmix coefficient may be updated based on a constraint condition defined by the similarity of the position to the position.
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第二ダウンミックス係数を更新してもよい。 According to an aspect of the present invention, the downmix coefficient updating unit includes a reproduction position of an acoustic signal of each channel included in the first downmix signal and an acoustic signal of each channel included in the second downmix signal. The second downmix coefficient may be updated based on a constraint condition determined by the similarity of the position with the reproduction position.
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第一ダウンミックス係数および第二ダウンミックス係数を更新してもよい。 According to an aspect of the present invention, the downmix coefficient updating unit sets the first downmix coefficient and the first downmix coefficient as a constraint condition that a value of a downmix coefficient between channels having the highest position similarity becomes maximum. The second downmix coefficient may be updated.
本発明の一態様によれば、コンピュータを、上記の何れか1つに記載のチャンネル数変換装置、として機能させるためのプログラムである。 According to one aspect of the present invention, there is provided a program for causing a computer to function as the channel number conversion device according to any one of the above.
本発明のチャンネル数変換装置によれば、再生環境(スピーカ数、スピーカ配置)に応じたダウンミックス係数を番組ごとに算出することができる。 According to the channel number conversion device of the present invention, the downmix coefficient according to the reproduction environment (the number of speakers and the speaker arrangement) can be calculated for each program.
<第一実施形態>
以下、本発明の第一実施形態によるチャンネル数変換装置を図1〜図7を参照して説明する。
図1は、本発明に係る第一実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図1に示すようにチャンネル数変換装置10は、マルチチャンネル音響信号入力部11と、参照信号入力部12と、スピーカ位置情報入力部13と、ダウンミックス信号算出部14と、差分信号算出部15と、ダウンミックス係数更新部16と、ダウンミックス係数記憶部17と、を備えている。
チャンネル数変換装置10は、所定のマルチチャンネル音響信号(Nチャンネル)を、そのマルチチャンネル音響信号のチャンネル数よりも少ないチャンネル数の音響信号(以下、参照信号と呼ぶ)(Sチャンネル)と、マルチチャンネル音響信号のスピーカ位置の情報と、ダウンミックス先のスピーカ位置の情報とに基づいて、所望のチャンネル数の再生用ダウンミックス音響信号(Mチャンネル)に変換する装置である。
<First embodiment>
Hereinafter, a channel number conversion device according to a first exemplary embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram showing an example of a channel number conversion device according to the first embodiment of the present invention.
As shown in FIG. 1, the channel
The channel
以下、所定のマルチチャンネル音響信号として4k/8Kの22.2ch音響システム、参照信号としてステレオ2ch、再生音響信号を7.1chの場合を例に説明を行う。しかし、マルチチャンネル音響信号、参照信号、ダウンミックス信号の各チャンネル数は、この例の数に限らない。また、チャンネル数変換装置10は、コンピュータによって構成されており、例えば、テレビなどの放送受信機やホームシアターなどのメディアの再生装置に組み込まれていてもよい。
図1は、チャンネル数変換装置10にマルチチャンネル音響信号と参照信号を入力し、ダウンミックス信号を出力する構成を示す。チャンネル数変換装置10が出力するダウンミックス信号は、例えば、再生装置に接続したスピーカ等から出力される。このとき、チャンネル数変換装置10は、入力したマルチチャンネル音響信号が作成されたときのスピーカ数およびスピーカ配置によって出力されたときに聴取者が感じる音の印象を、なるべく再現できるようなダウンミックス信号を生成する。チャンネル数変換装置10は、そのようなダウンミックス信号を生成するために、再生環境におけるスピーカの数およびスピーカ配置に応じた適切なダウンミックス係数を算出する。
An example will be described below in which the predetermined multi-channel audio signal is a 22.2ch audio system of 4k / 8K, the stereo signal is 2ch as a reference signal, and the reproduced audio signal is 7.1ch. However, the number of channels of the multi-channel audio signal, the reference signal, and the downmix signal is not limited to the number in this example. The channel
FIG. 1 shows a configuration in which a multi-channel acoustic signal and a reference signal are input to a channel
マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。ここで、マルチチャンネル音響信号は、例えば、放送局から送出された22.2chのマルチチャンネル音響信号とする。
参照信号入力部12は、参照信号を入力する。参照信号は、所望のダウンミックス信号のチャンネル数よりも少ないチャンネル数で制作されたマルチチャンネル音響信号と同一内容の音響信号であり、元のマルチチャンネル音響信号と別途入力される音響信号である。ここで、参照信号は、例えば、マルチチャンネル音響信号と同時に放送されたステレオ2chの音声信号である。また、参照信号は、所定のダウンミックス係数に基づいてマルチチャンネル音響信号からダウンミックスして生成された参照信号であってもよい。
The multi-channel audio
The reference
スピーカ位置情報入力部13は、マルチチャンネル音響信号の作成時において、そのマルチチャンネル音響信号に対して定められた複数のスピーカそれぞれの位置情報を取得する。また、スピーカ位置情報入力部13は、ダウンミックス信号の再生環境における一つまたは複数のスピーカそれぞれの位置情報を取得する。ここで、スピーカ位置情報は、例えば、座標情報、極座標情報として与えられる。
The speaker position
ダウンミックス信号算出部14は、第一ダウンミックス信号算出部141と、第二ダウンミックス信号算出部142と、を含む。第一ダウンミックス信号算出部141は、後述するダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)を用いて、チャンネル数Nのマルチチャネル音響信号(N)から所望のチャンネル数Mの第一ダウンミックス信号(M)を算出する。
第二ダウンミックス信号算出部142は、ダウンミックス係数記憶部17が記憶する第二ダウンミックス係数(S×M)を用いて、算出したチャンネル数Mの第一ダウンミックス信号(M)から参照信号と同じチャンネル数Sの第二ダウンミックス信号(S)とを算出する。
The downmix
The second downmix
差分信号算出部15は、参照信号と第二ダウンミックス信号(S)との差分を算出する。また、差分信号算出部15は、算出した差分が最小かどうか、または、算出した差分が所定の閾値以下かどうかを判定する。差分信号算出部15は、完全に最小値となるまで計算を繰り返さなくても、第一ダウンミックス係数(M×N)と第二ダウンミックス係数(S×M)を更新しても差分の変化が閾値以下となることに基づいて差分が最小となったと判定してもよい。
ダウンミックス係数更新部16は、差分信号算出部15が算出する差分が最小もしくは閾値以下になるように第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)、または、第一ダウンミックス係数(M×N)のみを補正する。ダウンミックス係数更新部16は、補正した第一ダウンミックス係数(M×N)等でダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)等を更新する。なお、後述するように、ダウンミックス係数更新部16は、例えば、マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と、第一ダウンミックス信号(M)に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて第一ダウンミックス係数(M×N)を更新する。
The difference
The downmix
ダウンミックス係数記憶部17は、チャンネル数変換処理に必要な種々のデータを記憶する。まず、ダウンミックス係数記憶部17は、第一ダウンミックス係数(M×N)の初期値、および、第二ダウンミックス係数(S×M)の初期値を記憶する。そして、ダウンミックス信号算出部14は、これらの初期値を用いて第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)の算出を開始する。なお、第一ダウンミックス係数(M×N)初期値、および、第二ダウンミックス係数(S×M)初期値については、例えば乱数を発生させて設定してもよい。または、ダウンミックス前後の各チャンネル位置の角度差や距離差に応じた数値を設定してもよい。また、ダウンミックス係数が規格などで決まっており、チャンネル数変換装置10によって、番組ごとの補正を行う場合は、規格で定められたダウンミックス係数を初期値に用いてもよい。
The downmix
図2は、本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第一の図である。図2を用いて本実施形態のチャンネル数変換処理の概要を説明する。
図2に示す(M−Ch1、・・・、M−ChN)は、Nチャンネルのマルチチャンネル音響信号である。
また、図2に示す行列の第2項目
FIG. 2 is a first diagram showing an example of the downmix coefficient in the first embodiment according to the present invention. An outline of the channel number conversion processing of this embodiment will be described with reference to FIG.
(M-Ch 1 , ..., M-Ch N ) shown in FIG. 2 is an N-channel multi-channel acoustic signal.
Also, the second item of the matrix shown in FIG.
は、M行N列の第一ダウンミックス係数(M×N)である。第一ダウンミックス信号算出部141は、この第一ダウンミックス係数(M×N)を用いて、マルチチャネル音響信号から所望のチャンネル数Mの第一ダウンミックス信号(M)を算出する。
また、図2に示す行列の第1項目
Is a first downmix coefficient (M × N) of M rows and N columns. The first downmix
Also, the first item of the matrix shown in FIG.
は、S行M列の第二ダウンミックス係数(S×M)である。第二ダウンミックス信号算出部142は、この第二ダウンミックス係数(S×M)を用いて、第一ダウンミックス信号(M)から参照信号と同じチャンネル数Sの第二ダウンミックス信号(S)を算出する。図2において、(Lt、Rt)は第二ダウンミックス信号(S)である。差分信号算出部15は、第二ダウンミックス信号(S)「(Lt、Rt)」と参照信号「(L、R)」との差分を、それぞれの信号のエネルギー差、二乗平均誤差、1−正規化相互相関係数(1から2つの信号の正規化相互相関係数を減算する)などの方法で算出する。なお、差分の算出方法は、これらの方法に限定されない。
Is a second downmix coefficient (S × M) of S rows and M columns. The second downmix
ダウンミックス係数更新部16は、差分信号算出部15が算出する第二ダウンミックス信号(S)と参照信号の差分に基づいて、第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を更新する。ダウンミックス係数更新部16が、差分が小さくなるようにダウンミックス係数を更新するアルゴリズムには、遺伝的アルゴリズム、最急降下法、確率的勾配降下法などを用いることができるが、差分を小さくする方法であれば、他の方法を用いてもよい。
また、ダウンミックス係数更新部16が、ダウンミックス係数を更新する場合、第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)を同時に変化させてもよい。あるいは、ダウンミックス係数更新部16は、第二ダウンミックス係数(S×M)を所定の値に固定した状態で、第一ダウンミックス係数(M×N)だけを変化させてもよい。また、ダウンミックス係数更新部16は、チャンネルの重要度に応じて、重要度の高いチャンネルの音響信号から順にダウンミックス係数を変化させてもよい。チャンネルの重要度は、例えば、前方に位置するスピーカに対応するチャンネルを重要度が高いと設定するなど再生位置によって規定されるほか、ダイアログ音声信号が含まれるチャンネルを重要度が高いと設定するなど音響信号の内容に応じて設定されてもよい。重要度は、メタデータとしてマルチチャンネル音響信号に付加されるほか、別途入力されるか、予め記憶されるか、ユーザによって指定されてもよい。なお、ダイアログ音声信号に含まれる音声は必ずしもダイアログ(対話)の音声に限られない。ナレーションなどの主に人の声で構成される音声信号をダイアログ音声信号としてよい。
The downmix
Further, when the downmix
ダウンミックス係数更新部16は、第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を用いて再度第二ダウンミックス信号(S)を出力する。ダウンミックス係数更新部16は、差分が最小となるか、差分が予め定められた閾値以下になるまでダウンミックス係数を更新する処理を繰り返す。差分信号算出部15で差分が閾値以下または最小と判定されると、ダウンミックス信号算出部14(第二ダウンミックス信号算出部142)は、最終的に更新された第一ダウンミックス係数(M×N)を用いて元のマルチチャンネル音響信号から所望の第一ダウンミックス信号(M)を算出し、再生装置に出力する。
The downmix
図3は、本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第一の図である。
図3(a)は、変換前のマルチチャンネル音響信号に含まれる各チャンネルの配置の一例を示している。図3(a)は、22.2chの中層のチャンネル配置の一例を示している。図3(a)において、例えば、チャンネル「FC」はユーザの正面、チャンネル「FL」「FLc」、「FC」、「FRc」、「FR」はユーザの前面に位置している。また、例えば、チャンネル「SiL」はユーザの左側、チャンネル「SiR」はユーザの右側、チャンネル「BC」はユーザの後側に位置するチャンネルである。
図3(b)は、変換後の所望の第一ダウンミックス信号(M)に含まれる各チャンネルの配置の一例を示している。図3(b)は、一例として、7.1chのチャンネル配置の一例を示している。例えば、チャンネル「Cm」はユーザの正面、チャンネル「Lm」、「Cm」、「Rm」はユーザの前面に位置している。これら、正面または前面のチャンネルには高い重要度が設定される場合がある。
図3(c)は、参照信号に含まれる各チャンネルの配置の一例を示している。図3(c)は、一例として、2chのチャンネル配置の一例を示している。
なお、図3(b)、図3(c)に例示するチャンネルは、22.2chの中層の高さに対応するチャンネルである。
FIG. 3 is a first diagram showing an example of coplanar channel arrangement in the first embodiment according to the present invention.
FIG. 3A shows an example of the arrangement of the channels included in the multi-channel acoustic signal before conversion. FIG. 3A shows an example of channel arrangement in the middle layer of 22.2 ch. In FIG. 3A, for example, the channel “FC” is located in front of the user, and the channels “FL” “FLc”, “FC”, “FRc”, and “FR” are located in front of the user. Further, for example, the channel “SiL” is located on the left side of the user, the channel “SiR” is located on the right side of the user, and the channel “BC” is located on the rear side of the user.
FIG. 3B shows an example of the arrangement of the channels included in the desired first downmix signal (M) after conversion. FIG. 3B shows, as an example, an example of channel arrangement of 7.1ch. For example, the channel “Cm” is located in front of the user, and the channels “Lm”, “Cm”, and “Rm” are located in front of the user. A high degree of importance may be set for these front or front channels.
FIG. 3C shows an example of the arrangement of the channels included in the reference signal. As an example, FIG. 3C shows an example of channel arrangement of 2ch.
The channels illustrated in FIGS. 3B and 3C are channels corresponding to the height of the middle layer of 22.2 ch.
本実施形態のチャンネル数変換装置10は、元のマルチチャンネル音響信号が持つ音響の印象をなるべく保持したまま第一ダウンミックス信号(M)を算出する。具体的には、ダウンミックス係数更新部16が、上記の第一ダウンミックス係数(M×N)等の更新処理を繰り返す中で、マルチチャンネル音響信号が持つ音響の印象をできるだけ保持できるような第一ダウンミックス係数(M×N)を算出し、第二ダウンミックス信号(S)と参照信号の差分が収束するように第一ダウンミックス係数(M×N)等を更新する。そのため、チャンネル数変換装置10では、第一ダウンミックス係数(M×N)の算出において、マルチチャンネル音響信号の特徴を保持するための拘束条件が必要となる。例えば、参照信号がモノ信号(1ch)やステレオ信号(2ch)であり、所望のチャンネル数が5.1chや7.1chであった場合、参照信号のチャンネル位置は、所望のチャンネル数のチャンネル配置に完全に包含される。この場合、拘束条件を設定しないと、元のマルチチャンネル音響から所望のチャンネル数に変換するための第一ダウンミックス係数(M×N)は、元のマルチチャンネル音響信号から参照信号と同じチャンネル数のダウンミックス係数と同じになる可能性がある。なぜなら、このような第一ダウンミックス係数(M×N)によって変換した第一ダウンミックス信号(M)を、図3(b)で例示したチャンネルの配置どおりに設置されたスピーカ群を有する再生装置が出力しても、そのとき再生される音は、図3(c)の「Lt」、「Rt」と同じ位置に配置されたチャンネル「Lm」、「Rm」に対応するスピーカだけから出力され、目的とする「マルチチャンネル音響信号が持つ音響の印象を保持した」音とはならないためである。このことからも、元のマルチチャネル音響の特徴をなるべく保持するためには、第一ダウンミックス係数(M×N)の算出に拘束条件が必要である。
The channel
次に、図3で例示したチャンネル配置を用いて、拘束条件の一部について説明を行う。図3に例示した各チャンネル数におけるチャンネル配置は、変換前後の各チャンネル数において、略同一の平面上に配置されるチャンネル群を対象としている。例えば、22.2chのマルチチャンネル音響信号では、図3(a)に例示する中層の他、上層、下層が存在し、これらを含めた場合、異なる高さである上層、下層からの変換を考慮しなければならない。図3では、これらの変換については考慮せず、略同一の平面内に配置されるチャンネル間での変換における拘束条件について説明する。 Next, some of the constraint conditions will be described using the channel arrangement illustrated in FIG. The channel arrangement in each number of channels illustrated in FIG. 3 is intended for a group of channels arranged on substantially the same plane in each number of channels before and after conversion. For example, in a 22.2 ch multi-channel audio signal, in addition to the middle layer illustrated in FIG. 3A, there are upper and lower layers, and when these are included, conversion from the upper and lower layers having different heights is considered. Must. In FIG. 3, these conversions are not taken into consideration, and constraint conditions for conversions between channels arranged in substantially the same plane will be described.
(位置の類似性による拘束条件)
拘束条件は、例えば、元のマルチチャンネル音響のチャンネル位置と所望のダウンミックス先のチャンネル位置の類似度によって規定してもよい。位置の類似度は、例えば、ユーザの聴取位置(図3の場合、円の中心)に対する変換前後のそれぞれのチャンネル位置の間の距離、角度の変化によって定義してもよい。例えば、図3(a)の「FC」と、変換後の図3(b)の「Cm」との位置の類似度は高い(どちらもユーザの正面であって、変換前後で距離、角度が同じ)。このような場合、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Cm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0」と設定することを拘束条件として定めてもよい。
あるいは、この場合のダウンミックス係数が最大となるように拘束条件として定めてもよい。拘束条件で「1.0」と定めた場合には、ダウンミックス係数算出の計算量を減らすことができる。
(Restriction condition by position similarity)
The constraint condition may be defined by, for example, the degree of similarity between the original multi-channel sound channel position and the desired down-mix destination channel position. The position similarity may be defined by, for example, a change in distance and angle between each channel position before and after conversion with respect to the listening position of the user (in the case of FIG. 3, the center of the circle). For example, the similarity between the position of “FC” in FIG. 3A and the position of “Cm” in FIG. 3B after conversion is high (both are in front of the user and the distance and angle before and after conversion are the same). In such a case, the downmix coefficient for converting the audio signal assigned to the channel “FC” to the audio signal assigned to the channel “Cm” is restricted to be set to “1.0”, for example. It may be set as a condition.
Alternatively, the constraint condition may be set so that the downmix coefficient in this case becomes maximum. When the constraint condition is set to "1.0", the amount of downmix coefficient calculation can be reduced.
(ダウンミックスの前後でユーザからの距離が変わらない場合)
また、この例の場合、まず、マルチチャネル音響信号に含まれるチャンネルの音響信号の再生位置の一つである「FC」と、ダウンミックス信号に含まれるチャンネルの音響信号の再生位置の一つである「Cm」とを予め対応付けておく。そして、「FC」から「Cm」へのダウンミックス係数の値を例えば「1.0」と定め、「FC」から他のチャンネルへのダウンミックス係数の値は「0」とすることを拘束条件としてもよい。
(When the distance from the user does not change before and after downmix)
In the case of this example, first, "FC", which is one of the reproduction positions of the audio signals of the channels included in the multi-channel audio signal, and one of the reproduction positions of the audio signals of the channels included in the downmix signal, are selected. A certain “Cm” is associated in advance. Then, the constraint condition is that the value of the downmix coefficient from "FC" to "Cm" is set to "1.0", and the value of the downmix coefficient from "FC" to another channel is "0". May be
また、例えば、図3(a)の「FC」と、変換後の図3(b)の「Lm」、「Rm」との位置の類似度はやや高い(どちらもユーザの前面であって、変換前後でユーザからの距離は変化せず、角度は例えば20度強変化する)。このような場合、位置の類似度に応じて、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Lm」、「Rm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0以下の同じ値」を設定することを拘束条件として定めてもよい。 Further, for example, the similarity between the positions of “FC” in FIG. 3A and “Lm” and “Rm” in FIG. 3B after conversion is slightly high (both in front of the user, The distance from the user does not change before and after the conversion, and the angle changes, for example, slightly more than 20 degrees). In such a case, the downmix coefficient for converting the audio signal assigned to the channel “FC” to the audio signal assigned to the channels “Lm” and “Rm” according to the position similarity is, for example, , “Same value less than or equal to 1.0” may be set as a constraint condition.
同様に、例えば、図3(a)の「FC」と、変換後の図3(b)の「Lssm」、「Rssm」との位置の類似度は低い(変換前後でユーザからの距離は変化しないが、角度は110度以上異なる)。このような場合、位置の類似度は低いことに基づいて、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Lssm」、「Rssm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「0」を設定することを拘束条件として定めてもよい。 Similarly, for example, the position similarity between “FC” in FIG. 3A and “Lssm” and “Rssm” in FIG. 3B after conversion is low (the distance from the user changes before and after conversion. No, but the angle differs by 110 degrees or more). In such a case, a downmix coefficient for converting the audio signal assigned to the channel “FC” to the audio signals assigned to the channels “Lssm” and “Rssm” is based on the fact that the position similarity is low. May be set as a constraint condition that "0" is set, for example.
また、例えば、図3(a)の「BL」と変換後の図3(b)の「Lrsm」との位置の類似度と、図3(a)の「BR」と変換後の図3(b)の「Rrsm」との位置の類似度とは同程度(どちらもユーザからみて左側または右側の斜め後方から、同じ側の斜め後方に位置するチャンネルへの変換)である。このような場合、位置の類似度が同程度であるため、チャンネル「BL」に割り当てられた音声信号から、チャンネル「Lrsm」に割り当てられる音声信号との変換を行うダウンミックス係数と、チャンネル「BR」に割り当てられた音声信号からチャンネル「Rrsm」に割り当てられる音声信号との変換を行うダウンミックス係数とに、同じ値を設定することを拘束条件として定めてもよい。 Further, for example, the position similarity between “BL” in FIG. 3A and “Lrsm” in FIG. 3B after conversion, and “BR” in FIG. The degree of similarity with the position of “Rrsm” in b) is approximately the same (both conversion from a channel on the left or right side of the user to a channel on the same side and diagonally rearward). In this case, since the position similarity is similar, the downmix coefficient for converting the audio signal assigned to the channel “BL” to the audio signal assigned to the channel “Lrsm” and the channel “BR”. The constraint condition may be that the same value is set for the downmix coefficient for converting the audio signal assigned to “” to the audio signal assigned to the channel “Rrsm”.
また、例えば、図3(a)の「BL」に割り当てられた音声信号から、変換後の図3(b)の「Lssm」、「Lrsm」に割り当てられる音声信号との変換を行うダウンミックス係数については、何れのチャンネルもユーザからの距離は同じとなる。しかしながら、変換前の「BL」の位置(ユーザからの角度)は、「Lrsm」により近く、「Lrsm」に比べれば「Lssm」がより遠いことに基づいて、「Lrsm」へのダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。あるいは、さらに「Lssm」へのダウンミックス係数の値は2番目に大きくなるように拘束条件を定めてもよい。また、円の中心と「BL」の位置を結ぶ線を基準とした、円の中心と「Lssm」および「Lssm」それぞれを結ぶ線がなす開き角度に基づいて、それぞれのダウンミックス係数の値の比が、開き角度の比の逆数となるようにダウンミックス係数を設定することを拘束条件として定めてもよい。 Also, for example, a downmix coefficient for converting the audio signal assigned to “BL” in FIG. 3A to the converted audio signal assigned to “Lssm” and “Lrsm” in FIG. 3B. For, the distance from the user is the same for all channels. However, the position of “BL” before conversion (angle from the user) is closer to “Lrsm”, and “Lssm” is farther than “Lrsm”. The constraint condition may be set so that the value becomes maximum. Alternatively, the constraint condition may be set such that the value of the downmix coefficient to “Lssm” is the second largest. Further, based on the opening angle formed by the line connecting the center of the circle and each of “Lssm” and “Lssm” with reference to the line connecting the center of the circle and the position of “BL”, the value of each downmix coefficient is calculated. The constraint condition may be to set the downmix coefficient so that the ratio is the reciprocal of the ratio of the opening angle.
(スピーカを理想的な位置に置けないような場合)
図3は、ダウンミックスの前後でユーザからの距離が変わらない場合を例示している。次に、図4を用いて、ユーザがスピーカなどを設置する部屋のレイアウト等の都合で、あるチャンネルに対応するスピーカを理想的な位置に置けないような場合の例を挙げて拘束条件の説明を行う。
(When the speaker cannot be placed in the ideal position)
FIG. 3 illustrates a case where the distance from the user does not change before and after the downmix. Next, the constraint conditions will be described with reference to FIG. 4 by taking an example in which the speaker corresponding to a certain channel cannot be placed in an ideal position due to the layout of the room where the user installs the speaker and the like. I do.
図4は、本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第二の図である。
図4(a)は、変換前のマルチチャンネル音響信号におけるチャンネル配置の一例を示している。図4(b)は、変換後の所望の第一ダウンミックス信号(M)におけるチャンネル配置の一例を示している。図4(b)において、チャンネル「Lssm」と「Lrsm」に対応するスピーカの位置は、所定の「Lssm」と「Lrsm」の位置からずれている。この例の場合、「Lssm」のスピーカが、変換前のマルチチャンネル音響信号におけるチャンネル「BL」の位置から距離vの位置に設置され、「Lrsm」のスピーカが、変換前のマルチチャンネル音響信号におけるチャンネル「BL」の位置から距離uの位置に設置されているものとする(v>u)。また、図示するように他のチャンネルから「Lssm」のスピーカ位置は、チャンネル「SiL」から「Lssm」までの距離yよりも離れているものとする。この場合、「SiL」から「Lssm」へのダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。さらに「BL」から「Lrsm」へのダウンミックス係数の値を1番目に大きく、「Lssm」へのダウンミックス係数の値が2番目に大きくなるように拘束条件を定めてもよい。また、距離u、vに基づいて、「BL」から「Lssm」へのダウンミックス係数の値と「BL」から「Lrsm」へのダウンミックス係数の値の比が、v:uとなるようにダウンミックス係数を設定することを拘束条件として定めてもよい。
FIG. 4 is a second diagram showing an example of coplanar channel arrangement in the first embodiment according to the present invention.
FIG. 4A shows an example of channel arrangement in the multi-channel acoustic signal before conversion. FIG. 4B shows an example of channel arrangement in the desired first downmix signal (M) after conversion. In FIG. 4B, the positions of the speakers corresponding to the channels “Lssm” and “Lrsm” are deviated from the predetermined “Lssm” and “Lrsm” positions. In the case of this example, the speaker of “Lssm” is installed at a position of a distance v from the position of the channel “BL” in the multi-channel audio signal before conversion, and the speaker of “Lrsm” in the multi-channel audio signal before conversion. It is assumed that it is installed at a position at a distance u from the position of the channel “BL” (v> u). Further, as shown in the figure, it is assumed that the speaker position of “Lssm” from another channel is farther than the distance y from the channel “SiL” to “Lssm”. In this case, the constraint condition may be set such that the value of the downmix coefficient from “SiL” to “Lssm” is maximized. Further, the constraint condition may be set such that the value of the downmix coefficient from “BL” to “Lrsm” is the first largest and the value of the downmix coefficient to “Lssm” is the second largest. Also, based on the distances u and v, the ratio of the value of the downmix coefficient from “BL” to “Lssm” and the value of the downmix coefficient from “BL” to “Lrsm” becomes v: u. Setting the downmix coefficient may be set as a constraint condition.
また、図4(b)において、チャンネル「Cm」に対応するスピーカの位置は、所定の「Cm」の位置から側方に距離wだけずれている。「FC」と「Cm」とを予め対応付け、「FC」から「Cm」へのダウンミックス係数の値を「1.0」、それ以外の他のチャンネルへのダウンミックス係数の値を「0」とする拘束条件の例を上記で説明した。この場合、変換前の「FC」の位置と変換後のwのずれを含む「Cm」の位置との位置の類似度(この場合は距離の差)が所定の範囲内であるときのみ、当該拘束条件を適用してもよい。 Further, in FIG. 4B, the position of the speaker corresponding to the channel “Cm” is laterally displaced from the position of the predetermined “Cm” by the distance w. “FC” and “Cm” are associated in advance, the value of the downmix coefficient from “FC” to “Cm” is “1.0”, and the value of the downmix coefficient to other channels is “0”. An example of the constraint condition that is “. In this case, only when the position similarity between the position of “FC” before conversion and the position of “Cm” including the shift of w after conversion (distance difference in this case) is within a predetermined range, Constraints may be applied.
なお、家庭でのスピーカ位置の座標情報は、ユーザが、チャンネル数変換装置10に入力してもよい。あるいは、音響再生装置が備える各スピーカ位置を検出する機能を利用して得た座標情報を、音響再生装置がチャンネル数変換装置10に入力してもよい。
The user may input the coordinate information of the speaker position at home into the channel
(変換前のマルチチャンネル音響信号におけるチャンネル配置の一例)
次に図5を用いて上層から中層への変換におけるダウンミックス係数の拘束条件について説明を行う。
図5は、本発明に係る第一実施形態における上層があるチャンネル配置の一例を示す図である。
図5(a)は、変換前のマルチチャンネル音響信号におけるチャンネル配置の一例を示している。図5(a)に、上層、中層の二層からなるチャンネル配置の一例を示す。図5(a)において、チャンネル「TpFL」は上層のユーザの左斜め前、チャンネル「TpFR」は上層のユーザの右斜め前、チャンネル「TpBL」は上層のユーザの左斜め後、チャンネル「TpBR」は上層のユーザの右斜め後に位置している。図5(b)は、変換後の所望の第一ダウンミックス信号(M)におけるチャンネル配置の一例を示している。図5(c)は、参照信号におけるチャンネル配置の一例を示している。
(Example of channel arrangement in multi-channel audio signal before conversion)
Next, the constraint condition of the downmix coefficient in the conversion from the upper layer to the middle layer will be described with reference to FIG.
FIG. 5 is a diagram showing an example of a channel arrangement with an upper layer according to the first embodiment of the present invention.
FIG. 5A shows an example of channel arrangement in the multi-channel acoustic signal before conversion. FIG. 5A shows an example of a channel arrangement including two layers, an upper layer and a middle layer. In FIG. 5A, the channel “TpFL” is diagonally to the left of the upper layer user, the channel “TpFR” is diagonally to the right of the upper layer user, the channel “TpBL” is diagonally to the left of the upper layer user, and the channel “TpBR”. Is located diagonally to the right of the user in the upper layer. FIG. 5B shows an example of channel arrangement in the desired first downmix signal (M) after conversion. FIG. 5C shows an example of channel arrangement in the reference signal.
例えば、図5(a)の「TpFL」と、変換後の図5(b)の「L」との位置の類似度は、どちらもユーザの斜め左前であるが、ユーザからの開き角度が若干変化する。また、「TpFL」は上層にあり「L」は中層に位置するという違いが存在する。従って、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0」または「1.0以下」の値を設定することを拘束条件として定めてもよい。拘束条件で「1.0」と定めた場合には、ダウンミックス係数算出の計算量を減らすことができる。 For example, the similarity between the positions of “TpFL” in FIG. 5A and “L” in FIG. 5B after conversion is both diagonally left front of the user, but the opening angle from the user is slightly different. Change. Further, there is a difference that "TpFL" is located in the upper layer and "L" is located in the middle layer. Therefore, the downmix coefficient for converting the audio signal assigned to the channel "TpFL" to the audio signal assigned to the channel "L" has a value of, for example, "1.0" or "1.0 or less". The setting may be defined as a constraint condition. When the constraint condition is set to "1.0", the amount of downmix coefficient calculation can be reduced.
また、この例の場合、上層の「TpFL」と中層の「TpFL」に対応する位置の近傍に存在する「L」とを予め対応付けておき、「TpFL」から「L」へのダウンミックス係数の値を例えば「1.0」、「TpFL」から他のチャンネルへのダウンミックス係数の値を「0」とすることを拘束条件としてもよい。 In the case of this example, the “TpFL” in the upper layer and the “L” existing in the vicinity of the position corresponding to the “TpFL” in the middle layer are previously associated with each other, and the downmix coefficient from “TpFL” to “L” is set. The constraint condition may be that the value of is, for example, “1.0”, and the value of the downmix coefficient from “TpFL” to another channel is “0”.
また、例えば、図5(a)の「TpFL」と、変換後の図5(b)の「Ls」、「Rs」との位置の類似度は低い(変換前後でユーザからの距離が遠ざかる関係にあり、角度も大きく異なり、さらに上層と中層の違いがある)。このような場合、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「Ls」、「Rs」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「0」を設定することを拘束条件として定めてもよい。 Further, for example, the degree of similarity between the positions of “TpFL” in FIG. 5A and “Ls” and “Rs” in FIG. 5B after conversion is low (the distance from the user increases before and after conversion). In, the angle is also very different, there is a difference between the upper and middle layers). In such a case, the downmix coefficient for converting the audio signal assigned to the channel "TpFL" to the audio signal assigned to the channels "Ls" and "Rs" should be set to "0", for example. May be defined as a constraint condition.
また、例えば、図5(a)の「TpFL」と変換後の図5(b)の「L」との位置の類似度と、図5(a)の「TpFR」と変換後の図5(b)の「R」との位置の類似度とは同程度である。このような場合、同一平面上でのダウンミックス係数と同様、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数と、チャンネル「TpFR」に割り当てられた音声信号から、チャンネル「R」に割り当てられる音声信号との変換を行うダウンミックス係数とに、同じ値を設定することを拘束条件として定めてもよい。 Further, for example, the similarity of the position between “TpFL” in FIG. 5A and “L” in FIG. 5B after conversion, and “TpFR” in FIG. The degree of similarity with the position of “R” in b) is about the same. In such a case, as with the downmix coefficient on the same plane, the downmix coefficient for converting the audio signal assigned to the channel "TpFL" to the audio signal assigned to the channel "L" and the channel "TpFR". The constraint condition may be that the same value is set to the downmix coefficient for converting the audio signal assigned to “” to the audio signal assigned to the channel “R”.
また、例えば、図5(a)の「TpFL」と図5(b)の「L」の距離、図5(a)の「TpFL」と図5(b)の「C」の距離に基づいて、「TpFL」は「L」により近いことから、「TpFL」に割り当てられた音声信号から「L」に割り当てられる音声信号への変換を行うダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。 Further, for example, based on the distance between “TpFL” in FIG. 5A and “L” in FIG. 5B, and the distance between “TpFL” in FIG. 5A and “C” in FIG. 5B. , "TpFL" is closer to "L", so the value of the downmix coefficient for converting the audio signal assigned to "TpFL" to the audio signal assigned to "L" should be set to the maximum value. May be defined as a constraint condition.
このように、変換元のマルチチャンネル音響信号のチャンネル位置とダウンミックス先のチャンネル位置との距離または開き角を算出し、最も近傍のチャンネル位置へのダウンミックス係数を最大となることを拘束条件とすることで、元のマルチチャンネル音響信号の特徴を保持できるダウンミックス係数を算出することが可能となる。 In this way, the constraint condition is that the distance or opening angle between the channel position of the conversion source multi-channel audio signal and the channel position of the downmix destination is calculated, and the downmix coefficient to the nearest channel position is maximized. By doing so, it becomes possible to calculate a downmix coefficient that can retain the characteristics of the original multi-channel audio signal.
(聞きやすさによる拘束条件)
図3、図5に戻り、他の拘束条件の他の例について説明する。拘束条件は、音の聞きやすさの観点によって規定されてもよい。例えば、後方、側方にあるチャンネルが前方にあるチャンネルにダウンミックスされるとき、前方のチャンネルに割り当てられたダイアログ音声信号などの音声が聞きにくくなる可能性がある。そのような場合に聞きやすさを担保するために、後方、側方のうち少なくとも一方に位置するチャンネルに割り当てられた音声信号から前方のチャンネルに割り当てられる音声信号へのダウンミックス係数に「1.0」よりも小さい補正値を乗じることを拘束条件として定めてもよい。
(Restriction condition based on ease of listening)
Returning to FIGS. 3 and 5, another example of another constraint condition will be described. The restraint condition may be defined in terms of the audibility of sound. For example, when a rear channel or a side channel is downmixed with a front channel, it may be difficult to hear a voice such as a dialog voice signal assigned to the front channel. In such a case, in order to ensure audibility, the downmix coefficient from the audio signal assigned to the channel located at least one of the rear side and the side to the audio signal assigned to the front channel is set to "1. The constraint condition may be defined as multiplication by a correction value smaller than "0".
同様に、上層か下層、もしくはその両方のチャンネルから中層のチャンネルへダウンミックスする場合に、上層、下層の音によって中層の音が聞き取りにくくなる可能性がある。従って、上層か下層、もしくはその両方のチャンネルから中層のチャンネルへのダウンミックス係数に1.0よりも小さい補正値を用いることを拘束条件として加えてもよい。 Similarly, when down-mixing channels from the upper layer, the lower layer, or both to the channels in the middle layer, the sounds in the middle layer may be difficult to hear due to the sounds in the upper and lower layers. Therefore, the use of a correction value smaller than 1.0 as the downmix coefficient from the channels in the upper layer, the lower layer, or both to the channel in the middle layer may be added as a constraint condition.
また、チャンネル配置は通常左右対称であるが、左右から聞こえてくる音の大きさのバランスが変化すると、マルチチャンネル音響信号を再生した場合の印象から大きく変わってしまう可能性がある。従って、左右対称な位置に配置されたチャンネルから対応する左右対称な位置に配置されたチャンネルへのダウンミックス係数を算出するにあたり、元のマルチチャネル音響信号に含まれる左右対称な位置に配置されたチャンネルから対応する左右対称な位置に配置されたチャンネルへのダウンミックス係数に同じ数値を用いることを拘束条件として加えてもよい。 Further, although the channel arrangement is usually bilaterally symmetric, if the balance of the volume of sounds heard from the left and right changes, the impression when reproducing a multi-channel audio signal may change greatly. Therefore, when calculating the downmix coefficient from the channel arranged in the symmetrical position to the corresponding channel arranged in the symmetrical position, the downmix coefficient is arranged in the symmetrical position included in the original multi-channel audio signal. It may be added as a constraint condition that the same numerical value is used for the downmix coefficient from the channel to the corresponding channel arranged at the symmetrical position.
前方からのダイアログ音声信号を強調した方が聞き取りやすい場合の例のように、ダウンミックス信号の特徴が、元のマルチチャンネル音響の特徴とは完全に一致しないことが望ましい場合がある。聞きやすさによる拘束条件を適用することで、ユーザの聞きやすさを確保することができる。 It may be desirable that the characteristics of the downmix signal do not exactly match the characteristics of the original multi-channel audio, as in the case where it is easier to hear if the dialog speech signal from the front is emphasized. The ease of listening for the user can be secured by applying the constraint condition based on the ease of listening.
(重要度による拘束条件)
次に、重要度による拘束条件について説明する。拘束条件は、重要度の観点によって規定されてもよい。例えば、報道番組の場合、アナウンサー等によるダイアログ音声信号が最も重要となる。このような場合、例えば前面に位置するチャンネル(例えば、図5の「L」、「C」、「R」)に対して、これらはダイアログ音声信号に対応するチャンネルであるとして、高い重要度が設定されてもよい。重要度は、例えばマルチチャンネル音響信号のメタデータとして入力される。あるいは、ユーザが入力することでダウンミックス係数更新部16に設定されてもよい。
この場合、例えば、「FL」から「L」、「FC」から「C」、「FR」から「R」へのダウンミックス係数に最大の値を設定することを拘束条件として加えてもよい。
重要度による拘束条件を適用することによって、特定の音響信号の印象を強調するようにダウンミックスすることができる。
(Restriction by importance)
Next, the constraint condition based on the degree of importance will be described. The constraint condition may be defined in terms of importance. For example, in the case of a news program, a dialog voice signal by an announcer or the like becomes the most important. In such a case, for example, with respect to the channels located on the front side (for example, “L”, “C”, and “R” in FIG. 5), it is considered that these are channels corresponding to the dialog voice signal, and therefore, the importance is high. It may be set. The importance level is input, for example, as metadata of a multi-channel audio signal. Alternatively, it may be set in the downmix
In this case, for example, setting a maximum value to the downmix coefficient from “FL” to “L”, “FC” to “C”, and “FR” to “R” may be added as a constraint condition.
By applying an importance constraint, it is possible to downmix to emphasize the impression of a particular acoustic signal.
なお、上記した拘束条件は、第一ダウンミックス係数(M×N)の算出時だけでなく、第二ダウンミックス係数(S×M)の算出時にも適用してよい。また、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値の各要素の値について、拘束条件によってダウンミックス係数の値を「1.0」とすると予め定められているような場合、そのチャンネル間のダウンミックス係数に対応する要素には、初期値の段階で「1.0」が設定されていてもよい。また、拘束条件によって値が「1.0」等と定められていない場合でも、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値の各要素の値には、上記した位置の類似性等に基づく拘束条件が考慮されて予め定められた値が設定されていてもよい。 The constraint condition described above may be applied not only when calculating the first downmix coefficient (M × N) but also when calculating the second downmix coefficient (S × M). In addition, regarding the value of each element of the initial value of the first downmix coefficient (M × N) and the initial value of the second downmix coefficient (S × M), the value of the downmix coefficient is “1.0” depending on the constraint condition. Then, in the case where it is predetermined, "1.0" may be set at the stage of the initial value for the element corresponding to the downmix coefficient between the channels. Further, even when the value is not set to “1.0” or the like due to the constraint condition, each of the initial value of the first downmix coefficient (M × N) and the initial value of the second downmix coefficient (S × M) is obtained. The value of the element may be set to a predetermined value in consideration of the constraint condition based on the above-described position similarity and the like.
次に図6を用いて、これらの拘束条件を課したうえで算出された第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)の一例を説明する。
図6は、本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第二の図である。
図6に例示する第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)は、ダウンミックス係数更新部16が、拘束条件を満たすようにして算出したものである。
図6の上図は、図5(a)で例示したマルチチャンネル音響信号に含まれる各チャンネル信号から、図5(b)で例示した所望の第一ダウンミックス信号(M)に含まれる各チャンネル信号への第一ダウンミックス係数(M×N)の一例を示している。例えば、「L」と「R」、「FL」と「FR」は左右対称の位置に配置されている。従って、「FL」に割り当てられた音声信号からチャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数と、「FR」に割り当てられた音声信号からチャンネル「R」に割り当てられる音声信号との変換を行うダウンミックス係数には同じ値「C1」が設定されている。また、また、「FL」と「L」はほぼ同じ位置に配置されている。同様に「FR」と「R」はほぼ同じ位置に配置されている。従って、「C1」の大きさは例えば「1.0」であってもよい。また、例えば、「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数「k1C1」の「k1」は、上層から中層のチャンネルへのダウンミックス係数に乗じる補正値の例である。ここで、k1は1よりも小さい値である。また、「SiL」と「L」の距離、「SiL」と「Ls」の距離を比べると、「SiL」と「Ls」の距離の方が短い。従って、「SiL」から「Ls」へのダウンミックス係数により大きな値が設定される(C4≧C3)。同様に、「BL」と「Ls」の距離、「BR」と「Ls」の距離を比べると、「BL」と「Ls」の距離の方が短い。従って、「BL」と「BR」とでは、「BL」から「Ls」へのダウンミックス係数により大きな値が設定される(C5≧C6)。また、上層の「TpBL」、「TpBR」に割り当てられた音声信号から、チャンネル「Ls」に割り当てられる音声信号との変換を行うダウンミックス係数には、上層から中層のチャンネルへのダウンミックス係数に用いる補正値「k1」が含まれている。
Next, with reference to FIG. 6, an example of the first downmix coefficient (M × N) and the second downmix coefficient (S × M) calculated by imposing these constraint conditions will be described.
FIG. 6 is a second diagram showing an example of the downmix coefficient in the first embodiment according to the present invention.
The first downmix coefficient (M × N) and the second downmix coefficient (S × M) illustrated in FIG. 6 are calculated by the downmix
The upper diagram of FIG. 6 shows each channel included in the desired first downmix signal (M) illustrated in FIG. 5B from each channel signal included in the multi-channel acoustic signal illustrated in FIG. 5A. The example of the 1st downmix coefficient (MxN) to a signal is shown. For example, “L” and “R”, “FL” and “FR” are arranged at symmetrical positions. Therefore, a downmix coefficient for converting an audio signal assigned to "FL" to an audio signal assigned to channel "L", and an audio signal assigned to channel "R" from an audio signal assigned to "FR". The same value "C1" is set as the downmix coefficient for performing the conversion with. Moreover, “FL” and “L” are arranged at substantially the same position. Similarly, “FR” and “R” are arranged at almost the same position. Therefore, the size of “C1” may be “1.0”, for example. Further, for example, the downmix coefficient “k1” of the downmix coefficient “k1C1” for converting the audio signal assigned to “TpFL” to the audio signal assigned to the channel “L” is downmixed from the upper layer to the middle layer. It is an example of a correction value by which a coefficient is multiplied. Here, k1 is a value smaller than 1. Further, comparing the distance between “SiL” and “L” and the distance between “SiL” and “Ls”, the distance between “SiL” and “Ls” is shorter. Therefore, a large value is set for the downmix coefficient from “SiL” to “Ls” (C4 ≧ C3). Similarly, comparing the distance between “BL” and “Ls” and the distance between “BR” and “Ls”, the distance between “BL” and “Ls” is shorter. Therefore, for “BL” and “BR”, a larger value is set for the downmix coefficient from “BL” to “Ls” (C5 ≧ C6). In addition, the downmix coefficient for converting the audio signals assigned to the upper layers “TpBL” and “TpBR” to the audio signals assigned to the channel “Ls” is the downmix coefficient from the upper layer to the middle layer. The correction value “k1” to be used is included.
図6の下図は、図5(b)で例示した所望の第一ダウンミックス信号(M)における各チャンネル信号から図5(c)で例示した参照信号への第二ダウンミックス係数(S×M)の一例を示している。上記の拘束条件は、第二ダウンミックス係数(S×M)に適用することも可能である。例えば、k2は、後方のチャンネルから前方のチャンネルへのダウンミックス係数に用いる補正値である。また、「Lt」は「C」よりも「L」により近い為、「L」から「Lt」へのダウンミックス係数により大きな値が設定される(Ct1>Ct2)。 The lower part of FIG. 6 shows the second downmix coefficient (S × M) from each channel signal in the desired first downmix signal (M) illustrated in FIG. 5B to the reference signal illustrated in FIG. 5C. ) Is shown. The above constraint condition can also be applied to the second downmix coefficient (S × M). For example, k2 is a correction value used for the downmix coefficient from the rear channel to the front channel. Since "Lt" is closer to "L" than "C", a larger value is set for the downmix coefficient from "L" to "Lt" (Ct1> Ct2).
図7は、本発明に係る第一実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
図7を用いて本実施形態のチャンネル数変換処理の流れを説明する。
前提として、マルチミックス音響信号の各チャンネルの位置情報(座標情報)、所望のダウンミックス信号の再生環境におけるスピーカの数および各スピーカの位置情報は、予めチャンネル数変換装置10に入力され、スピーカ位置情報入力部13がこれらの情報の入力を受け付けている。また、スピーカ位置情報入力部13は、マルチミックス音響信号の各チャンネルの位置情報と再生環境における各スピーカの位置情報とをダウンミックス係数更新部16に出力している。また、ダウンミックス係数更新部16には、ダウンミックス係数算出における種々の拘束条件が設定されている。また、ダウンミックス係数記憶部17は、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値を記憶している。
FIG. 7 is a flowchart showing an example of the channel number conversion processing in the first embodiment according to the present invention.
The flow of the channel number conversion processing of this embodiment will be described with reference to FIG.
As a premise, the position information (coordinate information) of each channel of the multimix audio signal, the number of speakers in the reproduction environment of the desired downmix signal, and the position information of each speaker are input to the channel
まず、ステップS11で、参照信号入力部12は、参照信号を入力する。参照信号入力部12は、入力した参照信号を差分信号算出部15に出力する。また、ステップS11と並行して、ステップS12で、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。続いて、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号をダウンミックス信号算出部14に出力する。
次に、ステップS13で、ダウンミックス信号算出部14では、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を算出する。具体的には、第一ダウンミックス信号算出部141は、ダウンミックス係数記憶部17から第一ダウンミックス係数(M×N)の初期値を読み出して取得し、この初期値でマルチチャンネル音響信号をダウンミックスして第一ダウンミックス信号(M)を算出する。続いて、第一ダウンミックス信号算出部141は、第一ダウンミックス信号(M)を第二ダウンミックス信号算出部142に出力する。
次に、ステップS14で、第二ダウンミックス信号算出部142が第二ダウンミックス信号(S)を算出する。具体的には、第二ダウンミックス信号算出部142は、ダウンミックス係数記憶部17から第二ダウンミックス係数(S×M)の初期値を読み出して取得し、この初期値で第一ダウンミックス信号(M)をダウンミックスして第二ダウンミックス信号(S)を算出する。第二ダウンミックス信号算出部142は、ダウンミックス信号(S)を差分信号算出部15へ出力する。
First, in step S11, the reference
Next, in step S13, in the downmix
Next, in step S14, the second downmix
次に、ステップS15で、差分信号算出部15は、第二ダウンミックス信号(S)と参照信号の差分を算出する。差分の算出には、2つの信号のエネルギー差、二乗平均誤差、1−正規化相互相関係数などの方法を用いてもよい。
次に、ステップS16で、差分信号算出部15は、差分が所定の閾値以下かどうかを判定する。あるいは、差分信号算出部15は、差分が最小となったかどうかを判定してもよい。差分が閾値以下の場合(差分が最小となった場合)、第一ダウンミックス信号算出部141は、ステップS13で第一ダウンミックス係数(M×N)によって、マルチチャンネル音響信号をダウンミックスして生成した第一ダウンミックス信号(M)を再生装置へ出力する。
Next, in step S15, the difference
Next, in step S16, the difference
差分が閾値より大きい場合(差分が最小ではない場合)、差分信号算出部15は、算出した差分をダウンミックス係数更新部16に出力する。
次に、ステップS17で、ダウンミックス係数更新部16は、ダウンミックス係数を更新する。ダウンミックス係数更新部16は、図3〜図6を用いて説明した拘束条件を満たしつつ、差分を小さくする第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)を算出する。
または、ダウンミックス係数更新部16は、第二ダウンミックス係数(S×M)が固定されている場合、第一ダウンミックス係数(M×N)のみを算出する。なお、第一ダウンミックス係数(M×N)等の算出には、遺伝的アルゴリズム、最急降下法、確率的勾配降下法などを用いてもよい。ダウンミックス係数更新部16は、第一ダウンミックス係数(M×N)等を算出すると、算出した新たな第一ダウンミックス係数(M×N)等をダウンミックス係数記憶部17に記録する。そして、差分が閾値以下となるまで、ステップS13からの処理を繰り返す。
なお、2回目以降のステップS13、及びステップS14の処理では、ダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値を用いるのではなく、ステップS17でダウンミックス係数更新部16が算出し、ダウンミックス係数記憶部17に記録した第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を用いる。
When the difference is larger than the threshold value (when the difference is not the minimum), the difference
Next, in step S17, the downmix
Alternatively, the downmix
In the processing of step S13 and step S14 after the second time, the initial value of the first downmix coefficient (M × N) stored in the downmix
地上デジタル放送において基本の音声フォーマットはステレオ2chであり、一方、BSデジタル放送については、ステレオ2chまたは5.1chサラウンド放送である。4K/8K放送では、22.2chマルチチャンネル音響と同時にステレオ2ch用の音声信号(参照信号)のいわゆるサイマル放送が検討されている。
そこで、本実施形態では、マルチチャンネル音響信号から再生環境のスピーカ配置に対応する第一ダウンミックス信号(M)と、再生環境のスピーカ配置に対応する参照信号と同じチャンネル数の第二ダウンミックス信号(S)とをダウンミックス係数の初期値を用いて作成する。そして、ステレオ2ch用の音声信号とダウンミックス信号(S)との差が最小となるようにダウンミックス係数を最適化する。
このとき、元のマルチチャンネル音響信号と所望の第一ダウンミックス信号(M)との変換について、スピーカ位置に応じた拘束条件を加えることで、元のマルチチャンネル音響の印象をなるべく保持した第一ダウンミックス信号(M)を実現する第一ダウンミックス係数(M×N)が算出できる。また、放送された番組製作者の意図が反映されたステレオ2chによる音声信号を参照することで、より番組製作者の意図に沿った第一ダウンミックス信号(M)を実現する第一ダウンミックス係数(M×N)が算出できる。
The basic audio format in terrestrial digital broadcasting is stereo 2ch, while the BS digital broadcasting is stereo 2ch or 5.1ch surround broadcasting. In 4K / 8K broadcasting, so-called simulcasting of audio signals (reference signals) for stereo 2ch at the same time as 22.2ch multi-channel sound is being considered.
Therefore, in the present embodiment, the first downmix signal (M) corresponding to the speaker arrangement in the reproduction environment and the second downmix signal having the same number of channels as the reference signal corresponding to the speaker arrangement in the reproduction environment are generated from the multi-channel audio signal. (S) and are created using the initial value of the downmix coefficient. Then, the downmix coefficient is optimized so that the difference between the audio signal for stereo 2ch and the downmix signal (S) is minimized.
At this time, regarding the conversion of the original multi-channel audio signal and the desired first downmix signal (M), by adding a constraint condition according to the position of the speaker, the first impression of the original multi-channel audio is retained as much as possible. The first downmix coefficient (M × N) that realizes the downmix signal (M) can be calculated. Further, the first downmix coefficient that realizes the first downmix signal (M) more in line with the program producer's intention by referring to the broadcasted audio signal from stereo 2ch in which the intention of the program producer is reflected. (M × N) can be calculated.
<第二実施形態>
以下、本発明の第二実施形態によるチャンネル数変換装置を、図8〜図9を参照して説明する。
図8は、本発明に係る第二実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図8に示すようにチャンネル数変換装置10aは、マルチチャンネル音響信号入力部11と、スピーカ位置情報入力部13と、ダウンミックス信号算出部14と、差分信号算出部15と、ダウンミックス係数更新部16と、ダウンミックス係数記憶部17と、参照信号算出部18と、を備えている。つまり、第二実施形態によるチャンネル数変換装置10aは、第一実施形態の参照信号入力部12に代えて参照信号算出部18を備えている。他の構成は、第一実施形態と同様である。
<Second embodiment>
Hereinafter, a channel number conversion device according to a second exemplary embodiment of the present invention will be described with reference to FIGS.
FIG. 8 is a block diagram showing an example of a channel number conversion device according to the second embodiment of the present invention.
As shown in FIG. 8, the channel number conversion device 10a includes a multi-channel acoustic
参照信号算出部18は、所定のダウンミックス係数を用いて、マルチチャンネル音響信号をダウンミックスして例えば2chステレオの参照信号を算出する。
第一実施形態では、マルチチャンネル音響信号と同時にステレオ2chの音声信号(参照信号)が放送される場合を前提とした。しかし、マルチチャンネル音響信号に対応する参照信号が常に得られるとは限らない。例えば、マルチチャンネル音響信号に付加されるメタデータとして参照信号へのダウンミックス係数が送出される場合がある。そこで、第二実施形態では、参照信号算出部18が、入力したマルチチャンネル音響信号から参照信号を算出する。
The reference
The first embodiment is based on the premise that a stereo 2ch audio signal (reference signal) is broadcast at the same time as the multi-channel audio signal. However, the reference signal corresponding to the multi-channel audio signal is not always obtained. For example, a downmix coefficient for a reference signal may be transmitted as metadata added to a multi-channel audio signal. Therefore, in the second embodiment, the reference
次に図9を用いて本実施形態のチャンネル数変換処理の流れを説明する。
図9は、本発明に係る第二実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
前提として、参照信号算出部18には、予めマルチチャンネル音響信号をステレオ2ch音声信号(参照信号)にダウンミックスするダウンミックス係数(参照ダウンミックス係数と呼ぶ)が設定されているとする。他の前提条件は第一実施形態と同様である。また、図7と同様の処理については簡単に説明する。
まず、ステップS12で、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を、参照信号算出部18、ダウンミックス信号算出部14に出力する。
ステップS121で、参照信号算出部18は、参照ダウンミックス係数によってマルチチャンネル音響信号をダウンミックスして参照信号を算出する。参照信号算出部18は、算出した参照信号を差分信号算出部15に出力する。以下の処理については第一実施形態と同様である。
つまり、次に、ステップS13で、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を算出し、ステップS14で、第二ダウンミックス信号算出部142が第二ダウンミックス信号(S)を算出する。
Next, the flow of the channel number conversion processing of this embodiment will be described with reference to FIG.
FIG. 9 is a flowchart showing an example of the channel number conversion processing in the second embodiment according to the present invention.
As a premise, it is assumed that a downmix coefficient (referred to as a reference downmix coefficient) for downmixing a multi-channel audio signal into a stereo 2ch audio signal (reference signal) is set in the reference
First, in step S12, the multi-channel acoustic
In step S121, the
That is, next, in step S13, the first downmix
次に、ステップS15で、差分信号算出部15は、第二ダウンミックス信号算出部142が算出した第二ダウンミックス信号(S)と参照信号算出部18が算出した参照信号の差分を算出する。次に、ステップS16で、差分信号算出部15は、差分が所定の閾値以下かどうかを判定し、差分が閾値以下の場合、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を再生装置へ出力する。
Next, in step S15, the difference
また、差分が閾値より大きい場合、ステップS17で、ダウンミックス係数更新部16は、ダウンミックス係数を更新し、差分が閾値より小さくなるまで、ステップS13からの処理を繰り返す。
If the difference is larger than the threshold, the downmix
本実施形態によれば、ステレオ2chが同時に放送されない場合でも、マルチチャンネル音響方式からステレオ2chなどの既存のチャンネル数への最適化されたダウンミックス係数(例えば、最適化されたダウンミックス係数がマルチチャンネル音響信号にメタデータとして付加されてもよい)によってダウンミックスされた信号を参照信号の代わりに用いる。これにより、第一実施形態と同様の手順で、マルチチャンネル音響信号の制作時のスピーカ数、スピーカ配置で再生されたときの音の印象をなるべく保持しつつ、再生装置のスピーカ数およびスピーカ配置に応じた第一ダウンミックス係数(M×N)を、番組ごとに算出することができる。 According to the present embodiment, even if the stereo 2ch is not broadcast at the same time, the optimized downmix coefficient from the multi-channel audio system to the existing number of channels such as the stereo 2ch (for example, the optimized downmix coefficient is multi-valued). The signal down-mixed by the channel audio signal (which may be added as metadata) is used instead of the reference signal. With this, by the same procedure as in the first embodiment, the number of speakers and the speaker arrangement of the reproducing apparatus are adjusted while maintaining the number of speakers when producing the multi-channel audio signal and the impression of the sound when reproduced with the speaker arrangement as much as possible. The corresponding first downmix coefficient (M × N) can be calculated for each program.
なお、上述のチャンネル数変換装置10、10aは、内部にコンピュータシステムを有している。そして、チャンネル数変換装置10等の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
The above-described channel
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
Further, the “computer system” also includes a homepage providing environment (or display environment) if a WWW system is used.
Further, the “computer-readable recording medium” refers to a portable medium such as a flexible disk, a magneto-optical disk, a ROM, a CD-ROM, or a storage device such as a hard disk built in a computer system. Further, the "computer-readable recording medium" means to hold a program dynamically for a short time like a communication line when transmitting the program through a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system that serves as a server or a client in that case holds a program for a certain period of time. Further, the program may be for realizing a part of the functions described above, or may be a program for realizing the functions described above in combination with a program already recorded in the computer system.
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
なお、第一ダウンミックス係数(M×N)、第一ダウンミックス係数(M×N)の初期値は、第一ダウンミックス係数の一例である。第二ダウンミックス係数(S×M)、第二ダウンミックス係数(S×M)の初期値は、第二ダウンミックス係数の一例である。また、第一ダウンミックス信号(M)は第一ダウンミックス信号の一例、第二ダウンミックス信号(S)は第二ダウンミックス信号の一例である。
In addition, it is possible to appropriately replace the components in the above-described embodiments with known components without departing from the spirit of the present invention. Further, the technical scope of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.
The initial values of the first downmix coefficient (M × N) and the first downmix coefficient (M × N) are examples of the first downmix coefficient. The initial values of the second downmix coefficient (S × M) and the second downmix coefficient (S × M) are examples of the second downmix coefficient. The first downmix signal (M) is an example of the first downmix signal, and the second downmix signal (S) is an example of the second downmix signal.
10、10a・・・チャンネル数変換装置
11・・・マルチチャンネル音響信号入力部
12・・・参照信号入力部
13・・・スピーカ位置情報入力部
14・・・ダウンミックス信号算出部
141・・・第一ダウンミックス信号算出部
142・・・第二ダウンミックス信号算出部
15・・・差分信号算出部
16・・・ダウンミックス係数更新部
17・・・ダウンミックス係数記憶部
18・・・参照信号算出部
10, 10a ...
Claims (11)
前記第二ダウンミックス信号と参照信号との差分を算出する差分信号算出部と、
前記差分信号算出部が算出した差分が、最小または所定の閾値以下となるように、前記第一ダウンミックス係数および第二ダウンミックス係数を更新するダウンミックス係数更新部と、
を備えることを特徴とするチャンネル数変換装置。 A desired first downmix signal is calculated from the multi-channel acoustic signal using the first downmix coefficient, and a second downmix having the same number of channels as the reference signal from the first downmix signal is calculated using the second downmix coefficient. A downmix signal calculation unit that calculates a signal,
A difference signal calculation unit that calculates a difference between the second downmix signal and a reference signal,
The difference calculated by the difference signal calculation unit is a minimum or a predetermined threshold value or less, a downmix coefficient updating unit for updating the first downmix coefficient and the second downmix coefficient,
An apparatus for converting the number of channels, comprising:
をさらに備えることを特徴とする請求項1に記載のチャンネル数変換装置。 A reference signal calculation unit that down-mixes the multi-channel acoustic signal using a predetermined down-mix coefficient, and calculates the reference signal,
The channel number conversion device according to claim 1, further comprising:
前記ダウンミックス係数更新部は、前記第二ダウンミックス係数を固定して、前記第一ダウンミックス係数のみを更新する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to claim 1 or 2,
The downmix coefficient updating unit fixes the second downmix coefficient and updates only the first downmix coefficient,
A channel number conversion device characterized by the above.
前記第一ダウンミックス係数の初期値と前記第二ダウンミックス係数の初期値とのうち少なくとも一方を記憶するダウンミックス係数記憶部、
をさらに備えることを特徴とするチャンネル数変換装置。 The channel number conversion device according to any one of claims 1 to 3,
A downmix coefficient storage unit that stores at least one of the initial value of the first downmix coefficient and the initial value of the second downmix coefficient,
An apparatus for converting the number of channels, further comprising:
前記ダウンミックス係数記憶部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第一ダウンミックス係数を記憶する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to claim 4,
The downmix coefficient storage unit is determined based on a positional relationship between a reproduction position of an audio signal of each channel included in the multi-channel audio signal and a reproduction position of an audio signal of each channel included in the first downmix signal. Storing the first downmix coefficient with an initial value set to
A channel number conversion device characterized by the above.
前記ダウンミックス係数記憶部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第二ダウンミックス係数を記憶する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to claim 4 or 5,
The downmix coefficient storage unit is based on the positional relationship between the reproduction position of the acoustic signal of each channel included in the first downmix signal and the reproduction position of the acoustic signal of each channel included in the second downmix signal. Storing said second downmix coefficient having a defined initial value,
A channel number conversion device characterized by the above.
前記ダウンミックス係数更新部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第一ダウンミックス係数を更新する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to any one of claims 1 to 6,
The downmix coefficient updating unit is determined by the similarity of the position between the reproduction position of the audio signal of each channel included in the multi-channel audio signal and the reproduction position of the audio signal of each channel included in the first downmix signal. Updating the first downmix coefficient based on the restrained conditions,
A channel number conversion device characterized by the above.
前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第一ダウンミックス係数を更新する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to claim 7,
The downmix coefficient updating unit updates the first downmix coefficient with a constraint that the value of the downmix coefficient between the channels having the highest position similarity is maximum.
A channel number conversion device characterized by the above.
前記ダウンミックス係数更新部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第二ダウンミックス係数を更新する、
ことを特徴とするチャンネル数変換装置。 The channel number converter according to any one of claims 4 to 8, which does not cite claim 1, claim 2, or claim 3 ,
The downmix coefficient updating unit determines the position similarity between the reproduction position of the acoustic signal of each channel included in the first downmix signal and the reproduction position of the acoustic signal of each channel included in the second downmix signal. Updating the second downmix coefficient based on a defined constraint condition,
A channel number conversion device characterized by the above.
前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第二ダウンミックス係数を更新する、
ことを特徴とするチャンネル数変換装置。 The channel number conversion device according to claim 9,
The downmix coefficient updating unit updates the second downmix coefficient with a constraint that the value of the downmix coefficient between the channels having the highest position similarity is maximum.
A channel number conversion device characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103594A JP6694755B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103594A JP6694755B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017212547A JP2017212547A (en) | 2017-11-30 |
JP6694755B2 true JP6694755B2 (en) | 2020-05-20 |
Family
ID=60476911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016103594A Expired - Fee Related JP6694755B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6694755B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7107727B2 (en) * | 2018-04-17 | 2022-07-27 | シャープ株式会社 | Speech processing device, speech processing method, program, and program recording medium |
-
2016
- 2016-05-24 JP JP2016103594A patent/JP6694755B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017212547A (en) | 2017-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109996166B (en) | Sound processing device and method, and program | |
CN101009952B (en) | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener | |
US8532306B2 (en) | Method and an apparatus of decoding an audio signal | |
CN104429102B (en) | Compensated using the loudspeaker location of 3D audio hierarchical decoders | |
TWI489887B (en) | Virtual audio processing for loudspeaker or headphone playback | |
KR101325402B1 (en) | Apparatus and method for generating audio output signals using object based metadata | |
CN110832881B (en) | Stereo virtual bass enhancement | |
RU2668113C2 (en) | Method and device for audio output, method and encoding device, method and decoding device and program | |
JP5417227B2 (en) | Multi-channel acoustic signal downmix device and program | |
CN112823534B (en) | Signal processing device and method, and program | |
US20230254655A1 (en) | Signal processing apparatus and method, and program | |
JP6694755B2 (en) | Channel number converter and its program | |
JP2010136236A (en) | Audio signal processing apparatus and method, and program | |
JP2010118978A (en) | Controller of localization of sound, and method of controlling localization of sound | |
JP6684651B2 (en) | Channel number converter and its program | |
WO2021140959A1 (en) | Encoding device and method, decoding device and method, and program | |
JP5680391B2 (en) | Acoustic encoding apparatus and program | |
US20240381050A1 (en) | Audio processing device and method therefor | |
JP6846822B2 (en) | Audio signal processor, audio signal processing method, and audio signal processing program | |
JP6832095B2 (en) | Channel number converter and its program | |
Moore et al. | Optimisation of the localisation performance of irregular ambisonic decoders for multiple off-centre listeners | |
RU2384973C1 (en) | Device and method for synthesising three output channels using two input channels | |
JP2006270649A (en) | Voice acoustic signal processing apparatus and method thereof | |
KR20110102719A (en) | Audio up-mixing apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6694755 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |