TWI447709B - 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 - Google Patents
用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 Download PDFInfo
- Publication number
- TWI447709B TWI447709B TW100103980A TW100103980A TWI447709B TW I447709 B TWI447709 B TW I447709B TW 100103980 A TW100103980 A TW 100103980A TW 100103980 A TW100103980 A TW 100103980A TW I447709 B TWI447709 B TW I447709B
- Authority
- TW
- Taiwan
- Prior art keywords
- encoded
- parameters
- dynamic range
- level
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 51
- 230000005236 sound signal Effects 0.000 title claims description 17
- 230000006835 compression Effects 0.000 claims description 45
- 238000007906 compression Methods 0.000 claims description 45
- 230000004044 response Effects 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims 2
- 238000012986 modification Methods 0.000 claims 2
- 230000000638 stimulation Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
本發明一般有關於編碼及解碼音訊信號,且更特定而言有關於可用來編碼及解碼音訊信號以用於較廣範圍的回放裝置及收聽環境的技術。
手持式及其他類型之可攜式裝置的逐漸普及已經對媒體內容的創作者及經銷商(以及對該等裝置的設計者及製造商)在這些裝置上的回放方面產生新的機會與挑戰。許多可攜式裝置能夠回放廣泛的媒體內容類型及格式,包括那些通常與HDTV、藍光光碟或DVD之高品質、寬廣頻寬及寬廣動態範圍音訊內容關聯的媒體內容類型及格式。可攜式裝置可用來在它們本身的內部聲波變換器上或者在諸如頭戴式耳機的外部變換器上回放這類型的音訊內容;然而,它們無法以跨越不同媒體格式及內容類型的一致響度及清晰度(intelligibility)之方式來再生此內容。
本發明之揭示
本發明針對提供用以編碼及解碼音訊信號以供在包括手持式及其他類型之可攜式裝置的各種裝置上回放的改良方法。
本發明的各種態樣於下列所示的申請專利範圍中加以陳述。
本發明的各種特徵及其較佳實施例可藉由參照下列討論及隨附圖式而更佳地被理解,在該等圖式中相似元件符號意指數個圖中的相似元件。僅陳述下列討論及圖式的內容作為範例,且不應被理解成代表對本發明之範圍的限制。
實行本發明之模式
A.導論
本發明針對音訊資訊之編碼及解碼以供在具挑戰性的收聽環境(諸如那些手持式及其他類型之可攜式裝置的使用者遭遇的收聽環境)中回放。音訊編碼及解碼的幾個實例由已發表的標準加以描述,諸如那些描述於由美國先進電視系統委員會在2005年6月14日所發表之「數位音訊壓縮標準(AC-3、E-AC-3)」,Revision B,Document A/52B(文中稱為「ATSC標準」)中,以及描述於由國際標準組織(ISO)所發表之ISO/IEC 13818-7,進階音訊編碼(Advanced Audio Coding,AAC)(文中稱為「MPEG-2 AAC標準」)以及ISO/IEC 14496-3,第4子部份(文中稱為「MPEG-4音訊標準」)中的標準。僅提到符合這些標準的編碼及解碼程序作為範例。也可將本發明的原則與符合其他標準的編碼系統一起使用。
發明人發現符合一些編碼標準的裝置可用特徵通常在對於手持式及其他類型之可攜式裝置典型的應用及收聽環境方面是不充足的。當這些類型的裝置被用來解碼符合這些標準之已編碼輸入信號的音訊內容時,已解碼音訊內容通常在響度位準顯著低於藉由解碼特別針對這些裝置上的回放所準備之已編碼輸入信號獲得的音訊內容的響度位準下加以再生。
符合ATSC標準的已編碼輸入信號(文中稱為「順應ATSC的已編碼信號」)例如含有已編碼音訊資訊及用以描述如何可將此資訊解碼的元資料。某些元資料參數識別動態範圍壓縮設定值,該動態範圍壓縮設定值指定當該已編碼音訊資訊被解碼時如何可將該音訊資訊的動態範圍壓縮。該已解碼信號的全動態範圍可被保持或它可在解碼時以不同程度加以壓縮,以滿足不同應用及收聽環境的需求。其他元資料識別該已編碼音訊資訊之響度的某一度量,諸如該已編碼信號中的平均計畫位準(program level)或對話位準。此元資料可被解碼器用來調整該已編碼信號的振幅以在回放期間達到指定的響度或參考再生位準。在一些應用中,可指定或假設一或更多個參考再生位準,而在其他應用中,使用者可控制參考再生位準之設定。例如,用來將順應ATSC的已編碼信號編碼及解碼的編碼程序假設對話是在二個參考再生位準的一者中加以回放。一個位準為低於截波位準31 dB,這是最大可能數位值或全刻度(full scale,FS)值,文中記為-31 dBFS
。使用此位準的解碼模式有時稱為「線模式(Line Mode)」,且意欲被使用於適合較廣動態範圍的應用及環境中。將另一位準設定在-20 dBFS
。使用此第二位準的解碼模式有時稱為「射頻模式(RF Mode)」,其意欲被使用於像是那些藉由將射頻(RF)信號調變的廣播中所遭遇的應用及環境中,此應用及環境中需要較窄的動態範圍以避免過度調變。
舉另一例子,符合MPEG-2 AAC及MPEG-4音訊標準的已編碼信號包括識別已編碼音訊資訊之平均響度位準的元資料。將順應MPEG-2 AAC及MPEG-4音訊之已編碼信號解碼的程序可容許收聽者指定想要的回放位準。解碼器使用該想要的回放位準及平均響度元資料來調整已編碼信號的振幅,使得該想要的回放位準被達到。
當手持式及其他類型的可攜式裝置被用來將順應ATSC、順應MPEG-2 AAC、及順應MPEG-4音訊之已編碼信號的音訊內容依據這些元資料參數而解碼及回放時,動態範圍及響度位準通常不合適,因為這些類型的裝置所遭遇之不利收聽環境或者因為這些裝置中所使用之較低操作電壓造成的電氣限制。
符合其他標準的已編碼信號使用類似類型的元資料,且可包括用以指定想要的回放響度位準的供應。解碼這些信號的可攜式裝置通常遭遇相同問題。
可將本發明用來在無須特別針對這些裝置所準備之內容的情況下改善手持式及可攜式裝置使用者的收聽體驗。
B.裝置概述
第1圖為併入本發明各種態樣的一種類型之接收器/解碼器裝置10的示意方塊圖。裝置10接收來自信號路徑11的已編碼輸入信號、於解格式器(deformatter)12中施加合適的程序以自該輸入信號擷取已編碼音訊資訊及關聯的元資料、傳送該已編碼音訊資訊至解碼器14且沿信號路徑13傳送該元資料。已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號,且元資料指定各種參數的值,該等參數包括一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。術語「動態範圍壓縮設定值」意指定義動態範圍壓縮器之操作特性的特徵,諸如增益因子、壓縮始動時間及壓縮釋放時間。
解碼器14施加解碼程序至已編碼音訊資訊以獲得已解碼次頻帶信號,該等已解碼次頻帶信號被傳送至動態範圍控制器16。可回應於自信號路徑13所接收之解碼控制參數而調整解碼程序的操作及功能。可用來調整解碼程序的操作及功能之解碼控制參數的實例為:識別由已編碼音訊資訊所代表之音訊通道的數量及組態的參數。
動態範圍控制器16任意地調整已解碼音訊資訊的動態範圍。此調整可能回應於自信號路徑13所接收之元資料及/或由回應於來自收聽者之輸入而可被提供的控制信號而加以開啟或關閉及調整。例如,控制信號可回應於收聽者操作切換器或選擇用於裝置10的操作選項而被提供。
在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中,例如,已編碼輸入信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量。動態範圍控制器16可能不採取動作,這容許該音訊信號以動態範圍的最大量加以回放,或該動態範圍控制器可能修改已解碼次頻帶信號以用不同程度壓縮該動態範圍。
合成濾波器排18施加一排合成濾波器至已解碼次頻帶信號(該等已解碼次頻帶信號可能已經由動態範圍控制器16加以調整),且在它的輸出提供了可能為數位或類比信號的時域音訊信號。
增益-限幅器20在本發明一些實施例中被用來調整時域音訊信號的振幅。將增益-限幅器20的輸出沿路徑21傳送以供隨後由聲波變換器的呈現。
第2圖為併入本發明各種態樣的編碼器/發送器裝置30的示意方塊圖。裝置30接收來自信號路徑31且代表聽覺刺激的音訊輸入信號。裝置30施加一排分析濾波器至音訊信號以獲得呈該輸入音訊信號之頻域表示的次頻帶信號或者一組代表該輸入音訊信號的頻寬限制信號。元資料計算器34分析該音訊輸入信號及/或一或更多個該音訊輸入信號所衍生的信號(諸如該音訊輸入信號的已修改版本或來自分析濾波器排32的次頻帶信號)以計算元資料,該元資料指定用於各種參數的值,該等參數包括編碼控制參數、一或更多個解碼控制參數及一或更多個依據動態範圍壓縮設定值指定動態範圍壓縮的參數。元資料計算器34可分析時域信號、頻域信號、或時域信號及頻域信號的組合。也可回應於自路徑33所接收的一或更多個元資料參數而調整由元資料計算器34所實施的計算。編碼器36施加編碼程序至分析濾波器排32的輸出,以獲得包括已編碼次頻帶信號的已編碼音訊資訊,該已編碼音訊資訊被傳送至格式器38。可回應於自路徑33所接收之編碼控制參數而調整編碼程序。編碼程序也可沿路徑33產生其他解碼控制參數,以供裝置10中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合該已編碼音訊資訊及該元資料的至少一些成為具有適用於傳輸或儲存之格式的已編碼輸出信號,該元資料包括該一或更多個解碼控制參數及該一或更多個指定動態範圍壓縮的參數。
在符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準的實施例中,例如,已編碼輸出信號包括以一序列的區段或訊框配置之已編碼音訊資訊。各訊框含有已編碼次頻帶信號,該等已編碼次頻帶信號代表具有它的全動態範圍之音訊信號的頻譜分量且具有用於在參考再生位準回放的振幅。
解格式器12、解碼器14、合成濾波器排18、分析濾波器排32、編碼器36及格式器38在設計及操作上可為習知的。幾個實例包括符合上述已發表標準的對應組件。這些標準中所指定或建議之組件的實施例適合與本發明一起使用,但它們不是必需的。這些組件的特定實施例不是關鍵的。
第3至5圖為轉碼器裝置40之不同實施例的示意方塊圖,該轉碼器裝置包含上述裝置10及裝置30中的一些組件。這些組件實質上以與它們的對應部分相同的方式操作。第3圖中所示的裝置40能夠轉碼自路徑11所接收的已編碼輸入信號成為符合相同編碼標準的已修改版本。在此實施例中,裝置40接收來自信號路徑11的已編碼輸入信號、於解格式器12中施加合適的程序以自該已編碼輸入信號擷取第一已編碼音訊資訊及關聯的元資料、傳送該第一已編碼音訊資訊至解碼器14及至格式器38、且沿信號路徑43傳送該元資料。該第一已編碼音訊資訊包括代表聽覺刺激之頻譜內容的已編碼次頻帶信號,且該元資料指定用於各種參數的值,該等參數包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的參數。解碼器14施加解碼程序至該第一已編碼音訊資訊以獲得已解碼次頻帶信號。可回應於自信號路徑43所接收之該一或更多個解碼控制參數而調整解碼程序的操作及功能。次頻帶信號可為聽覺刺激的頻域表示或者一組代表該聽覺刺激的頻寬限制信號。
元資料計算器44分析已解碼次頻帶信號及/或自該等已解碼次頻帶信號所衍生的一或更多個信號以計算一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的參數值。例如,該一或更多個信號可藉由施加合成濾波器排18至該等已解碼次頻帶信號所衍生。可回應於自路徑43所接收的元資料而調整由元資料計算器44所實施的計算。如果元資料計算不需要合成濾波器排18的輸出,則可自此實施例刪去該合成濾波器排。
裝置40的另一實施例顯示於第4圖中。此實施例類似於第3圖中所示的實施例,但包括編碼器36。該編碼器36的含括係容許裝置40轉碼自路徑11所接收的已編碼輸入信號(符合第一編碼標準)成為符合第二編碼標準的已編碼輸出信號,該第二編碼標準可能與該第一編碼標準相同或相異,前提是該二個編碼標準的次頻帶信號相容。這可能在此實施例中藉由使編碼器36施加編碼程序至次頻帶信號以獲得符合該第二編碼標準的第二已編碼音訊資訊而加以完成。將第二已編碼音訊資訊傳送至格式器38。可回應於自路徑43所接收的元資料而調整編碼程序。編碼程序也可沿路徑43產生其他元資料,以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。格式器38組合自路徑43所接收的元資料及它接收的已編碼音訊資訊成為具有適用於傳輸或儲存之格式的已編碼輸出信號。
裝置40的另一實施例顯示於第5圖中。此實施例包括合成濾波器排18,其被施加至已解碼次頻帶信號以獲得已編碼音訊資訊的時域或寬頻表示。合成濾波器排18及分析濾波器排32的含括係容許裝置40基本上在編碼標準的任何選擇之間轉碼。將合成濾波器排18的輸出傳送至分析濾波器排32,該分析濾波器排產生次頻帶信號以供編碼器36編碼。編碼器36施加編碼程序至分析濾波器排32的輸出以產生第二已編碼音訊資訊,該第二已編碼音訊資訊被傳送至格式器38。編碼程序也可沿路徑43產生其他元資料,以供裝置40中所實施的程序用來解碼該已編碼音訊資訊。元資料計算器44可自它對於下列之任一者或所有者的分析來計算元資料參數值:自解碼器14所接收的次頻帶信號、合成濾波器排18的輸出、及分析濾波器排32的輸出。
將裝置10及裝置30的一些態樣更詳細地描述於下。這些描述應用至裝置40的對應特徵。這些態樣在符合上述ATSC標準之方法及裝置的特徵及特性方面加以描述。這些特定特徵及特性僅以範例方式加以討論。這些實施例隱含的原理可直接應用於符合其他標準的方法及裝置。
C.接收器/解碼器
上述回放問題可藉由使用下述三種不同技術的一或更多者而解決。第一種技術使用增益-限幅且可僅藉由裝置10中的特徵來實施。第二及第三種技術使用動態範圍壓縮且它們的實施需要裝置10及裝置30兩者中的特徵。
1.增益-限幅器
第一種技術將裝置10操作於RF模式中而不是線模式中,使得它以動態範圍控制器16提供較高動態範圍壓縮位準及較高參考再生位準的方式來解碼順應ATSC的已編碼輸入信號。增益-限幅器20提供額外的增益,提高有效參考再生位準的值自-14 dBFS
至-8 dBFS
。實驗結果指示參考位準等於-11 dBFS
對許多應用產生良好結果。
增益-限幅器20也施加限幅操作以防止被放大的數位信號超過0 dBFS
。限幅器的操作特性可影響已再生音訊的感知品質(perceived quality),但對本發明而言沒有特定限幅器是關鍵的。限幅器基本上可用任何可能想要的方式加以實施。較佳地,將限幅器設計成提供「軟性的」限幅功能,而不是「硬性的」截波功能。
2.微分壓縮值
第二種技術容許裝置10施加動態範圍控制器16中的一或更多個已修改動態範圍壓縮參數。解格式器12獲得來自已編碼輸入信號的微分動態範圍壓縮(dynamic range compression,DRC)參數值,且將該微分參數值與習知DRC參數值一起沿路徑13傳送至動態範圍控制器16。動態範圍控制器16藉由以算術方式結合該等習知DRC參數值與對應的微分DRC參數值來計算它需要的該一或更多個DRC參數值。在此情況中不需要使用增益-限幅器20。
藉由產生已編碼輸入信號的編碼器/發送器裝置30將微分DRC參數值提供於該已編碼輸入信號中。此將描述於下。
如果已編碼輸入信號不含有這些微分DRC值,裝置10可依據上述第一種技術使用增益-限幅器20。
3.相異的壓縮設定值
第三種技術容許裝置10依據動態範圍控制器16中的新動態範圍壓縮設定值來施加動態範圍壓縮。解格式器12獲得一或更多個來自已編碼輸入信號之用於該新設定值的DRC參數值,且沿路徑13傳送該一或更多個DRC參數值至動態範圍控制器16。在此情況中不需要使用增益-限幅器20。
藉由產生已編碼輸入信號的編碼器/發送器裝置30將用於新動態範圍壓縮設定值的DRC參數值提供於該已編碼輸入信號中。此將描述於下。
如果已編碼輸入信號不含有該一或更多個用於該新DRC設定值的DRC參數值,裝置10可依據上述第一種技術使用增益-限幅器20。
D.編碼器/發送器
1.微分壓縮值
藉由使用自已編碼輸入信號所擷取的微分DRC參數值來將以上討論之第二種技術的程序實施於裝置10中。這些微分參數值由產生已編碼信號的裝置30所提供。
裝置30提供一組微分DRC參數值,該組微分DRC參數值代表一組將出現於已編碼信號中的DRC參數值與一組防止已解碼音訊信號樣本超過0 dBFS
的較高參考再生位準的用於新DRC設定值之對應基參數值之間的差異。對本發明而言沒有計算DRC參數值的特定方法是關鍵的。符合ATSC標準之計算DRC參數值的已知方法係揭示於由美國先進電視系統委員會在2009年11月4日所發表之「ATSC Recommended Practice:Techniques for Establishing an Maintaining Audio Loudness for Digital Television」,Document A/85中,尤其是Section 9與Annex F,以及於Robinson等人之「Dynamic Range Control via Metadata」中,preprint no.5028,107th AES Convention,New York,1999年9月。
如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準或MPEG-4音訊標準,增加參考再生位準的值自-14 dBFS
至-8 dBFS
。實驗結果指示參考位準等於-11 dBFS
對許多應用產生良好結果。
對於順應ATSC的已編碼輸出信號,元資料計算器34計算該標準中所指示之對應基參數「compr」的微分參數值。格式器38可組合該微分參數值成為各已編碼信號訊框被記為「addbsi(額外位元串流資訊)」及/或「auxdata(輔助資料)」的部分。如果將微分參數值組合成為「addbsi」或「auxdata」部分,已編碼信號將與所有順應ATSC的解碼器相容。那些無法辨識微分參數值的解碼器仍可藉由忽略「addbsi」或「auxdata」部分而正確地處理及解碼該已編碼信號訊框。更多細節參照上述之A/52B Document。
對於符合MPEG-2 AAC或MPEG-4音訊標準的已編碼輸出信號,格式器38可組合該等微分參數值成為各已編碼信號訊框在該二個標準中被記為「Fill_Element」或「Data_Stream_Element」的部分。如果將微分參數值組合成為這些部分的任一者,已編碼信號將與所有順應MPEG-2 AAC及MPEG-4音訊標準的解碼器相容。更多細節參照上述之ISO/IEC 13818-7及ISO/IEC 14496-3。
微分參數值可被計算且以一速率被插入至已編碼信號中,該速率大於、等於、或小於對應基參數於該已編碼信號中的速率。用於微分值的速率可變動。也可將用以指示先前的微分值是否應被再度使用的旗標或位元含括於已編碼信號中。
2.相異的壓縮設定值
藉由使用自已編碼輸入信號所擷取之用於新動態範圍壓縮設定值的DRC參數值來將以上討論之第三種技術的程序實施於裝置10中。這些參數值由產生已編碼信號的裝置30所提供。
裝置30藉由計算防止已解碼音訊信號樣本超過0 dBFS
的較高參考再生位準所需要的參數值而衍生出用於新DRC設定值的DRC參數值。
如果已編碼輸出信號符合ATSC標準、MPEG-2 AAC或MPEG-4音訊標準,元資料計算器34根據參考再生位準的值自-14 dBFS
增加至-8 dBFS
的假設來計算DRC壓縮值。實驗結果指示參考位準等於-11 dBFS
對許多應用產生良好結果。格式器38可組合用於該DRC設定值的參數值成為各已編碼信號訊框的部分,如同以上針對微分參數所述。這些訊框部分的使用係容許已編碼信號與所有符合各別標準的解碼器相容。
E.實施例
併入本發明各種態樣的裝置可用各種方式加以實施,包括由電腦或包括更特定組件(諸如耦接至類似於一般用途電腦中出現之組件的數位信號處理器(DSP)電路)的某其他裝置所執行的軟體。第6圖為可被用來實施本發明態樣之裝置70的示意方塊圖。處理器72提供運算資源。RAM 73為用於處理之處理器72所使用的系統隨機存取記憶體(RAM)。ROM 74代表諸如唯讀記憶體(ROM)的一些持續儲存器的形式,用以儲存操作裝置70所需的程式且可能用以進行本發明各種態樣。I/O控制器75代表用以藉由通訊通道76、77接收輸入信號及發送輸出信號的介面電路。在所示實施例中,所有主要系統組件連接至匯流排71,其可代表超過一個的實體或邏輯匯流排;然而,不需要匯流排架構來實施本發明。
在由一般用途電腦系統所實施的實施例中,可將額外組件含括而用於介接於諸如鍵盤或滑鼠及顯示器的裝置,且用於控制具有儲存媒體(諸如磁帶或磁碟、或光學媒體)的儲存裝置。儲存媒體可被用來記錄用於作業系統、公用程式及應用程式的指令程式,且可包括實施本發明各種態樣的程式。
實行本發明各種態樣所需要的功能可由以各種方式實施的組件(包括分離的邏輯組件、積體電路、一或更多個ASIC及/或程式控制處理器)加以實施。實施這些組件的方式對本發明並不重要。
本發明的軟體實施例可藉由各種機器可讀取媒體加以傳送,諸如貫穿包括從超聲波至紫外線頻率之頻譜的基頻或調變通訊路徑,或藉由利用基本上任何記錄技術(包括磁帶、磁卡或磁碟、光學卡或光碟、及在包括紙的媒體上的可偵測標記)而傳送資訊的儲存媒體。
10...接收器/解碼器裝置
11、13、31、43...信號路徑
12...解格式器
14...解碼器
16...動態範圍控制器
18...合成濾波器排
20...增益-限幅器
21、33...路徑
30...編碼器/發送器裝置
32...分析濾波器排
34、44...元資料計算器
36...編碼器
38...格式器
40...轉碼器裝置
70...裝置
71...匯流排
72...處理器
73...隨機存取記憶體
74...唯讀記憶體
75...I/O控制器
76、77...通訊通道
第1圖為回放裝置的示意方塊圖。
第2圖為編碼裝置的示意方塊圖。
第3至5圖為轉碼裝置的示意方塊圖。
第6圖為可被用來實施本發明各種態樣之裝置的示意方塊圖。
10...接收器/解碼器裝置
11、13...信號路徑
12...解格式器
14...解碼器
16...動態範圍控制器
18...合成濾波器排
20...增益-限幅器
21...路徑
Claims (14)
- 一種用以解碼已編碼輸入信號以產生音訊輸出信號的方法,其中該方法包含:接收該已編碼輸入信號,其包括已編碼音訊資訊及關聯的元資料,該關聯的元資料包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數,且該元資料任意地包括一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數,其中該一或更多個第一參數具有的值係依據產生該已編碼音訊資訊的編碼程序加以設定且用以代表具有在第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激,且其中該一或更多個第二參數具有的值係依據產生該已編碼音訊資訊的編碼程序加以設定且用以代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激,該第二參考再生位準係高於該第一參考再生位準;施加解碼程序至該已編碼音訊資訊以獲得代表該聽覺刺激之頻譜內容的次頻帶信號,其中該解碼程序回應於該一或更多個解碼控制參數而調整;修改該等次頻帶信號以獲得具有已改變動態範圍特性的已修改次頻帶信號,其中如果該元資料包括該一或更多個第二參數,該修改回應於該一或更多個第二參數而調整,或如果該元資料不包括該一或更多個第二參數,該修改回應於該一或更多個第一參數而調整;施加合成濾波器排至該等已修改次頻帶信號以獲得時 域音訊信號;及如果該元資料不包括該一或更多個第二參數,回應於該元資料施加增益及限幅器至該時域音訊信號,其中該增益之施加修改該時域音訊信號以獲得具有在該第二參考再生位準回放之振幅的音訊輸出信號,且其中該限幅器之施加防止該音訊輸出信號的振幅超過該截波位準。
- 如申請專利範圍第1項之方法,其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
- 如申請專利範圍第1或2項之方法,其中該已編碼輸入信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準,該第一參考再生位準對應於低於該截波位準20dB的振幅,且該第二參考再生位準對應於低於該截波位準11dB的振幅。
- 一種用以編碼代表聽覺刺激之音訊輸入信號的方法,其中該方法包含:接收該音訊輸入信號;施加分析濾波器排至該音訊輸入信號以產生代表該音訊輸入信號之頻譜內容的次頻帶信號;分析一或更多個自該音訊輸入信號所衍生的信號以計算元資料,該元資料包括一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數及一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數,其中該一或更多個第一參數具有的值經設定而代表具有在 第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激,且其中該一或更多個第二參數具有的值經設定而代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激;施加編碼程序至該等次頻帶信號以獲得已編碼音訊資訊;及組合該已編碼音訊資訊及該元資料成為具有適用於傳輸或儲存之格式的已編碼輸出信號,其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
- 如申請專利範圍第4項之方法,其中該已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準,該第一參考再生位準對應於低於該截波位準20dB的振幅,且該第二參考再生位準對應於低於該截波位準11dB的振幅。
- 一種用以轉碼已編碼輸入信號以產生已編碼輸出信號的方法,其中該方法包含:接收該已編碼輸入信號,其包括第一已編碼音訊資訊及關聯的元資料,該關聯的元資料包括一或更多個解碼控制參數及一或更多個依據第一動態範圍壓縮設定值指定動態範圍壓縮的第一參數,其中該一或更多個第一參數具有的值係依據產生該第一已編碼音訊資訊的第一編碼程序加以設定且用以代表具有在第一參考再生位準回放之不超過截波位準之振幅的聽覺刺激; 施加解碼程序至該第一已編碼音訊資訊以獲得代表該聽覺刺激之頻譜內容的次頻帶信號,其中該解碼程序回應於該一或更多個解碼控制參數而調整;分析一或更多個自該等次頻帶信號所獲得的信號以計算一或更多個依據第二動態範圍壓縮設定值指定動態範圍壓縮的第二參數,其中該一或更多個第二參數具有的值經設定而代表具有在第二參考再生位準回放之不超過該截波位準之振幅的聽覺刺激;及組合第二已編碼音訊資訊、該一或更多個第一參數及該一或更多個第二參數成為具有適用於傳輸或儲存之格式的已編碼輸出信號,其中該第二已編碼音訊資訊為該等次頻帶信號的已編碼表示。
- 如申請專利範圍第6項之方法,其中該一或更多個第二參數代表該第一動態範圍壓縮設定值與該第二動態範圍壓縮設定值之對應參數間的差異。
- 如申請專利範圍第6或7項之方法,其包含:施加合成濾波器排至該等次頻帶信號以獲得被分析以計算該一或更多個指定動態範圍壓縮之第二參數的該一或更多個信號。
- 如申請專利範圍第6或7項之方法,其包含:施加第二編碼程序至該等次頻帶信號以產生該第二已編碼音訊資訊。
- 如申請專利範圍第6或7項之方法,其中該第二已編碼音訊資訊為該第一已編碼音訊資訊。
- 如申請專利範圍第6或7項之方法,其中該已編碼輸入信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準,且該第一參考再生位準對應於低於該截波位準20dB的振幅。
- 如申請專利範圍第6或7項之方法,其中該已編碼輸出信號符合ATSC標準、MPEG-2 AAC標準、或MPEG-4音訊標準,且該第二參考再生位準對應於低於該截波位準11dB的振幅。
- 一種設備,其包含用以實施申請專利範圍第1至12項中任一項之方法步驟的手段。
- 一種記錄指令程式的儲存媒體,該指令程式由裝置所執行以實施申請專利範圍第1至12項中任一項方法之步驟。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30364310P | 2010-02-11 | 2010-02-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201205559A TW201205559A (en) | 2012-02-01 |
TWI447709B true TWI447709B (zh) | 2014-08-01 |
Family
ID=43881135
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100103980A TWI447709B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TW103122263A TWI529703B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103122263A TWI529703B (zh) | 2010-02-11 | 2011-02-01 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
Country Status (18)
Country | Link |
---|---|
US (8) | US8903729B2 (zh) |
EP (5) | EP4459615A2 (zh) |
JP (2) | JP5666625B2 (zh) |
KR (1) | KR101381588B1 (zh) |
CN (2) | CN102754151B (zh) |
AR (1) | AR080156A1 (zh) |
BR (2) | BR112012019880B1 (zh) |
CA (6) | CA3075793C (zh) |
CL (1) | CL2012002213A1 (zh) |
CO (1) | CO6511277A2 (zh) |
EA (1) | EA023730B9 (zh) |
ES (1) | ES2916403T3 (zh) |
MX (1) | MX2012008954A (zh) |
MY (1) | MY169981A (zh) |
SG (1) | SG182632A1 (zh) |
TW (2) | TWI447709B (zh) |
UA (1) | UA105277C2 (zh) |
WO (1) | WO2011100155A1 (zh) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10158337B2 (en) | 2004-08-10 | 2018-12-18 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
AR077680A1 (es) | 2009-08-07 | 2011-09-14 | Dolby Int Ab | Autenticacion de flujos de datos |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2695161B1 (en) * | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
CN104303229B (zh) * | 2012-05-18 | 2017-09-12 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
BR112015010023B1 (pt) * | 2012-11-07 | 2021-10-19 | Dolby Laboratories Licensing Corporation | Codificador de áudio e método para codificar um sinal de áudio |
US9411881B2 (en) | 2012-11-13 | 2016-08-09 | Dolby International Ab | System and method for high dynamic range audio distribution |
KR101637897B1 (ko) | 2013-01-21 | 2016-07-08 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 프로그램 라우드니스 및 경계 메타데이터를 가진 오디오 인코더 및 디코더 |
KR102194120B1 (ko) | 2013-01-21 | 2020-12-22 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN107578781B (zh) * | 2013-01-21 | 2021-01-29 | 杜比实验室特许公司 | 利用响度处理状态元数据的音频编码器和解码器 |
BR122022020284B1 (pt) * | 2013-01-28 | 2023-02-28 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia |
JP6250071B2 (ja) * | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN118016076A (zh) | 2013-09-12 | 2024-05-10 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
EP3044876B1 (en) | 2013-09-12 | 2019-04-10 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
JP6531649B2 (ja) * | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
US20150095320A1 (en) * | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
PT3522157T (pt) * | 2013-10-22 | 2021-12-03 | Fraunhofer Ges Forschung | Conceito combinado para a compressão de gama dinâmica e a prevenção de clipping guiada para dispositivos de áudio |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US20150146099A1 (en) * | 2013-11-25 | 2015-05-28 | Anthony Bongiovi | In-line signal processor |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US10063207B2 (en) * | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
WO2015128390A1 (en) * | 2014-02-27 | 2015-09-03 | Sonarworks Sia | Method of and apparatus for determining an equalization filter |
US9936321B2 (en) * | 2014-03-24 | 2018-04-03 | Dolby Laboratories Licensing Corporation | Method and device for applying dynamic range compression to a higher order ambisonics signal |
CA2942743C (en) * | 2014-03-25 | 2018-11-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US10820883B2 (en) | 2014-04-16 | 2020-11-03 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
US9922657B2 (en) * | 2014-06-27 | 2018-03-20 | Dolby Laboratories Licensing Corporation | Method for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
CN106464943B (zh) * | 2014-06-30 | 2020-09-11 | 索尼公司 | 信息处理装置和方法 |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
ES2912586T3 (es) | 2014-10-01 | 2022-05-26 | Dolby Int Ab | Descodificación de una señal de audio codificada usando perfiles DRC |
EP3518236B8 (en) * | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
US11089349B2 (en) * | 2017-01-20 | 2021-08-10 | Hanwha Techwin Co., Ltd. | Apparatus and method for playing back and seeking media in web browser |
CN110679083B (zh) * | 2017-03-31 | 2023-11-17 | 杜比国际公司 | 动态范围控制反演 |
CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
KR102580673B1 (ko) | 2018-04-09 | 2023-09-21 | 돌비 인터네셔널 에이비 | Mpeg-h 3d 오디오의 3 자유도(3dof+) 확장을 위한 방법, 장치 및 시스템 |
US11211043B2 (en) | 2018-04-11 | 2021-12-28 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
US10959035B2 (en) | 2018-08-02 | 2021-03-23 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US12126973B2 (en) | 2019-09-13 | 2024-10-22 | Dolby Laboratories Licensing Corporation | Dynamic range compression with reduced artifacts |
EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
CN112732069A (zh) * | 2021-02-20 | 2021-04-30 | 上海创感传感技术有限公司 | 一种电子设备状态修改方法和装置 |
CN112992159B (zh) * | 2021-05-17 | 2021-08-06 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置、设备及存储介质 |
US20240276143A1 (en) * | 2023-02-09 | 2024-08-15 | Samsung Electronics Co., Ltd. | Signal normalization using loudness metadata for audio processing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2149983A1 (en) * | 2008-07-29 | 2010-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
Family Cites Families (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
JP2007109328A (ja) | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
WO2008032828A1 (fr) * | 2006-09-15 | 2008-03-20 | Panasonic Corporation | Dispositif de codage audio et procédé de codage audio |
DE102006048685A1 (de) | 2006-10-14 | 2008-04-17 | Mtu Aero Engines Gmbh | Turbinenschaufel einer Gasturbine |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
US9336785B2 (en) * | 2008-05-12 | 2016-05-10 | Broadcom Corporation | Compression for speech intelligibility enhancement |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
EP2146522A1 (en) | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
JP5136378B2 (ja) * | 2008-12-09 | 2013-02-06 | 富士通株式会社 | 音響処理方法 |
US20100161340A1 (en) * | 2008-12-24 | 2010-06-24 | Plantronics, Inc. | Dynamic Codec Switching |
US9269366B2 (en) * | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
EP2381574B1 (en) | 2010-04-22 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an input audio signal |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
JP5908112B2 (ja) | 2011-12-15 | 2016-04-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | クリッピングアーチファクトを回避する装置、方法及びコンピュータプログラム |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
BR122022020284B1 (pt) | 2013-01-28 | 2023-02-28 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
PT3522157T (pt) | 2013-10-22 | 2021-12-03 | Fraunhofer Ges Forschung | Conceito combinado para a compressão de gama dinâmica e a prevenção de clipping guiada para dispositivos de áudio |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
CA2942743C (en) | 2014-03-25 | 2018-11-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
PL3522554T3 (pl) | 2014-05-28 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Procesor danych i transport danych kontrolnych użytkownika do dekoderów audio i modułów renderowania |
RU2699406C2 (ru) | 2014-05-30 | 2019-09-05 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
CN106471574B (zh) | 2014-06-30 | 2021-10-12 | 索尼公司 | 信息处理装置和信息处理方法 |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
RU2703973C2 (ru) | 2015-05-29 | 2019-10-22 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ регулировки уровня громкости |
RU2685999C1 (ru) | 2015-06-17 | 2019-04-23 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Управление громкостью для пользовательской интерактивности в системах аудиокодирования |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2011
- 2011-02-01 TW TW100103980A patent/TWI447709B/zh active
- 2011-02-01 TW TW103122263A patent/TWI529703B/zh active
- 2011-02-03 EP EP24193995.8A patent/EP4459615A2/en active Pending
- 2011-02-03 CN CN201180009098.1A patent/CN102754151B/zh active Active
- 2011-02-03 EP EP22160243.6A patent/EP4047602B1/en active Active
- 2011-02-03 CA CA3075793A patent/CA3075793C/en active Active
- 2011-02-03 US US13/576,386 patent/US8903729B2/en active Active
- 2011-02-03 WO PCT/US2011/023531 patent/WO2011100155A1/en active Application Filing
- 2011-02-03 KR KR1020127023274A patent/KR101381588B1/ko active IP Right Grant
- 2011-02-03 EP EP24193996.6A patent/EP4459616A2/en active Pending
- 2011-02-03 EP EP11706975.7A patent/EP2534656B1/en active Active
- 2011-02-03 CA CA3114177A patent/CA3114177C/en active Active
- 2011-02-03 CA CA2918302A patent/CA2918302C/en active Active
- 2011-02-03 JP JP2012552907A patent/JP5666625B2/ja active Active
- 2011-02-03 CA CA3201814A patent/CA3201814A1/en active Pending
- 2011-02-03 EP EP18191911.9A patent/EP3444816B8/en active Active
- 2011-02-03 BR BR112012019880-7A patent/BR112012019880B1/pt active IP Right Grant
- 2011-02-03 EA EA201270712A patent/EA023730B9/ru not_active IP Right Cessation
- 2011-02-03 MY MYPI2012003595A patent/MY169981A/en unknown
- 2011-02-03 SG SG2012053765A patent/SG182632A1/en unknown
- 2011-02-03 MX MX2012008954A patent/MX2012008954A/es active IP Right Grant
- 2011-02-03 BR BR122019025627-6A patent/BR122019025627B1/pt active IP Right Grant
- 2011-02-03 CA CA2787466A patent/CA2787466C/en active Active
- 2011-02-03 ES ES18191911T patent/ES2916403T3/es active Active
- 2011-02-03 CA CA2995461A patent/CA2995461C/en active Active
- 2011-02-03 CN CN201410039751.4A patent/CN103795364B/zh active Active
- 2011-02-03 UA UAA201210385A patent/UA105277C2/ru unknown
- 2011-02-10 AR ARP110100414A patent/AR080156A1/es active IP Right Grant
-
2012
- 2012-07-30 CO CO12127728A patent/CO6511277A2/es active IP Right Grant
- 2012-08-09 CL CL2012002213A patent/CL2012002213A1/es unknown
-
2014
- 2014-10-28 US US14/525,536 patent/US9646622B2/en active Active
- 2014-12-10 JP JP2014249460A patent/JP6133263B2/ja active Active
-
2017
- 2017-04-07 US US15/482,328 patent/US10418045B2/en active Active
-
2019
- 2019-07-05 US US16/504,076 patent/US10566006B2/en active Active
-
2020
- 2020-02-11 US US16/787,502 patent/US11341982B2/en active Active
-
2022
- 2022-05-23 US US17/750,803 patent/US11670315B2/en active Active
-
2023
- 2023-04-20 US US18/303,919 patent/US11948592B2/en active Active
-
2024
- 2024-03-28 US US18/620,081 patent/US20240249738A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2149983A1 (en) * | 2008-07-29 | 2010-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
Non-Patent Citations (1)
Title |
---|
Jeffrey C. Riedmiller, "An Analysis of Audio for Digital Cable Television Recommendations for the Digital Transition via Audio Metadata", Dolby Laboratories Inc. NCTA Technical Papers, pages 1-18, 2001. * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI447709B (zh) | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |