FI118835B - Koodausmallin valinta - Google Patents
Koodausmallin valinta Download PDFInfo
- Publication number
- FI118835B FI118835B FI20045052A FI20045052A FI118835B FI 118835 B FI118835 B FI 118835B FI 20045052 A FI20045052 A FI 20045052A FI 20045052 A FI20045052 A FI 20045052A FI 118835 B FI118835 B FI 118835B
- Authority
- FI
- Finland
- Prior art keywords
- excitation
- ltp
- audio signal
- block
- encoder
- Prior art date
Links
- 230000005284 excitation Effects 0.000 claims description 193
- 230000005236 sound signal Effects 0.000 claims description 92
- 238000000034 method Methods 0.000 claims description 62
- 230000000737 periodic effect Effects 0.000 claims description 22
- 230000003044 adaptive effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 239000004575 stone Substances 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 230000006837 decompression Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
118835 KOODAUSMALLIN VALINTA Keksinnön ala 5 Keksinnön kohteena on audiokoodaus, jossa koodaustilaa vaihdetaan audiosignaalin ominaisuuksien mukaan. Nyt esillä olevan keksinnön kohteena on kooderi, joka käsittää tulon audiosignaalin kehysten syöttämiseksi, pitkäaikaisen ennusteen (long term prediction, LTP) ana-lyysilohkon LTP-analyysin tekemiseksi audiosignaalin kehyksille pitkä-10 aikaisen ennusteen (LTP) parametrien muodostamiseksi audiosignaalin ominaisuuksien perusteella, ja ainakin ensimmäisen herätelohkon ensimmäisen herätteen suorittamiseksi audiosignaalin kehyksille ja toisen herätelohkon toisen herätteen suorittamiseksi audiosignaalin kehyksille. Keksinnön kohteena on myös laite, joka käsittää kooderin, 15 joka käsittää tulon audiosignaalin kehysten syöttämiseksi, LTP-analyysilohkon LTP-analyysin suorittamiseksi audiosignaalin kehyksille LTP-parametrien muodostamiseksi audiosignaalin ominaisuuksien perusteella, ja ainakin ensimmäisen herätelohkon ensimmäisen herätteen suorittamiseksi audiosignaalin kehyksille ja toisen heräte-20 lohkon toisen herätteen suorittamiseksi audiosignaalin kehyksille. Keksinnön kohteena on myös järjestelmä, joka käsittää kooderin, joka kä- :\i sittää tulon audiosignaalin kehysten syöttämiseksi, LTP-analyysilohkon • .·. LTP-analyysin suorittamiseksi audiosignaalin kehyksille LTP-para- ,*···! metrien muodostamiseksi audiosignaalin ominaisuuksien perusteella, • · :*!*. 25 ja ainakin ensimmäisen herätelohkon ensimmäisen herätteen suoritta- miseksi audiosignaalin kehyksille ja toisen herätelohkon toisen herät-teen suorittamiseksi audiosignaalin kehyksille. Keksinnön kohteena on • · *·· myös menetelmä audiosignaalien prosessoimiseksi, jossa audio signaalin kehyksille suoritetaan LTP-analyysi LTP-parametrien muo-: 30 dostamiseksi signaalin ominaisuuksien perusteella, ja ainakin ensim- mäinen heräte ja toinen heräte ovat valittavissa suoritettaviksi audio- . !·. signaalien kehyksille. Keksinnön kohteena on moduuli, joka käsittää • · · ".I, LTP-analyysilohkon LTP-analyysin tekemiseksi audiosignaalien kehyk- **:*’ sille LTP-parametrien muodostamiseksi audiosignaalin ominaisuuksien ·· : ’·· 35 perusteella. Keksinnön kohteena on tietokoneohjelmatuote, joka käsit- tää koneellisesti suoritettavat vaiheet audiosignaalien koodaamiseksi, joissa audiosignaalin kehyksille suoritetaan LTP-analyysi LTP- 118835 2 parametrien muodostamiseksi signaalin ominaisuuksien perusteella, ja ainakin ensimmäinen heräte ja toinen heräte ovat valittavissa suoritettaviksi audiosignaalien kehyksille.
5 Keksinnön tausta
Monissa audiosignaalien käsittelysovelluksissa audiosignaalit pakataan käsittelytehovaatimusten pienentämiseksi audiosignaaleja käsiteltäessä. Esimerkiksi digitaalisissa viestintäjäijestelmissä audiosignaali 10 vastaanotetaan yleensä analogisena signaalina, digitalisoidaan analo-gia-digitaali- (A/D) -muuntimella ja tämän jälkeen koodataan ennen siirtoa langattoman radioliitännän välityksellä, joka on käyttäjän laitteen, kuten matkapuhelimen, ja tukiaseman välissä. Koodauksen tarkoituksena on pakata digitalisoitu signaali ja siirtää se radioliitännän 15 välityksellä mahdollisimman pienen datamäärän avulla ja samalla säilyttää hyväksyttävä signaalin laatutaso. Tämä on erityisen tärkeää, koska langattoman radioliitännän radiokanavakapasiteetti on rajallinen matkaviestinverkossa. On myös sovelluksia, joissa digitalisoitu audiosignaali tallennetaan tallennusvälineeseen audiosignaalin myöhempää 20 toisintamista varten.
Pakkaaminen voi olla häviöllistä tai häviötöntä. Häviöllisessä pakkaa- • · :misessa osa informaatiosta katoaa tiivistämisen aikana, eikä tällöin ole mahdollista toisintaa täydellisesti alkuperäistä signaalia pakatun sig-•“I, 25 naalin pohjalta. Häviöttömässä pakkaamisessa informaatiota ei *".j yleensä katoa. Täten alkuperäinen signaali voidaan yleensä täydelli- sesti toisintaa pakatun signaalin perusteella.
• · • · • ·
Termillä ’’audiosignaali” tarkoitetaan tavallisesti signaalia, joka sisältää • · I 30 puhetta, musiikkia (ei-puhetta) tai molempia. Puheen ja musiikin erilai- O nen luonne aiheuttaa sen, että on melko vaikeaa laatia yksi . ;·, kompressioalgoritmi, joka toimii tarpeeksi hyvin sekä puheelle että • · · "! musiikille. Siksi ongelma ratkaistaan usein laatimalla eri algoritmit sekä äänelle että puheelle ja käyttämällä jonkinlaista tunnistusmenetelmää, 35 jolla tunnistetaan, onko audiosignaali puheenkaltaista vai musiikin-kaltaista, ja valitaan sopiva algoritmi tunnistuksen mukaisesti.
118835 3
Yleisesti ottaen luokittelu puhtaasti puhesignaalien ja musiikki- tai ei-puhe-signaalien välillä on vaikea tehtävä. Vaadittava tarkkuus on vahvasti riippuvainen sovelluksesta. Joissakin sovelluksissa, kuten puheentunnistuksessa tai tarkassa arkistoinnissa tallennus- ja hakutar-5 koituksiin, tarkkuus on tärkeämpää. Tilanne on kuitenkin erilainen, jos luokittelua käytetään optimaalisen pakkausmenetelmän valitsemiseksi tulosignaalille. Tässä tapauksessa voi olla, ettei ole olemassa yhtä pakkausmenetelmää, joka on aina optimaalinen puheelle, ja toista pakkausmenetelmää, joka on aina optimaalinen musiikille tai ei-puhe 10 -signaaleille. Käytännössä voi olla, että puhetransienteille tarkoitettu pakkausmenetelmä on hyvin tehokas myös musiikkitransienttien kohdalla. On myös mahdollista, että vahvoille tonaalisille komponenteille tarkoitettu musiikkipakkaus voi olla hyvä soinnillisille puhesegmenteille. Näissä tapauksissa menetelmät puhtaasti puheelle ja musiikille luokit-15 telemiseksi eivät siis tuota optimaalisinta algoritmia parhaan pakkausmenetelmän valitsemiseksi.
Usein puheen taajuuden voidaan katsoa rajoittuvan noin välille 200-3400 Hz. Tyypillinen näytteenottotaajuus, jota A/D-muunnin käyt-20 tää muuntaakseen analogisen puhesignaalin digitaaliseksi signaaliksi, on joko 8 kHz tai 16 kHz. Musiikki- tai ei-puhe -signaalit voivat sisältää taajuuskomponentteja, jotka ovat huomattavasti normaalia puheen :taajuusaluetta korkeammalla. Joissakin sovelluksissa audiojärjestel-"•V män tulisi pystyä käsittelemään taajuusaluetta, jonka laajuus on .**:* 25 20 Hz-20 000 kHz. Laskostumisen välttämiseksi tällaisten signaalien :*Y näytteenottotaajuuden tulisi olla ainakin 40 000 kHz. Tässä on huo- M» ·;;; mättävä, että edellä mainitut arvot ovat vain ei-rajoittavia esimerkkejä.
:···: Esimerkiksi joissakin järjestelmissä musiikkisignaalien ylempi raja voi olla noin 10 000 kHz tai jopa sitä matalampi.
: 30
Seuraavaksi digitaalinen näytesignaali koodataan, yleensä kehys ke-. ]·. hykseltä, ja näin saadaan digitaalinen datavirta, jonka bittinopeuden määrää koodaamiseen käytetty koodekki. Mitä suurempi bittinopeus '*:** on, sitä enemmän dataa koodataan, mikä johtaa tulokehyksen tarkem- 35 paan esittämiseen. Koodattu audiosignaali voidaan sitten dekoodata ja :\j ohjata digitaali-analogi (D/A) -muuntimen läpi sellaisen signaalin toi- sintamiseksi, joka on mahdollisimman lähellä alkuperäistä signaalia.
118855 4
Ihanteellinen koodekki koodaa audiosignaalin mahdollisimman vähillä biteillä optimoiden siten kanavan kapasiteetin sekä tuottaa samalla dekoodatun audiosignaalin, joka kuulostaa mahdollisimman tarkasti alku-5 peräiseltä audiosignaalilta. Käytännössä joudutaan tavallisesti tekemään kompromissi koodekin bittinopeuden ja dekoodatun äänen laadun välillä.
Tällä hetkellä on olemassa lukuisia erilaisia koodekkeja, kuten adaptii-10 vinen moninopeuksinen koodekki (adaptive multi-rate, AMR) ja adaptiivinen moninopeuksinen laajakaistakoodekki (adaptive multi-rate wideband, AMR-WB), jotka on kehitetty pakkaamaan ja koodaamaan audiosignaaleja. AMR kehitettiin 3rd Generation Partnership Project (3GPP) -projektissa GSM/EDGE- ja WCDMA-tietoliikenneverkkoja 15 varten. Lisäksi ennakoidaan, että AMR:ää tullaan käyttämään pakettivälitteisissä verkoissa. AMR perustuu algebralliseen koodiherätteiseen lineaariseen ennakoivaan (ACELP) -koodaukseen. AMR-koodekki koostuu kahdeksasta ja AMR WB-koodekki yhdeksästä aktiivisesta bittinopeudesta, ja ne sisältävät ääniaktiivisuuden ilmaisun (VAD) ja 20 epäjatkuva lähetys (DTX) -toiminnon. Tällä hetkellä AMR-koodekin näytteistystaajuus on 8 kHz ja AMR WB-koodekin näytteistystaajuus on :*·,· 16 kHz. On selvää, että edellä mainitut koodekit ja näytteistystaajuudet : .·! ovat vain ei-rajoittavia esimerkkejä.
··· · ··· • · 25 ACELP-koodaus toimii käyttämällä mallia siitä, kuinka signaalin lähde "Y tuotetaan, ja erottaa signaalista mallin parametrit. Tarkemmin sanot-
Mt •;;J tuna ACELP-koodaus perustuu malliin ihmisen äänenmuodostus- :···: elimistöstä, jossa kurkku ja suu on mallinnettu lineaariseksi suodatti meksi ja puhe tuotetaan suodattimesta poistuvan ilman jaksottaisella j.:‘: 30 värähtelyllä. Kooderi analysoi puheen kehyksittäin ja tuottaa ja lähettää :.***: jokaiselle kehykselle joukon parametreja, jotka edustavat mallinnettua . I·. puhetta. Parametrijoukkoon voi kuulua heräteparametreja ja suodatti- men kertoimet sekä muita parametreja. Puhekooderin lähtöä kutsutaan ’*:** usein tulopuhesignaalin parametriesitykseksi. Sopivalla tavalla konfigu- j‘‘<· 35 roitu dekooderi käyttää sitten parametrijoukkoa tuottaakseen uudelleen tulopuhesignaalin.
118835 5
Ei-puheen audiokoodauksessa käytetään yleisesti muunnoskoodausta. Muunnoskoodauksen ylivoimaisuus ei-puhesignaalien kohdalla perustuu havainnointimaskaukseen (perceptual masking) ja taajuusalue-koodaukseen. Vaikka muunnoskoodaustekniikka tekee audiosignaa-5 lista ylivoimaisen laadukkaan, suoritus ei ole hyvä jaksoittaisille puhe-signaaleille, ja siksi muunnoskoodatun puheen laatu on yleensä melko heikko. Toisaalta ihmisen puheenmuodostusjärjestelmään perustuvien puhekoodekkien suoritus on yleensä huono audiosignaalien kohdalla.
10 Joidenkin tulosignaalien kohdalla pulssimainen ACELP-heräte tuottaa parempaa laatua, ja joillekin tulosignaaleille muunnoskoodattu heräte (TCX) on optimaalisempi. Tässä yhteydessä oletetaan, että ACELP-herätettä käytetään enimmäkseen tavanomaisen puhesisällön ollessa tulosignaalina ja TCX-herätettä käytetään enimmäkseen tyypillisen 15 musiikin ja muun ei-puheäänen ollessa tulosignaalina. Näin ei kuitenkaan aina ole, eli puhesignaalissa on joskus musiikinkaltaisia osia ja musiikkisignaalissa on joskus puheenkaltaisia osia. Voi myös olla olemassa sekä musiikkia että puhetta sisältäviä signaaleja, jolloin näille signaaleille valittu koodausmenetelmä ei välttämättä ole vapaavalintai-20 nen tekniikan tason mukaisissa järjestelmissä.
Herätteen valinta voidaan suorittaa monella tavalla: kaikkein monimut- • · : .·. kaisin ja melko hyvä menetelmä on koodata sekä ACELP- että TCX- !···! heräte ja valita sitten syntetisoidun audiosignaalin perusteella paras 25 heräte. Tämä synteesianalyysityyppinen menetelmä tuottaa hyviä tu-"Y loksia, mutta joissakin sovelluksissa se ei ole käytännöllinen, koska se on hyvin monimutkainen. Tässä menetelmässä voidaan käyttää esi-*···: merkiksi SNR-tyyppistä algoritmia kummankin herätteen tuottaman laadun mittaamiseen. Tätä menetelmää voidaan kutsua ’’raaka voima” 0 · : 30 (engl. "brute force”) -menetelmäksi, koska se kokeilee kaikkia erilais- ·*..’·· ten herätteiden yhdistelmiä ja valitsee jälkikäteen parhaan. Vähemmän . !·. monimutkaisessa menetelmässä synteesi suoritettaisiin vain kerran • · · ..Y analysoimalla signaalin ominaisuudet etukäteen ja valitsemalla sitten '*:** paras heräte. Menetelmä voi olla myös esivalinnan ja ”raa’an voiman” • *·· 35 yhdistelmä, jotta voidaan tehdä kompromissi laadun ja monimutkaisuu- den välillä.
* · 6 1 1 8835
Kuva 1 esittää yksinkertaistettua kooderia 100, jossa käytetään tunnetun tekniikan tason mukaista hyvin monimutkaista luokittelua. Audiosignaali tulee tulosignaalilohkoon 101, jossa signaali digitalisoidaan ja suodatetaan. Tulosignaalilohko 101 myös muodostaa kehyksiä digitali-5 soidusta ja suodatetusta signaalista. Kehykset syötetään lineaarisen ennakoivan koodauksen (linear prediction coding, LPC) analyysi-lohkoon 102. Siinä suoritetaan digitalisoidun tulosignaalin LPC-analyysi kehyksittäin sellaisen parametrijoukon löytämiseksi, joka parhaiten vastaa tulosignaalia. Määritetyt parametrit (LPC-parametrit) kvantisoi-10 daan ja tulostetaan 109 kooderista 100. Toisessa LPC-synteesi-lohkossa 104 käytetään ACELP-herätelohkon 106 tuottamaa signaalia audiosignaalin syntetisoimiseksi, jotta löydetään se koodivektori, joka tuottaa ACELP-herätteelle parhaan tuloksen. Herätevalintalohkossa 107 LPC-synteesilohkojen 103, 104 tuottamia signaaleja verrataan, 15 jotta voidaan päättää, mikä herätemenetelmistä antaa parhaan (optimaalisen) herätteen. Tieto valitusta herätemenetelmästä ja valitun he-rätesignaalin parametrit esimerkiksi kvantisoidaan ja kanavakoodataan 108 ennen kuin signaalit lähtevät 109 kooderista 100 lähettämistä varten.
20
Keksinnön yhteenveto • · • · · • 1« : Yksi nyt esillä olevan keksinnön tavoitteista on tarjota parannettu me- |···' netelmä koodausmenetelmän valitsemiseksi audiosignaalin eri osille.
25 Keksinnössä käytetään algoritmia koodausmenetelmän valitsemiseksi :*V ainakin ensimmäisen ja toisen koodausmenetelmän, esimerkiksi TCX:n ·;;; tai ACELP.n, joukosta avoimen silmukan menetelmällä koodausta varten. Valinta suoritetaan parhaan koodausmallin löytämiseksi tulo-signaalille, mikä ei tarkoita puheen ja musiikin erottamista. Keksinnön : 30 yhden suoritusmuodon mukaisesti algoritmi valitsee ACELP:n erityi- i***: sesti jaksollisille signaaleille, joilla on korkea pitkäaikainen korrelaatio . (esim. soinnillinen puhesignaali) ja signaalitransienteille. Toisaalta tie- tynlaiset stationaariset signaalit, kuten kohinankaltaiset signaalit ja sä-**;* velenkaltaiset signaalit, koodataan käyttäen muunnoskoodausta, jotta 35 taajuusresoluutiota pystytään käsittelemään paremmin.
• · • · · • ·♦ • · 118835 7
Keksintö perustuu ajatukseen, että tulosignaali analysoidaan tutkimalla LTP-analyysin tuottamia parametreja esimerkiksi transienttien, jaksollisten osien yms. löytämiseksi audiosignaalista. Nyt esillä olevan keksinnön mukaiselle kooderille on ensisijaisesti tunnusomaista se, että 5 kooderi käsittää lisäksi parametrianalyysilohkon mainittujen LTP-para-metrien analysoimiseksi sekä herätteenvalintalohkon yhden heräteloh-kon valitsemiseksi mainitun ensimmäisen ja mainitun toisen heräteloh-kon joukosta herätteen suorittamiseksi audiosignaalin kehyksille para-metrianalyysin perusteella, ja että mainittu ensimmäinen heräte on 10 muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. Nyt esillä olevan keksinnön mukaiselle laitteelle on ensisijaisesti tunnusomaista se, että laite käsittää lisäksi parametrianalyysilohkon mainittujen LTP-parametrien analysoimista varten sekä herätteenvalintalohkon yhden herätelohkon valitsemiseksi mainitun ensimmäisen ja 15 mainitun toisen herätelohkon joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametrianalyysin perusteella, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. Nyt esillä olevan keksinnön mukaiselle järjestelmälle on ensisijaisesti tunnusomaista se, että järjestelmä käsittää 20 lisäksi mainitussa kooderissa parametrianalyysilohkon mainittujen LTP-parametrien analysoimista varten sekä herätteenvalintalohkon yhden herätelohkon valitsemiseksi mainitun ensimmäisen ja mainitun toisen herätelohkon joukosta herätteen suorittamiseksi audiosignaalin kehyk-•sille parametrianalyysin perusteella, ja että mainittu ensimmäinen
Ml · .*··. 25 heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. Nyt esillä olevan keksinnön mukaiselle menetelmälle * V on ensisijaisesti tunnusomaista se, että menetelmä käsittää lisäksi mainittujen LTP-parametrien analysoinnin ja yhden herätelohkon valin-’···* nan mainittujen ainakin ensimmäisen ja toisen herätteen joukosta 30 herätteen suorittamiseksi audiosignaalin kehyksille parametrianalyysin : ’** perusteella, ja että mainittuna ensimmäisenä herätteenä käytetään muunnoskoodattua herätettä ja mainittuna toisena herätteenä käytetään aikatason herätettä. Nyt esillä olevan keksinnön mukaiselle moduulille on ensisijaisesti tunnusomaista se, että moduuli käsittää li- • · 35 säksi parametrianalyysilohkon LTP-parametrien analysoimiseksi ja he-: rätteenvalintalohkon yhden herätelohkon valitsemiseksi ensimmäisen C!J herätelohkon ja toisen herätelohkon joukosta ja valitun herätemetodin 118835 δ ilmaisemiseksi kooderille, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. Nyt esillä olevan keksinnön mukaiselle tietokoneohjelmatuotteelle on ensisijaisesti tunnusomaista se, että tietokoneohjelmatuote käsittää 5 lisäksi koneellisesti suoritettavia vaiheita mainittujen LTP-parametrien analysoimiseksi ja yhden herätteen valitsemiseksi ainakin mainitun ensimmäisen herätteen ja toisen herätteen joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametrianalyysin perusteella, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu 10 toinen heräte on aikatason heräte.
Nyt esillä oleva keksintö tarjoaa etuja verrattuna tunnetun tekniikan mukaisiin menetelmiin ja järjestelmiin. Käyttämällä nyt esillä olevan keksinnön mukaista luokittelumenetelmää on mahdollista parantaa 15 toistetun äänen laatua vaikuttamatta paljoakaan pakkaustehokkuuteen. Keksintö parantaa erityisesti sekasignaalien toistetun äänen laatua, toisin sanoen signaalien, jotka sisältävät sekä puheenkaltaisia että ei-puheenkaltaisia signaaleja.
20 Piirustusten kuvaus kuva 1 esittää yksinkertaistettua kooderia jossa käytetään tunnetun :/.} tekniikan mukaista hyvin monimutkaista luokittelua, • · • · · • · · ··· · .1. 25 kuva 2 esittää suoritusesimerkkiä kooderista, jossa käytetään kek- : .·. sinnön mukaista luokittelua, • · · ··· · ··· ♦ kuva 3 esittää soinnillisen puhejaksonäytteen skaalattua normalisoitua korrelaatiota, viivettä ja skaalattuja vahvistus-30 parametreja, • 9 9 99 9 999 \..s kuva 4 esittää yhden instrumentin äänen sisältävän audiosignaali- näytteen skaalattua normalisoitua korrelaatiota, viivettä ja ....j skaalattuja vahvistusparametreja, '· * 35 • · • · · • · · *·· · • · • · *·· 118835 9 kuva 5 esittää useiden instrumenttien musiikkia sisältävän audio-signaalinäytteen skaalattua normalisoitua korrelaatiota, viivettä ja skaalattua vahvistusta sekä 5 kuva 6 esittää esimerkkiä nyt esillä olevan keksinnön mukaisesta järjestelmästä.
Keksinnön yksityiskohtainen kuvaus 10 Seuraavassa nyt esillä olevan keksinnön yhden suoritusesimerkin mukaista kooderia 200 selostetaan yksityiskohtaisemmin viittaamalla kuvaan 2. Kooderi 200 käsittää tulolohkon 201, jossa tulosignaali tarvittaessa digitalisoidaan, suodatetaan ja kehystetään. Tässä yhteydessä tulee huomata, että tulosignaali voi jo olla koodausprosessiin soveltu-15 vassa muodossa. Tulosignaali voi esimerkiksi olla digitalisoitu aikaisemmassa vaiheessa ja tallennettu muistivälineeseen (ei piirustuksissa). Tulosignaalikehykset syötetään LPC-analyysilohkoon 208, joka suorittaa tulosignaalille LPC-analyysin ja muodostaa LPC-parametrit signaalin ominaisuuksien perusteella. LTP-analyysilohko 209 muo-20 dostaa LTP-parametrit LPC-parametrien perusteella. LPC-parametrit ja LTP-parametrit tutkitaan parametrianalyysilohkossa 202. Analyysin tu-loksen perusteella herätteenvalintalohko 203 määrittää, mikä heräte- • · ; :\ menetelmä on sopivin tulosignaalin kulloisenkin kehyksen koodauk- seen. Herätteenvalintalohko 203 tuottaa ohjaussignaalin 204 valinta- • · 25 välineiden 205 ohjaamiseksi parametrianalyysin mukaisesti. Jos mää-:*V ritettiin, että paras herätemenetelmä tulosignaalin senhetkisen kehyk- ·;;; sen koodaukseen on ensimmäinen herätemenetelmä, valintaväli- neitä205 ohjataan valitsemaan ensimmäisen herätelohkon 206 signaali (heräteparametrit) syötettäväksi kvantisointi- ja koodausloh-30 koon 212. Jos määritettiin, että paras herätemenetelmä tulosignaalin senhetkisen kehyksen koodaukseen on toinen herätemenetelmä, . X valintavälineitä 205 ohjataan valitsemaan toisen herätelohkon 207 sig- \*if naali (heräteparametrit) syötettäväksi kvantisointi- ja koodausloh- **:*' koon 212. Vaikka kuvan 2 kooderissa on vain ensimmäinen 206 ja toi- ·“*·· 35 nen herätelohko 207 koodausprosessia varten, on selvää, että koode- rissa 200 voi olla useampia kuin kaksi erilaista herätelohkoa erilaisia herätemenetelmiä varten käytettäväksi tulosignaalin koodauksessa.
118835 10
Ensimmäinen herätelohko 206 tuottaa esimerkiksi TCX-herätesignaalin (vektorin) ja toinen herätelohko 207 tuottaa esimerkiksi ACELP-heräte-signaalin (vektorin). On myös mahdollista, että valittu herätelohko 206, 5 207 kokeilee ensin kahta tai useampaa herätevektoria, jolloin vektori, joka tuottaa kaikkein tiiveimmän tuloksen, valitaan lähetystä varten. Tiiveimmän tuloksen määrittäminen voidaan tehdä esimerkiksi siirrettävien bittien määrän perusteella tai koodausvirheen (syntetisoidun äänen ja aidon äänisyötteen välisen eron) perusteella.
10 LPC-parametrit 210, LTP-parametrit 211 ja heräteparametrit 213 esimerkiksi kvantisoidaan ja koodataan kvantisointi- ja koodauslohkossa 212 ennen lähettämistä esimerkiksi tietoliikenneverkkoon 604 (kuva 6). Ei kuitenkaan ole välttämätöntä lähettää parametreja, vaan ne voidaan 15 esimerkiksi tallentaa muistivälineeseen ja hakea sieltä myöhemmässä vaiheessa lähettämistä ja/tai dekoodausta varten.
Laajennetussa AMR-WB-koodekissa (AMR-WB+) on kahdenlaisia herätteitä LP-synteesille: pulssimainen ACELP-heräte ja muunnoskoo-20 dattu TCX-heräte. ACELP-heräte on sama, jota käytettiin jo alkuperäisessä 3GPP AMR-WB-standardissa (3GPP TS 26.190), ja TCX-heräte on laajennetussa AMR-WB:ssä käyttöön otettu olennainen parannus.
• i • · • · · * · · AMR-WB+ -koodekissa lineaarinen prediktiokoodaus (LPC) lasketaan 25 jokaisessa kehyksessä spektrivaipan mallintamiseksi. LPC-heräte V (koodatun LP-suodattimen lähtö) koodataan joko algebrallisen koodihe- rätteisen lineaarisen ennakoivan (ACELP) koodauksen tyyppisellä tai muunnoskoodaukseen perustuvalla algoritmilla (TXC). Esimerkiksi ACELP suorittaa LTP-parametreja ja vakiintuneen koodikirjan paramet- 30 reja LCP-herätettä varten. Esimerkiksi AMR-WB+:n muunnoskoodaus (TCX) käyttää hyväksi FFT:tä (Fast Fourier transform). AMR- , \ WB+ -koodekissa TCX-koodaus voidaan suorittaa käyttämällä yhtä ‘::f kolmesta eri kehyspituudesta (20,40 ja 80 ms).
• · • ♦ ··· 35 Seuraavassa selostetaan tarkemmin yhtä esimerkkiä nyt esillä olevan ·*·.: keksinnön mukaisesta menetelmästä. Menetelmässä määritetään algo ritmin avulla joitakin audiosignaalin ominaisuuksia, kuten jaksollisuutta 118835 11 ja korkeutta. Korkeus on soinnillisen puheen perusominaisuus. Soinnillista puhetta varten äänirako avautuu ja sulkeutuu jaksottaisella tavalla antaen herätteelle jaksoluonteen. Korkeusjakso, TO, on ääniraon perättäisten avautumisten välinen aika. Soinnillisilla puhesegmenteillä on 5 erityisen vahva pitkäaikainen korrelaatio. Tämä korrelaatio johtuu ääni-huulten värähtelyistä, joiden taajuusjakso vaihtelee yleensä välillä 2-20 ms.
LTP-parametrlt viive ja vahvistus lasketaan LPC-residuaalia varten. 10 LTP-viive liittyy läheisesti puhesignaalin perustaajuuteen, ja siihen viitataan usein englanninkielisillä termeillä ’’pitch-lag parameter”, "pitch-delay parameter” tai ”lag”, mikä kuvaa puhesignaalin jaksollisuutta puhenäytteiden suhteen. Äänenkorkeusviive-parametri voidaan laskea käyttämällä adaptiivista koodikirjaa. Äänenkorkeusviiveen arvioimiseksi 15 voidaan tehdä avoimen silmukan äänenkorkeusanalyysi. Tämä tehdään äänenkorkeusanalyysin yksinkertaistamiseksi ja suljetun silmukan äänenkorkeushaun rajoittamiseksi pieneen määrään viiveitä lähellä avoimen silmukan arvioituja viiveitä. Toinen perustaajuuteen liittyvä LTP-parametri on vahvistus, jota kutsutaan myös LTP-vahvistukseksi. 20 LTP-vahvistus yhdessä LTP-viiveen kanssa on tärkeä parametri, ja näitä käytetään luonnollisen puheen toiston tuottamiseen.
* · • · t • · : .·! Lähdesignaalin stationaariset ominaisuudet analysoidaan esim. norma- ',···[ lisoidulla korrelaatiolla, joka voidaan laskea seuraavasti: 25 :.:: ΛΜ ,
NormCorr = £ (1) .···. j=Q ΛΐΧί~Τ0 Λ1χΐ • f * v • · : .·. missä TO on kehyksen avoimen silmukan viive ja kehyksen pituus on • · · "1/ N. Xj on /:s näyte koodatusta kehyksestä. Χ,-ΤΟ on näyte äskettäin **:*' 30 koodatusta kehyksestä, joka on TO näytettä taaksepäin näytteestä Xj.
• · · • · · ···
Joitakin esimerkkejä LTP-parametrien ominaisuuksista ajan funktiona ··] voidaan nähdä kuvissa 3, 4 ja 5. Kuvissa käyrä A osoittaa signaalin normalisoitua korrelaatiota, käyrä B osoittaa viivettä ja käyrä C osoittaa ‘‘ 35 skaalattua vahvistusta. Normalisoitu korrelaatio ja LTP-vahvistus on 118835 12 skaalattu (kerrottu luvulla 100) niin, että ne sopivat samaan kuvaan LTP-viiveen kanssa. Kuvissa 3, 4 ja 5 myös LTP-viivearvot on jaettu luvulla 2. Esimerkiksi soinnillinen puhesegmentti (kuva 3) sisältää korkean LTP-vahvistuksen ja tasaisen LTP-viiveen. Myös soinnillisen 5 puhesegmentin normalisoitu korrelaatio ja LTP-vahvistus osuvat yhteen, ja niillä on siten suuri korrelaatio. Keksinnön mukainen menetelmä luoklttelee tämänkaltaisen signaalisegmentin niin, että koodausmenetelmäksi valitaan ACELP (ensimmäinen koodausmenetelmä). Jos LTP-viiveen korkeuskäyrä (joka koostuu senhetkisestä ja edellisistä 10 viiveistä) on tasainen, mutta LTP-vahvistus on matala tai epätasainen ja/tai LTP-vahvistuksen ja normalisoidun korrelaation välinen korrelaatio on pieni, koodausmenetelmäksi valitaan TCX (toinen koodausmenetelmä). Tällainen tilanne on kuvattu kuvan 4 esimerkissä, jossa näkyvät yhden instrumentin (saksofonin) synnyttämän audiosignaalin 15 parametrit. Jos senhetkisen ja edellisten kehysten LTP-viiveen korkeuskäyrä on hyvin epätasainen, valitaan myös tässä tapauksessa koodausmenetelmäksi TCX. Tämä on kuvattu kuvan 5 esimerkissä, jossa näkyvät usean instrumentin synnyttämän audiosignaalin parametrit. Sana ’tasainen’ merkitsee tässä yhteydessä, että esimerkiksi 20 tämänhetkisen ja edellisten kehysten minimi- ja maksimiviivearvojen välinen ero on jonkin ennaltamäärätyn kynnyksen alapuolella (toinen .‘.j kynnys TH2). Siten viive ei vaihtele paljon tämänhetkisessä ja edelli- sissä kehyksissä. AMR-WB+ -koodekissa LTP-vahvistuksen vaihtelu-*“.* väli on 0-1,2. Normalisoidun korrelaation vaihteluväli on 0-1,0. Esimer- !**:* 25 kiksi korkeaa LTP-vahvistusta osoittava kynnys voisi olla yli 0,8. LTP- • · * Y vahvistuksen ja normalisoidun korrelaation välisen korkean korrelaation •••j’ (tai samanlaisuuden) voi havaita esimerkiksi niiden eroista. Jos ero on \..8 kolmannen kynnyksen TH3 alapuolella, esimerkiksi 0,1 tämänhetki sessä ja/tai edellisissä kehyksissä, LTP-vahvistuksen ja normalisoidun :30 korrelaation välinen korrelaatio on suuri.
··· · • ♦ • · ··· ' \ Jos signaali on luonteeltaan transientti, se koodataan ensimmäisellä *:*!:* koodausmenetelmällä, esimerkiksi ACELP-koodausmenetelmällä, nyt :*··: esillä olevan keksinnön suoritusesimerkissä. Transientit jaksot voidaan 35 havaita käyttämällä vierekkäisten kehysten spektrietäisyyttä SD. Esi-merkiksi jos kehyksen n spektraalietäisyys SD„, joka on laskettu immittanssispektriparin (ISP) kertoimista (LP-suodattimen kertoimet, 118835 13 jotka on muutettu ISP-esitykseksi) senhetkisessä ja edellisessä kehyksessä, ylittää edeltä määrätyn ensimmäisen kynnyksen TH1, signaali luokitellaan transientiksi. Spektrietäisyys SDn voidaan laskea ISP-pa-rametreista seuraavasti: 5 N-1 SD(n) = Σ | ISPn (0 - ISPn-i (i)\ (2) /=0 missä ISPn on kehyksen n ISP-kerroinvektori ja ISPn(i) on sen i. elementti.
10
Kohinankaltaiset jaksot koodataan toisella koodausmenetelmällä, esimerkiksi muunnoskoodauksella TCX. Nämä jaksot voidaan havaita LTP-parametreista ja keskimääräisestä taajuudesta taajuusalueen kehyksessä. Jos LTP-parametrit ovat hyvin epätasaiset ja/tai keskimää-15 räinen taajuus ylittää ennaltamäärätyn kynnyksen TH16, menetelmässä määritellään, että kehys sisältää kohinankaltaisen signaalin.
Alla selostetaan esimerkkialgoritmi nyt esillä olevan keksinnön mukaiselle luokitteluprosessille. Algoritmia voidaan käyttää kooderissa 200, 20 esimerkiksi AMR-WB+ -koodekin kooderissa.
• · • · · • ·· • · IA: if (SDn > TH1)
Mode = ACELP MODE
··· else ·:· 25 if (LagDifbUf< TH2) if (Lagn == HIGH LIMIT or Lagn == LOW LIMIT){ if (Gainn-NormCorrn<TH3 and NormCorrn>TH4)
. . Mode = ACELP MODE
• · · ::l.: else
*·:·* 30 Mode = TCX_MODE
else if (Gainn- NormCorrn < TH3 and NormCorrn > TH5)
Mode - ACELP MODE
..** else if (Gainn - NormCorrn > TH6)
V*; Mode = TCX_MODE
i.’·: 35 else 118835 14
NoMtcx = NoMtcx +1 if (MaxEnergybuf < TH7) if (SDn > TH1)
Mode = ACELP MODE
5 else
NoMtcx = NoMtcx +1 if (LagDifbuf< TH2) if (NormCorrn < TH9 and SDn < TH10)
10 Mode = TCX_MODE
if (lphn > TH11 and SDn<TH10)
Mode = TCX_MODE
if (vadFlag0id == 0 and vadFlag == 1 and Mode == TCX_MODE)) 15 NoMtcx = NoMtcx +1 if (Gainn - NormCorrn < TH12 and NormCorrn > TH13 and Lagn > TH14) DFTSum = 0; for (i=1; i<NO_of_elements; i++) { TFirst element left out*/ DFTSum = DFTSum + mag[i]; 20 if (DFTSum > TH15 and mag[0] < TH16) {
Mode = TCX_MODE
e,se
i’.*; Mode = ACELP MODE
::i.: NoMtcx = NoMtcx +1 • ·
• ♦ AIB
... 25 !*V Edellä esitetty algoritmi sisältää joitakin kynnyksiä TH1-TH5 ja vakiot “jj* HIGH_UMIT, LOW_LIMIT, Buflimit, NO_of_elements. Seuraavassa esitetään joitakin esimerkkiarvoja kynnyksille ja vakioille, mutta on selvää, että arvot ovat vain ei-rajoittavia esimerkkejä.
30 TH 1=0,2 . I·. TH2=2 th3=o,i TH4=0,9 :*·.. 35 TH5=0,88 i/.j TH6=0,2 TH7=60 118835 15 TH8=0,15 TH9=0,80 TH10=0,1 TH11=200 5 ΤΗ 12=0,006 TH13=0,92 TH14=21 ΤΗ15=95 ΤΗ16=5 10 NO_of_elements=40 HIGH_LIMIT=115 LOWJ_IMIT=18
Algoritmin muuttujien merkitykset ovat seuraavat: HIGH_UMIT ja 15 LOWJJMIT liittyvät LTP-viiveen maksimi- ja minimiarvoihin, tässä järjestyksessä; LagDifbUf on puskuri, joka sisältää LTP-viiveitä senhetkisestä ja edellisistä kehyksistä. Lagn on yksi tai useampi senhetkisen kehyksen LTP-viivearvo (AMR-WB+ -koodekissa lasketaan kaksi avoimen silmukan viivearvoa kehyksessä). Gainn on yksi tai useampi 20 senhetkisen kehyksen LTP-vahvistusarvo. NormCorrn on yksi tai useampi senhetkisen kehyksen normalisoidun korrelaation arvo.
: MaxEnergybuf on senhetkisen ja edellisen kehyksen energia-arvot si- sältävän puskurin maksimiarvo. Iphn osoittaa spektrikallistuman. :y,.: vadFlag0id on edellisen kehyksen VAD-lippu, ja vadFlag on senhetkisen 25 kehyksen VAD-lippu. NoMtcx on lippu, joka ohjaa välttämään TCX-muunnosta suurella kehyspituudella (esim. 80 ms), jos toinen koo-dausmalli TCX on valittu. Mag on erillinen Fourier-muunnettu (DFT) spektrivaippa, joka on luotu senhetkisen kehyksen LP-suodatinkertoi-mista, Ap, jotka voidaan laskea seuraavan ohjelmakoodin mukaisesti: II: 30 for (i=0; i<DFTN*2; i++) cos_t[i] = cos[i*N_MAX/(DFTN*2)j *:!:] sinJIi] = sin[i*N_MAX/(DFTN*2)] for (i=0; i<LPC_N; i++) j\. 35 ip[i] = Ap[i] mag[0] = 0.0; for (i=0; i<DFTN; i++) /*calcDFT7 118835 16
x = y = O
for 0=0; j<LPC_N; j++) x = x + ip[j]*cos_t[(i*j)&(DFTN*2-1)] y = y + ipO]*sin_t[(i*j)&(DFTN*2-1)]
Mag[i] = 1/sqrt(x*x+y*y) 5 missä DFTN = 62, N_MAX = 1152, LPC_N = 16. Vektorit cos ja sin sisältävät kosini- ja sinifunktioiden arvot, tässä järjestyksessä. Kosini- ja sinivektoreiden pituus on 1152. DFTSum on ensimmäisten mag-vekto-rin NO_of_elements (esim. 40) elementtien summa poislukien mag-10 vektorin aivan ensimmäinen elementti (mag(0)).
Edellä kuvatussa esimerkissä käytettiin AMR-WB-laajennusta (AMR-WB+) käytännön esimerkkinä kooderista. Keksintö ei kuitenkaan rajoitu AMR-WB-koodekkeihin tai ACELP- ja TCX-herätemenetelmiin. 15
Vaikka keksintö esitettiin edellä käyttäen kahta erilaista herätemene-telmää, on mahdollista käyttää useampaa kuin kahta erilaista heräte-menetelmää ja tehdä valinta niiden kesken audiosignaalin pakkaamiseksi.
20
Kuva 6 esittää esimerkkiä järjestelmästä, jossa nyt esillä olevaa kek-sintöä voidaan soveltaa. Järjestelmä käsittää yhden tai useamman • 9 : ;·. audiolähteen 601, joka tuottaa puhe- ja/tai ei-puhe-audiosignaaleja.
Tarvittaessa audiosignaalit muutetaan digitaalisiksi signaaleiksi A/D-25 muuntimella 602. Digitalisoidut signaalit syötetään lähetinlaitteen 600 :“V kooderiin 200, jossa pakkaaminen suoritetaan nyt esillä olevan keksin- nön mukaisesti. Tarvittaessa pakatut signaalit myös kvantisoidaan ja ···' koodataan lähetystä varten kooderissa 200. Lähetin 603, esimerkiksi matkaviestimen 600 lähetin, lähettää pakatut ja koodatut signaalit tieto- • · : 30 liikenneverkkoon 604. Vastaanottolaitteen 606 vastaanotin 605 ottaa ·'.**.*·· signaalit vastaan tietoliikenneverkosta 604. Vastaanotetut signaalit siir- . !·. retään vastaanottimesta 605 dekooderiin 607 tietojen dekoodausta, • · · .I", dekvantisointia ja purkamista varten. Dekooderi 607 käsittää ilmaisu- **:*’ välineet 608 kooderissa 200 senhetkiselle kehykselle käytetyn pak- : *·· 35 kausmenetelmän määrittämiseksi. Määrityksen perusteella dekooderi 607 valitsee ensimmäisen purkamisvälineen 609 tai toisen purkamis-välineen 610 kyseisen kehyksen purkamista varten. Puretut signaalit 118835 17 kytketään purkamisvälineistä 609, 610 suodattimeen 611 ja D/A-muun-timeen 612 digitaalisten signaalien muuntamiseksi analogisiksi signaaleiksi. Analoginen signaali voidaan tämän jälkeen muuttaa audiosignaaliksi esimerkiksi kaiuttimessa 613.
5
Nyt esillä olevaa keksintöä voidaan soveltaa erilaisissa järjestelmissä, erityisesti pientaajuuslähetyksissä, tunnetun tekniikan mukaisia järjestelmiä tehokkaamman pakkaamisen ja/tai paremman äänenlaadun saavuttamiseksi toistetulle (puretulle/dekoodatulle) audiosignaalille 10 erityisesti tilanteissa, joissa audiosignaali sisältää sekä puheenkaltaisia signaaleja että el-puheenkaltaisia signaaleja (esim. puhetta ja musiikkia sekaisin). Nyt esillä olevan keksinnön mukainen kooderi 200 voidaan toteuttaa tietoliikennejärjestelmän eri osissa. Kooderi 200 voidaan toteuttaa esimerkiksi matkaviestimessä, jonka prosessointikyky on ra-15 jallinen.
Keksintö voidaan toteuttaa myös moduulina 202, 203, joka voidaan kytkeä kooderiin parametrien analysoimiseksi ja herätemenetelmän valinnan ohjaamiseksi kooderia 200 varten.
20
On selvää, että nyt esillä oleva keksintö ei rajoitu pelkästään edellä ku-vailtuihin suoritusmuotoihin vaan sitä voidaan muunnella oheisten pa- • · : .·. tenttivaatimusten puitteissa.
··1 · «·· • 25 • · · • · · ·»· · ··· ««·· «·· • · ♦ · *·· • · * · f • · · ··· · M· • · • · • « · • · · • · · • · · *·· • · • ♦ • · · ·» • ·
• M
· * « ·
• »I
• ·
Claims (50)
1. Kooderi (200), joka käsittää tulon (201) audiosignaalin kehysten syöttämiseksi, LTP-analyysilohkon (209) LTP-analyysin tekemiseksi 5 audiosignaalin kehyksille ja LTP-parametrien muodostamiseksi audiosignaalin ominaisuuksien perusteella sekä ainakin ensimmäisen herä-telohkon (206) ensimmäisen herätteen suorittamiseksi audiosignaalin kehyksille ja toisen herätelohkon (207) toisen herätteen suorittamiseksi audiosignaalin kehyksille, tunnettu siitä, että kooderi (200) käsittää 10 lisäksi parametrianalyysilohkon (202) mainittujen LTP-parametrien analysoimiseksi ja herätteenvalintalohkon (203) yhden herätelohkon valitsemiseksi mainitun ensimmäisen herätelohkon (206) ja mainitun toisen herätelohkon joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametrianalyysin perusteella, ja että mainittu ensimmäinen 15 heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte.
2. Patenttivaatimuksen 1 mukainen kooderi (200), tunnettu siitä, että mainittu parametrianalyysilohko (202) käsittää lisäksi välineet, normali- 20 soidun korrelaation laskemiseksi ja analysoimiseksi ainakin LTP-parametrien perusteella. • ·
3. Patenttivaatimuksen 1 tai 2 mukainen kooderi (200), tunnettu siitä, että mainitut LTP-parametrit käsittävät ainakin viiveen ja vahvistuksen. »M A_ 25
: 4. Patenttivaatimuksen 1, 2 tai 3 mukainen kooderi (200), tunnettu «M · ' ' siitä, että mainittu parametrianalyysilohko (202) on järjestetty tutkimaan .**% ainakin yksi seuraavista audiosignaalin ominaisuuksista: - signaalitransientit, ... 30 - kohinankaltaiset signaalit, j..!* - pysyvät signaalit, *·:** - jaksolliset signaalit, - pysyvät ja jaksolliset signaalit. • * . \φ 35
5. Patenttivaatimuksen 4 mukainen kooderi (200), tunnettu siitä, että :;i.: kohina on järjestetty määriteltäväksi epätasaisten LTP-parametrien • · * · ·» 118835 19 ja/tai ennalta määritellyn kynnyksen ylittävän keskimääräisen taajuuden perusteella.
6. Patenttivaatimuksen 4 mukainen kooderi (200), tunnettu siitä, että 5 pysyvät ja jaksolliset signaalit on järjestetty määriteltäviksi oleellisesti korkean LTP-vahvistuksen ja oleellisesti tasaisen LTP-viiveen ja normalisoidun korrelaation perusteella.
7. Jonkin patenttivaatimuksen 1-6 mukainen kooderi (200), tunnettu 10 siitä, että mainittu kooderi (200) on adaptiivinen moninopeuksinen laajakaistakoodekki (adaptive multi-rate wideband codec).
8. Patenttivaatimuksen 7 mukainen kooderi (200), tunnettu siitä, että mainittu LTP-analyysilohko (209) on adaptiivisen moninopeuksisen 15 laajakaistakoodekin LTP-analyysilohko.
9. Jonkin patenttivaatimuksen 1-8 mukainen kooderi (200), tunnettu siitä, että mainittu toinen heräte on algebrallinen koodiherätteinen lineaariprediktioheräte (Algebraic Code Excited Linear Prediction 20 excitation, ACELP) ja mainittu ensimmäinen heräte on muunnoskoodattu heräte (transform coded excitation, TCX).
*/·: 10. Laite (600), joka käsittää kooderin (200), joka käsittää tulon (201) j.:‘: audiosignaalin kehysten syöttämiseksi, LTP-analyysilohkon (209) LTP- Γ": 25 analyysin tekemiseksi audiosignaalin kehyksille ja LTP-parametrien • ·'; muodostamiseksi audiosignaalin ominaisuuksien perusteella, ainakin ··· * ensimmäisen herätelohkon (206) ensimmäisen herätteen suorittami-!···, seksi audiosignaalin kehyksille ja toisen herätelohkon (207) toisen he rätteen suorittamiseksi audiosignaalin kehyksille, tunnettu siitä, että ..e 30 laite (600) käsittää lisäksi parametrianalyysilohkon (202) mainittujen *„!* LTP-parametrien analysoimiseksi ja herätteenvalintalohkon (203) yh- • m *·»* den herätelohkon valitsemiseksi mainitun ensimmäisen heräteloh- :\j kon (206) ja mainitun toisen herätelohkon (207) joukosta herätteen ·:··: suorittamiseksi audiosignaalin kehyksille parametrianalyysin perus- . *, 35 teella, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. • · • * • Il 118835 20
11. Patenttivaatimuksen 10 mukainen laite (200), tunnettu siitä, että mainittu parametrianalyysilohko (202) käsittää lisäksi välineen, jolla lasketaan ja analysoidaan normalisoitu korrelaatio ainakin LTP-para-metrien perusteella. 5
12. Patenttivaatimuksen 10 tai 11 mukainen laite (200), tunnettu siitä, että mainitut LTP-parametrit käsittävät ainakin viiveen ja vahvistuksen.
13. Patenttivaatimuksen 10, 11 tai 12 mukainen laite (200), tunnettu 10 siitä, että mainittu parametrianalyysilohko (202) on järjestetty tutkimaan ainakin yksi seuraavista audiosignaalin ominaisuuksista: - signaalitransientit, - kohinankaltaiset signaalit, - pysyvät signaalit, 15. jaksolliset signaalit, - pysyvät ja jaksolliset signaalit.
14. Patenttivaatimuksen 13 mukainen laite (200), tunnettu siitä, että kohina on järjestetty määriteltäväksi epätasaisten LTP-parametrien 20 ja/tai ennalta määritellyn kynnyksen ylittävän keskimääräisen taajuuden perusteella.
15. Patenttivaatimuksen 13 mukainen laite (200), tunnettu siitä, että : :*· pysyvät ja jaksolliset signaalit on järjestetty määriteltäviksi oleellisesti • •t · .···. 25 korkean LTP-vahvistuksen ja oleellisesti tasaisen LTP-viiveen ja nor- malisoidun korrelaation perusteella. M* m * ··*
16. Jonkin patenttivaatimuksen 10-15 mukainen laite (200), tunnettu *·*·* siitä, että mainittu kooderi (200) on adaptiivinen moninopeuksinen 30 laajakaistakoodekki (adaptive multi-rate wideband codec). • · • *· ··*
17. Patenttivaatimuksen 16 mukainen laite (200), tunnettu siitä, että mainittu LTP-analyysilohko (209) on adaptiivisen moninopeuksisen laajakaistakoodekin LTP-analyysilohko. *. * 35 • t ϊ.ΐ:
18. Jonkin patenttivaatimuksen 10-17 mukainen laite (200), tunnettu siitä, että mainittu toinen heräte on algebrallinen koodiherätteinen 21 118835 lineaariprediktioheräte (ACELP) ja mainittu ensimmäinen heräte on muunnoskoodattu heräte (TCX).
19. Järjestelmä, joka käsittää kooderin (200), joka käsittää tulon (201) 5 audiosignaalin kehysten syöttämiseksi, LTPC-analyysilohkon (209) LTP-analyysin tekemiseksi audiosignaalin kehyksille ja LTP-paramet-rien muodostamiseksi audiosignaalin ominaisuuksien perusteella, ainakin ensimmäisen herätelohkon (206) ensimmäisen herätteen suorittamiseksi audiosignaalin kehyksille ja toisen herätelohkon (207) toisen 10 herätteen suorittamiseksi audiosignaalin kehyksille, tunnettu siitä, että järjestelmä käsittää lisäksi mainitussa kooderissa (200) parametriana-lyysilohkon (202) mainittujen LTP-parametrien analysoimiseksi ja he-rätteenvalintalohkon (203) yhden herätelohkon valitsemiseksi mainitun ensimmäisen herätelohkon (206) ja mainitun toisen herätelohkon (207) 15 joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametri-analyysin perusteella, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte.
20. Patenttivaatimuksen 19 mukainen järjestelmä, tunnettu siitä, että 20 mainittu parametrianalyysilohko (202) käsittää lisäksi välineet normalisoidun korrelaation laskemiseksi ja analysoimiseksi ainakin LTP-parametrien perusteella. • · • · · • ··
21. Patenttivaatimuksen 19 tai 20 mukainen järjestelmä, tunnettu siitä, • * · 25 että mainitut LTP-parametrit käsittävät ainakin viiveen ja vahvistuksen. • · »·« • · • · · :*V
22. Patenttivaatimuksen 19, 20 tai 21 mukainen järjestelmä, tunnettu •»I* siitä, että mainittu parametrianalyysilohko (202) on järjestetty tutkimaan ainakin yksi seuraavista audiosignaalin ominaisuuksista: 30. signaalitransientit, - kohinankaltaiset signaalit, - pysyvät signaalit, . - jaksolliset signaalit, *· *: - pysyvät ja jaksolliset signaalit. 35
23. Patenttivaatimuksen 22 mukainen järjestelmä, tunnettu siitä, että kohina on järjestetty määriteltäväksi epätasaisten LTP-parametrien ··· 118835 22 ja/tai ennalta määritellyn kynnyksen ylittävän keskimääräisen taajuuden perusteella.
24. Patenttivaatimuksen 22 mukainen järjestelmä, tunnettu siitä, että 5 pysyvät ja jaksolliset signaalit on järjestetty määriteltäviksi oleellisesti korkean LTP-vahvistuksen ja oleellisesti tasaisen LTP-viipeen ja normalisoidun korrelaation perusteella.
25. Jonkin patenttivaatimuksen 19-24 mukainen järjestelmä, tunnettu 10 siitä, että mainittu kooderi (200) on adaptiivinen moninopeuksinen laajakaistakoodekki.
26. Patenttivaatimuksen 25 mukainen järjestelmä, tunnettu siitä, että mainittu LTP-analyysilohko (209) on adaptiivisen moninopeuksisen 15 laajakaistakoodekin LTP-analyysilohko.
27. Jonkin patenttivaatimuksen 19-26 mukainen järjestelmä, tunnettu siltä, että mainittu toinen heräte on algebrallinen koodiherätteinen lineaariprediktioheräte (ACELP) ja mainittu ensimmäinen heräte on 20 muunnoskoodattu heräte (TCX).
28. Menetelmä audiosignaalin koodaamiseksi, jossa audiosignaalin . kehyksille tehdään LTP-analyysi LTP-parametrien muodostamiseksi !*/ signaalin ominaisuuksien perusteella ja ainakin ensimmäinen heräte ja * * # 25 toinen heräte ovat valittavissa suoritettaviksi audiosignaalien kehyk- ;···*’ sille, tunnettu siitä, että menetelmä käsittää lisäksi mainittujen LTP- i.i: parametrien analysoinnin ja yhden herätelohkon valinnan mainitun en- simmäisen herätemenetelmän ja mainitun toisen herätemenetelmän joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametri- 30 analyysin perusteella, ja että mainittuna ensimmäisenä herätteenä käytetään muunnoskoodattua herätettä ja mainittuna toisena .···. herätteenä käytetään aikatason herätettä.
··· • · :·*·: 29. Patenttivaatimuksen 28 mukainen menetelmä, tunnettu siitä, että 35 normalisoitu korrelaatio lasketaan ainakin LTP-parametrien perusteella :ja laskettu normalisoitu korrelaatio analysoidaan. «·· · ··· • · • · 118835 23
30. Patenttivaatimuksen 28 tai 29 mukainen menetelmä, tunnettu siitä, että mainitut LTP-parametrit käsittävät ainakin viiveen ja vahvistuksen.
31. Patenttivaatimuksen 28, 29 tai 30 mukainen menetelmä, tunnettu 5 siitä, että ainakin yksi seuraavista audiosignaalin ominaisuuksista tutkitaan: - signaalitransientit, - kohinankaltaiset signaalit, - pysyvät signaalit, 10. jaksolliset signaalit, - pysyvät ja jaksolliset signaalit.
32. Patenttivaatimuksen 31 mukainen menetelmä, tunnettu siitä, että kohina määritellään epätasaisten LTP-parametrien ja/tai ennalta mää- 15 ritellyn kynnyksen ylittävän keskimääräisen taajuuden perusteella.
33. Patenttivaatimuksen 31 mukainen menetelmä, tunnettu siitä, että pysyvät ja jaksolliset signaalit määritellään oleellisesti korkean LTP-vahvistuksen ja oleellisesti tasaisen LTP-viipeen ja normalisoidun kor- 20 relaation perusteella.
34. Jonkin patenttivaatimuksen 28-33 mukainen menetelmä, tunnettu . . siitä, että mainittu toinen heräte on algebrallinen koodiherätteinen • · · / / lineaariprediktioheräte (ACELP) ja mainittu ensimmäinen heräte on ί·! · 25 muunnoskoodattu heräte (TCX). • · • · ··· U ϊ
35. Moduuli, joka käsittää LTP-analyysilohkon (209) LTP-analyysin suorittamiseksi audiosignaalin kehyksille LTP-parametrien muodosta- f miseksi audiosignaalin ominaisuuksien perusteella, tunnettu siitä, että 30 moduuli käsittää lisäksi parametrianalyysilohkon (202) mainittujen LTP- :\>e parametrien analysoimiseksi ja herätteenvalintalohkon (203) yhden he- !···. rätelohkon valitsemiseksi ensimmäisen herätelohkon (206) ja toisen • · \·\ herätelohkon (207) joukosta ja valitun herätemenetelmän ilmaisemi- !.*·: seksi kooderille (200), ja että mainittu ensimmäinen heräte on 35 muunnoskoodattu heräte ja mainittu toinen heräte on aikatason heräte. • „ • · • · * • · · ·*♦ · • *· • · • « ··· 118835 24
36. Patenttivaatimuksen 35 mukainen laite (200), tunnettu siitä, että mainittu parametrianalyysilohko (202) edelleen käsittää välineet normalisoidun korrelaation laskemiseksi ja analysoimiseksi ainakin LTP-parametrien perusteella. 5
37. Patenttivaatimuksen 35 tai 36 mukainen laite (200), tunnettu siitä, että mainitut LTP-parametrit käsittävät ainakin viiveen ja vahvistuksen.
38. Patenttivaatimuksen 35, 36 tai 37 mukainen laite (200), tunnettu 10 siitä, että mainittu parametrianalyysilohko (202) on järjestetty tutkimaan ainakin yksi seuraavista audiosignaalin ominaisuuksista: - signaalitransientit, - kohinankaltaiset signaalit, - pysyvät signaalit, 15. jaksolliset signaalit, - pysyvät ja jaksolliset signaalit.
39. Patenttivaatimuksen 38 mukainen laite (200), tunnettu siitä, että kohina on järjestetty määriteltäväksi epätasaisten LTP-parametrien 20 ja/tai ennalta määritellyn kynnyksen ylittävän keskimääräisen taajuuden perusteella.
^ . 40. Patenttivaatimuksen 38 mukainen laite (200), tunnettu siitä, että ** / stationaariset ja periodiset signaalit on järjestetty määriteltäviksi oleelli- *“:t: 25 sesti korkean LTP-vahvistuksen ja oleellisesti tasaisen LTP-viipeen ja normalisoidun korrelaation perusteella. • · • * · • · · ··· *
41. Jonkin patenttivaatimuksen 35-40 mukainen laite (200), tunnettu siitä, että mainittu kooderi (200) on adaptiivinen moninopeuksinen 30 laajakaistakoodekki.
·· • · • ·· !···. 42. Patenttivaatimuksen 41 mukainen laite (200), tunnettu siitä, että \*\ mainittu LTP-analyysilohko (209) on adaptiivisen moninopeuksisen V·: laajakaistakoodekin LTP-analyysilohko. ·:·*: 35
: !\ 43. Jonkin patenttivaatimuksen 35-42 mukainen laite (200), tunnettu !···* siitä, että mainittu toinen heräte on algebrallinen koodiherätteinen • · »·· 118835 25 lineaariprediktioheräte (ACELP) ja mainittu ensimmäinen heräte on muunnoskoodattu heräte (TCX).
44. Tietokoneohjelmatuote, joka käsittää koneellisesti suoritettavia vai-5 heitä audiosignaalin koodaamiseksi, jolloin audiosignaalin kehyksistä tehdään LTP-analyysi LTP-parametrien muodostamiseksi signaalin ominaisuuksien perusteella ja ainakin ensimmäinen heräte ja toinen heräte ovat valittavissa suoritettaviksi audiosignaalien kehyksille, tunnettu siitä, että tietokoneohjelmatuote käsittää lisäksi koneellisesti 10 suoritettavia vaiheita mainittujen LTP-parametrien analysoimiseksi ja yhden herätteen valitsemiseksi mainitun ensimmäisen herätteen ja mainitun toisen herätteen joukosta herätteen suorittamiseksi audiosignaalin kehyksille parametrianalyysin perusteella, ja että mainittu ensimmäinen heräte on muunnoskoodattu heräte ja mainittu 15 toinen heräte on aikatason heräte.
45. Patenttivaatimuksen 44 mukainen tietokoneohjelma, tunnettu siitä, että se käsittää koneellisesti suoritettavia vaiheita normalisoidun korrelaation laskemiseksi ainakin LTP-parametrien perusteella ja laskettu 20 normalisoitu korrelaatio analysoidaan.
46. Patenttivaatimuksen 44 tai 45 mukainen tietokoneohjelmatuote, .·,. tunnettu siitä, että mainitut LTP-parametrit käsittävät ainakin viiveen ja .*vahvistuksen. • · · 25
)···: 47. Patenttivaatimuksen 44, 45 tai 46 mukainen tietokoneohjelmatuote, : tunnettu siitä, että se käsittää koneellisesti suoritettavia vaiheita aina- kin yhden seuraavista audiosignaalin ominaisuuksista tutkimiseksi: - signaalitransientit, 30. kohinankaltaiset signaalit, ···.. - pysyvät signaalit, .···. - jaksolliset signaalit, - pysyvät ja jaksolliset signaalit. * · · • M • ·
48. Patenttivaatimuksen 47 mukainen tietokoneohjelmatuote, tunnettu : !·. siitä, että se käsittää koneellisesti suoritettavia vaiheita LTP-paramet- • · · "··*. rien tasaisuuden tutkimiseksi ja/tai keskimääräisen taajuuden vertaa- • · »·* 118835 26 miseksi ennalta määrättyyn kynnykseen audiosignaalin kohinan määrittämiseksi.
49. Patenttivaatimuksen 47 mukainen tietokoneohjelma, tunnettu siitä, 5 että se käsittää koneellisesti suoritettavia vaiheita LTP-viiveen tasaisuuden ja normalisoidun korrelaation tutkimiseksi ja LTP-vahvistuksen vertaamiseksi kynnykseen audiosignaalien pysyvyyden ja jaksollisuuden määrittämiseksi.
50. Jonkin patenttivaatimuksen 44-49 mukainen tietokoneohjelmatuote, tunnettu siitä, että se käsittää lisäksi koneellisesti suoritettavia vaiheita algebrallisen koodiherätteisen lineaarisen ennakoivan herätteen (ACELP) suorittamiseksi mainittuna toisena herätteenä ja koneellisesti suoritettavia vaiheita muunnoskoodatun herätteen (TCX) 15 suorittamiseksi ensimmäisenä herätteenä. • · «tl • ·« • · • · • · · ·1· · ·1« • · • « **· • 1 • · · • · · ·«« · * ·«« ♦ ··#· ··· • · • · «tl *· • · * 2 3 • · · • t • · »·· • · • · · • M • · * · • · • · · * · « ··· · · 2 * · 3 118835 27
Priority Applications (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20045052A FI118835B (fi) | 2004-02-23 | 2004-02-23 | Koodausmallin valinta |
TW094104983A TW200534599A (en) | 2004-02-23 | 2005-02-21 | Coding model selection |
PCT/FI2005/050043 WO2005081231A1 (en) | 2004-02-23 | 2005-02-22 | Coding model selection |
CN200580005610XA CN1922659B (zh) | 2004-02-23 | 2005-02-22 | 编码模式选择 |
RU2006129871/09A RU2006129871A (ru) | 2004-02-23 | 2005-02-22 | Выбор модели кодирования |
AU2005215745A AU2005215745A1 (en) | 2004-02-23 | 2005-02-22 | Coding model selection |
KR1020087020819A KR20080083718A (ko) | 2004-02-23 | 2005-02-22 | 부호화 모델 선택 |
CA002555768A CA2555768A1 (en) | 2004-02-23 | 2005-02-22 | Coding model selection |
EP05717297.5A EP1719120B1 (en) | 2004-02-23 | 2005-02-22 | Coding model selection |
JP2007500239A JP2007523388A (ja) | 2004-02-23 | 2005-02-22 | エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、オーディオ信号を符号化する方法、モジュール、およびコンピュータプログラム製品 |
SG200901538-9A SG150572A1 (en) | 2004-02-23 | 2005-02-22 | Coding model selection |
KR1020067019497A KR100879976B1 (ko) | 2004-02-23 | 2005-02-22 | 부호화 모델 선택 |
BRPI0508309-5A BRPI0508309A (pt) | 2004-02-23 | 2005-02-22 | codificador, sistema, método, dispositivo e módulo para codificar um sinal de áudio, e, programa de computador |
US11/065,717 US7747430B2 (en) | 2004-02-23 | 2005-02-23 | Coding model selection |
ZA200606714A ZA200606714B (en) | 2004-02-23 | 2006-08-14 | Codings Model Selection |
HK07107509.2A HK1099960A1 (en) | 2004-02-23 | 2007-07-13 | Coding model selection |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20045052 | 2004-02-23 | ||
FI20045052A FI118835B (fi) | 2004-02-23 | 2004-02-23 | Koodausmallin valinta |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20045052A0 FI20045052A0 (fi) | 2004-02-23 |
FI20045052A FI20045052A (fi) | 2005-08-24 |
FI118835B true FI118835B (fi) | 2008-03-31 |
Family
ID=31725818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20045052A FI118835B (fi) | 2004-02-23 | 2004-02-23 | Koodausmallin valinta |
Country Status (15)
Country | Link |
---|---|
US (1) | US7747430B2 (fi) |
EP (1) | EP1719120B1 (fi) |
JP (1) | JP2007523388A (fi) |
KR (2) | KR100879976B1 (fi) |
CN (1) | CN1922659B (fi) |
AU (1) | AU2005215745A1 (fi) |
BR (1) | BRPI0508309A (fi) |
CA (1) | CA2555768A1 (fi) |
FI (1) | FI118835B (fi) |
HK (1) | HK1099960A1 (fi) |
RU (1) | RU2006129871A (fi) |
SG (1) | SG150572A1 (fi) |
TW (1) | TW200534599A (fi) |
WO (1) | WO2005081231A1 (fi) |
ZA (1) | ZA200606714B (fi) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11676611B2 (en) * | 2008-07-11 | 2023-06-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
EP1829027A1 (en) * | 2004-12-15 | 2007-09-05 | Telefonaktiebolaget LM Ericsson (publ) | Method and device for encoding mode changing of encoded data streams |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
WO2007083934A1 (en) * | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
WO2008107027A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications network |
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
CA2716817C (en) * | 2008-03-03 | 2014-04-22 | Lg Electronics Inc. | Method and apparatus for processing audio signal |
DE102008022125A1 (de) * | 2008-05-05 | 2009-11-19 | Siemens Aktiengesellschaft | Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
TWI520128B (zh) * | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
CN101615395B (zh) | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
CN101609677B (zh) | 2009-03-13 | 2012-01-04 | 华为技术有限公司 | 一种预处理方法、装置及编码设备 |
CN101615910B (zh) * | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
JP5243661B2 (ja) * | 2009-10-20 | 2013-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム |
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
ES2968927T3 (es) * | 2010-07-08 | 2024-05-14 | Fraunhofer Ges Forschung | Decodificador que utiliza cancelación del efecto de solapamiento hacia delante |
TWI564882B (zh) | 2011-02-14 | 2017-01-01 | 弗勞恩霍夫爾協會 | 利用重疊變換之資訊信號表示技術(一) |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
SG192748A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
WO2012110473A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
EP3373296A1 (en) * | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
MY164797A (en) | 2011-02-14 | 2018-01-30 | Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V | Apparatus and method for processing a decoded audio signal in a spectral domain |
BR112013020588B1 (pt) * | 2011-02-14 | 2021-07-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho e método para codificação de uma parte de um sinal de áudio utilizando uma detecção transiente e um resultado de qualidade |
AR085361A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio |
MX2013009301A (es) | 2011-02-14 | 2013-12-06 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio. |
ES2535609T3 (es) | 2011-02-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio con estimación de ruido de fondo durante fases activas |
ES2616434T3 (es) | 2013-01-29 | 2017-06-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para seleccionar uno de un primer algoritmo de codificación de audio y un segundo algoritmo de codificación de audio |
CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
MX349256B (es) | 2014-07-28 | 2017-07-19 | Fraunhofer Ges Forschung | Aparato y metodo para seleccionar uno de un primer algoritmo de codificacion y un segundo algoritmo de codificacion usando reduccion de armonicos. |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5250940A (en) * | 1991-01-18 | 1993-10-05 | National Semiconductor Corporation | Multi-mode home terminal system that utilizes a single embedded general purpose/DSP processor and a single random access memory |
SE469764B (sv) * | 1992-01-27 | 1993-09-06 | Ericsson Telefon Ab L M | Saett att koda en samplad talsignalvektor |
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
FR2729245B1 (fr) * | 1995-01-06 | 1997-04-11 | Lamblin Claude | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
US6311154B1 (en) * | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
US6510407B1 (en) * | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6738739B2 (en) * | 2001-02-15 | 2004-05-18 | Mindspeed Technologies, Inc. | Voiced speech preprocessing employing waveform interpolation or a harmonic model |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
-
2004
- 2004-02-23 FI FI20045052A patent/FI118835B/fi active
-
2005
- 2005-02-21 TW TW094104983A patent/TW200534599A/zh unknown
- 2005-02-22 SG SG200901538-9A patent/SG150572A1/en unknown
- 2005-02-22 AU AU2005215745A patent/AU2005215745A1/en not_active Abandoned
- 2005-02-22 EP EP05717297.5A patent/EP1719120B1/en active Active
- 2005-02-22 CN CN200580005610XA patent/CN1922659B/zh active Active
- 2005-02-22 KR KR1020067019497A patent/KR100879976B1/ko not_active IP Right Cessation
- 2005-02-22 JP JP2007500239A patent/JP2007523388A/ja not_active Withdrawn
- 2005-02-22 CA CA002555768A patent/CA2555768A1/en not_active Abandoned
- 2005-02-22 WO PCT/FI2005/050043 patent/WO2005081231A1/en active Application Filing
- 2005-02-22 KR KR1020087020819A patent/KR20080083718A/ko not_active Application Discontinuation
- 2005-02-22 RU RU2006129871/09A patent/RU2006129871A/ru not_active Application Discontinuation
- 2005-02-22 BR BRPI0508309-5A patent/BRPI0508309A/pt not_active Application Discontinuation
- 2005-02-23 US US11/065,717 patent/US7747430B2/en active Active
-
2006
- 2006-08-14 ZA ZA200606714A patent/ZA200606714B/en unknown
-
2007
- 2007-07-13 HK HK07107509.2A patent/HK1099960A1/xx unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11676611B2 (en) * | 2008-07-11 | 2023-06-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains |
US11682404B2 (en) | 2008-07-11 | 2023-06-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains |
US11823690B2 (en) | 2008-07-11 | 2023-11-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
Also Published As
Publication number | Publication date |
---|---|
KR100879976B1 (ko) | 2009-01-23 |
WO2005081231A1 (en) | 2005-09-01 |
US20050192797A1 (en) | 2005-09-01 |
FI20045052A0 (fi) | 2004-02-23 |
KR20070015155A (ko) | 2007-02-01 |
JP2007523388A (ja) | 2007-08-16 |
AU2005215745A1 (en) | 2005-09-01 |
HK1099960A1 (en) | 2007-08-31 |
RU2006129871A (ru) | 2008-03-27 |
EP1719120B1 (en) | 2019-06-19 |
ZA200606714B (en) | 2007-11-28 |
KR20080083718A (ko) | 2008-09-18 |
FI20045052A (fi) | 2005-08-24 |
US7747430B2 (en) | 2010-06-29 |
TW200534599A (en) | 2005-10-16 |
BRPI0508309A (pt) | 2007-07-24 |
CA2555768A1 (en) | 2005-09-01 |
CN1922659A (zh) | 2007-02-28 |
CN1922659B (zh) | 2010-05-26 |
SG150572A1 (en) | 2009-03-30 |
EP1719120A1 (en) | 2006-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI118835B (fi) | Koodausmallin valinta | |
FI118834B (fi) | Audiosignaalien luokittelu | |
KR100908219B1 (ko) | 로버스트한 음성 분류를 위한 방법 및 장치 | |
US8244525B2 (en) | Signal encoding a frame in a communication system | |
CA2833874C (en) | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium | |
JP4907826B2 (ja) | 閉ループのマルチモードの混合領域の線形予測音声コーダ | |
KR100798668B1 (ko) | 무성 음성의 코딩 방법 및 장치 | |
US7016832B2 (en) | Voiced/unvoiced information estimation system and method therefor | |
JP2002544551A (ja) | 遷移音声フレームのマルチパルス補間的符号化 | |
JP4567289B2 (ja) | 準周期信号の位相を追跡するための方法および装置 | |
MXPA06009370A (en) | Coding model selection |