Sakaru Pasaule - Žurnāls par
modernām komunikācijām

  
  


Atpakaļ Jaunais numurs Arhīvs Par mums Meklēšana

Audiosignāla ciparu kodēšana un kompresija – VII

   

Šajā, jau septītajā, tēmas apceres rakstā aplūkoti platjoslas audio ciparu kodēšanas paņēmieni, kas izmantoti pēc kārtas nākamā, t. i., MPEG-2 standarta audiosadaļās. Pēc atkāpes par stereo būtiskām īpašībām izsekots MPEG-2 BC un MPEG-2 AAC standartu izstrādei. Bet sākumā, noslēdzot VI rakstu, vēl par MPEG-1.

Vēl par MPEG-1

Iepriekšējā šīs sērijas rakstā autors centās aptvert neaptveramo: izstāstīt ļoti sarežģītās MPEG-1 platjoslas audiosignāla kodēšanas paņēmienus četrās žurnāla lapaspusēs. Atcerēsimies, ka MPEG-1 I slānis ir algoritma Musicam vienkāršots variants. MPEG-1 II slānis, kas ir identisks ar Musicam, šķiet, cita starpā pretendē uz Eiropas digitālās radiofonijas DAB (Digital Audio Broadcasting) plašu lietojumu. Latvijā MPEG-1 II slānis tiks vispirms lietots digitālo video un audio signālu sadales un savākšanas tīklā (sk. SP 2000/3, 23. lpp.). Kas attiecas uz MPEG-1 III, kas ir ļoti veiksmīgs Musicam un Aspec algoritmu apvienojums, tad šo slāni izmanto visās digitālās tehnikas un telekomunikāciju jomās, kur pieļaujama (vai nepieciešama) lielāka audio signālu kompresija (vairāk nekā 10:1).
Ņemot vērā par II slāni sacīto, šīs sērijas iepriekšējā, t. i., VI raksta materiālu sadaļā Apakšjoslu kodu vārdi būtu jāpapildina ar MPEG-1 II slāņa bitu piešķiršanas (izvietošanas) tabulu (1. tabula).

Atkāpe – stereo

Cilvēks ir apveltīts ar binaurālo (burtiski: divu ausu) dzirdi. Tātad svarīgas ir abās ausīs ieejošo akustisko signālu starpības (diferences). Tās ir divējādas: gan intensitāšu (līmeņu), gan laika kavējuma diferences. Tieši šīs atšķirības bez skaņas skaļuma (intensitātes), augstuma (frekvences) un skaņas tembra (harmonikas jeb virstoņi) dzirdes sajūtu vēl izrotā ar ceturto papildu īpašību – telpiskumu. Cilvēks spēj telpā lokalizēt skaņas avotus, konstatē to atrašanās virzienus. Taču maldīgi būtu domāt, ka divkanālu jeb parastā stereopārraide to nodrošina pareizi. Telpiskums izpaužas tikai daļēji un nepilnīgi. Zināms (vienkāršoti skat., piemēram [2]), ka, vienai skaņas programmai atvēlot lielāku kanālu skaitu, stereofoniskais jeb telpiskuma efekts palielinās, 5÷6 kanālos tas izpaužas gandrīz pilnībā (virs 90 procentiem).
Tāpēc loģisks digitālo platjoslas koderu tālāks uzlabojums ir pāreja no divkanālu uz daudzkanālu stereo.

Daudzkanālu stereo

Vienai skaņas pārraidei atvēlot 5,1 (skat. tālāk) atsevišķu kanālu, pārraides atskaņošanas telpā tiek pilnībā atjaunots oriģinālais telpiskās skaņas (t. s. surround sound) lauks.

TV skaņa

Tas sevišķi svarīgi augstas kvalitātes TV skaņas pavadījumam. Lai skatītājs sajustu stereoefektu, tam vēlams atrasties galvenokārt uz labā un kreisā kanāla skaļruņu izvietojuma viduslīnijas. Šo ierobežojumu dēļ TV skaņas pavadījuma stereovariants pasaulē plašu izplatību nav guvis. Parasti lieto aparatūras ziņā vienkāršāko mono variantu. Tā priekšrocība – skatītājs var atrasties jebkurā televizora telpas vietā, jo skaņas ceturtā parametra – telpiskuma – vienkārši nav! Daudzkanālu stereo sistēmā TV uztvērēja priekšā rekonstruētais, oriģinālais skaņas lauks paceļ atskaņojuma kvalitāti visaugstākā kvalitātē, vienlaikus noņemot ierobežojumus uz skatītāja atrašanās vietu, jo skaņas telpiskums izpaužas lielā telpas daļā.
Nākotnē TV studiju skaņu režisori varēs izmantot atsevišķus kanālus specifisku efektu radīšanai, saistot TV programmu videoobjektus ar precīzi tiem noteiktu rekonstruētā skaņas lauka vietu.
Paredzams, ka šādas daudzkanālu audiosistēmas gūs lietojumu:
· visaugstākās kvalitātes telpiskās skaņas pārraidēm;
· gadījumos, kad šāda kvalitatīva skaņa tiek pārraidīta vienkopus ar attēlu (multimediji, HDTV – augstas izšķirtspējas TV, elektroniskais kino u. c.).
Digitālo daudzkanālu stereo ASV izmanto kinoteātros jau kopš deviņdesmito gadu vidus. Tā ir Dolby firmas kodēšanas un kompresijas sistēma, par ko ceru pastāstīt turpmāk. Daudzkanālu stereoierakstus ļoti ērti spēj nodrošināt datu ietilpīgie DVD diski.

Apzīmējums F/S

Starptautiskā organizācija ITU-R (International Telecommunication Union - Radio) platjoslas audio daudzkanālu sistēmām iesaka lietot apzīmējumu F/S, kur F – Frontal – frontālo kanālu skaits, bet S – Surround – burtiski no angļu - ieskaujošo, t. i., sānu un aizmugures kanālu skaits. Piemēram, parastās stereopārraides apzīmējums ir 2/0, bet 3/2 atbilst pieckanālu skaļruņu izvietojumam: trīs frontālie kanāli: labais (R - Right), kreisais (L - Left) un centrālais (C - Centre), kā arī labējais sānu, aizmugures (RS - Right Surround) un kreisais sānu, aizmugures (LS - Left Surround). Pacēlumu uz zemām frekvencēm, lai nepārslogotu pārējos kanālus, iegūst, izmantojot īpašu LFE (Low Frequency Enhancement) kanālu ar t. s. subwoofer akustisko sistēmu, kas telpā atskaņo tikai zemās audio frekvences (15÷120 Hz rajonā). Relatīvi šaurās joslas dēļ šai kanālā var izmantot daudz lēnākas bitu plūsmas. Seškanālu 5.1 apzīmējumā LFE ir 0,1 jeb sestais kanāls (skat. 2. tabulu un 1. zīm.).

MPEG-2 daudzkanālu kodēšana

MPEG-1 platjoslas audiokodēšanas sistēmu tālāka attīstība lika izstrādāt MPEG-2 5.1 daudzkanālu kodēšanas standartus (ISO/IEC 13818-3). Sākotnēji tika izvirzīti vēl divi, izstrādātājiem pārāk smagi, papildu noteikumi MPEG-1 un MPEG-2 standartu savstarpējai savietojamībai (forward and backward compatibility). Tas nozīmē, ka MPEG-2 daudzkanālu dekoderiem bija jāspēj dekodēt MPEG-1 visu slāņu mono vai stereo signālus, kurpretī MPEG-1 visu slāņu stereo dekoderiem, kas nodrošina tikai divus platjoslas audio kanālus, bija jāspēj dekodēt nebojātu 2/0 formāta signālu no sarežģītās MPEG-2 3.1/2 daudzkanālu bitu plūsmas. Tādējādi MPEG-1 dekoderu lietotāji varētu daudzkanālu pārraidi noklausīties vienkāršotā variantā ar mono vai parasto stereo iekārtu. Ar to bija iecerēts panākt daudzkanālu audiosistēmas lēnu, pakāpenisku ieviešanu, MPEG-1 dekoderus nepadarot nederīgus.
Šīs sarežģītās prasības tika realizētas:
· lietojot MPEG-1 koderus un dekoderus kā MPEG-2 sistēmas sastāvdaļu;
· definējot MPEG-2 bitu plūsmu kā MPEG-1 bitu plūsmas apvienojumu ar plūsmas daļu, kas piederīga tikai MPEG-2 un paredzēta pārējiem pārraides kanāliem (t. i., 3, 4, 5 un 0.1);
· izmantojot koderos kanālu sajaukšanas (matrices) bloku, pēc noteiktām kārtulām lineāri sajaucot audio signālu komponentes piecos kompozītkanālos.

Nepraktisks projekts?

Salīdzinot universālo MPEG-2 daudzkanālu kodēšanas paņēmienu (dažreiz lieto apzīmējumu MPEG-2 BC – Backwards Compatible –, kur pēdējie burti (BC) uzsver gan tikai atpakaļsavietojamību) ar līdzīgiem ASV Dolby un AT&T firmās izstrādātiem AC-3 un PAC (Perceptual Audio Coding) kodēšanas paņēmieniem, atklājās dramatiski MPEG-2 trūkumi. Amerikāņu sistēmas ar lēnākām bitu plūsmām bija ieguvušas augstākas kvalitātes telpisko skaņu! Turpretī MPEG-2 BC bija saklausāmi no matricbloka nākošie kodēšanas trokšņi, tiklīdz bitu plūsmu palēnināja zem 640 kbit/s uz pilnu kanālu skaitu. Par savietojamību tika maksāta pārāk dārga cena! Bet prasības pēc lēnākām bitu plūsmām arī platjoslas audiokodēšanā deviņdesmito gadu sākumā jau guva virsroku.

MPEG-2 NBC/AAC

1994. g. MPEG nenogurdināmie izstrādātāji ķērās pie jauna daudzkanālu standarta MPEG-2 NBC (Non Backward Compatible) bez prasībām par savietojamību, kas vēlāk tika pārdēvēts par MPEG-2 AAC (Advanced Audio Coding). Galvenie mērķi bija divi:
no oriģināla grūti atšķirama atskaņojuma kvalitāte (tika ieviests īpašs termins indistinguishable quality);
izmantojot lēnas bitu plūsmas (384 kbit/s uz pilnu kanālu skaitu).
Dž. Džonsona, S. Kvakenbuša u. c. speciālistu izstrādātais AAC algoritms [3] ietvēra visu labāko no MPEG-1 un MPEG-2 standartiem, kā arī izmantoja pilnīgi jaunus līdzekļus (tools): spektrālo koeficientu prognozi, no Dolby patapinātus KB (Kaiser - Bessel) tipa logus datu apstrādei, joslas platuma un bitu plūsmas ātruma mērogošanas operācijas, divpakāpju bitu izvietošanas procedūras u. c. No 1994. līdz 1997. gadam tas deva iespēju izveidot MPEG-2 AAC standartu: ISO/IEC 13818-7 Part 7, kas bitu plūsmas ātruma ziņā pārsniedza sākotnējos mērķus par 64 kbit/s. Kodēšanas sistēma nevainojami darbojās ar 320 kbit/s ātruma plūsmu uz visiem 5.1 kanāliem.
Kodēšanas efektivitātes uzlabošanu labi raksturo, piemēram, tas, ka MPEG-2 AAC ar 96 kbit/s bitu plūsmas ātrumu nodrošina tikpat augstvērtīgu atskaņojuma kvalitāti, ko dod MPEG-1 II slānis, darbojoties ar 192 kbit/s plūsmu. Tātad bitu plūsmas ātruma samazinājums – 2:1!
MPEG-2 AAC kanālu skaits ir maināms: no viena līdz 48! Protams, tādā gadījumā tie ir šaurjoslu kanāli. Tāpat maināmi vienam kanālam nepieciešamie bitu plūsmas ātrumi – no 8 līdz 192 kbit/s uz kanālu. Var izmantot arī dažādas diskretizācijas frekvences – no 8 līdz 96 kHz atsevišķā kanālā.
Iespējams, ka MPEG-2 AAC apstiprinās par ASV digitālās radiofonijas standartu.
MPEG-2 AAC organizēts kā kodēšanas līdzekļu kopojums. Atkarībā no centrālā procesora vai kanāla resursiem un vēlamās kvalitātes var izvēlēties trīs sarežģītības pakāpes jeb t. s. profilus:
· galveno (Main), ja pieejama nepieciešamā procesora jauda un atmiņas resursi;
· zemas komplicētības (Low Complexity), ja signāla apstrādes ātrumi un atmiņas resursi ir ierobežoti;
· SSR (Scaleable Sampling Rate) – ar mērogotu diskretizācijas frekvenci, ja no kopējās bitu plūsmas nepieciešams izdalīt signālus ar atšķirīgu audio kvalitāti.
MPEG-2 AAC divkanālu variantā var realizēt uz 133 MHz Pentium platformas, kas izmanto 40 procentu pieejamo procesora resursu profilā Main un, to pašu veicot, ar 25 procentiem resursu Low Complexity profilā.
MPEG-2 AAC vienkāršota kodēšanas blokshēma parādīta 2. zīm. Salīdzinot ar MPEG-1 II slāni (skat. SP 2000/3, 27. lpp.), šeit izmantoti jauni elementi. TNS (Temporal Noise Shaping) – temporālais trokšņu izmaiņu un slāpēšanas bloks kontrolē kvantēšanas trokšņu un signāla intensitātes laika atkarību, novēršot arī priekšatbalsi. Prognozes bloks samazina bitu plūsmas ātrumu, kodējot sekojošās apakšjoslu nolases dotajā apakšjoslā, bet savu prognozi veido uz iepriekšējā datu apstrādes laika blokā dekodēto spektru. Kvantēšanai un Hafmana beztrokšņu kodēšanai tiek izmantota iteratīvā metode, lai kvantēšanas trokšņus noturētu zem globālā maskēšanas līmeņa. Hafmana kodēšanas (skat. arī SP 2000/3, 29. lpp.) bloks izmanto 12 kodugrāmatas.

(Turpmāk vēl)

Arnolds VĪTOLS, speciāli SP

Informācijas avoti
1. M. Hunter. Digital Audio. BBC Training and Development Centre. Wood Norton Eversham, Worcestershire, WR11 4YB, UK.
2. A. Vītols. Radiouztvērējs, LVI, Rīga, 1963, 81.-86. lpp.
3. J. Johnson et alab. MPEG audio coding. In: Wavelet, Subband and Block Transforms in Communications and Multimedia. Eds.: A. Akansu and M. Medley, Boston, MA; Kluwer Academic, 1999, ch. 7.
 
Design and programming by Anton Alexandrov - 2001