Trocha teorie

Šedivá je teorie a zelený je strom života, říkali nám často na vysoké škole. Ale někdy jen praktické zkušenosti nestačí, je potřeba se také něčemu novému přiučit. Možná, že k tomu vám pomohou i některé články, které se zde budou objevovat. Dnes předkládám zajímavý článek o audio komprimačních metodách, které se používají (nejen) při satelitních přenosech, z pera člena Československého DX klubu, ing.Milana Gazdíka.

MPEG a jeho hladiny


DVBNa stránkách DX Revue se v poslední době setkáváme s novými pojmy, které mají přímou vazbu na digitální zpracování a šíření obrazových a zvukových signálů. Ať se nám to líbí, či nikoliv, éra digitalizace je zde a dotkne se rozhodně všech našich specializací, pokud se tak do určité míry již nestalo. Jen namátkou uvádím, že více jak třicet televizních vysílačů po celé republice šíří analogově signály, které jsou ale na jejich vstupy dopraveny ze studia v digitální formě, že existují významné rozhlasové stanice, které jinak než digitálně signál již dnes nedistribuují a milovníci krátkých vln nechť jsou si vědomi toho, že řada významných světových společností distribuční přenosy realizuje nikoliv přes satelity, ale zcela elegantně prostřednictvím Digitální sítě integrovaných služeb, čili vlastně digitálně po telefonu. Když prozradím, že i studiová praxe při výrobě a zpracování programu má z velké části digitální charakter, vyplyne nám z toho jeden velice důležitý závěr, že totiž právě my, diváci a posluchači, tedy konzumenti programu, se stáváme postupně jediným, ryze analogovým, článkem celého moderně řešeného mediálního řetězu. Ano, jsou to naše přijímače, které zaspaly dobu a nevyužívají náležitě všech předností, které moderní digitální technologie nabízí. Asi nikdo z nás nebude tak bláhový, aby se domníval, že ve velice krátké době nedojde alespoň k nastartování nápravy této situace. Kolegové, vyznávající satelitní příjem, ti mi věří, těm ostatním prozradím, že pozemní, tedy přímé televizní i rozhlasové vysílání je i v naší republice blíže, než se možná domnívají.
I když všechny připravované projekty samozřejmě počítají s hybridním vysíláním po řadu let, domnívám se, že alespoň lehká teoretická příprava může být pro posluchače či diváky našeho ražení, tedy pro nadšené fandy, vhodná. Dovolte mi proto v dnešním příspěvku poodhrnout roušku tajemství velmi významného procesu, uplatňovaného na digitalizovaném signálu, totiž redukce bitového toku.

Program v digitální podobě

V době, kdy se prováděla popularizace digitálních technologií často zazníval názor, který, bohužel, dosud přežívá. Říkalo se, že ve chvíli, kdy získá zvukový, nebo obrazový signál digitální podobu, přestává být signálem a stává se obecně počítačovým souborem, pouhou kombinací nul a jedniček, a tím pádem na něj lze uplatňovat dostatečně propracované metody výpočetní techniky. Je to teorie sice atraktivní, ale má jednu velmi podstatnou vadu. Není totiž zcela seriozní. Prvním rozdílem je, že signálové soubory mohou dosahovat nebývalých rozměrů, což je pro některé počítačové aplikace nepřijatelné. Druhá výhrada je ale ještě závažnější. Je zde zásadní rozdíl v tom, jakou péči musíme věnovat ochraně dat klasického "počítačového" souboru a souboru reprezentujícího zvukový či obrazový signál. Je-li v prvním případě nutné nejrůznějšími prostředky důsledně chránit serióznost všech bitů, je druhý případ pravým opakem. Ze souboru, reprezentujícího videosignál, je možné bez náhrady vyjmout celé dlouhé bloky bitů a vizuálně rozdíl nikdy nezjistíme. Zvukové soubory mají nadbytečných bitů sice podstatně méně, ale nic to nemění na skutečnosti, že jejich úzkostlivá ochrana ve všech etapách zpracování by byla rovněž krajně nevhodná.
Uvedené skutečnosti vedly k prosté úvaze. Proveďme nejprve důkladnou probírku souboru, reprezentujícího signál, vyextrahujme z něj ty bity, které jsou nadbytečné a získáme soubor, který se tomu klasickému významně přiblíží. O zbylé bity se začneme obávat, protože jsou to ty nejdůležitější a všechny systémy datové ochrany nám najednou začnou vyhovovat a zároveň se soubor významně zkrátí, čímž odpadne druhá zmíněná nevýhoda, jeho extrémní délka. To je důležité z hlediska kapacity záznamových médií, snížení nároků na výpočetní rychlost a uvidíme, že i pro snazší přenos digitalizovaného signálu.

Komprimace zvuku

Až do této chvíle bylo možné hovořit o obrazových i zvukových datech společně. Proces komprimace, dosahovaný výběrem nadbytečných bitů a jejich vypouštěním či úspornější náhradou, se však liší naprosto zásadně. V tomto příspěvku si budeme všímat komprimace digitalizovaných signálů zvukových. V zásadě je dvojího typu.
1. Bezeztrátová - která umožňuje dokonalou rekonstrukci původního datového toku. Lze dosáhnout pouze nízkých kompresních poměrů (2 až 3x), závislých na charakteru signálu. Tato metoda je málo rozšířena.
2. Modelová - k původní podobě datového souboru se již nikdy nelze vrátit, nabízí však vysoké kompresní poměry (6 až 25x). Informace o redukci bitů není souborem přenášena, o rekonstrukci se stará pouze jednotný dekodér.
Druhá metoda prožívá v současnosti veliký rozmach, zejména její psychoakustický způsob kódování. Princip je celkem jednoduchý, snadno představitelný a bez významného rozdílu v komerční a profesionální sféře. Základem tohoto typu úsporného kódování je dávno známý, t.zv. psychoakustický maskovací jev, využívaný formou elektronického modelování dynamického maskovacího efektu, který vykazuje lidské slyšení. Vyčleněním těch částí zvukového signálu, které lidské ucho stejně není schopné vnímat, vznikne prostor pro zvýšení záznamové či přenosové kapacity signálů slyšitelných.
Tolik obecný princip, jehož první životaschopná varianta pocházela od firmy Philips a nesla označení Musicam. Z dalších systémů jmenujme produkty firmy Dolby Laboratories, označené AC2 (střední stupeň komprese stereosignálů) a AC3 (vícekanálová verze, současný konkurent MPEG2), my se však zaměříme na stručný popis systému MPEG.

MPEG audio

V rámci výzkumné skupiny Moving Pictures Expert Group (zde je původ používané zkratky) vznikl v roce 1992 velmi významný dokument, který definuje naprosto převratným způsobem novou, zcela otevřenou architekturu komprimačních systémů. Právě v ní spočívá ono tajemství, proč byly MPEG technologie tak široce přijaty prakticky přes noc. Oč se jedná:
Definovány jsou pouze vlastnosti dekodéru. Prostor pro řešení enkodéru je zcela otevřený, což zajišťuje průběžné zdokonalování celého procesu.
Jinými slovy, s původním souborem si udělej co chceš, ale po dekódování MPEG dekodérem musíš dosáhnout jeho co nejvěrnější rekonstrukci. Tato úžasná filozofie v sobě skrývá záruky, že s rozvojem technologií buď budeme úsporněji kódovat (při zachování kvality signálu bude soubor stále kratší), nebo dosáhneme zvýšení kvality při stejném bitovém toku. Důležitou vlastností je i to, že složité maticové operace jsou prováděny v enkodéru, dekodér zůstává poměrně jednoduchý.
Aby se mohl uživatel rozhodnout jak vysoký stupeň komprese vyžaduje, definoval zmíněný standard, označený jako MPEG1 (ISO/IEC 11172-3), ve své zvukové části tři t.zv.hladiny :

* Layer I - ta je nejjednodušší, nabízí pouze nízkou kompresi a užívá se spíše v konzumní sféře (např. digitální kazeta DCC s odvozeným protokolem PASC)
* Layer II - složitější, nabízí větší kompresi a je to nejrozšířenější hladina pro profesionální aplikace (digitální rozhlas DAB, digitální televize DVB, digitální telefon ISDN). Výsledné bitové toky nepřekračují hodnotu 384 kbit/s. Zvukový doprovod satelitního vysílání používá právě tuto hladinu.
* Layer III - vysoká komprese, obvodově složitější, vhodná pro úzkopásmovou Digitální síť integrovaných služeb, tedy opět ISDN v profesionálních aplikacích, Internet.

Popisovaný standard MPEG1 počítal pouze s dvoukanálovým, resp. stereofonním zvukovým signálem a s třemi vzorkovacími kmitočty 32, 44.1 a 48 kHz. To se ale záhy ukázalo jako nedostatečné a proto navázal o dva roky později nový standard ISO/IEC 13818, označovaný jako MPEG2. Hlavní rozdíly jsou vůči MPEG1 dva:
1. možnost použití polovičních vzorkovacích kmitočtů 16, 22.05 a 24 kHz, což umožňuje získat kvalitní zvuk i při nízkých bitových tocích (to je využíváno v telekomunikační technice, konferencích atd.)
2. Psychoakustické kódování multikanálové, podporující až pětikanálový (resp. sedmikanálový) prostorový zvuk.
Z hlediska zajištění kompatibility má protokol MPEG2 tyto vlastnosti:
* Dekodér MPEG2 je schopen dekódovat MPEG1 audio i video
* MPEG1 audio dekodér je schopen dekódovat MPEG2 multikanál do formy stereo
* MPEG2 je slučitelný až do hladiny osmi kanálů s filmovým multikanálem Prologic.
* Bitový tok ISO/MPEG2 je tvořen základní částí MPEG1 stereo, k němu přistupuje multikanálová část formou rozšíření.
Aby systém MPEG nebyl pouze opěvován, dovolím si připojit následující poznámku. Když se setkáte s pojmem MPEG2-NBC, jedná se o regulérní standard MPEG2 s označením ISO/IEC 13818-7, který vznikl dodatečným "vylepšením" vlastností protokolu MPEG2 po málo úspěšných subjektivních poslechových testech. Vznikl tak sice velmi dokonalý systém, ale jak napovídají písmenka NBC, za cenu ztráty kompatibility s dekodérem podle MPEG1.

Jak dále?

Tento odstavec by mohl být nejobsáhlejší. Je řada projektů, které na MPEG přímo navazují (zvykejme si na pojmy MPEG7 a hlavně MPEG4, který představuje naprostou revoluci v oblasti redukce bitových toků). Kódování podle protokolu MPEG lze provádět buď do formy pevného bitového toku FBR (Fixed Bit Rate), nebo proměnného bitového toku VBR (Variable Bit Rate). Druhá metoda je výhodnější, protože umožňuje měnit datový tok enkodéru podle složitosti zvukového signálu. Rozvoj tohoto způsobu kódování lze očekávat zejména v oblasti masteringu (film, diskové technologie).
Často je kladena i otázka, zda komprimace nemá jen dočasné opodstatnění. Až budou dostatečné kapacity záznamových médií, až stoupnou dostatečně rychlosti přenosových signálových cest, nestane se redukce bitového toku zbytečností? Patrně ne. Budou totiž vytvořeny podmínky pro zvyšování počtu účastníků v datových multiplexech a bude možné přenášet více programů za jednotku času. Zkrátka, máme se v této oblasti skutečně na co těšit.

Ing.Milan Gazdík

 

Uveřejněno také v Magazínu DXR, srpen 1998, zpracoval ing.Václav Hrubec, Kvasice

---

Back to VHR

Reprodukce zde zveřejněných informací jen s udáním jejich původu (VHR).
Information published on these pages may not be reproduced unless the source (VHR) is mentioned.

vhr@vhr.cz

© VHR, last change: 12 MAY 2000