+ All Categories
Home > Documents > PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE · 2019. 2. 27. · Cursul 7 PRELUCRAREA ȘI...

PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE · 2019. 2. 27. · Cursul 7 PRELUCRAREA ȘI...

Date post: 30-Jan-2021
Category:
Upload: others
View: 18 times
Download: 0 times
Share this document with a friend
13
Cursul 7 PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE Cuprins 1. Sunetul in televiziune 2. Sistemul de sunte analogic ZWEITON 3. Sistemul de sunet digital NICAM 728 4. Principii ale prelucrarii sunetului in televiziunea digitala Introducere In televiziune se transmit imagini insotite de sunete. Procesele privind transmisia si prelucrarea sunetelor a evoluat de la analog la digital si de la mono la dual si stereofonic. Acest capitol trateaza principiile privind captarea, procesarea si transmiterea sunetului in analog si digital la nivelul utilizarii unor sisteme de sunet dual, adica bilingv, si stereofonic. Sistemele vizate sunt sistemul ZWEITON, NICAM 728 si sistemul digital de televiziune referitor la prelucrarea informatie de sunt cu accent asupra principiilor de compresie si de transmisie. Obiective Dupa parcurgerea acestui curs studentii vor fi in masura: Sa descrie particularitatile sistemelor de sunet ZWEITON si NICAM 728 Sa reprezinte caracteristica de canal pentru sistemul de sunet NICAM 728 Sa explice particularitatile procesarii sunetului in televiziunea digitala pentru reducerea debitului de informatie Sa reprezinte schema procesului de codare pe subbenzi a semnalelor audio in TV digital Timpul mediu de studiu Timpul mediu de studiu individual este de 2 ore 1. Sunetul in televiziune În televiziune, sistemul de sunet asigură transmisia informaţiei audio care însoţeşte informaţia video. Sistemele de sunet pot fi monofonice sau
Transcript
  • Cursul 7

    PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Cuprins

    1. Sunetul in televiziune 2. Sistemul de sunte analogic ZWEITON 3. Sistemul de sunet digital NICAM 728 4. Principii ale prelucrarii sunetului in televiziunea digitala

    Introducere

    In televiziune se transmit imagini insotite de sunete. Procesele privind transmisia si prelucrarea sunetelor a evoluat de la analog la digital si de la mono la dual si stereofonic.

    Acest capitol trateaza principiile privind captarea, procesarea si transmiterea sunetului in analog si digital la nivelul utilizarii unor sisteme de sunet dual, adica bilingv, si stereofonic. Sistemele vizate sunt sistemul ZWEITON, NICAM 728 si sistemul digital de televiziune referitor la prelucrarea informatie de sunt cu accent asupra principiilor de compresie si de transmisie.

    Obiective

    Dupa parcurgerea acestui curs studentii vor fi in masura: Ø Sa descrie particularitatile sistemelor de sunet ZWEITON

    si NICAM 728 Ø Sa reprezinte caracteristica de canal pentru sistemul de

    sunet NICAM 728 Ø Sa explice particularitatile procesarii sunetului in

    televiziunea digitala pentru reducerea debitului de informatie

    Ø Sa reprezinte schema procesului de codare pe subbenzi a semnalelor audio in TV digital

    Timpul mediu

    de studiu

    Timpul mediu de studiu individual este de 2 ore

    1. Sunetul in televiziune

    În televiziune, sistemul de sunet asigură transmisia informaţiei audio care

    însoţeşte informaţia video. Sistemele de sunet pot fi monofonice sau

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 2

    stereofonice cu prelucrare analogică sau digitală. Ultima categorie – sisteme audio stereofonice digitale, cunoaşte o dezvoltare şi o extindere continuă odată cu trecerea la radiodifuziune digitală.

    Pentru televiziune, sistemele de sunet pot fi împărțite în doua categorii: - Sisteme de sunet analogice; - Sisteme de sunet digitale. Ambele categorii pot asigura transmisii și recepții de sunet monofonic,

    dual (sau bilingv) și stereofonic. Televiziunea analogica la inceput transmitea sunetul prin modulatia in

    frecventa a unei singure purtatoare de radiofrecventa cu frecventa mai mare decat frecventa purtatoarei de imagine la un ecart de 5,5 MHz sau 6,5 MHz. Apoi a fost introdusa a o a doua frecventa purtatoare de sunet pentru a se asigura astfel transmisiile de sunet dual si/sau stereo.

    Aceasta a doua frecventa purtatoare de sunet este mai mare decat prima purtatoare de sunet, la un ecart de cateva sute de kHz valoarea depinzand de standardul de televiziune, dar a fost utilizata de-a lungul evolutiei televiziunii pentru transmisii de sunet analogic si apoi pentru transmisia de sunet digital. Sistemele de sunet analogic TV, prelucrează informaţia de sunet prin procedee analogice, transmisia informaţiei realizându-se prin modulaţie în frecvenţă şi pot fi:

    a) monofonice cu o singură subpurtătoare de sunet; b) stereofonice (respectiv bilingve sau duale) cu două subpurtătoare de sunet.

    a) Sistemele de sunet monofonice cu prelucrare analogică realizează prelucrarea şi transmisia informaţiei de sunet prin modulaţia în frecvenţă a purtătoarei de sunet din banda canalului de televiziune. Purtătoarea de sunet din canalul de televiziune se află dispusă faţă de purtătoare de imagine la un ecart de 5,5 MHz în cazul standardului TV CCIR B/G sau la 6,5 MHz în cazul standardului TV CCIR D/K (vechiul standard OIRT D/K). La recepţie informaţia de sunet este extrasă prin demodularea de frecvenţă a purtătoarei de sunet folosindu-se circuitele demodulatoare de coincidenţă. b) Sistemele de sunet stereofonice sunt rezultatul dezvoltării transmisiei de sunet dual (bilingv) în televiziune. Sistemele de sunet dual realizează transmisia informaţiei de sunet pe două subpurtătoare de sunet (fps1 şi fps2) prin modulaţie în frecvenţă. Pe o subpurtătoare de radiofrecvenţă se transmite informaţia audio într-o anume limbă de comunicare iar pe a doua subpurtătoare de radiofrecvenţă de sunet se transmite informaţia audio pe o altă limbă de comunicare, în funcţie de specificul de ţară.

    2. Sistemul de sunet analogic ZWEITON În Europa cel mai răspândit sistem audio stereo sau dual analogic este sistemul ZWEITON, produs German, adoptat de ţările care utilizează standardul

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 3

    CCIR. Apariţia şi dezvoltarea sistemului de sunet stereo sau bilingv trebuia să asigure cerinţele:

    - sistemul să fie compatibil cu sistemele monofonice ale receptoarelor cu sunet monofonic atât în sens direct cât şi în sens invers;

    - să realizeze comutarea (trecerea) automată sau la comanda utilizatorului în una din cele trei situaţii de recepţie şi prelucrare a sunetului: recepţie monofonică, recepţie stereofonică sau recepţie duală (cu două subpurtătoare monofonice prin selectarea uneia din cele două căi independente de sunet cu informaţie în limbi diferite).

    Caracteristica amplitudine frecvenţă a canalului TV în cazul transmisiei

    de sunet stereofonic sau bilingv (dual) pentru sistemul ZWEITON este reprezentată în figura 1.1. În funcţie de particularităţilor de standard TV utilizat sistemul ZWEITON poate fi: • Sistemul ZWEITON - B/G caracterizat prin următoarele particularităţi

    principale: - prima purtătoare de sunet fps1 se află la un ecart de frecvenţă de 5,5

    MHz faţă de purtătoarea de imagine şi este modulată în frecvenţă cu semnalul audio al primei limbi de transmisie în cazul transmisiei bilingve sau cu semnalul audio sumă (L+R)/2, a celor două canale stânga (L) şi dreapta (R), în cazul transmisie sterofonice;

    - a doua purtătoare de sunet fps2 se află la un ecart de frecvenţa de 5,742 MHz faţă de purtătoarea de imagine şi este modulată în frecvenţă cu semnalul audio al celei de a doua limbi de transmisie în cazul transmisiei bilingve sau cu semnalul audio a canalului dreapta (R) în cazul transmisie sterofonice.

    • Sistemul ZWEITON - D foloseşte acelaşi principiu de transmisie a informaţiei ca în cazul sistemului ZWEITON - B/G, doar valorile frecvenţei subpurtătoarelor de sunet sunt altele şi anume:

    - prima purtătoare de sunet fps1 se află la un ecart de frecvenţa de 6,5 MHz faţă de purtătoarea de imagine;

    - a doua purtătoare de sunet fps2 se află la un ecart de frecvenţa de 6,742 MHz faţă de purtătoarea de imagine.

    • Sistemul ZWEITON - M foloseşte acelaşi principiu de transmisie a informaţiei ca în cazul sistemului ZWEITON - B/G, valorile frecvenţei subpurtătoarelor de sunet fiind:

    - prima purtătoare de sunet fps1 se află la un ecart de frecvenţa de 4,5 MHz faţă de purtătoarea de imagine;

    - a doua purtătoare de sunet fps2 se află la un ecart de frecvenţa de 4,742 MHz faţă de purtătoarea de imagine.

    Alături de caracteristicile principale prezentate sistemul de sunet

    ZWEITON prezintă şi următoarele particularităţi care îi permit transmisia şi

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 4

    identificarea cu uşurinţă la recepţie a tipului de transmisie audio mono, stereo sau dual:

    - raportul în putere între purtătoarea de imagine şi de sunet este de 13 dB pentru prima subpurtătoare şi de 20 dB pentru a doua subpurtătoare;

    - tipul modulaţiei este modulaţia în frecvenţă pentru ambele subpurtătoare;

    - deviaţia de frecvenţă este de ± 300 kHz pentru ambele subpurtătoare; - se transmite aceeaşi informaţie pe ambele subpurtătoare în cazul

    transmisiei monofonice şi informaţii diferite în cazul transmisiei duale sau stereofonice;

    - pentru identificarea tipului de transmisie a sunetului este transmis pe canalul doi (pe a doua subpurtătoare de sunet) un semnal pilot de identificare cu frecvenţa de 54,6875 kHz nemodulat sau modulat în amplitudine 50 % astfel: § nemodulat în cazul transmisiei monofonice; § modulat cu un semnal cu frecvenţa de 117,5 Hz în cazul

    transmisiei stereofonice; § modulat cu un semnal cu frecvenţa de 274,1 Hz în cazul

    transmisiei duale (bilingve).

    3. Sistemul de sunet digital NICAM 728 Transmisia digitală a sunetului în televiziune a fost perfectată de către

    BBC (British Broadcasting Corporation) din radiodifuziunea britanică. Sistemul de sunet digital este utilizat în Marea Britanie şi în unele ţări din Europa. Sistemul este cunoscut ca sistem NICAM 728 după adoptarea sa de către ITU-R.

    Fig. 1.1 Caracteristica de frecvenţă a unui canal TV pentru norma de televiziune CCIR B/G – cu două subpurtătoare de sunet, norma SWIETON B/G -

    fps1 = 5,5 MHz pentru transmisie monofonică şi fps2 = 5,742 MHz pentru stereo.

    fsc

    Caracteristica semnalului de crominanţă fsc = 4,4336..MHz

    Caracteristica semnalului de luminanţă

    fps1 fps2

    fpi

    f [MHz] -1,25 0 1 2 3 4 5 5,5 5,724

    Caracteristica de frecvenţă pentru canalul sunet 1

    fps1 = 5,5 MHz

    Caracteristica de frecvenţă pentru canalul sunet 2

    fps2 = 5,742 MHz

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 5

    Prescurtarea NICAM vine de la denumirea engleză Near Instantaneous Compounding Audio Modulation a cărei traducere se referă la esenţa sistemului - Modulaţie Audio cu Comprimare Instantanee. Sistemul de sunet NICAM asigură o transmisie digitală pe a doua frecvenţă de sunet pentru informaţia audio stereofonică sau duală, prima frecvenţă purtătoare de sunet este folosită mai departe pentru o transmisie analogică clasică cu modulaţie în frecvenţă (fig.1.2).

    Sistemul de sunet digital NICAM - 728 prezintă următoarele particularităţi tehnice de prelucrare şi transmisie:

    Ø păstrează neschimbat spectrul de frecvenţă video – sunet analogic pe canalul I de sunet (prima subpurtătoare de sunet - fps1) din motive de compatibilitate cu sistemele de sunet tradiţionale;

    Ø asigură transmisia digitală pe două căi (pentru transmisia duală şi stereofonică) folosind canalul II de sunet (a doua subpurtătoare de sunet - fps2);

    Ø a doua subpurtătoare de sunet este plasată, în funcţie de normă, pe o frecvenţa cu valoarea de:

    • 5,850 MHz pentru sistemul NICAM - B/G sau NICAM – L; • 6,552 MHz pentru sistemul NICAM – I .

    Ø pentru evitarea intermodulaţiei nivelul transmisiei de sunet este atenuat cu 20 dB faţă de nivelul purtătoarei de imagine;

    Ø frecvenţa biţilor de semnal este de 728 kbit/s (echivalent 728 bit/ms); Ø modulaţia utilizată este de tip DQPSK (Differentially encoded

    Quadrature Phase – Shift Keying), modulaţie cu deviaţie de fază în cuadratură.

    Modulaţia DQPSK constă în variaţia relativă a fazei purtătoarei în funcţie

    de informaţia digitală modulatoare. Faza purtătoarei se modifică în paşi de 900,

    Fig. 1.2 Caracteristica de frecvenţă a unui canal TV cu transmisia sunetului digital pe a doua frecvenţă purtătoare de sunet potrivit standardului NICAM - 728

    fps1 = 5,5 MHz pentru transmisie analogică şi fps2 = 5,850 MHz pentru digital.

    fsc

    Caracteristica semnalului de crominanţă fsc = 4,4336..MHz

    Caracteristica semnalului de luminanţă

    fps1 fps2

    fpi

    f [MHz] -1,25 0 1 2 3 4 5 6 7

    Caracteristica de frecvenţă pentru canalul sunet 1

    fps1 = 5,5 MHz

    Caracteristica de frecvenţă pentru canalul sunet 2

    fps2 = 5,850 MHz

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 6

    putând avea 4 valori distincte corespunzătoare celor 4 combinaţii cu cele 2 valori ale informaţiei digitale (0 şi 1).

    Fiecărei perechi de biţi, denumită şi simbol, îi corespunde o anumită fază de repaus a purtătoarei de semnal aşa cum este reprezentat în figura 1.3. Caracteristici ale conversiei analog digitale şi ale codării informaţiei în sistemul audio digital NICAM 728 Semnalul audio de natură analogică este convertit şi codat în format digital, proces caracterizat prin: Ø transmisia sterofonică conţine două semnale analogice corespunzătoare

    canalelor stânga (admitem a fi notat cu A) şi dreapta (notat cu B); Ø în transmisia duală sau bilingvă sunt tot două semnale care pot fi notate

    de asemenea cu A şi B; Ø fiecare semnal audio analogic (A şi B) este eşantionat, frecvenţa de

    eşantionare este calculată cu relaţia fE = 2∙fH = 2∙15,626 kHz = 31,2 kHz ≈ 32 kHz. Frecvenţa de eşantionare va determina în semnalul analogic 32 de eşantioane într-un interval de 1 (una) milisecunde;

    Ø codificarea se face cu 14 biti / eşantion; Ø comprimarea informaţiei va reduce numărul de biţi la

    10 biţi / eşantion, fiecărui eşantion îi este adăugat câte un bit de paritate (P) pentru detectarea erorilor, deci fiecare eşantion va avea în total 11 biţi;

    Ø informaţia digitală este organizată în blocuri (cadre) de câte 32 eşantioane pentru fiecare cale A şi B a câte 11 biti / eşantion, corespunzător unui semnal de audiofrecvenţă cu durata de 1 ms. Rezultă un total de 704 biţi;

    Ø fiecărui bloc (cadru) de date îi sunt adăugaţi un număr de 24 biţi pentru sincronizare, control şi date suplimentare;

    Ø ordonarea biţilor într-o ordine diferită de cea temporală în vederea reducerii interferenţelor, erorilor şi a zgomotului.

    Potrivit celor prezentate un semnal de audiofrecvenţă cu două căi (stereo sau dual) pentru o durată de 1 (una) milisecundă va fi alcătuit din: 64 eşantioane x 11 biţi = 704 biţi la care se adaugă cei 24 biţi pentru sincronizare, control şi date. Rezultă astfel un total de 728 biţi pentru un cadru de date, de aici şi

    900

    1800 00

    2700

    10

    11 00

    01 Fig. 1.3 Variaţia relativă a fazei purtătoarei în funcţie de informaţia digitală în cazul

    modulaţiei DQPSK

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 7

    codificarea sistemului NICAM – 728. Structura blocului (cadrului) de date este reprezentată în figura 1.4.

    Cei 24 de biţi ataşaţi celor 704 biţi aparţinând semnalelor A şi B

    codificate, sunt grupaţi astfel: • 8 biţi pentru cuvântul de aliniere a cadrului, sunt notaţi FAW (Frame

    Alignement Word) şi asigură sincronizarea (alinierea) între frecvenţa biţilor de la emisie şi frecvenţa de lucru a sistemului de recepţie, prin stabilirea fazei iniţiale de repaus a purtătoarei de referinţă la recepţie;

    • 5 biţi care formează grupul biţilor de control. Fiecare din biţii C0 la C4 are o anumită semnificaţie în controlul transmisiei care poate fi monofonică, sterofonică sau duală;

    • 11 biţi care formează grupul biţilor de rezervă (auxiliari) şi care pot fi utilizaţi pentru transmisia de date suplimentare viitoare, rezervate şi nedefinite încă.

    În structura cadrului de date biţii corespunzători eşantioanelor celor două canale (semnale) A şi B sunt aranjaţi alternativ un eşantion din semnalul A următorul din semnalul B, fiecare având 10 biţi plus un bit de paritate (fig. 1.5).

    În vederea eliminării interferenţelor dintre datele corespunzătoare eşantioanelor semnalelor A şi B şi pentru reducerea zgomotului cei 704 biţi din fiecare cadru de date sunt supuşi unui proces de intercalare (amestecare/mapare). În urma procesului de intercalare structura cadrului de date digitale este organizat din cei 24 biţi de aliniere, control şi suplimentari urmaţi de 44 de grupe a câte 16 biţi fiecare, corespunzătoare celor 704 biţi de informaţie audio.

    Cadrul de date digitale obţinut în urma procesului de intercalare (amestec), reprezentat în figura 1.5, este aplicat modulatorului emiţătorului de radiofrecvenţă în vederea emisiei, procesul continuă prin formarea unui nou cadru de date.

    Sistemul audio digital NICAM – 728 se pretează a fi folosit împreună cu sistemul de transmisie TV codat MAC (Multiplexed Analogue Components) –

    24 biţi 704 biţi

    8 biţi 5 biţi 11 biţi 11 biţi

    FAW C AD A1 B1 A2 B2 A3 B3 A31 B31 A32 B32

    01001110 C0 …… C4

    AD0 …… AD10 X0 …….….. X9 P

    Fig. 1.4 Structura cadrului de date NICAM 728 obţinut în urma procesului de conversie analog digitală şi de codificare - comprimare

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 8

    sistem adoptat în Europa -, sistem care presupune un proces de multiplexare în timp a datelor video şi audio.

    Datele corespunzătoare informaţiei audio se transmit în intervalele de

    timp corespunzătoare semnalelor de stingere pe orizontală care au o durată de 12 µs şi care urmează fiecărei linii analogice cu durata de 52 µs din structura semnalului video complex de televiziune analogică.

    Sistemul audio digital NICAM – 728 permite şi transmisii digitale monofonice, situaţie în care procesul de prelucrare este similară celor prezentate anterior, cel de al doilea canal (canalul B) devine transparent sau este utilizat pentru transmisii de date digitale pentru alte domenii sau servicii.

    În regim dual (bilingv) al sistemului NICAM – 728 fiecare cadru de date este format folosind numai eşantioane provenite de la o singură sursă de semnal A sau B. Deci se vor transmite 64 eşantioane provenind de la o singură sursă de semnal ceea ce înseamnă că durata unei secvenţe (cadru sau bloc de date) va fi de 2 ms şi nu de 1 ms.

    4. Principii ale prelucrării sunetului în televiziunea digital

    Conversia analog-digitală a semnalelor audio foloseşte eşantionarea cu frecvenţa de 32 kHz, 44,1 kHz, 48 kHz, 96 kHz sau mai mult. Eşantionarea cu 48 kHz la o rezoluţie de 16 biţi asigură un debit al informaţiei de 786 kbit/s (fig. 1.6) pentru un canal audio, ceea ce înseamnă aprox. 1,5 Mbit/s pentru un semnal stereo sau dual (două canale audio).

    Obiectivul compresiei audio este acela de a reduce debitul informaţiei de la 1,5 Mbit/s coresăunzător unei transmisii stereofonoce sau duale la (100 – 400) kbit/s. Sistemul de compresie audio folosit în MPEG are la bază sistemul MUSICAM (Masking pattern Universal Sub-band Integrated Coding And Multiplexing) dezvoltat de IRT (Institut für Rundfunktechnik) şi Philips pentru DAB (Digital Audio Broadcasting). Evoluţia metodelor de compresie a semnalului audio este prezentată mai jos.

    8 biţi 5 biţi 11 biţi ALINIERE CONTROL ADIŢIONALI

    1 ........... 8 25, 69, 113, .................................... 641, 685 26, 70, 114, .................................... 642, 686 27, 71, 115, .................................... 643, 687 ....................................................................... ......................................................................... 68, 112, 156, 199, ................................... 728

    14 ................ 24

    9 ........ 13

    704 biţi de date intercalaţi şi grupaţi în 44 grupe de câte 16 biţi fiecare

    Fig. 1.5 Conţinutul cadrului de date pregătit pentru a modula purtătoarea de radiofrecvenţă

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 9

    Compresia MUSICAM se bazează pe principiile mascării psiho-acustice, principii care au la bază particularităţile de percepere a suntelor de către urechea umană. Sistemul MUSICAM modifică paşii de cuantizare (fE) în cadrul unor benzi înguste ale semnalului audio funcţie de gradul de intensitate al acestuia şi de frecvenţă. Urechea umană nu poate percepe sunetele aflate în vecinătatea unui sunet (puls) foarte puternic, practic acesta mascând sunetele din vecinătate, ceea ce face ca sunetele mascate să nu mai fie utile ca informaţie şi deci nici necesar a fi transmisie [2].

    a) Modelul psiho-acustic al urechii umane Sensibilitatea urechii umane este puternic dependentă de frecvenţa

    sunetelor pe care le percepe. Sunetele cu frecvenţa sub 20 Hz şi cu frecvenţa de peste 20 kHz nu sunt percepute şi ca urmare sistemul MUSICAM le va elimina prin filtrare.

    Maximul sensibilităţii audio al urechii umane este situat între 3 şi 4 kHz, iar în afara acestei game sensibilitatea scade atât către frecvenţele joase cât şi către frecvenţele înalte din domeniul audio. Pragul de audibilitate determinat experimental este prezentat în figura 1.7, caracteristica reprezentată poartă denumirea de curba Fletcher-Munsen. Caracteristica a fost determinată experimental prin măsurarea nivelului presiunii audio în funcţie de frecvenţa semnalului audio. Curba de audibilitate este reprezentată atât la scară liniară cât şi la scară logaritmică.

    Toate componentele audio al căror nivel se află sub pragul de audibilitate nu vor fi transmise, ele sunt irelevante pentru urechea umană.

    O caracteristică importantă a urechii umane care este exploatată în procesul de codare este caracteristică de mascare. Spre exemplu, dacă unei persoane i se aplică un semnal de test sinusoidal cu frecvenţa de 1 kHz şi amplitudine constantă însoţit de alte semnale cu frecvenţe apropiate şi

    768 kbit/s

    FTB 15-20000 Hz

    16 biti CAD

    768 kbit/s

    FTB 15-20000 Hz

    16 biti CAD

    Generator comandat pentru fE

    Fig.1.6 Conversia analog-digitală a semnalelor audio

    comandă eşantionare

    Canal L

    Canal R

    fE = 48 kHz

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 10

    amplitudini variabile se constată că celelalte componente cu frecvenţe diferite de frecvenţa de 1 kHz sunt percepute numai dacă amplitudinea acestora va depăşi un anumit nivel, nivel care diferă de la o zonă la alta de frecvenţă din domeniul audio (20 Hz – 20 kHz).

    f[kHz]

    a) reprezentare la scară liniară b) reprezentare la scară logaritmică

    Fig.1.7 Caracteristica de audibilitate a urechii umane (A) SPL - nivelul presiunii audio; B – curba de mascare;

    C – semnal de mascare; D – semnal mascat

    Totalitatea nivelurilor dispuse în jurul unui semnal de nivel ridicat sub care nu mai sunt percepute alte semnale audio determină curba de mascare (fig.1.7.b. litera B). Lărgimea curbei de mascare diferă în funcţie de domeniul de frecvenţă din plaja semnalelor audio, fiind mai largă în zona frecvenţelor înalte şi mai îngustă în zona frecvenţelor joase. Deci, forma pragurilor de mascare este dependentă de frecvenţă, la frecvenţele înalte având o formă mai largă.

    Componentele a căror frecvenţe sunt situate sub pragurile / caracteristica de mascare nu vor fi transmise.

    Principiile de bază în codarea semnalelor audio (MPEG Layer I, II) au la bază caracteristicile modelului psiho-acustic al urechii umane. Datorită fenomenului de mascare, un număr mare de componente audio nu vor fi transmise. Se impune separarea acestor componente în domeniul frecvenţă funcţie de amplitudinea acestora. Această separare este posibilă prin utilizarea transformatei Fourier rapidă FFT (Fast Fourier Transform).

    Simultan cu analizarea spectrală a semnalului audio se face şi o împărţire în subbenzi a acestuia în baza următoarelor considerente:

    • Măştile corespunzătoare curbelor de mascare diferă in funcţie de frecvenţă;

    • Se poate întâmpla ca o subbandă să fie complet mascată de componentele dintr-o altă subbandă;

    • Sensibilitatea urechii variază cu frecvenţa ceea ce face posibilă cuantizarea cu fineţe diferită astfel încât să se menţină zgomotul sub pragul audibil;

    f[kHz]

    SPL [dB]

    SPL[dB]

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 11

    • În cadrul fiecărei subbenzi se face analiza semnalelor pentru a vedea dacă acestea nu sunt armonici ale semnalelor din benzile inferioare. Numai semnalele care nu reprezintă armonici ale altor semnale ce se transmit vor fi complet suprimate dacă se află sub pragul de mascare. Numărul de subbenzi în care este împărţit domeniul audio (20 Hz la 20 kHz) este de 32, fiecare subbandă are o lărgime de 750 Hz.

    • Fiecare subandă este cuantizată separat, proces care este însoţit şi de eliminarea componentelor aflate sub pragul de audibilitate şi a componentelor aflate sub pragul de mascare.

    Codarea pe subbenzi este prezentată în schema bloc în figură 1.8, din care se observă că fiecare subbandă este cuantizată separat iar cuantizarea este controlată de blocurile FFT şi modelul psiho-acustic.

    Pentru MPEG Layer II, rezultatele FFT pentru 1024 de eşantioane sunt

    transferate blocului psiho-acustic la fiecare 24 ms care ia decizii asupra fineţii cuantizării sau a necuantizării pentru cele 32 de subbenzi. În codarea MPEG eşantioanele sunt grupate în cadre pentru fiecare subbandă, un cadru conţinând un anumit număr de eşantioane. Pentru Layer I un cadru este format din 12 eşantioane, iar pentru Layer II un cadru este format din 3x12 = 36 eşantioane.

    Pentru fiecare bloc de 12 eşantioane este determinată valoarea celui mai mare eşantion care se va considera factor de scală pentru reducerea redundanţei în transmisie. Factorul de scală fiind necesar la decodare va fi conţinut în fluxul elementar audio în header-ul pachetelor de date audio. b. Fluxul elementar Audio

    Fluxul elementar audio este rezultatul procesului de cuantizare MPEG Layer I sau Layer II a semnalelor audio. Eşantioanele de date audio sunt grupate

    Fig.1.8 Codarea pe subbenzi a semnalelor din domeniul audio (Q – circuite de cuantizare)

    Intrare semnal audio

    Semnal audio comprimat la

    (100-400)kbit/s

    FTB 1

    FTB 2

    FTB 32

    Q

    Q

    Q

    FFT 512 puncte pt. Layer I

    1024 puncte pt. Layer II

    Model psihoacustic

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 12

    în cadre pentru fiecare din cele 32 de subbenzi din domeniul audio. Fiecare cadru conţinând un anumit număr de eşantioane. În codarea MPEG Layer I un cadru este format din 12 eşantioane iar în cazul codării MPEG Layer II un cadru este format din 3x12 = 36 eşantioane. În cadrul transmisiei, pentru fiecare cadru de 12 eşantioane este determinată valoarea celui mai mare eşantion care se va considera factor de scală şi care va fi înscris în header-ul fluxului elementar audio pentru reducerea redundanţei în transmisie, factorul de scală fiind necesar la decodare.

    Ca şi în cazul fluxului elementar video, informaţia audio este precedată de un header care conţine informaţii referitoare la: Ø Sincronizare Ø Tipul Layer-lui (I sau II) Ø Frecvenţa de eşantionare Ø Modul transmisiei audio: mono, stereo, dual (două canale independente) Ø Preaccentuare

    c) Pachete elementare ale fluxului de date (PES) Header-ul este urmat de factorul de scală care este necesar a fi transmis

    datorită reducerii redundantei prin ponderarea la transmisie a valorilor eşantioanelor.

    În procesul de compresie a semnalului audio, informaţia referitoare la acesta este reprezentată de:

    • 384 de eşantioane grupate câte 12 eşantioane / subbanda x 32 subbenzi, pentru MPEG Layer I;

    • 1152 de eşantioane grupate câte 12 eşantioane x 3 grupe / subbanda x 32 subbenzi, pentru MPEG Layer II.

    În standardul MPEG toate fluxurile elementare sunt mai întâi împărţite în pachete de lungime variabilă numite pachete de fluxuri elementare PES (Packetized Elementary Streams). Pachetelor elementare video, care au iniţial dimensiunea maximă de 64 kbyte/s, le sunt adăugate câte un header. Alte detalii referitoare la prelucrarile digitale se vor prezenta in cursul 12.

    Rezumat

    Principiile si procesele privind prelucrarea sunetului in sistemul NICAM 728 reprezinta fundamentele pentru televiziunea digitala in ceea ce priveste sunetul.

    Aplicarea pricipiilor psiho-acustice ale urechii umane in procesele de prelucrare a sunetului, impartirea domeniului audio in 32 de subbenzi de frecventa de 750 kHz, aplicarea transformatei Fourier rapide (FFT) si apoi realizarea pachetelor de date numerice audio constituie esenta procesarii digitale a sunetului in sistemele actuale de televiziune si chiar a celor de radio digital.

  • PRELUCRAREA ȘI TRANSMITERA SUNETULUI ÎN TELEVIZIUNE

    Page 13

    Bibliografie

    [1] George Nicolae, Dan lozneanu, Televiziune. Analog si Digital. Editura Universităţii” Transilvania”, Braşov. 2009. ISBN 978-973-598-636-0, 227 pagini.

    [2] ISO/IEC 11172: Coding of moving pictures and associated audio for digital storage media at up about 1,5 Mbit/s. MPEG-1. 1993

    [3] Vlaicu, A., Televiziune alb-negru şi color. Editura Comprex, Cluj Napoca, 1993

    [4] Mitrofan, Gh.: Televiziunea de la videocameră la monitor. Editura Teora, 1996

    Intrebari: Scrieti varanta sau variantele corecte:

    Ras puns

    Test de autoevaluare

    1. Care sistem de sunet TV foloseste prelucrarea digitala: a) ZWEITON b) COFDM c) NICAM

    2. Care semnale din spectrul audio, potrivit caracteristicii psiho-acustice ala urechii umane sunt eliminate: a) aflate deasupra caracteristicii de audibilitate; b) aflate in interiorul caracteristicii de mascare; c) aflate sub pragul e audibilitate;

    3. Pentru digitizare, analiza spectrală a semnalului audio se face pe 32 de subbenzi avand o banda de frecventa de: a) 750 kHz; b) 800 kHz; c) 750 Hz;

    4. Rezultatul procesului de cuantizare MPEG Layer I sau Layer II a semnalelor audio este: a) fluxul elementar audio; b) fluxul digital video; c) flux de pachete digitale audio standard;

    5. Obiectivul compresiei audio in digital este acela de a reduce debitul informaţiei: a) de la 5,1 Mbit/s la (400 – 800) kbit/s; b) de la 1,5 Mbit/s la (100 – 400) kbit/s; c) de la 1000 kbit/s la (100 – 200) kbit/s.

    Răspuns corect: 1 – c; 2 – b si c; 3 – c; 4 – a; 5 – b;


Recommended