marcarea transparenta a datelor

Universitatea Politehnica Timişoara

Facultatea de Electronică şi Telecomunicaţii

Corina Naforniţă

Stadiul actual al tehnicilor de marcare transparentă a imaginilor

–Raport de cercetare din cadrul grantului CNCSIS, de tip TD, cod 47, număr 34702/24.06.2005–

Cuprins

Introducere .........................................................................................................................1

Domenii de aplicare a marcării transparente ...................................................................1 Condiţii impuse marcajului transparent ...........................................................................2 Alegerea marcajului .........................................................................................................4

1. Tehnici de marcare transparentă pe bază de corelaţie ..............................................51.1 Tehnici de bază în domeniul spaţial...........................................................................5 1.2 Extensii pentru integrarea logourilor sau mai multor biţi într-o imagine ..................7 1.3 Tehnici în domeniul transformatelor .......................................................................12 1.4 Metode adaptive de marcare transparentă bazate pe sistemul vizual uman.............18

2. Tehnici de marcare transparentă de tip spread spectrum.......................................21 2.1 Codare cu spectru împrăştiat a marcajului în domeniul DCT..................................22 2.2 Tehnici spread spectrum în domeniul wavelet.........................................................28

2.2.1 Transformarea Wavelet Discretă (DWT)......................................................28 2.2.2 Marcare transparentă în domeniul DWT ......................................................28

3. Îmbunătăţirea tehnicilor de marcare pe bază de corelaţie ......................................33 3.1 Îmbunătăţiri prin anticiparea atacurilor de tip compresie ........................................33 3.2 Anticiparea transformărilor geometrice...................................................................35

4. Alte tipuri de metode de marcare transparentă........................................................38 4.1 Modificarea celui mai puţin semnificativ bit (LSB) ................................................38 4.1 Metoda QIM.............................................................................................................38

5. Rezultate .......................................................................................................................39 5.1 Metode în domeniul spaţial......................................................................................39 5.2 Tehnici CDMA în domeniul spaţial.........................................................................44 5.3 Tehnici în domeniul DCT ........................................................................................45 5.4 Tehnici în domeniul wavelet....................................................................................48

Concluzii ...........................................................................................................................51 Bibliografie .......................................................................................................................52

Introducere Domenii de implementare a marcării transparente Deşi datele digitale au multe avantaje faţă de datele analogice, furnizorii de servicii sunt reţinuţi în oferirea serviciilor în formă digitală, deoarece se tem de multiplicarea şi răspândirea materialelor cu copyright. Proprietatea intelectuală a datelor înregistrate digital trebuie protejată din cauza unor posibile probleme de copyright. Lipsa sistemelor adecvate de protecţie pentru materialele cu copyright, a fost motivul pentru introducerea cu întârziere a sistemelor DVD (digital versatile disk). Mai multe companii media au refuzat iniţial să furnizeze materiale DVD, până când problema protecţiei împotriva copierii a fost adresată. Reprezentanţi din industria de electronică de consum şi din industria de cinema au fost de acord cu proiectarea dispozitivelor de înregistrare video digitale care respectă legislaţia. Pentru a asigura protecţia împotriva copierii şi protecţia copyright-ului pentru date audio-video digitale, s-au dezvoltat două tehnici complementare: criptarea şi marcarea transparentă. Sistemele de criptare pot fi folosite pentru a proteja datele digitale pe durata transmisiei, de la transmiţător la receptor [BB01]. După ce receptorul a recepţionat datele decriptate, datele sunt identice cu cele originale şi nu mai sunt protejate. Tehnicile de marcare transparentă pot complementa criptarea prin plasarea unui semnal secret, imperceptibil, adică a unui marcaj transparent, direct în datele originale în aşa fel ca aceasta să rămână prezent întotdeauna. Un aşa fel de marcaj poate fi folosit pentru următoarele scopuri [BN04]:

Protecţie copyright: pentru protejarea proprietăţii intelectuale, proprietarul datelor poate plasa un marcaj transparent, care să reprezinte informaţiile de copyright din datele sale. Acest marcaj poate dovedi că el e proprietarul datelor, dacă cineva a încălcat dreptul de autor.

Amprentare (fingerprinting): pentru a afla sursa copiilor ilegale, proprietarul poate folosi o tehnică de amprentare. În acest caz, proprietarul poate plasa marcaje transparente diferite în copii ale datelor ce sunt furnizate la clienţi diferiţi. Amprentarea poate fi comparată prin plasarea unui număr de serie în date, care se află în relaţie cu identitatea clientului. Acest lucru permite proprietarului să identifice clienţii care şi-au încălcat înţelegerile de licenţiere prin furnizarea datelor unui terţ.

Protecţie la copiere: informaţia stocată într-un marcaj transparent, poate controla direct dispozitivul de înregistrare digitală, în scopul protecţiei la copiat. În acest caz marcajul transparent reprezintă un bit de inhibare a copierii, şi detectoarele de marcaj din dispozitivul de înregistrare determină dacă datele oferite dispozitivului pot fi stocate sau nu.

Monitorizarea transmisiei: prin plasarea marcajului în publicitatea comercială, un sistem de monitorizare automată poate verifica dacă reclamele sunt transmise conform contractului. Nu numai publicitatea ci şi programe TV de valoare pot fi protejate prin monitorizarea transmisiei. Un sistem de supraveghere a transmisiei, poate verifica toate canalele transmise şi taxa postul TV conform constatărilor.

Autentificarea datelor: marcaje transparente fragile pot fi folosite pentru a verifica autenticitatea datelor. Un marcaj fragil indică dacă datele au fost modificate şi oferă informaţii de localizare asupra locului unde datele au fost modificate.

1

Tehnicile de marcare transparentă nu sunt folosite doar în scopul protecţiei, pot fi incluse şi alte aplicaţii:

Indexare: indexarea filmelor şi articolelor de ştiri, unde pot fi plasate semne şi comentarii care ar putea fi folosite de motoarele de căutare de pe Internet.

Siguranţa medicală: plasarea datelor şi numelui pacientului în imagini medicale poate fi o măsură de securitate folositoare

Ascunderea datelor: tehnici de marcare transparentă pot fi folosite pentru transmiterea mesajelor private, secrete. Deoarece diversele guverne restricţionează folosirea serviciilor de criptare, oamenii pot să-şi ascundă mesajele în alte date.

Condiţii impuse marcajului transparent Fiecare aplicaţie de marcare transparentă îşi are cerinţele ei specifice. De aceea, nu există un set anume de cerinţe, care să satisfacă toate tehnicile de marcare transparentă. Totuşi, pot fi date nişte cerinţe generale pentru majoritatea aplicaţiilor menţionate mai sus:

Transparenţă perceptuală: în majoritatea aplicaţiilor algoritmul de marcare transparentă, trebuie să plaseze marcajul transparent în aşa fel încât acesta să nu afecteze calitatea datelor gazdă. Un marcaj transparent este într-adevăr imperceptibil, dacă oamenii nu pot distinge datele originale de datele marcate transparent. Totuşi, chiar şi cea mai nesemnificativă modificare în datele gazdă poate deveni vizibilă atunci când datele originale sunt comparate direct cu datele marcate transparent. Din moment ce utilizatorii datelor marcate transparent, în mod normal, nu au acces la datele originale, nu pot efectua această comparaţie. De aceea poate fi suficient ca modificările din imaginea marcată transparent să treacă neobservate atât timp cât datele nu sunt comparate cu cele originale.

Încărcătura marcajului transparent: cantitatea de informaţie care poate fi stocată într-un marcaj transparent depinde de aplicaţie. În scopul protejării la copiere, încărcătura de un singur bit este de obicei suficientă. Pentru protejarea drepturilor proprietăţii intelectuale, pare rezonabil să presupunem că se doreşte plasarea unei cantităţi de informaţii similară cu cea folosită pentru ISBN, International Standard Book Numbering, (10 cifre) sau ISRC, International Standard Recording Code (12 litere alfanumerice). La toate astea, trebuie adăugat şi anul copyrightului, modificările permise asupra materialului, şi clasificarea acestor modificări. Aceasta înseamnă că aproximativ 60 de biţi de informaţie ar trebui să fie plasaţi în datele gazdă, imaginea, materialul video, sau fragmentul audio. Un alt concept important cu privire la încărcătura marcajului transparent pentru date audio-video digitale este granularitatea marcajului transparent. Fărâmiţarea marcajului transparent reprezintă cantitatea de informaţie necesară pentru plasarea unei unităţi de informaţie de marcaj. Folosind exemplul de mai sus, o unitate de informaţie de marcaj constă din 60 sau 70 de biţi. Aceştia ar putea fi plasaţi într-un singur cadru video, sau împrăştiaţi, de exemplu, asupra a 100 de cadre video.

Robusteţea: un marcaj transparent fragil care trebuie să demonstreze autenticitatea datelor gazdă, nu trebuie să fie robust împotriva tehnicilor de procesare sau alterărilor intenţionate asupra datelor gazdă, deoarece eşecul detecţiei marcajului transparent demonstrează că datele gazdă au fost modificate şi nu mai sunt autentice. Totuşi, dacă

2

un marcaj transparent este folosit pentru altă aplicaţie, este de dorit ca marcajul transparent să rămână întotdeauna în datele gazdă, chiar şi dacă calitatea datelor gazdă a fost degradată, intenţionat sau neintenţionat. Exemple pentru degradări neintenţionate sunt aplicaţii care implică transmisia sau stocarea de date, unde sunt aplicate tehnici de compresie cu pierderi asupra datelor pentru a reduce rata de biţi şi a creşte eficienţa. Alte tehnici de procesare care degradează calitatea datelor în mod neintenţionat, includ filtrarea, re-eşantionarea, conversia analog-digitală, şi digital-analogică. Pe de altă parte, marcajul transparent poate fi subiectul unor procesări cu intenţia de a-l elimina. Când există multe copii al aceluiaşi conţinut, cu marcaje transparente diferite, ca şi în cazul amprentării, este posibilă eliminarea marcajului transparent datorită coliziunii dintre mai multe copii diferite. În general, nu ar trebui să existe nici o cale prin care marcajul transparent să fie eliminat sau modificat, fără degradarea suficientă a calităţii perceptuale a datelor gazdă.

Securitate: securitatea tehnicilor de marcare transparentă poate fi interpretată în acelaşi mod ca şi securitatea tehnicilor de criptare. O tehnică de marcare transparentă este într-adevăr sigură, dacă cunoaşterea exactă a algoritmului de plasare şi extragere a marcajului transparent, nu ajută o persoană neautorizată în detectarea prezenţei marcajului şi eliminarea ei.

Marcare publică contra marcare privată („oblivious/blind versus nonoblivious/non-blind”): în unele aplicaţii, ca protecţia copyright şi monitorizarea datelor, algoritmii de extragere a datelor pot folosi imaginea originală nemarcată pentru a găsi marcajul transparent. Acest procedeu este numit marcare transparentă privată („nonoblivious watermarking”). În majoritatea aplicaţiilor, cum ar fi protecţia la copiere şi indexarea, algoritmii de extragere a marcajului transparent nu au acces la imaginea originală, nemarcată. Acest lucru îngreunează extragerea marcajului transparent. Algoritmii de marcare transparentă de acest fel sunt publici („oblivious”).

Cerinţele de mai sus sunt toate legate una de alta. De exemplu, poate fi obţinut un marcaj transparent foarte robust prin efectuarea multor modificări mari asupra datelor gazdă, pentru fiecare bit al marcajului transparent. Totuşi, modificările mari în datele gazdă sunt observabile, şi multe modificări la bit de marcaj, vor limita cantitatea maximă de biţi ai marcajului transparent care pot fi stocaţi în obiectul gazdă. Deci, trebuie considerat un compromis între diferitele cerinţe, astfel putând fi dezvoltat un marcaj transparent optim pentru fiecare aplicaţie. Dependenţele mutuale dintre cerinţele de bază sunt arătate în figura 1.

Relaţia dintre cerinţele de bază pentru un marcaj transparent sigur, bine proiectat sunt prezentate în figura 2. Axa de impact perceptual reprezintă degradarea calităţii datelor din cauza marcării transparente. Cu cât este mai mare impactul perceptual, cu atât este mai gravă degradarea calităţii. Axa încărcăturii reprezintă cantitatea de date care poate fi plasată în date. Axa robusteţii reprezintă capacitatea sistemului de marcare transparentă de a rezista la atacuri. Securitatea unui marcaj transparent influenţează enorm robusteţea. Dacă un marcaj transparent nu este sigur, nu poate fi foarte robust.

3

Fig. 1 – Dependenţele mutuale dintre cerinţele de bază

Fig. 2 – Relaţia dintre cerinţele de bază pentru un marcaj transparent sigur

Alegerea marcajului Prima întrebare care se pune în legătură cu un sistem de marcare transparentă sau unul steganografic este ce formă va lua mesajul ce va fi integrat. Cea mai simplă metodă ar fi de a integra un text într-o imagine, permiţând imaginii să fie purtătorul direct al unor informaţii ca autor, titlu, dată, ş.a.m.d. Dezavantajul acestei abordări este însă că textul ASCII se poate considera într-un fel ca fiind o compresie LZW, în care fiecare literă este reprezentată de un anumit şablon de biţi. Prin compresia marcajului înainte de integrare, robusteţea are de suferit. Având în vedere natura codului ASCII, o eroare de un singur bit, în urma unui atac, poate schimba înţelesul acelui caracter, şi prin urmare şi a mesajului. Ar fi simplu chiar şi pentru o simplă compresie JPEG ca să reducă textul de copyright la o colecţie aleatoare de caractere. De aceea informaţia se poate integra, în loc de caractere, într-o formă deja foarte redundantă ca o imagine.

Fig. 3 – Marcaj original, respectiv marcaj extras, cu 25% Zgomot Gaussian Aditiv

Este de menţionat faptul că în ciuda numărului mai mare de erori apărute la recuperarea marcajului, marcajul este încă de recunoscut.

4

1. Tehnici de marcare transparentă pe bază de corelaţie

1.1 Tehnici de bază în domeniul spaţial Cea mai simplă metodă de a plasa un marcaj într-o imagine, este adăugarea unui zgomot pseudo-aleator la valorile de luminozitate a punctelor de imagine (pixel). În general zgomotul pseudo-aleator constă din numerele întregi {-1,0,1}. El e generat pe baza unei chei. Singurele constrângeri sunt că energia lui este mai mult sau mai puţin uniform distribuită şi că nu este corelat cu conţinutul imaginii gazdă. Pentru a crea imaginea marcată Iw(x,y), modelul pseudo-aleator W(x,y) este multiplicat cu un factor mic de câştig k şi apoi adunat la imaginea gazdă I(x,y), ca în figura 1.1.

Figura 1.1 – Procedura de plasare a marcajului

( ) ( ) ( )yxWkyxIyxIw ,,, ⋅+= (1.1)

Pentru a detecta un marcaj într-o imagine posibil marcată Iw’(x,y), se calculează corelaţia

dintre imaginea Iw’(x,y) şi zgomotul pseudo-aleator W(x,y). În general, W(x,y) este

normalizat la o medie de zero înainte de corelaţie. Modelele pseudo-aleatoare generate folosind diferite chei au o corelaţie foarte mică între ele. De aceea, pe durata procesului de detecţie, valoarea corelaţiei va fi foarte mare pentru un model pseudo-aleator generat cu cheia corectă, şi va fi foarte mică în caz contrar. Acest lucru este arătat în figura 1.2.

Figura 1.2 – Valorile corelaţiei pentru un model pseudo-aleator generat cu cheia

(„seed”)=10 corelat cu modelul pseudo-aleator generat cu alte chei („seed” )

5

Aici imaginea Lena a fost marcată prin adăugarea unui zgomot pseudo-aleator la imagine, generat cu cheia=10 (seed=10). Figura 1.2 arată valorile de corelaţie, pentru un model pseudo-aleator generat folosind chei care variază între 0 şi 15, cu imaginea marcată. Se poate vedea că corelaţia este foarte mare când se foloseşte cheia corectă (10), iar când se folosesc alte chei corelaţia este foarte mică. Pe durata procesului de detecţie, se alege de obicei un prag T pentru a decide dacă marcajul este detectat sau nu. Dacă corelaţia depăşeşte un anumit prag T, detectorul de marcaj determină că imaginea Iw

’(x,y) conţine marcajul W(x,y)

),(detectat estenu

detectat),(),(),('

yxWT

yxWTR yxWyxIW

→<

→> (1.2)

Dacă W(x,y) este alcătuit doar din numerele întregi {-1,1}, şi dacă numărul „-1”-rilor este egal cu numărul de „1”-uri, corelaţia se poate estima ca fiind

[ ] [ ]{ }∑ ∑ ∑= =

−+

=

−+ −=+==N

i

N

iWW

N

iiWiWiWyxWyxI yxIyxIWI

NWI

NyxWyxI

NR

iiiW1

2/

1

''2/

1

'''),(),( ),(),(

2111),(),(1

' µµ (1.3)

Aici N este numărul punctelor de imagine din imaginea IW

’ , şi +,- indică setul de puncte unde zgomotul corespunzător este pozitiv sau negativ, şi µ[IW

’+(x,y)] reprezintă valoarea medie a setului de puncte în IW

’+(x,y). Din relaţia (1.3) rezultă că problema detecţiei marcajului corespunde cu testarea ipotezei dacă două seturi de puncte de imagine alese aleator dintr-o imagine marcată au aceeaşi medie. Pe durata procesului de detecţie, detectorul de marcaj poate comite două tipuri de erori. În primul rând, poate detecta existenţa marcajului, deşi acesta nu există. Acest lucru este numit fals pozitiv. A doua eroare posibilă este respingerea existenţei marcajului de către detector, deşi marcajul este prezent. Acest lucru este numit fals negativ. Funcţia densităţii de probabilitate pentru procesul de detecţie este prezentat în figura 1.3.

Figura 1.3 – Procedura de detecţie a marcajului

Probabilităţile acestor două tipuri de erori rezultă pe baza modelului autoregresiv de ordin întâi a imaginii [LSL00]:

6

⎟⎟⎠

⎞⎜⎜⎝

⎛=

221

1σσWfp

NTerfcP şi

( )⎟⎟⎠

⎞⎜⎜⎝

⎛ −=

221

1

2

σσσ

W

Wfn

NTerfcP (1.4)

Unde dtecerfcx

t∫∞

−⋅= 2/2

21)(π

Aici Pfp reprezintă probabilitatea de fals pozitiv, iar Pfn reprezintă probabilitatea de fals negativ, σW

2 reprezintă varianţa pixelilor marcajului şi σ12 denumeşte varianţa pixelilor

din imagine. Dacă marcajul W(x,y) constă doar din numerele întregi {-1,1}, şi numărul „-1”-lor este egal cu numărul „1”-lor, varianţa marcajului, σW

2 , este egal cu k2. Erorile Pfp şi Pfn pot fi minimizate crescând factorul de câştig k. Totuşi, folosind valori mai mari pentru factorul de câştig, scade calitatea vizuală a imaginii marcate. Întrucât conţinutul imaginii poate interfera cu marcajul, în special în componentele de frecvenţă joasă, fiabilitatea detectorului poate fi îmbunătăţită prin aplicarea filtrării potrivite înainte de corelaţie [DKL98, STO94]. Acest lucru scade contribuţia imaginii originale la corelaţie. De exemplu, poate fi folosit, un simplu filtru, cu răspuns finit la impuls (FIR), de intensificare a marginilor, Fedge

2/1111101111

⎥⎥⎥

⎦

⎤

⎢⎢⎢

⎣

⎡

−−−−−−−−

=edgeF (1.5)

Rezultatele experimentale arată că aplicarea acestui filtru înainte de corelaţie, reduce semnificativ probabilitatea de eroare, chiar dacă calitatea vizuală a imaginii marcate a fost afectat serios înainte de corelaţie [HLR00], [LLL97]. În [LR00] este propusă o altă metodă pentru creşterea robusteţii marcajului, şi anume egalizarea spectrală înaintea plasării marcajului. 1.2 Extensii pentru integrarea logourilor sau mai multor biţi într-o imagine Din punctul de vedere al detectorului marcajului, o imagine I poate fi privită ca un zgomot Gaussian, care distorsionează informaţia de marcaj W. Mai departe, imaginea marcată IW poate fi privită ca ieşirea unui canal de comunicaţie afectat de zgomot Gaussian, prin care se transmite informaţia de marcaj. În acest caz, transmisia sigură a marcajului este teoretic posibilă, dacă rata de informaţie a marcajului nu depăşeşte capacitatea canalului, care este dată în [SW49]:

pixelbitWC Wb /1log 2

1

2

2 ⎟⎟⎠

⎞⎜⎜⎝

⎛+=σσ (1.6)

7

Aici C este dată în biţi (ai informaţiei de marcaj) per pixel de imagine, şi lăţimea de bandă disponibilă Wb egală cu un Hertz per pixel. Pentru sistemele reale, totuşi, poate fi determinată empiric o limită mai redusă:

pixelbitWC Wb /1log 2

1

2

2 ⎟⎟⎠

⎞⎜⎜⎝

⎛⋅

+=σα

σ (1.7)

Aici, α este un factor de scală („headroom”), care este mai mare decât unu şi tipic,

în jurul valorii de trei. Deoarece raportul semnal/zgomot σW2/ σ1

2 e mult mai mic decât unu, relaţia de mai sus poate fi aproximată cu :

pixelbitC W /2ln

121

2

⎟⎟⎠

⎞⎜⎜⎝

⎛⋅

≈σα

σ (1.8)

Conform relaţiei de mai sus, e posibilă introducerea a mai mult de 1 bit de

informaţie într-o imagine. De exemplu, un marcaj alcătuit din numerele întregi {-k,k}, adăugat la imaginea Lena de 512x512 pixeli, poate avea aproximativ 50, 200 sau 500 de biţi de informaţie pentru k=1,2,3 şi α=3.

Cea mai simplă metodă de a plasa un şir de l biţi de marcaj b0b1...bl-1 într-o imagine este împărţirea imaginii I în l subimagini I0I1...Il-1 , şi adăugarea unui marcaj la fiecare subimagine, unde fiecare marcaj reprezintă un bit al şirului [LLL97], [SC96], [HLR00]. Acest procedeu este descris în figura 1.4.

Figura 1.4 – Procedura de plasare a şirului biţilor de marcaj

Folosind relaţia (1.8) se pot calcula numărul de pixeli P necesari per subimagine

pentru detecţia sigură a unui singur bit într-o subimagine

pixeliPW2

21 2lnσ

ασ≈ (1.9)

Biţii de marcaj pot fi reprezentaţi în mai multe moduri. Dacă bitul de marcaj e 1 se adaugă o secvenţă pseudo-aleatoare, iar dacă e 0 subimaginea se lasă neatinsă. În acest caz detectorul calculează corelaţia dintre subimagine şi secvenţa pseudo-aleatoare şi atribuie valoarea 1 bitului de marcaj, când corelaţia depăşeşte un anumit prag T, în caz

8

contrar bitul de marcaj se consideră zero. Folosirea unui prag, poate fi ocolită prin adăugarea a două secvenţe pseudo-aleatoare diferite, RP0 şi RP1, pentru biţii de marcaj 0 şi 1. În acest caz detectorul calculează corelaţia dintre subimagine şi cele două modele. Bitului de marcaj i se asignează valoarea asociată secvenţei care generează corelaţia maximă. Cele două secvenţe pseudo-aleatoare pot fi alese astfel încât ca ele să difere doar prin semn, RP0=-RP1 ca şi în [SC96]. În acest caz, detectorul trebuie să calculeze doar o corelaţie dintre subimagine şi una dintre secvenţe; semnul corelaţiei determină valoarea bitului de marcaj.

Pentru a cerceta efectul prefiltrului din detector, a factorului de câştig k şi a numărului de pixeli P la bit de marcaj, asupra robusteţii marcajului se fac următoarele verificări. Prima oară se plasează un marcaj într-o imagine prin metoda propusă în [SC96]. Următorul pas este comprimarea imaginii marcate cu algoritmul JPEG [PM93], unde factorul de calitate QJPEG al algoritmului de compresie este variabil. În final, marcajul este extras din imaginea decomprimată şi comparat bit cu bit cu biţii de marcaj integraţi original. Din acest experiment, se determină procentul de biţi de marcaj eroronaţi datorită compresiei JPEG, ca o funcţie de factorul de calitate JPEG.

Primul experiment arată efectul prefiltrului dat de relaţia (1.5) înaintea detecţiei marcajului introdus cu un factor de câştig k=2, şi P=32x32 pixeli per bit de marcaj. În figura 1.5 sunt prezentate procentajele erorilor de bit cauzate de compresia JPEG, pentru un detector care foloseşte acest prefiltru, şi pentru un detector simplu. Se poate observa clar că prefiltrarea creşte semnificativ robusteţea marcajului.

Figura 1.5 – Detecţia marcajului cu şi fără prefiltrare

Al doilea experiment arată efectul creşterii factorului de câştig k pentru un marcaj

introdus cu P=32x32 pixel per bit de marcaj, şi detectat folosind un prefiltru. Din figura 1.6 reiese că robusteţea marcajului poate fi îmbunătăţită semnificativ prin creşterea factorului de câştig.

9

Figura 1.6 – Influenţa factorului de câştig k asupra robusteţii marcajului

Al treilea experiment arată influenţa numărului de pixeli P per bit de marcaj asupra robusteţii unui marcaj introdus cu un factor de câştig k=2, şi detectat folosind un prefiltru. Din figura 1.7 reiese că scăzând încărcătura marcajului prin creşterea lui P, se îmbunătăţeşte robusteţea semnificativ.

Figura 1.7 – Influenţa numărului de pixeli per bit de marcaj P asupra

robusteţii marcajului

Altă modalitate de a creşte încărcătura marcajului de bază, este folosirea tehnicilor DS-CDMA prezentat în [RP98a,b]. Aici pentru fiecare bit bj din şirul biţilor de marcaj b0,b1...bl-1 este generată o secvenţă pseudo-aleatoare diferită, stohastic independentă, RPi , care are aceeaşi dimensiune ca imaginea. Acest model este independent de valoarea bitului bj. Aici se foloseşte modelul +RPi dacă bj reprezintă un 0 şi -RPi dacă bj reprezintă un 1. Suma tuturor l secvenţe aleatoare ±RPi formează marcajul. Înaintea adăugării marcajului la imagine, se poate scala marcajul cu un factor sau limita la un anumit domeniu. Un exemplu pentru generarea unui marcaj unidimensional este prezentat în figura 1.8. Acest exemplu foloseşte şapte secvenţe pseudo-aleatoare diferite pentru plasarea celor şapte biţi de marcaj 0011010.

10

Figura 1.8 – Exemplu pentru generarea unui marcaj CDMA pentru 7 biţi

b0,b1...bl

Fiecare bit bj din şirul biţilor de marcaj b0,b1...bl-1 poate fi extras prin calcularea

corelaţiei dintre imaginea normalizată IW’ şi secvenţa pseudo-aleatoare corespunzătoare

RPi. Dacă corelaţia este pozitivă, atunci valoarea 0 este repartizată bitului de marcaj, în caz contrar bitul de marcaj este presupus că este 1. Figura 1.9 arată ca exemplu extragerea biţilor de marcaj plasaţi în figura 1.8.

Figura 1.9 – Exemplu pentru extragerea marcajului CDMA

Metodele pentru creşterea încărcăturii marcajului descrise mai sus, şi anume,

folosirea de porţiuni de imagine individuale pentru fiecare bit de marcaj şi folosirea CDMA, au avantajele şi dezavantajele lor. Dacă fiecare bit de marcaj are propria porţiune de imagine, nu există interferenţă între biţi, şi doar un număr mic de multiplicări este necesar pentru calcularea corelaţiei. Totuşi, dacă se decupează o porţiune de imagine, biţii de marcaj de la margine se pierd. Dacă se foloseşte tehnica CDMA, probabilitatea ca toţi biţii să fie recuperaţi după decuparea imaginii, este mare. Totuşi, biţii de marcaj pot interfera între ei, şi este necesară efectuarea multor multiplicări pentru calcularea corelaţiilor, deoarece fiecare bit este complet împrăştiat pe suprafaţa imaginii.

Biţii de marcaj plasaţi folosind metodele menţionate mai sus, pot reprezenta orice: mesaje copyright, numere de serie, text simplu, semnale de control, etc. Conţinutul reprezentat de aceşti biţi poate fi comprimat, criptat, şi protejat prin coduri corectoare de erori. În unele cazuri poate fi utilă plasarea unui logo ca marcaj în locul unui şir de biţi. Dacă imaginea marcată este distorsionată, logoul va fi afectat şi el. Acum însă, pot fi exploatate capacităţile de recunoaştere de modele a sistemului vizual uman (human visual system - HVS), pentru detectarea logoului [Brau97], [HW96], [VP96]. De exemplu, se poate plasa un logo de marcaj binar de 128x32 de pixeli într-o imagine de 512x512 pixeli folosind tehnicile descrise. Fiecare pixel din logo este plasat într-o porţiune de imagine de 8x8 pixeli prin adăugarea modelului pseudo-aleator +RP sau –RP la porţiunea de imagine, pentru un pixel alb sau respectiv negru din logo. Ca un exemplu în figura 1.10

11

sunt arătate rezultatele logourilor extrase după ce imaginea marcată a fost degradată cu ajutorul algoritmului de compresie cu pierderi JPEG, folosind diferiţi factori de calitate. Se poate observa că, deşi puternic distorsionate, logourile încă se pot recunoaşte.

Figura 1.10 – Logouri de marcaj extrase dintr-o imagine distrosionată de

compresie JPEG

1.3 Tehnici în domeniul transformatelor Tehnicile descrise anterior pot fi aplicate şi in domeniul unor transformate ale

imaginii. Fiecare domeniu de transformare are avantajul şi dezavantajul lui. În [RDB96], este folosită faza transformării Fourier discrete (DFT) pentru plasarea marcajului, pentru că faza este mai importantă decât amplitudinea valorilor DFT pentru inteligibilitatea imaginii. Plasarea marcajului în cele mai importante componente ale imaginii, îmbunătăţeşte robusteţea marcajului, deoarece modificarea acestor componente importante de imagine cu scopul eliminării marcajului, va degrada calitatea imaginii. Al doilea motiv pentru folosirea fazei valorilor DFT este că modulaţia de fază prezintă imunitate superioară la zgomot în comparaţie cu modulaţia de amplitudine.

Multe tehnici de marcare folosesc modulaţia de amplitudine în DFT, din cauza proprietăţii de invarianţă la translaţii sau deplasări. Deoarece translaţia ciclică a imaginii în domeniul spaţial nu afectează amplitudinile coeficienţilor DFT, marcarea plasată în acest domeniu va fi invariantă la translaţii. În cazul folosirii unui marcaj CDMA, metoda poate fi rezistentă la decupare. În continuare, marcajul poate fi plasat direct în cele mai importante frecvenţe medii, deoarece modulaţia coeficienţilor de cea mai joasă frecvenţă rezultă în artefacte vizibile, în timp ce coeficienţii frecvenţelor înalte sunt foarte vulnerabili la zgomot, filtrare şi compresie cu pierderi. În final marcajul poate fi făcut dependent de conţinutul imaginii, prin modularea coeficienţilor de amplitudine DFT |I(u,v)| în modul următor [CKLS95]:

|IW(u,v)|=|I(u,v)|.(1+k.W(u,v)) (1.10)

Aici, W(u,v) reprezintă un marcaj CDMA, un model pseudo-aleator

bidimensional (2D), şi k reprezintă factorul de câştig. Modificarea coeficienţilor DFT nu este fixă, ci proporţională cu amplitudinea coeficienţilor DFT. Coeficienţii DFT mici sunt foarte puţin afectaţi, în timp ce coeficienţii DFT mai mari sunt modificaţi în măsură mai mare. Acest lucru este în conformitate cu legea lui Weber [Jai81]. Sistemul vizual uman (HVS) nu percepe modificările egale în imagini egale, dar sensibilitatea vizuală este

12

aproape constantă în privinţa schimbărilor relative dintr-o imagine. Dacă ∆I este o diferenţă uşor vizibilă, atunci ∆I/I=constantă. Rescrierea relaţiei (1.10) dă:

constant),(),(),(

),(),(),(

≅⋅=∆

=−

vuWkvuIvuI

vuIvuIvuI W (1.11)

Deoarece în acest caz marcajul este plasat în mare măsură în coeficienţii DFT mai

mari, adică, în componentele cele mai semnificative ale imaginii din punct de vedere perceptual, robusteţea marcajului este îmbunătăţită.

Este de menţionat că simetria coeficienţilor Fourier trebuie păstrată pentru a asigura ca datele de imagine să fie de valoare reală după transformarea inversă la domeniul spaţial. Dacă coeficientul |I(u,v)| într-o imagine cu NxM pixeli este modificat conform relaţiei (1.10), corespondentul lui, |I(N-u,M-v)|, trebuie modificat şi el în acelaşi mod. În figura 1.12(b) este dat un exemplu pentru o imagine în care marcajul este plasat folosind toţi coeficienţii de amplitudine DFT în conformitate cu relaţia (1.10), şi folosind un factor de câştig k relativ mic. Figura 1.12(c) prezintă diferenţa puternic amplificată dintre imaginea originală şi cea marcată. Figura 1.12(d) arată o imagine marcată, folosindu-se o valoare mare pentru factorul de câştig k.

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

49 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

Figura 1.11 - Valori de cuantizare folosite în schema de compresie JPEG

13

Figura 1.12 – Marcaj de amplitudine Fourier (a) Imaginea originală, (b)

Imaginea marcată, (c) Diferenţa W(x,y)=I-IW , scalată pentru a fi vizibilă, şi (d) Imagine puternic marcată

Alt domeniu folosit frecvent pentru plasarea marcajului este domeniul

transformării cosinus discrete (DCT). Folosind DCT, o imagine poate fi împărţită cu uşurinţă în benzi de pseudo-frecvenţă, în aşa fel încât marcajul să poată fi plasat convenabil în cele mai importante frecvenţe medii. Pe deasupra, sensibilitatea sistemului vizual uman (HVS) la imaginile de bază DCT, a fost intens studiată, rezultând tabelul de cuantizare JPEG (figura 1.11) [PM93]. Aceste rezultate pot fi folosite pentru predicţia şi minimizarea impactului vizual al distorsiunilor cauzate de marcaj. În final, DCT pe bază de blocuri, este folosit pe scară largă pentru compresia imaginilor şi materialelor video. Prin plasarea marcajului în acelaşi domeniu ca al schemei de compresie folosită pentru procesarea imaginii (în acest caz domeniul DCT), se poate anticipa compresia cu pierderi, pentru că se pot anticipa coeficienţii DCT care vor fi eliminaţi de către algoritmul de compresie. Pe deasupra, se poate exploata descompunerea DCT pentru a crea aplicaţii de marcare în timp real.

În figura 1.13(a) este dat un exemplu pentru o imagine în care este plasat un marcaj CDMA bidimensional, W, în frecvenţele medii a blocurilor DCT de 8x8. Coeficienţii DCT de 8x8, F(u,v), sunt modulaţi conform:

14

⎪⎩

⎪⎨⎧

∉

∈⋅+=

Myx

MyxyxW FvuvuI

FvuvuWkvuIvuI

yx ,),,(

,),,(),(),(

,

,,

, (1.12)

x,y=1,8,16...

Aici FM înseamnă frecvenţele medii, k factorul de câştig, (x,y) locaţia spaţială a unui bloc 8x8 de pixeli în imaginea I, şi (u,v) coeficientul DCT în blocul DCT de 8x8 corespunzător (figura 1.14).

În figura 1.13(c) este prezentată diferenţa puternic amplificată dintre imaginea originală şi imaginea marcată. Figura 1.13(d) arată spectrul Fourier al marcajului. Aici se poate vedea clar că marcajul afectează doar frecvenţele medii (regiuni albe), lăsând componentele de frecvenţă joasă şi înaltă relativ neafectate (regiuni întunecate).

Figura 1.13 – Un marcaj DCT de 8x8, de bandă medie, independent de

conţinutul imaginii. (a) Imaginea marcată, (b) Imaginea puternic marcată, (c) Diferenţa W(x,y)=I(x,y)-IW(x,y), şi (d) Spectrul Fourier W(u,v)

Figura 1.14 – Definirea frecvenţelor de bandă medie într-un bloc DCT

15

Marcajul poate fi făcut dependent de imagine prin schimbarea funcţiei de modulaţie cu:

⎪⎩

⎪⎨⎧

∉

∈⋅+=

Myx

MyxyxW FvuvuI

FvuvuWkvuIvuI

yx ,),,(

,)),,(1)(,(),(

,

,,

, (1.13)

x,y=1,8,16…

Dacă este aplicată această funcţie de modulaţie, rezultatele din figura 1.12 se vor schimba în rezultatele prezentate în figura 1.15. Din figura 1.15(b) şi (c) reiese că majoritatea distorsiunilor introduse de marcaj sunt localizate în jurul marginilor şi în porţiunile cu „textură”.

Figura 1.15 - Un marcaj DCT de 8x8, de bandă medie, dependent de

conţinutul imaginii. (a) Imaginea marcată, (b) Imaginea puternic marcată, (c) Diferenţa W(x,y)=I(x,y)-IW(x,y), şi (d) Spectrul Fourier W(u,v)

Îmbunătăţiri suplimentare pentru performanţele sistemelor de marcare în

domeniul DCT, pe bază de corelaţie, pot fi obţinute prin folosirea detectoarelor de marcaj pe baza modelelor Gaussiene generalizate, şi nu pur Gaussiene [HAPG00].

Dacă tehnicile de marcare pot exploata caracteristicile sistemului vizual uman (HVS), este posibilă ascunderea marcajelor într-o imagine cu mai multă energie, lucru care creşte robusteţea marcajelor. Din acest punct de vedere transformarea wavelet discretă (DWT) este foarte atractivă, deoarece este mai eficientă din punctul de vedere al calculelor. Se pare că ochiul uman este mai puţin sensibil la zgomot în benzile DWT de rezoluţie înaltă şi în benzile DWT cu orientare de 45o (banda HH). Pe deasupra, codarea DWT a imaginilor şi a materialelor video, cum ar fi codarea EZW (embedded zero-tree wavelet), va fi inclus în standardele viitoare de compresie video şi de imagine, cum ar fi JPEG2000. Prin plasarea marcajului în acelaşi domeniu (domeniul DWT) se poate

16

anticipa compresia EZW cu pierderi, deoarece se pot anticipa care benzi DWT vor fi afectate de schema de compresie. Mai departe, se poate exploata descompunerea DWT pentru a crea aplicaţii de marcare în timp real.

În figura 1.17(a) este dat un exemplu pentru o imagine în care este plasat un marcaj CDMA bidimensional, W, în benzile DWT: LH1, HH1, şi HL1, folosind un factor de câştig k mare. Coeficienţii DWT din cele trei benzi DWT sunt modulaţi folosind:

),(),(),( vuWkvuIvuIW ⋅+= (1.14)

Figura 1.17(b) arată diferenţa puternic amplificată, dintre imaginea originală şi

cea marcată. Marcajul DWT poate fi făcut dependent de imagine prin modularea coeficienţilor

DWT în fiecare dintre cele trei benzi DWT conform ecuaţiei de mai jos:

)),(1)(,(),( vuWkvuIvuIW ⋅+= (1.15)

În figura 1.18(a) este dat un exemplu pentru o imagine în care este plasat acelaşi marcaj CDMA, W, în benzile DWT: LH1, HH1, şi HL1 , conform relaţiei (1.15) cu un factor de câştig k mare.

Figura 1.16 – Marcaj DWT independent de conţinutul imaginii. (a) Imagine

puternic marcată, şi (b) Diferenţa W(x,y)=I(x,y)-IW(x,y)

Figura 1.17 – Marcaj DWT dependent de conţinutul imaginii. (a) Imagine

puternic marcată, şi (b) Diferenţa W(x,y)=I(x,y)-IW(x,y)

17

1.4 Metode adaptive de marcare transparentă bazate pe sistemul vizual uman

Robusteţea marcajului poate fi îmbunătăţită prin creşterea energiei marcajului. Totuşi, creşterea energiei conduce la degradarea calităţii imaginii. Prin exploatarea proprietăţilor sistemului vizual uman, energia poate fi crescută local în locurile unde marcajul nu este remarcat de ochiul uman. Deci, prin exploatarea sistemului vizual uman, se pot plasa marcaje invizibile perceptual, care au energie mai mare ca în cazul distribuţiei uniforme a acestei energii asupra imaginii. Pentru ca un semnal vizual să fie perceput, trebuie să aibă o cantitate minimă de contrast, care depinde de luminozitatea şi frecvenţa medie. Pe deasupra, un semnal de anumită frecvenţă poate masca un semnal perturbator de frecvenţă similară [Wan95], [BBCP98]. Efectul de mascare este deja folosit în marcajul DCT dependent de imagine, descris anterior, unde coeficienţii DCT sunt modulaţi cu ajutorul formulei (1.13). Aici, la fiecare sinusoidă din imagine (semnal de mascare), este adăugată o altă sinusoidă (marcajul), având amplitudinea proporţională cu semnalul de mascare. Dacă factorul de câştig k este ales corespunzător, se produce mascarea de frecvenţă. Sistemul vizual uman este mai puţin sensibil la schimbări în regiunile cu luminozitate mare. Acest lucru poate fi exploatat prin alegerea factorului de câştig a marcajului dependent de luminozitate. Deoarece ochiul uman este cel mai puţin sensibil la canalul albastru, un marcaj perceptual invizibil, plasat în canalul albastru, poate conţine mai multă energie ca un marcaj perceptual invizibil plasat în canalul de luminozitate a unei imagini color [KJB97]. În jurul marginilor şi porţiunilor cu „texturi” a unei imagini, sistemul vizual uman este mai puţin sensibil la distorsiuni, decât în porţiunile netede. Acest efect se numeşte mascare spaţială, şi poate fi folosit pentru marcare, prin creşterea locală a energiei marcajului în aceste porţiuni mascate ale imaginii [MQ95]. Tehnicile de bază pentru marcarea spaţială descrise anterior, pot fi extinse prin mascare spaţială, de exemplu, folosind următoarea funcţie de modulaţie:

),(),(),(),( yxWkyxMskyxIyxIW ⋅⋅+= (1.16)

Aici, W(x,y) reprezintă marcajul pseudo-aleator bidimensional, k reprezintă factorul de câştig fix, şi Msk(x,y) reprezintă imaginea mască. Valorile măştii se întind de la 0 la k’max şi dau o măsură a insensibilităţii la distorsiuni pentru fiecare punct corespunzător în imaginea originală I(x,y). O metodă de a genera imaginea mască Msk, este filtrarea imaginii originale cu un filtru trece-sus Laplacian, şi luarea valorilor absolute a imaginii filtrate rezultate [KDHM99]. În figura 1.18(a) este arătată o mască pentru imaginea Lena, care este generată de un simplu detector de margini Prewitt. Figura 1.18(b) arată marcajul puternic amplificat modulat cu această mască.

18

Figura 1.18 – Marcare folosind masca bazată pe operatori Prewitt. (a) Mască, şi (b)

Diferenţa W(x,y)=I(x,y)-IW(x,y)

O altă metodă pentru generarea imaginii mască este folosirea sumei pătratice ai coeficienţilor DCT-AC de 8x8 [NCH99]. Figura 1.19(a) arată o mască generată folosind această energie DCT-AC, pentru imaginea Lena. Figura 1.19(b) prezintă marcajul puternic amplificat modulat cu această mască. Experimentele arată că un marcaj invizibil, modulat cu un factor de câştig adaptat local la o asemenea mască, poate conţine de două ori mai multă energie ca un marcaj invizibil, modulat cu un factor de câştig fix. Pentru a investiga efectele acestei dublări de energie asupra robusteţii marcajului, se poate efectua următorul experiment. Se adaugă un marcaj Wfix(x,y) la imaginea Lena folosind un factor de câştig fix de k=2. Creşterea acestui factor fix de câştig cauzează „artefacte” vizibile în imaginea marcată. Se adaugă un marcaj Wvar(x,y) la o altă imagine Lena, cu aceeaşi metodă, folosind un factor de câştig variabil adaptat local la imaginea mască prezentată în figura 1(a). Deşi marcajul Wvar(x,y) conţine de două ori mai multă energie ca Wfix(x,y) , marcajul nu este perceptibil în a doua imagine marcată.

Figura 1.19 – Marcare folosind o imagine mască pe baza energiei DCT-AC. (a)

Imaginea mască, şi (b) Diferenţa W(x,y)=I(x,y)-IW(x,y)

La urmă, se comprimă ambele imagini marcate cu algoritmul JPEG, unde factorul de calitate QJPEG este variabil. În ultima etapă, marcajele sunt extrase din imaginea decomprimată şi comparate cu marcajul original. Astfel se află rata erorii de bit, datorită compresiei JPEG, ca o funcţie de factorul de calitate JPEG. În figura 1.20 sunt trasate curbele de eroare pentru ambele marcaje Wfix(x,y) şi Wvar(x,y). Se poate vedea că

19

robusteţea este uşor îmbunătăţită prin aplicarea unui factor de câştig variabil adaptat la sistemul vizual uman. Mascarea spaţială poate fi aplicată şi atunci când marcajul e plasat în alt domeniu, cum ar fi DFT, DCT, sau DWT. În acest caz, prima oară este plasat marcajul nespaţial într-o imagine I, rezultatul fiind o imagine temporară notată cu IWt. Imaginea marcată IW este acum construită prin mixarea imaginii originale I şi a acestei imagini temporare IWt, cu ajutorul unei imagini mască Msk:

),(),(),()),(1(),( yxIyxMskyxIyxMskyxI WtW ⋅+⋅−= (1.17) Aici imaginea mască trebuie scalată la valori in domeniul zero la unu.

Figura 1.20 – Influenţa factorului de câştig variabil adaptat la sistemul vizual uman,

asupra robusteţii marcajului

20

2. Tehnici de marcare transparentă de tip spread spectrum

Pentru a înţelege avantajele metodei de marcare în domeniul frecvenţă, se examinează etapele prin care trece o imagine în timpul procesului de transmisie, şi efectele pe care le pot avea aceste etape asupra datelor (figura 2.1).

Figura 2.1 –Operaţii de procesare comune pentru un document

Deşi majoritatea operaţiilor efectuate în timpul transmisiei sunt fără pierderi de informaţie, multe scheme de compresie (JPEG, MPEG) sunt cu pierderi, şi pot duce la posibila degradare a calităţii datelor, prin pierderea nerecuperabilă de informaţie. În general o schemă de marcare transparentă ar trebui să fie rezistentă la distorsiunile introduse de aceşti algoritmi. Compresia cu pierderi este o operaţie care de obicei elimină componentele imperceptibile dintr-o imagine. Majoritatea operaţiilor de acest gen au loc în domeniul frecvenţă. De fapt, pierderi de date apar de obicei printre componentele de frecvenţă înaltă. Distorsiunile geometrice sunt specifice imaginilor şi materialelor video, şi includ operaţii ca: rotire, redimensionare, decupare şi translaţie. Prin determinarea manuală a minim patru din nouă puncte corespondente dintre marcajul original şi cel distorsionat, este posibilă îndepărtarea oricărei transformări bi- sau tri-dimensionale [Fau93]. Totuşi, o redimensionare, în sensul micşorării imaginii, duce la pierdere de date în componentele spectrală de frecvenţă înaltă ale imaginii. Decuparea unor porţiuni din imagine, duce la pierderea irecuperabilă de date referitoare la imagine, ceea ce poate afecta serios orice marcaj transparent în domeniul spaţial. Totuşi, o schemă bazată pe frecvenţă împrăştie

21

marcajul pe toată suprafaţa imaginii, şi din această cauză este mai puţin probabil ca acesta să fie afectat de operaţia de decupare. Distorsiunile de semnal cel mai des întâlnite includ conversia analog-digital, digital-analog, recuantizare, reeşantionare, redimensionare şi operaţii de îmbunătăţire a semnalelor de culoare şi contrast din imagine. Multe dintre aceste distorsiuni sunt neliniare, şi tocmai de aceea sunt greu de analizat efectele pe care le produc. 2.1 Codare cu spectru împrăştiat a marcajului în domeniul DCT Având în vedere cele prezentate mai sus, reiese că marcajul nu trebuie plasat în regiunile nesemnificative din punct de vedere perceptual al imaginii, deoarece multe procesări de semnal şi geometrice afectează aceste componente. De exemplu un marcaj plasat în frecvenţele înalte a unei imagini poate fi eliminat uşor cu degradarea minimă asupra imaginii, de orice proces care efectuează direct sau indirect filtrare trece jos. Atunci problema devine cum se poate plasa un marcaj în regiunile perceptual semnificative ale spectrului în aşa fel încât să se păstreze şi fidelitatea. Pentru a rezolva această problemă, domeniul de frecvenţă a unei imagini este considerat ca un canal de comunicaţie, şi în concordanţă, marcajul este considerat ca un semnal ce urmează a fi transmis prin acesta. Atacurile şi distorsiunile de semnal neintenţionate sunt tratate ca zgomote la care semnalul transmis (marcajul) trebuie să fie imun. În comunicaţiile cu spectru împrăştiat, se transmite un semnal de bandă îngustă printr-un canal de bandă mult mai largă, în aşa fel încât energia semnalului fiecărei frecvenţe să fie nedetectabilă. Similar marcajul este împrăştiat pe mai multe benzi de frecvenţă, în aşa fel încât energia în fiecare bandă este foarte mică, şi cu siguranţă nedetectabilă. Totuşi, din cauză că în procesul de verificare a marcajului se ştie locaţia şi conţinutul marcajului, este posibilă concentrarea acestor semnale numeroase de putere mică într-o singură ieşire cu raport semnal-zgomot mare. Pentru a distruge aşa un marcaj ar fi nevoie să se adauge zgomot cu amplitudine mare la toate benzile de frecvenţă. Împrăştierea marcajului prin tot spectrul unei imagini, asigură o securitate sporită împotriva atacurilor intenţionate şi neintenţionate: în primul rând, locaţia marcajului nu este evidentă, iar în al doilea rând, regiunile de frecvenţă trebuie să fie selectate în aşa fel încât orice atac asupra marcajului să aibă ca urmare degradarea severă a datelor originale. Un marcaj care este bine plasat în domeniul frecvenţă a unei imagini este practic imposibil de observat, ceea ce este întotdeauna adevărat, dacă energia marcajului este suficient de mică în fiecare coeficient de frecvenţă. În plus, este posibil să creştem energia prezentă în anumite frecvenţe prin exploatarea sistemului vizual uman. Mascarea perceptuală se referă la orice situaţie unde informaţiile dintr-o anumită regiune a unei imagini sunt „umbrite” (mascate) de informaţii mai proeminente perceptual din alte părţi ale imaginii. Este cunoscut că sistemele vizuale şi auditive prezintă rezoluţie mai înaltă la regiunile spectrale cu energie mare şi frecvenţă joasă a unei scene audio sau vizuale. Din analiza spectrală a imaginilor rezultă faptul că majoritatea informaţiilor în asemenea date sunt localizate în regiunile de frecvenţă joasă.

Figura 2.2 arată procedura generală de marcare în domeniul frecvenţei prezentată în [CKLS97].

22

Figura 2.2 – Etapele procesului de marcare în domeniul DCT

După aplicarea unei transformări de frecvenţă asupra imaginii, este calculată o mască perceptuală, care indică regiunile din spectru, ce suportă marcajul fără să afecteze fidelitatea perceptuală. Pasul următor este plasarea marcajului în aceste regiuni. Mărimea precisă a fiecărei modificări este cunoscută doar de proprietar, un atacator poate să aibă cunoştinţă doar asupra unui posibil domeniu al modificărilor. Ca să fie sigur că a eliminat marcajul, un atacator trebuie să presupună că fiecare modificare s-a efectuat la limita acestui domeniu, în ciuda faptului că doar puţine astfel de modificări sunt aşa de mari. Ca rezultat, un atacator creează distorsiuni vizibile în date. Similar, distorsiunile de semnal neintenţionate datorită compresiei sau manipulării imaginii, trebuie să lase intacte componentele spectrale importante din punct de vedere perceptual, în caz contrar imaginea rezultată ar fi sever degradată. Acest lucru face marcajul transparent aşa de robust. În principiu, poate fi folosită orice transformare în domeniul frecvenţă. Fiecare coeficient în domeniul frecvenţă are o capacitate perceptuală, care este, o cantitate de informaţie adiţională, care poate fi adăugată fără impact, sau cu impact minim, asupra fidelităţii perceptuale a datelor. Pentru determinarea capacităţii perceptuale pentru fiecare frecvenţă, se pot folosi modele pentru sistemul perceptual sau simple experimentări. În [CKLS97], pentru a plasa un marcaj cu lungimea n într-o imagine NxN, se calculează DCT-ul (transformata cosinus discretă) NxN a imaginii, şi se plasează marcajul în cei mai mari n coefiecienţi ai matricii de transformare, excluzând componenta DC.

23

Structura marcajului. În implementarea de bază, marcajul constă într-o secvenţă de numere reale X= x1,x2,.... xn. În practică se creează un marcaj unde fiecare valoare xi este o v.a. din N(0,1) (unde N(µ,σ2) înseamnă o distribuţie normală cu media µ şi varianţa σ2). Sunt posibile şi distribuţii alternative, inclusiv alegerea uniformă a lui xi din {1,-1}, {0,1} sau {0,1}.

Procedura de marcare. Din fiecare document D se extrage o secvenţă de valori V= v1,v2,.... vn , în care se inserează marcajul X= x1,x2,.... xn , pentru a obţine o secvenţă de valori ajustate V’= v1

’,v2’,.... vn

’. V’ este inserat înapoi în document, în locul lui V, pentru a obţine documentul marcat D’. Unul sau mai mulţi atacatori pot deteriora D’, producând un document nou D*, şi un marcaj, posibil corupt X* este extras şi statistic comparat cu X. Este extras X* , prin extragerea prima oară a unui set de valori V*= v1

*,v2*,.... vn

*, din D* (folosind informaţii despre D) şi apoi prin generarea lui X* din V* şi V.

Figura 2.3 – Codarea şi decodarea marcajului

Inserarea şi extragerea marcajului. Când se inserează X în V pentru a obţine V’, se specifică un parametru de scalare α , care determină măsura în care X modifică V. Trei formule posibile pentru calcularea V’ sunt

vi’=vi+ αxi (2.1)

vi’=vi(1+αxi) (2.2)

vi’=vi(eαxi) (2.3)

Ecuaţia (2.1) este totdeauna inversabilă, ecuaţiile (2.2) şi (2.3) sunt inversabile dacă vi≠0. V* fiind dat, se poate calcula funcţia inversă pentru a obţine X* din V* şi V. Ecuaţia (2.1)

24

s-ar putea să nu fie potrivită dacă valorile lui vi variază mult. Dacă vi=106 adăugând 100 s-ar putea să fie insuficient pentru recuperarea marcajului, dar dacă vi=10 adăugând 100 va distorsiona această valoare într-o măsură neacceptabilă. Inserţia bazată pe ecuaţia (2.2) sau (2.3) este mai rezistentă împotriva acestor variaţii mari. Este de menţionat că (2.2) şi (2.3) dau rezultate similare dacă αxi este mic. De asemenea dacă vi este pozitiv, atunci (2.3) este echivalent cu lg(vi

’)=lg(vi) + αxi ,şi poate fi privit ca o aplicaţie a lui (2.1) pentru cazul în care sunt folosiţi logaritmii valorilor originale.

Determinarea parametrilor de scalare. Autorii [CKLS97] sugerează ca un singur parametru de scalare α să nu fie aplicabil pentru perturbarea tuturor valorilor lui vi, deoarece diferitele componente spectrale s-ar putea să prezinte mai multă sau mai puţină toleranţă la modificări. Mai general, se pot folosi parametri de scalare multipli α1,α2,....αn în relaţia vi

’=vi(1+αixi). Parametrul αi poate fi privit ca măsură relativă a modificării lui vi. Un αi mare înseamnă că se modifică vi cu un factor mare fără să se modifice calitatea perceptuală a documentului. În unele cazuri, alegerea lui αi se poate baza pe presupuneri generale. De exemplu, (2.2) este un caz special al lui (2.1) generalizat (vi

’=vi+αixi), pentru αi=αvi. De fapt (2.2) face rezonabilă presupunerea că o valoare mare este mai puţin sensibilă la alterări aditive, decât o valoare mică. În general nu se cunoaşte cât de sensibilă este imaginea la diferite valori xi . O metodă empirică de estimare a sensibilităţii este de a determina distorsiunile cauzate de o serie de atacuri asupra imaginii originale. De exemplu, se poate calcula o imagine degradată D*, din D, se extrag valorile corespunzătoare v1

*,....,vn*, şi se alege αi

proporţională cu deviaţia |vi*-vi|. Pentru o mai bună robusteţe, ar trebui încercate mai

multe forme de distorsiune, şi să facem αi proporţională cu valoarea medie a lui |vi*-vi|.

Această abordare empirică s-ar putea combina cu presupuneri generale globale asupra sensibilităţii valorilor. De exemplu, s-ar putea să fie nevoie ca αi ≥αj când vi≥vj. O cale de a combina această constrângere cu abordarea empirică ar fi să se aleagă αi conform relaţiei

αi~maxj|vj≤vi | vj*-vj | (2.4)

Alegerea lungimii n a marcajului. Alegerea lui n dictează gradul de împrăştiere

a marcajului printre componentele importante ale imaginii. În general, cum creşte numărul componentelor modificate, scade măsura în care sunt modificate componentele respective. Pentru o evaluare mai cantitativă, se consideră un marcaj transparent de forma vi

’=vi+αxi şi se modelează un atac cu zgomot alb prin vi*=vi

’+ri unde ri este ales conform distribuţiei normale independente cu deviaţia standard σ. Pentru procesul de marcare transparentă descrisă, marcajul se poate recupera dacă α este proporţional cu σ/ n . Aceasta înseamnă că dacă creşte de patru ori numărul componentelor folosite, se poate înjumătăţi amplitudinea marcajului plasat în fiecare componentă. Este de menţionat faptul că numărul biţilor de informaţie asociaţi cu marcajul, poate fi arbitrar – marcajul este folosit ca un simplu index la o înregistrare într-o bază de date asociată cu marcajul.

Evaluarea asemănării marcajelor. Este foarte puţin probabil ca marcajul extras X* să fie identic cu marcajul original X. Chiar şi recuantizarea documentului marcat

25

pentru a fi transmis, cauzează devierea lui X* de la X. Asemănarea dintre X* şi X este măsurată prin

( )**

**,

XXXXXXsim⋅

⋅= (2.5)

Există şi alţi parametri de evaluare a asemănării, inclusiv coeficientul de corelaţie standard. Pentru a decide dacă X* şi X corespund, determinăm dacă sim(X,X*)>T , unde T este un prag. Alegerea pragului de decizie este o problemă clasică de detecţie, în care se doreşte minimizarea probabilităţilor de fals negativ Pfn (detecţii ratate), şi fals pozitiv Pfp (alarme false).

Calcularea probabilităţii de alarmă falsă. Există întotdeauna posibilitatea ca X*

şi X să fie foarte asemănătoare doar prin pură întâmplare, de aici orice asemănare va avea ca rezultat valori semnificative eronate. Se presupune că creatorii documentului D* n-au avut acces la X ; atunci chiar şi condiţionat de orice valoare fixată pentru X* , fiecare xi va fi distribuit independent conform N(0,1). Asta înseamnă că X este independent de X*.

Distribuţia lui X*.X poate fi calculată prin scrierea în forma ∑=⋅

n

i ii xx1

* , unde xi*

este constant. Folosind formula pentru distribuţia unei combinaţii liniare a variabilelor independente şi normal distribuite, X*.X va fi distribuit conform

( **

1

2* ,0,0 XXNxNn

ii ⋅=⎟⎠

⎞⎜⎝

⎛ ∑=

) (2.6)

Astfel, sim(X,X*) este distribuit conform lui N(0,1). Atunci se poate aplica statistica test standard pentru distribuţia normală. De exemplu, dacă X* este creat independent de X, atunci probabilitatea ca sim(X,X*)>6 este probabilitatea ca o variabilă aleatoare distribuită normal să-şi depăşească media cu mai mult decât 6 deviaţii standard.

De aici, pentru un număr mic de documente, setarea pragului T la 6 va cauza foarte rar corespondenţe („match”) eronate. Desigur, trebuie considerat numărul testelor de efectuat în determinarea probabilităţii acceptabile de fals pozitiv. De exemplu, dacă se testează un marcaj extras X* împotriva 106 marcaje, atunci creşte probabilitatea de fals pozitiv printr-un factor multiplicativ de 106.

Este de menţionat că analiza asupra gradului de asemănare şi probabilitatea de fals pozitiv nu depinde de lungimea marcajului, n. Totuşi n apare implicit, deoarece, de exemplu, este foarte probabil ca sim(X,X*) să fie în jurul valorii n , atunci când X este generat în modul descris mai sus. Valori mai mari a lui n tind să genereze valori ale similarităţii mai mari atunci când X şi X* sunt într-adevăr asemănătoare, fără ca acest lucru să se întâmple atunci când X şi X* sunt independente.

Statistici asupra robusteţii. Din analiza de mai sus reiese doar cerinţa ca X să fie independent de X*, şi nu reiese nici o cerinţă specifică pentru proprietăţile lui X*. Acest lucru oferă în continuare o flexibilitate sporită, când vine vorba de preprocesarea lui X*. X* se poate procesa în mai multe moduri, pentru sporirea capacităţii de a extrage marcajul. De exemplu, în anumite experimente asupra imaginilor se pot întâlni exemple când valoarea medie a lui xi

*, notată cu Ei(X*), diferă substanţial de zero, datorită efectelor procedurii de „dithering”. Performanţe superioare pot fi obţinute prin postprocesarea marcajului extras. O simplă transformare xi

*← xi* - Ei(X*) produce valori

superioare pentru sim(X,X*). Performanţa sporită rezultă din valorile scăzute a lui X*. X*, valorile lui X*.X fiind foarte puţin afectate.

26

În experimente din [CKLS97], s-a observat deseori că xi* poate să fie foarte

distorsionat pentru anumite valori ale lui i. O variantă pentru postprocesare ar fi simpla ignorare ale acestor valori, setându-le la zero. Aceasta înseamnă

⎪⎩

⎪⎨⎧ ≤

←restîn 0,

tolerantadacă, *** iii

xxx (2.7)

Încă o dată, scopul unei astfel de transformări este de a scădea X*. X*. O versiune a acestei abordări este normalizarea valorilor lui X* la -1, 0, sau 1, prin

( )( )*** XExsignx iii −← (2.8)

Rămâne întrebarea dacă aceşti paşi de postprocesare nu riscă generarea falsurilor pozitive. Totuşi, atât timp cât metoda generării unui set de valori pentru X* depinde numai de D şi D*, calculele de testare statistică rămân neafectate.

Rezistenţa la atacurile de coliziune. Atacul cel mai des întâlnit constă în folosirea a t copii marcate D1

’,D2’,…Dt

’ a documentului D pentru a produce un document nemarcat D*. Majoritatea schemelor propuse în literatură, sunt destul de vulnerabile la asemenea atacuri. Pentru a ilustra efectul atacurilor de coliziune se consideră o schemă de marcare în care vi

’ este generat prin adăugarea lui 1 sau -1 la un vi aleator. În momentul în care cineva găseşte două documente cu valori vi

’ diferite, poate determina vi , şi, deci elimina complet această componentă a marcajului. Cu ajutorul a t documente, prin mediere, se pot elimina toate componentele marcajului în afară de o fracţie 21-t . Este de menţionat că acest atac nu presupune nimic asupra distribuţiei lui vi . În timp ce o alocare mult mai inteligentă a valorilor ±1 în marcaj, va rezista mai bine la atacurile simple, natura discretă a componentelor marcajului le face mai uşor de eliminat. În mod interesant, s-a determinat experimental că dacă se alege un xi uniform într-un interval, atunci marcajul se poate elimina folosind doar cinci documente. Folosirea marcajelor cu valoare continuă pare să ofere o rezistenţă mai bună la asemenea atacuri. Folosirea distribuţiei normale pare să ofere o performanţă mai bună, ca distribuţia considerată mai sus. O măsură a performanţei este valoarea maxi(X*.Xi), unde X* este marcajul extras dint-un document D* , generat de documentele D1,D2,…,Dt , cu marcajele corespunzătoare X1,X2,…,Xt . Valoarea numitorului ** XX ⋅ , poate să crească întotdeauna, de exemplu, prin zgomot aditiv. Aceasta are ca efect scăderea similarităţii, cu preţul distorsionării imaginii. Deci, maxi(X*.Xi) se poate considera ca fiind unui grafic ce reprezintă compromisul fidelitate/nedetectabilitate şi valoarea lui ** XX ⋅ ca un punct pe această curbă. Când Xi este inserat în D printr-o operaţie liniară, atunci un atac de mediere, ce setează

tDDD t++

= 1* (2.9)

are ca rezultat

27

tXXX t++

= 1* (2.10)

În acest caz ( ) ( )iiiii XXXX ⋅≈⋅ maxmax * (presupunând că XiXj≈0). Aceasta înseamnă că ieşirea detectorului are un comportament 1/t. Este de menţionat faptul că printr-un atac simplu de mediere, numitorul,

** XX ⋅ , va fi aproximativ de t/1 ori mai mic, aşa că ( )*,max XXsim ii va fi

aproximativ tn / . Totuşi, precum era menţionat şi mai înainte, se poate adăuga zgomot aditiv, aşa că marcajul extras, X*, are aceeaşi putere ca oricare dintre marcajele originale Xi. Atunci ( )*,max XXsim ii va fi aproximativ tn / . Astfel, gradul de asemănare poate fi micşorat cu un factor t.

2.2 Tehnici spread spectrum în domeniul wavelet

Ideea propusă în [XBA98] este asemănătoare celei propuse de Cox şi alţii [CKLS97], diferenţa fiind că marcajul se aplică în domeniul DWT, iar decodarea se face ierarhic, reducându-se astfel timpul de procesare.

2.2.1 Transformarea Wavelet Discretă (DWT) Ideea de bază în DWT pentru un semnal este următoarea. De obicei, un semnal unidimensional este împărţit în două părţi, partea de frecvenţe înalte şi partea de frecvenţe joase. Partea de frecvenţe joase este împărţită iar în două părţi, una de frecvenţă înaltă şi una de frecvenţă joasă. Acest proces este repetat de un număr de ori arbitrar, care este de obicei determinat de aplicaţie. Mai departe, semnalul original poate fi reconstruit din aceşti coeficienţi DWT. Acest proces de reconstrucţie este numit DWT inversă (IDWT). DWT şi IDWT pot fi definite matematic cum urmează. Fie

( ) ∑ −⋅=k

jkk ehH ωω , şi ( ) ∑ −⋅=

k

jkk egG ωω (2.11)

un filtru trece jos, respectiv un filtru trece sus, care satisfac o anumită condiţie. Un semnal x[n] poate fi descompus recursiv ca

∑ −− =n

njknkj chc ,2,1 (2.12)

∑ −− =

nnjknkj cgd ,2,1 (2.13)

pentru j=J+1,J,...J0 , unde cJ+1,k=x[k], Zk ∈ , J+1 este indicele pentru nivelul de rezoluţie înaltă, şi J0 este indicele pentru nivelul de rezoluţie joasă. Coeficienţii

sunt coeficienţii DWT al semnalului x[n], unde reprezintă kJkJkJkJ dddc ,,1,, ,...,,,000 + kJc ,0

28

partea de rezoluţie cea mai joasă (de aproximare) al lui x[n] şi sunt detaliile lui x[n] în diferitele benzi de frecvenţă. Mai departe, semnalul x[n] poate fi reconstruit recursiv din coeficienţii săi DWT:

kjd ,

∑ ∑ −−−− ⋅+⋅=k k

kjknkjknnj dgchc ,12,12, (2.14)

Reconstrucţia de mai sus este numită IDWT a lui x[n]. Pentru a asigura relaţia DWT şi IDWT de mai sus, este nevoie ca următoarea condiţie de ortogonalitate pentru filtrele H(ω) şi G(ω) să fie îndeplinită:

( ) ( ) 122 =+ ωω GH (2.15)

Un exemplu pentru un astfel de H(ω) şi G(ω) este dat de:

( ) ωω jeH −+=21

21 şi ( ) ωω jeG −−=

21

21 , (2.16)

care sunt cunoscute ca filtrele wavelet Haar. DWT şi IDWT de mai sus pentru un semnal unidimensional x[n], mai pot fi descrise în forma filtrelor cu două canale şi structură arborescentă ca în figura 2.4. DWT şi IDWT pentru imagini bidimensionale x[m,n] pot fi definite similar, prin implementarea DWT şi IDWT unidimensionale, pentru fiecare dimensiune, respectiv m şi n, separat: DWTn[DWTm[x[m,n]]], (figura 2.5). O imagine poate fi descompusă într-o structură piramidală, arătată în figura 2.6, cu diferite informaţii de bandă: cum ar fi banda de frecvenţă joasă-joasă LL, banda de frecvenţă joasă-înaltă LH, banda de frecvenţă înaltă-înaltă HH, etc. Un asemenea exemplu de descompunere cu două nivele este arătat în figura 2.7, unde marginile apar în toate benzile, în afara benzii celei mai joase, ca şi în colţul din stânga sus.

Figura 2.4 - DWT pentru semnale unidimensionale

29

Figura 2.5 - DWT pentru semnale unidimensionale

Figura 2.6 - Descompunerea DWT piramidală a unei imagini

Figura 2.7 Exemplu pentru descompunerea DWT piramidală

2.2.2 Marcare transparentă în domeniul DWT Marcarea transparentă în domeniul DWT este alcătuită din două părţi: codare şi decodare. În partea de codare, se descompune imaginea în mai multe benzi cu structură piramidală ca în figurile 2.5-2.7, şi apoi se adaugă o secvenţă de zgomot pseudo-aleator (zgomot Gaussian) la cei mai mari coeficienţi, coeficienţi care nu se află în imaginea de aproximare cu rezoluţia cea mai joasă (banda LL). Se notează cu y[m,n] coeficienţii DWT a unei imagini x[n,m], care nu sunt localizaţi în banda de cea mai joasă frecvenţă. Se adaugă o secvenţă de zgomot Gaussian N[m,n], cu media zero şi varianţa 1, la y[m,n]:

],[],[],[],[~ 2 nmNnmynmynmy α+= (2.17)

30

unde α este un parametru de control al nivelului marcării, pătratul indicând amplificarea coeficienţilor DWT mari. Coeficienţii DWT la rezoluţiile cele mai joase rămân neschimbaţi. Apoi, se ia transformata IDWT bidimensională a coeficienţilor modificaţi şi a coeficienţilor neschimbaţi la cele mai joase rezoluţii. Se notează cu coeficienţii IDWT. Pentru ca imaginea modificată să aibă acelaşi domeniu dinamic ca şi imaginea originală, este modificat conform:

y~

],[~ nmx

],[~ nmx

])}),[min(],,[~max{]),,[min(max(],[~ nmxnmxnmxnmx = (2.18)

Operaţia (2.18) face ca datele bidimensionale , să aibă aceeaşi domeniu dinamic ca imaginea originală x[m,n]. Imaginea rezultată este imaginea x[m,n] marcată transparent. Partea de codare este ilustrată în figura 2.8 (a).

],[~ nmx],[~ nmx

Fig. 2.8(a) - Codare

Metoda de decodare este ierarhică şi este descrisă în continuare. Prima oară se descompune imaginea recepţionată şi imaginea originală (se presupune că se cunoaşte imaginea originală) cu DWT în patru benzi, respectiv banda (LL1), banda (LH1), banda (HL1), şi banda (HH1). Se compară semnătura adăugată în banda HH1 şi diferenţa coeficienţilor DWT în HH1 a imaginilor recepţionate şi celor originale, prin calcularea intercorelaţiei lor. Dacă este un vârf în intercorelaţie, semnătura este considerată detectată. În caz contrar, se compară semnăturile adăugate în benzile HH1 şi LH1 cu diferenţa coeficienţilor DWT în benzile HH1 şi LH1. Dacă este un vârf, semnătura este considerată detectată. În caz contrar, se consideră semnăturile adăugate în benzile HL1,LH1 şi HH1. Dacă tot nu se detectează un vârf în intercorelaţie, se continuă descompunerea semnalelor recepţionate şi cele originale în banda LL1 în patru subbenzi adiţionale LL2,LH2,HL2 şi HH2 , ş.a.m.d. până este detectat un vârf în intercorelaţie. În caz contrar semnătura nu poate fi detectată. Metoda de decodare este ilustrată în figura 2.8 (b).

31

Fig. 2.8(b) - Decodare

32

3. Îmbunătăţirea tehnicilor de marcare pe bază de corelaţie 3.1 Îmbunătăţiri prin anticiparea atacurilor de tip compresie Marcajele care au fost plasate într-o imagine cu ajutorul tehnicii de marcare spaţială de mai sus, nu pot fi detectate cu un grad mare de certitudine, după ce imaginea marcată a fost puternic comprimată cu algoritmul de compresie cu pierderi JPEG. Acest lucru se datorează faptului că aceste marcaje sunt alcătuite esenţial din zgomote de putere mică şi frecvenţă înaltă. Deoarece JPEG alocă mai puţini biţi pentru componentele de frecvenţă înaltă, aceste marcaje pot fi cu uşurinţă distorsionate. Mai departe, aceste marcaje pot fi puternic afectate de operaţii trece-jos ca cele realizate de filtrele liniare sau mediane. Robusteţea la compresia JPEG poate fi îmbunătăţită în mai multe moduri. O metodă constă în comprimarea şi apoi decomprimarea unui model pseudo-aleator W, cu ajutorul algoritmului JPEG [SC96]. Energia modelului rezultat este crescută pentru a compensa pierderea de energie datorită compresiei. In final, acest model este adăugat la imagine pentru generarea imaginii marcate. Aici, ideea este de a folosi algoritmul de compresie pentru a elimina prin filtrare în avans toată energia care în caz contrar s-ar pierde mai târziu pe parcursul compresiei. Se presupune că un marcaj alcătuit în acest fel, este invariant la compresii JPEG ulterioare, cu acelaşi factor de calitate, cu excepţia unor mici artefacte numerice. Pot fi aplicate alte distorsiuni preliminare ale modelului de marcaj, precum filtrarea, pentru a preveni alte degradări anticipate ale imaginii marcate. În [NP96] energia modelului de marcaj este concentrată în componentele spectrale de frecvenţe mai joase prin calcularea unui factor de câştig individual kx,y pentru fiecare pixel al modelului de marcaj, în locul folosirii aceluiaşi factor de câştig k pentru toţi pixelii. Prima oară este generat un model pseudo-aleator W(x,y), care constă din numerele 0 şi k. Apoi modelul este despărţit în blocuri 8x8, şi este calculată transformata DCT W(u,v) a fiecărui bloc 8x8. Elementele nenule din blocurile 8x8, sunt acum privite ca factori de câştig kx,y, şi adaptate în aşa fel încât energia Φ din coeficienţii DCT de frecvenţă înaltă FH să fie minimizată (Figura 3.1):

{ }∑ ∑∈

≤<≤<==ΦHFvu

H vuvuFvuW,

2 85,85|,),( (3.1)

Energia Φ este minimizată ţinând cont de următoarea condiţie:

∑∑ ∑∑= = = =

≤≤⋅=⋅8

1

8

1

8

1max,min

8

1, ,),(),(

x y xyx

yyx kkkkyxWkyxW (3.2)

Figura 3.1 – Banda DCT FH în care energia Φ a marcajului este minimizată

33

Efectul minimizării energiei de frecvenţe înalte asupra modelului marcajului este ilustrată în Figura 3.2. Figura 4.2 (a) arată modelul marcajului în interiorul unui bloc 8x8, unde este folosit un factor de câştig constant k=3. După minimizarea energiei pentru kmin=0 şi kmax=6, modelul marcajului descreşte spre zero (Figura 3.2 (b)), deşi suma pixelilor nenuli încă este egală cu suma pixelilor nenuli din marcajul original.

Figura 3.2 – (a) Marcaj original şi (b) Marcaj de frecvenţă joasă

În [HLR00] şi în [LLL97], imunitatea la compresia JPEG se asigură prin

obţinerea unui factor de câştig k pentru fiecare bloc de 32x32 de pixeli pe baza unei imagini comprimate JPEG de calitate mai scăzută. La fiecare bloc de imagine de 32x32 pixeli este adăugat un model pseudo-aleator de 32x32 pixeli reprezentând un bit de marcaj. O copie a acestui bloc de imagine marcată, este degradată în conformitate cu standardul JPEG, pentru care se foloseşte un factor de calitate relativ scăzut. Dacă bitul de marcaj nu se poate extrage corect din această copie degradată, modelul de marcaj este adăugat la imagine cu ajutorul unui factor de câştig mai mare, şi este alcătuită o nouă copie degradată pentru a verifica bitul. Această procedură este repetată iterativ pentru fiecare bit, până toţi biţii pot fi extraşi cu un grad de certitudine mare din copiile degradate. Un marcaj format în acest mod este rezistent la compresia JPEG, folosind un factor de calitate mai mare sau egal cu factorul de calitate folosit pentru degradarea copiilor. În figura 4.3 este dat un exemplu pentru un asemenea marcaj, amplificat pentru a fi vizibil.

Figura 3.3 – Marcaj unde factorul de câştig local la un bloc este bazat pe o

imagine comprimată JPEG cu calitate mai scăzută

34

3.2 Anticiparea transformărilor geometrice

Un marcaj trebuie să fie robust nu numai la tehnicile de compresie cu pierderi, dar

şi la transformările geometrice ca scalare, decupare, rotire, etc. Transformările geometrice afectează în mică măsură calitatea imaginii, dar afectează în mare măsură marcajele plasate cu ajutorul metodelor descrise anterior. Deoarece transformările geometrice afectează în mod tipic sincronizarea dintre modelul pseudo-aleator al marcajului şi imaginea marcată, sincronizarea trebuie redobândită înainte ca detectorul să înceapă calculele corelaţiilor.

Cea mai la îndemână metodă de a obţine invarianţa la translaţie („shift”), este modulaţie de amplitudine a coeficienţilor DFT. Dacă, dintr-o anumită cauză, este preferat un alt domeniu pentru plasarea marcajului şi este nevoie şi de invarianţă la schimbări de poziţie, se poate adăuga un marcaj (semn) în domeniul spaţial pentru a determina translaţia. Acest semn poate fi un model pseudo-aleator, ca şi marcajul transparent însăşi. Detectorul determină prima oară poziţia spaţială a acestui marcaj prin mişcarea lui peste tuturor locaţiilor posibile din imagine, şi calculând corelaţia dintre aceasta şi porţiunea de imagine corespunzătoare. Translaţia cu corelaţia cea mai mare defineşte poziţia spaţială a semnului. În final, imaginea este mişcată înapoi în poziţia sa originală, şi aplicată procedura normală de detecţie a marcajului.

O căutare completă a acestui marcaj (semn), este foarte anevoioasă din punct de vedere al calculelor. De aceea, în [KDHM99], este propusă o altă metodă: adăugarea unui model pseudo-aleator în imagine de două ori, dar în diferite locuri. Aici conţinutul marcajului transparent, adică biţii marcajului, sunt plasaţi în poziţii relative a două modele de marcaj. Pentru a detecta marcajul transparent, detectorul calculează corelaţia de fază dintre imagine şi modelul de marcaj, folosind transformarea Fourier rapidă (FFT), şi detectează cele două vârfuri de corelaţie a celor două modele. Conţinutul marcajului transparent derivă din poziţiile relative ale vârfurilor. Dacă toată imaginea e deplasată înainte de detecţie, poziţiile absolute ale vârfurilor de corelaţie se schimbă, dar poziţiile relative rămân neschimbate, lăsând biţii marcajului detectabili.

În [FH97], este propusă o metodă în care se adaugă o grilă la o imagine, care poate fi folosită pentru a scala, roti, şi translata înapoi imaginea în poziţia şi mărimea originală. Grilajul este reprezentat de o sumă de semnale sinusoidale, care apar ca maxime în domeniul de frecvenţă FFT. Aceste vârfuri sunt folosite pentru a determina distorsiunile geometrice.

În [KP99], este propusă o metodă care plasează un model pseudo-aleator de mai multe ori, la diferite locaţii, în domeniul spaţial al unei imagini. Detectorul estimează marcajul W’ , prin aplicarea unui filtru trece sus FHP asupra imaginii marcate:

HPW FIW ⊗='

35

12/

00010000001000000100011112111000100000010000001000

⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

−−−

−−−−−−−−−

=HPF (3.3)

In final, este calculată funcţia de autocorelaţie a marcajului estimat W’. Această

funcţie va avea valori maxime în centru şi în poziţiile marcajelor inserate de mai multe ori. Dacă imaginea a fost supusă unei transformări geometrice, vârfurile din funcţia de autocorelaţie vor reflecta aceeaşi transformare şi deci, furniza un grilaj care poate fi folosit pentru a transforma înapoi imaginea la mărimea şi orientarea originală.

În [HPRP98] şi în [HRPP98], se propune o metodă care plasează marcajul într-un domeniu invariant la rotire, scalare, şi translaţie, folosind o combinaţie dintre transformata Fourier discretă, DFT, şi reprezentarea polară logaritmică, LPM („log polar map”). Figura 3.4 prezintă o schemă a acestei metode de marcare transparentă.

Figura 3.4 – Schemă de marcaj transparent invariantă la rotire, scalare, şi

translaţie

Prima oară este calculată amplitudinea coeficienţilor DFT pentru a obţine un domeniu invariant la translaţii. În pasul următor, pentru fiecare coordonată (u,v) al amplitudinilor DFT este determinat un punct corespunzător (µ,θ) în LPM:

)cos(θµeu = (3.4) )sin(θµev =

Acest sistem de coordonate polar logaritmic (LPM) transformă rotirea şi scalarea,

în translaţii de-a lungul axei orizontale şi verticale. In continuare, prin folosirea amplitudinii DFT a coordonatelor LPM, se obţine un domeniu invariant la rotire, scalare şi translaţie. În acest domeniu se poate adăuga un marcaj transparent CDMA, de exemplu, prin modularea coeficienţilor folosind relaţia |IW(u,v)|=|I(u,v)|.(1+k.W(u,v)).

36

Figura 3.5 demonstrează un exemplu al proprietăţilor LPM. Partea (b) arată LPM al imaginii Lena (a). Partea (c) ne arată o versiune rotită şi scalată a imaginii Lena, şi (d) ne arată LPM corespunzătoare lui (c). Se poate vedea clar că rotirea şi scalarea în domeniul spaţial, original sunt convertite în translaţii în domeniul LPM.

Figura 3.5 – Exemplu al proprietăţilor LPM. (a) Imaginea originală, (b)

LPM lui (a), (c) Scalat şi rotit, şi (d) LPM lui (c)

În practică, implementarea schemei din figura 4.4 s-a dovedit a fi dificilă. De aceea autorii propun o abordare diferită, unde un marcaj transparent CDMA este plasat în domeniul amplitudinii DFT invariante la translaţii. Pentru a face marcajul transparent invariant la scalare şi rotire, se plasează un al doilea marcaj transparent ca şablon, în acest domeniu. Pentru a extrage marcajul transparent, prima oară se determină scara şi orientarea imaginii marcate prin folosirea şablonului după cum urmează:

-Este calculată transformata DFT a imaginii marcate -Sunt calculate coordonatele LPM ale amplitudinilor coeficienţilor DFT şi ale modelului şablonului -Sunt calculate „offset”-urile orizontale şi verticale dintre cele două LPM,

folosind tehnici de căutare şi intercorelaţie vaste, rezultând un factor de scalare şi rotire. In final, imaginea este transformată înapoi la mărimea şi orientarea originală, şi

este extras marcajul purtător de informaţie.

37

4. Alte tipuri de metode de marcare transparentă

4.1 Modificarea celui mai puţin semnificativ bit (LSB) Cea mai simplă metodă de a marca o imagine, este de a integra marcajul în cei mai puţin semnificativi biţi ai imaginii gazdă (cover - object). Dată fiind capacitatea extraordinar de mare a canalelor prin metoda folosirii întregii imagini purtătoare pentru transmisie, un obiect mai mic poate fi integrat de mai multe ori. Chiar dacă majoritatea acestor obiecte se pierd din cauza atacurilor, un singur marcaj supravieţuitor poate fi considerat un succes. Metoda substituirii LSB-urilor prezintă o serie de neajunsuri, în ciuda simplităţii ei. Deşi poate supravieţui transformărilor ca decuparea, orice adăugare de zgomot sau compresie cu pierderi cauzează, mai mult ca sigur, pierderea marcajului. Un atac chiar mai bun ar fi substituirea bitului LSB a fiecărui punct din imagine cu „1”, pierzându-se în totalitate posibilitatea recuperării marcării, cu un impact neglijabil asupra imaginii gazdă (cover - object). Mai departe, odată descoperit algoritmul, marcajul poate fi modificat uşor. O îmbunătăţire a tehnicii substituirii LSB-ului, ar fi folosirea unui generator de numere pseudo-aleatoare pentru a determina pixelii din imagine care urmează să fie folosiţi pentru integrarea marcajului, pe baza unei „chei” date. Securitatea marcării este îmbunătăţită din moment ce marcajul nu poate fi văzut cu uşurinţă de persoane intermediare. În schimb algoritmul rămâne în continuare vulnerabil la atacul prin substituţia LSB-ului cu o constantă. Chiar şi în locurile care nu s-au folosit pentru biţi de marcare, efectul substituirii este neglijabil asupra imaginii purtătoare. Modificarea LSB-ului se dovedeşte a fi o metodă simplă şi puternică pentru steganografie, totuşi lipseşte robusteţea de bază cerută de aplicaţiile de marcare transparentă. 4.2 Tehnica QIM

O altă metodă de marcare, diferită de tehnicile LSB si spread spectrum, este bazată pe modulaţia prin cuantizarea indexată QIM [CW99]. Cea mai simplă formă de marcare QIM cuantizează semnalul gazdă folosind un cuantizor indexat de mesajul de marcaj. Dacă se noteaza cu s semnalul marcat, cu m mesajul şi cu x semnalul gazdă, atunci s(x,m) = qm(x). Semnalul rezultat va fi compus numai din valori din setul posibil al ieşirilor cuantizorului. Acest tip de marcare este adecvat mai ales în cazul în care semnalul rezultat va fi cuantizat, de exemplu prin compresie. Modulaţia de dither poate produce un semnal care conţine toate valorile din semnalul gazdă. Din valorile cuantizate sunt translatate cu un nivel variabil de dither, de exemplu cu relaţia s(x,m) = qm(x + d) − d.

Aceste tehnici sunt mai robuste şi optimale din punct de vedere al transmiterii informaţiei decât metodele clasice de tip LSB sau SS.

38

5. Rezultate

În cele ce urmează se compară diferitele tehnici prezentate anterior. Pentru marcare s-au folosit 3 marcaje transparente diferite, din care 2 sunt arătate în figurile 5.1 şi 5.2:

Figura 5.1 – Marcaj mic (12 x 9 pixeli)

Figura 5.2 – Marcaj normal (50 x 20 pixeli)

Nu este arătat mai sus marcajul de mărime mare folosit în algoritmul LSB (substituirea celui mai nesemnificativ bit), care foloseşte marcajul normal ca să alcătuiască imaginea de mărime completă. Pentru imagine de referinţă s-a folosit imaginea Lena:

Figura 5.3 – Imaginea referinţă, Lena (512x512 pixeli)

5.1 Metode în domeniul spaţial

Rezultatele în cazul substituirii bitului celui mai nesemnificativ (LSB), au fost cele aşteptate. Imaginea marcată transparent s-a degradat foarte puţin, neobservabil, în timp ce marcajul a fost recuperat perfect.

39

Deşi marcajul transparent s-a recuperat perfect în cazul ideal, adăugarea oricărui zgomot, sau compresia imaginii folosind algoritmul JPEG, distruge în totalitate marcajul transparent plasat, lăsând doar zgomot. Chiar mai grav, marcajul poate fi eliminat cu costul unor schimbări imperceptibile asupra imaginii marcate transparent. Capacitatea canalului pentru metoda LSB este totuşi destul de bună.

Substituirea celui mai nesemnificativ bit

Figura 5.1 a - Imagine marcată PSNR= 102 dB

Figura 5.4 b – Marcajul recuperat

Robusteţea pentru substituirea celui mai nesemnificativ bit

Figura 5.5a – Marcajul recuperat după

adăugarea a 1% zgomot Gaussian

Figura 5.5b – Marcajul recuperat după

compresie JPEG cu factor de calitate Q=95

Rezultatele pentru corelaţia pe bază de prag au arătat o îmbunătăţire a robusteţii, în comparaţie cu metoda LSB. Totuşi mai mulţi parametri trebuie discutaţi, înainte de a trece la rezultatele acestei tehnici. Un factor de câştig de k=5 a fost alesă experimental; pot fi folosiţi factori mai mari pentru creşterea robusteţii cu costul degradării calităţii vizuale a imaginii.

40

Altă problemă existentă la tehnicile pe bază de prag este alegerea unui prag potrivit pentru detecţie. O metodă este stocarea corelaţiei pentru fiecare secvenţă de zgomot pseudo-aleatoare şi apoi folosirea mediei tuturor corelaţiilor ca şi prag T. Pentru marcajele transparente cu un număr relativ egal de zero-uri şi unu-uri, această tehnică ar trebui să se dovedească oarecum adaptivă la diferite tipuri de imagine, ca şi la diferite nivele de zgomot.

Figura 5.6 – Alegerea pragului conform valorii medii

Referitor la mărimea marcajului transparent care urmează să fie plasat: un marcaj mai mic va permite folosirea unor blocuri mai mari în imagine pentru inserarea marcajului, crescând corelaţia şi robusteţea sistemului. Pentru marcajul de mărime normală (fig. 5.2) de 1000 biţi, mărimea celui mai mare bloc posibil b ∈ {8,16,32...} este determinată de :

2

512 5121000b∗

≤

şi rezultă o mărime maximă a blocului b = 16. Corelaţia pe bază de prag

k = 5 mărimea blocului=16

Figura 5.7a – Imagine marcată PSNR = 94.0 dB

Figura 5.7 b – Marcaj recuperat

Deşi marcajul transparent mai poate fi recunoscut cu un factor de câştig de k=5, rezultatele nu sunt spectaculoase. Crescând câştigul, se îmbunătăţeşte calitatea vizuală a marcajului transparent, totuşi, după ce se trece de valoarea k=5, porţiunile cu zgomot

41

devin vizibile în imaginea marcată transparent, cum se observă şi în figura 5.8. Este de menţionat de asemenea scăderea severă a PSNR care este o măsură a degradării imaginii marcate faţă de cea originală.

Corelaţia pe bază de prag k = 40 mărimea blocului=16

Figura 5.8 a –Imagine puternic marcată

PSNR = 57.9 dB


Deşi marcajul transparent nu a fost recuperat perfect, corelaţia pe bază de prag se comportă mult mai bine, decât în cazul marcării LSB, în prezenţa zgomotului şi compresiei. Folosind un câştig de 5, marcajul transparent este încă greu de distins după atacul prin zgomot AWGN şi compresie. Cum era de aşteptat, crescând câştigul la 40, se îmbunătăţeşte robusteţea marcajului semnificativ.

Robusteţea corelaţiei pe bază de prag

Mărimea blocului=16

Figura 5.9 a - 5% Zgomot Gaussian (k = 5)

Figura 5.9 b - 5% Zgomot Gaussian (k = 40)

Figura 5.9 c – Compresie JPEG Q=75 (k = 5)

Figura 5.9 d – Compresie JPEG Q=75 (k = 40)

42

Recuperarea marcajului transparent s-a putut îmbunătăţi prin folosirea unui marcaj transparent mai mic (deci un număr mai mic de biţi) şi crescând mărimea blocului folosit pentru inserare. Acest lucru ar trebui să reducă numărul de erori de la detecţia normală, şi să îmbunătăţească robusteţea marcajului transparent.

O posibilă îmbunătăţire la adresa tehnicii de corelaţie pe bază de prag discutată mai sus, este folosirea a două secvenţe de zgomot pseudo-aleatoare pentru inserare; o secvenţă pentru a coda un „1” şi cealaltă pentru a coda un „0”. Această abordare are avantajul, de a nu cere alegerea „oarbă” a pragului, din moment ce modelul cu corelaţie mai mare este ales. Pe deasupra, prin alegerea cu grijă a acestor două modele în aşa fel încât să fie cât mai decorelate, se poate reduce semnificativ probabilitatea detecţiei false.

Un avantaj mai subtil este că această abordare foloseşte mai bine sistemul vizual uman prin împrăştierea zgomotului peste toată suprafaţa imaginii. Ochiul e mai sensibil la schimbări bruşte în calitatea imaginii, deci porţiunile cu zgomot în blocuri tind să deranjeze privitorii mai mult decât ar deranja un nivel constant de zgomot. Deşi valoarea de vârf a raportului semnal-zgomot, PSNR, din figura 5.10 a scăzut cu un factor de 10, imaginea rămâne aproape identică cu originalul.

Corelaţia pe bază de comparaţie

k = 5 mărimea blocului=16

Figura 5.10a – Imagine marcată PSNR = 72.5 dB


Este de menţionat că marcajul transparent pe bază de comparaţie, cu factor de

câştig k=5, a prezentat un comportament chiar mai bun decât marcajul transparent pe bază de prag, cu câştig k=40; cu impact mai puţin vizibil asupra imaginii gazdă.

Robusteţea este îmbunătăţită deasemenea, la marcajul transparent pe bază de comparaţie. Încă o dată se observă că abordarea pe bază de comparaţie cu un factor de câştig de 5 este comparabilă sau chiar mai bună decât abordarea pe bază de prag cu câştig de 40.

43

Robusteţea corelaţiei pe bază de comparaţie Mărimea blocului=16

Figura 5.11 a - 5% Zgomot Gaussian (k = 5)

Figura 5.11 b – Compresie JPEG Q=75 (k = 5)

Un dezavantaj al acestor tehnici pe bază de blocuri, în comparaţie cu tehnica LSB,

este că sunt foarte sensibile la rotiri şi decupări. Aceste transformări deteriorează sistemul de coordonate a imaginii, făcând sarcina de comparaţie a blocurilor, la plasarea şi recuperarea marcajului transparent, destul de dificilă. Totuşi, tehnica ar trebui să se dovedească destul de rezistentă la modificarea contrastului, luminozităţii şi orice alt fel de transformare a pixelilor. 5.2 Tehnici CDMA în domeniul spaţial Primele experimentări cu CDMA au demonstrat o robusteţe excepţională referitoare la zgomot şi compresie JPEG de nivel înalt, cu recuperarea impecabilă a marcajului transparent din imaginea marcată. Totuşi CDMA în domeniul spaţial are de suferit din cauza mai multor probleme ce îi limitează utilitatea. Dezavantajul principal al CDMA este capacitatea de inserare este mai limitată decât a tehnicilor similare pe bază de corelaţie. Una din cauze este că capacitatea de recuperare a marcajului scade foarte mult cu creşterea lungimii mesajelor. Au fost obţinute rezultate bune folosind marcajul mic, totuşi rezultatele cu marcajul de mărime normală au fost dezamăgitoare. De asemenea, timpul de procesare pentru marcarea transparentă CDMA în domeniul spaţial creşte exponenţial cu creşterea mărimii mesajului. CDMA pentru mesajul de mărime normală a avut nevoie de cel mai lung timp de procesare dintre toate tehnicile testate. In concluzie, CDMA s-a comportat foarte bine folosind mesajul de mărime mică. Prin experimentare, s-a ajuns la concluzia că factorul de câştig k=2 prezintă un echilibru bun între calitatea vizuală şi robusteţea marcajului transparent.

Din figura 5.13a şi 5.13b, se poate trage concluzia că CDMA în domeniul spaţial, îndeplineşte cu uşurinţă cerinţele pentru robusteţe moderată, dacă mesajele plasate sunt relativ mici. Rezultatele sunt şi mai impresionante dacă considerăm că imaginea marcată (fig. 5.13b) a fost în totalitate de nerecunoscut, după adăugarea a 50% zgomot Gaussian, pe când marcajul recuperat se mai poate încă recunoaşte.

Teoretic, CDMA ar trebui să fie rezistent la cantităţi mici de decupări şi rotiri limitate. Totuşi, limitările majore ale CDMA în domeniul spaţial vor rămâne timpul mare de procesare şi capacitatea de mesaj limitată. Plasarea marcajelor transparente mari folosind CDMA cere un câştig de plasare k mic pentru a păstra calitatea vizuală a imaginii. Totuşi, cu adăugarea mai multor secvenţe de zgomot pseudo-aleatoare la

44

imaginea gazdă, este nevoie de factori de câştig mai mari pentru a păstra corelaţia dintre secvenţele asemănătoare. Aceste cerinţe contradictorii sunt motivele pentru care CDMA în domeniul spaţial va rămâne mai limitat în capacitate decât celelalte tehnici.

CDMA cu spectru împrăştiat K = 2

Figura 5.12 a – Imagine marcată transparent

PSNR = 62.3 dB


Robusteţea CDMA cu spectru împrăştiat

k=2

Figura 5.13 a - 15% Zgomot Gaussian

Figura 5.13 b - 50% Zgomot Gaussian

Figura 5.13 c – Compresie JPEG Q=75

Figura 5.13 d – Compresie JPEG Q=50

5.3 Tehnici în domeniul DCT Rezultatele tehnicii de marcare prin modularea diferentei relative a doi coeficienti compararea coeficienţilor DCT de bandă medie au fost încurajatoare. In acest caz, k nu este un factor de câştig ca la tehnicile pe bază de corelaţie, ci un prag, mai specific,

45

reprezintă valoarea din tabela de cuantizare JPEG pentru cei doi coeficienţi comparaţi [ZK95]. Dacă diferenţa dintre cei doi coeficienţi nu depăşeşte k, aceştia sunt scalaţi în aşa fel încât să îndeplinească această cerinţă. Ca şi în tehnicile precedente, k a fost ales experimental, totuşi se pot folosi valori mai mari pentru k pentru robusteţe crescută cu costul degradării calităţii imaginii.

Compararea coeficienţilor DCT de bandă medie k = 50

Figura 5.14 a – Imaginea marcată transparent

PSNR = 67.6 dB


Robusteţea tehnicii prin compararea coeficienţilor DCT de bandă medie

K=50





În figura 5.14 se poate observa că tehnica funcţionează perfect pentru imagini

nealterate, cu calitate vizuală bună a imaginii marcate transparent. Mărimea blocurilor

46

pentru fiecare dintre tehnicile pe bază de DCT, a fost constantă la 8x8, pentru anticiparea compresiei JPEG. Se pot obţine rezultate mai bune folosind blocuri mai mari, cu costul reducerii lungimii mesajului.

Metoda de marcare prin compararea coeficienţilor DCT s-a dovedit a fi destul de robustă la zgomot Gaussian şi extrem de robustă împotriva compresiei JPEG. Rezultatele recuperării au fost încă bune la recuperare cu o imagine marcată transparent, care a fost comprimată JPEG, cu un factor de calitate Q=20, deşi imaginea marcată şi comprimată astfel, a prezentat artefacte JPEG puternice.

Cea mai bună comparaţie poate fi făcută cu CDMA în domeniul spaţial. Deşi CDMA spaţial a fost mai rezistent la zgomotul Gaussian, tehnica prin compararea coeficienţilor DCT s-a dovedit mult mai rezistenă la compresia JPEG. Acest lucru ar tinde să indice că inserarea marcajului în acelaşi domeniu în care au loc distorsiuni (de exemplu compresia), este clar mai avantajoasă. Prin anticiparea coeficientului DCT care urmează să fie alterat folosind compresia JPEG, se poate atinge un nivel foarte mare pentru robusteţe.

Rezultatele tehnicii DCT pe bază de corelaţie sunt similare cu cele de mai sus. DCT pe bază de corelaţie a fost puţin mai slabă pentru nivele mici de distorsiune, dar mai performantă pentru nivele mari de distorsiune. Deşi a fost implementată corelaţia pe bază de prag în banda medie DCT, rezultatele obţinute au fost mai slabe decât cu abordarea pe bază de comparaţie arătată mai jos. Se ştie deja din rezultatele corelaţiei spaţiale că utilizarea a două secvenţe de zgomot pseudo-aleatoare este mai bună sub aproape toate aspectele, şi ca urmare rezultatele pe bază de prag nu vor fi prezentate aici.

Tehnica prin corelaţie pe bază de comparaţie în banda medie DCT k = 15

Figura 5.16a – Imaginea marcată PSNR=65.7 dB


Chiar şi fără modificarea imaginii marcate transparent, se poate observa deja un număr de erori la detecţie în marcajul recuperat (fig.5.16b). A fost nevoie de un factor de câştig de 25 pentru ca marcajul să fie detectat fără erori, totuşi la acest factor de câştig distorsiunile cauzate de plasarea marcajului au devenit vizibile. Modelul „zigzag”, introdus de această tehnică folosind un câştig mare, este foarte obişnuit şi mai deranjant

47

pentru privitor decât zgomotul mic introdus la folosirea metodei comparării coeficienţilor. Nu prezintă nici un interes faptul că acest model in zigzag ar fi eliminat dacă s-ar alege secvenţe de zgomot pseudo-aleatoare separate pentru fiecare bloc. Acest lucru ar cere însă revenirea la detecţia pe bază de prag, şi probabil performanţa globală ar avea de suferit.

Robusteţea tehnicii prin corelaţie pe bază de comparaţie în banda medie DCT k=15





Interesant este faptul că marcajul recuperat dintr-o imagine comprimată JPEG cu factor de calitate Q=50 este de fapt mai bun decât cel recuperat dintr-o imagine marcată nealterată. Acest lucru ar indica că erorile la detecţie în sursa nemodificată sunt chiar la limita corelaţiei, şi adăugarea de zgomot este suficientă pentru a o depăşi. Tehnicile DCT pe bază de blocuri discutate au un dezavantaj comun cu tehnicile pe bază de corelaţie din domeniul spaţial descrise anterior, şi anume fragilitatea la scalare, decupare şi alte transformări geometrice. Decuparea imaginii, sau scalarea lui la un nemultiplu al imaginii marcate transparent afectează sistemul de coordonate de care depinde DCT pe bază de blocuri. O îmbunătăţire posibilă ar fi plasarea unei secvenţe de zgomot pseudo-aleatoare independente, ca o “origine”, la care să se raporteze toate celelalte locaţii. Dacă acest model ar fi plasat în centrul imaginii, primul pas al recuperării ar fi trecerea acestei secvenţe de-a lungul imaginii şi înregistrarea locurilor unde corelaţia are un maxim. Orientarea iniţială a imaginii ar putea fi determinată prin rotirea secvenţei de zgomot pseudo-aleatoare în jurul originii, până când corelaţia atinge un maxim. Cunoscând locaţia originii şi orientarea iniţială a imaginii, imaginea ar putea fi rotită înapoi în poziţia originală, şi toate blocurile s-ar raporta la aceasta. 5.4 Tehnici în domeniul wavelet Datorită modelării eficiente, din punct de vedere a calculelor, a sistemului vizual uman, domeniul wavelet oferă poate cel mai promiţător mediu pentru marcarea transparentă robustă. CDMA în domeniul wavelet a fost prima oară testată folosind

48

mesajul de mărime mai mică, şi apoi folosind mesajul de mărime normală în majoritatea implementărilor.

CDMA cu spectru împrăştiat în domeniul wavelet k = 2 cu marcaj de mărime mică

Figura 5.18 a – Imagine marcată PSNR=68.1 dB


Algoritmul a permis recuperarea fără probleme a marcajului mic din imaginea marcată transparent, care s-a degradat foarte puţin datorită integrării marcajului. Chiar şi cu un factor de câştig minimal de k=2, algoritmul a fost încă în măsură să ofere robusteţe moderată la zgomot Gaussian şi compresie JPEG, cum se şi vede în figura 5.19 de mai jos. Marcajul transparent recuperat, a fost de recunoscut şi când imaginea gazdă a fost puternic degradată, prin adăugarea a 50% zgomot Gaussian, sau compresie JPEG cu factor de calitate Q=20.

Robusteţea CDMA de spectru împrăştiat în domeniul wavelet k=2





49

În timp ce la marcarea folosind tehnici CDMA în domeniul spaţial marcajul s-a degradat cu creşterea mărimii imaginii, la marcarea folosind tehnici CDMA în domeniul wavelet marcajul a fost integrat normal, şi s-au obţinut rezultate bune. În figura 5.20 se vede mesajul normal de 1000 de biţi plasat în imaginea gazdă cu câştig moderat, recuperat cu eroare de doar un singur bit.

Robusteţea a fost bună folosind mesajul de mărime normală,. În figura 5.21 se poate vedea că marcajul transparent mai poate fi recunoscut la detecţie, chiar şi cu adăugarea unui nivel moderat de zgomot Gaussian la imaginea gazdă. Robusteţea la compresie JPEG a fost şi mai bună, marcajul putind fi recunoscut chiar şi după compresie JPEG, cu factor de calitate Q=20. Această abordare pare să combine capacitatea de mesaj a tehnicilor pe bază de blocuri, cu imunitatea la zgomot a CDMA în domeniul spaţial. In plus, deoarece secvenţele de zgomot pseudo-aleatoare au, în acest caz o lungime înjumatăţită, complexitatea calculelor algoritmului este redusă la jumătate. Tehnica CDMA în domeniul wavelet pare să fie cea mai promiţătoare dintre tehnicile de marcare transparentă testate. Algoritmul descris este unul dintre cei mai simpli din domeniul wavelet, iar rezultatele sunt foarte bune. Aceste rezultate conduc la concluzia că domeniul wavelet este cel mai promiţător domeniu pentru marcarea transparentă digitală.

CDMA de spectru împrăştiat în domeniul wavelet k = 2 cu marcaj de mărime normală

Figura 5.20 a – Imagine marcată transparent

PSNR = 55.2 dB


50

Robusteţea CDMA de spectru împrăştiat în domeniul wavelet, K=2

Figura 5.21a - 5% Zgomot Gaussian




Concluzii

În lucrare s-au abordat doar cele mai importante tehnici de marcare digitală. Metoda pe bază de corelaţie aparţine primei categorii. Aici marcajul transparent este plasat prin adăugarea zgomotului pseudo-aleator la componentele imaginii, şi detectat prin corelarea acestui zgomot cu componentele respective de imagine. A doua categorie conţine tehnicile care nu se bazează pe corelaţie. Aceaste metode de marcare pot fi împărţite în două grupuri: grupul bazat pe modificarea LSB şi grupul bazat pe relaţii geometrice. Tehnica LSB nu este un candidat foarte bun pentru marcarea transparentă digitală, datorită lipsei unui nivel minim de robusteţe. Marcajele transparente plasate prin metoda LSB pot fi cu uşurinţă îndepărtate folosind tehnici care nu afectează în mod vizibil calitatea imaginii. Pe deasupra, dacă se foloseşte unul dintre algoritmii cei mai populari, mesajul integrat poate fi cu uşurinţă recuperat sau chiar modificat de către un terţ. Se pare că metoda substituţiei LSB va rămâne în domeniul steganografiei datorită capacităţii sale de a îngloba informaţie. Marcajul folosit în domeniul coeficienţilor DCT s-a dovedit a fi foarte rezistent la compresia JPEG, şi la un nivel mare de zgomot. Prin anticiparea coeficienţilor care urmează a fi modificaţi de cuantizările şi transformările ce urmează, se poate crea o tehnică de marcare cu robusteţe moderată, capacitate bună şi impact vizual minim. Marcarea în domeniul wavelet s-a dovedit foarte rezistentă la compresie şi zgomot, cu degradarea minimă a calităţii imaginii. Domeniul wavelet pare să fie cel mai promiţător domeniu găsit până acum. Marcarea transparentă digitală este încă un domeniu de cercetare foarte atractiv, care permite noi abordari si solutii. Nota: Simulările din acest referat au fost efectuate de către autoare folosind sursele Matlab online date de către C. Shoemaker [Shoe02].

51

Bibliografie [BB01] T. Bajenescu, M.Borda, Securitatea in informatica si telecomunicatii, ed.

Dacia 2001. [BBCP98] F. Bartolini, M. Barni, V. Cappellini, and A. Piva, “Mask building for

perceptually hiding frequency embedded watermarks,” in Proc. 5th IEEE Int. Conf. Image Processing ICIP’98, vol. I, Chicago, IL, Oct. 4-7, 1998, pp. 450-454.

[BN04] M. Borda, I. Nafornita, “Digital Watermarking – Principles and Applications”, Proc. Of Int. Conf. Communications 2004, pp.41-54.

[Brau97] G.W. Braudaway, “Protecting publicly-available images with an invisible watermark,” in Proc. ICIP 97, IEEE Int. Conf. Image Processing, Santa Barbara, CA, Oct. 1997, pp. 524-531.

[CKLS95] I.J. Cox, J. Kilian, T. Leighton, and T. Shamoon, “Secure spread spectrum watermarking for multimedia,” NEC Res. Insti., Princeton, NJ, Tech. Rep. 95-10, 1995.

[CKLS97] I.J. Cox, J. Kilian, F.T. Leighton, T. Shamoon, Secure spread spectrum watermarking for multimedia, IEEE Trans. On Image Processing, Vol. 6, No. 12, Dec. 1997, pp.1673-1687.

[CW99] Brian Chen, Gregory W. Wornell, Quantization Index Modulation: A Class of Provably Good Methods for Digital Watermarking and Information Embedding (1999), ISIT: Proceedings IEEE International Symposium on Information Theory.

[DKL98] G. Depovere, T. Kalker, and J.-P. Linnartz, “Improved watermark detection using filtering before correlation,” in Proc. 5th IEEE Int. Conf. Image Processing ICIP’98, vol. I, Chicago, IL, Oct. 4-7, 1998, pp. 430-434.

[Fau93] O. Faugeras, Three Dimensional Computer Vision: A Geometric Viewpoint. Cambridge, MA: MIT Press, 1993

[FH97] D.J. Fleet and D.J. Heeger, “Embedding invisible information in color images,” in Proc. ICIP 97, IEEE Int. Conf. Image Processing, Santa Barbara, CA, Oct. 1997.

[HAPG00] J.R. Hernández, M. Amado, and F. Pérez-Gonzalez, “DCT-Domain watermarking techniques for still images: Detector performance analysis and a new structure,” IEEE Trans. Image Processing, vol. 9, pp. 55-68, Jan. 2000.

[HLR00] A. Hanjalic, G.C. Langelaar, P.M.B. van Roosmalen, J. Biemond, and R.L. Lagendijk, Image and Video Databases: Restoration, Watermarking and Retrieval (Advances in Image Communications, vol. 8). New York: Elsevier Science, 2000.

[HPRP98] A. Herrigel, H. Petersen, J. O Ruanaidh, T. Pun, and P. Shelby, “Copyright techniques for digital images based on asymmetric cryptographic techniques,” presented at Workshop on Information Hiding, Portland, Oregon, USA, Apr. 1998.

[HRPP98] A. Herrigel, J.J.K. Ó Ruanaidh, H. Petersen, S. Pereira, and T. Pun, “Secure copyright protection techniques for digital images,” in

52

Information Hiding (Lecture Notes in Computer Science, vol. 1525), D. Aucsmith, Ed. Berlin, Germany: Springer, 1998, pp. 169-190.

[HW96] C.-T. Hsu and J.-L. Wu, “Hidden signatures in images,” in Proc. ICIP-96, IEEE Int. Conf. Image Processing, vol. III, Lausanne, Switzerland, Sept. 16-19, 1996, pp. 223-226.

[Jai81] A.K. Jain, “Image data compression: A review,” Proc. IEEE, vol. 69, pp. 349-389, Mar. 1981.

[KDHM99] T. Kalker, G. Depovere, J. Haitsma, and M. Maes, “A video watermarking system for broadcast monitoring,” in Proc. SPIE Electronic Imaging ‘99, Security and Watermarking of Multimedia Contents, San Jose, CA, Jan. 1999, pp. 103-112.

[KJB97] M. Kutter, F. Jordan, and F. Bossen, “Digital signature of color images using amplitude modulation,” in Proc. SPIE Electronic Imaging ‘97, Storage and Retrieval for Image and Video Databases V, San Jose, CA, Feb. 1997, pp. 518-526.

[KP99] M. Kutter and F.A.P. Petitcolas, “A fair benchmark for image watermarking systems,” in Proc. Electronic Imaging ‘99, Security and Watermarking of Multimedia Contents, vol 3657, San Jose, CA, Jan. 25-27, 1999, pp. 226-239.

[LLL97] G.C. Langelaar, J.C.A. van der Lubbe, and R.L. Lagendijk, “Robust labeling methods for copy protection of images,” in Proc. SPIE Electronic Imaging ‘97, Storage and Retrieval for Image and Video Databases V, San Jose, CA, Feb. 1997, pp. 298-309.

[LR00] T. Liang and J. Rodriguez, “Improved watermarking robustness via spectrum equalization,” in Proc. IEEE ICASSP 2000, Istanbul, Turkey, June 5-9, 2000.

[LSL00] G. C. Langelaar, I. Setyawan, and R. Lagendijk, “Watermarking digital image and video data: A state-of-the-art overview,” IEEE Signal Processing Mag., vol. 17, no. 5, pp. 20–46, Sept. 2000.

[MQ95] B.M. Macq and J.-J. Quisquater, “Cryptology for digital TV broadcasting,” Proc. IEEE, vol. 83, pp. 944-957, June 1995.

[NCH99] K.S. Ng and L.M. Cheng, “Selective block assignment approach for robust digital image watermarking,” in Proc.SPIE/IS&T Int. Conf. Security and Watermarking of Multimedia Contents, vol. 3657, San Jose, CA, Jan. 25-27, 1999, pp. 14-17.

[NP96] N. Nikolaidis and I. Pitas, “Copyright protection of images using robust digital signatures,” in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing (ICASSP-96), vol. 4, Atlanta, GA, May 1996, pp. 2168-2171.

[PM93] W.B. Pennebakker and J.L. Mitchell, The JPEG Still Image Data Compression Standard. New York: Van Nostrand, 1993.

[RDB96] J.J.K. Ó Ruanaidh, W.J. Dowling, and F.M. Boland, “Phase watermarking of digital images,” in Proc. IEEE Int. Conf. Image Processing, vol. III, Lausanne, Switzerland, Sept. 16-19, 1996, pp. 239-242.

[RP98a] J.J.K. O Ruanaidh and S. Pereira, “A secure robust digital image watermark” Electronic Imaging: Processing, Printing and Publishing in Colour, SPIE Proceedings, Zürich, Switzerland, May 1998.

53

[RP98b] J.J.K. Ó Ruanaidh and T. Pun, “Rotation, scale and translation invariant spread spectrum digital image watermarking,” Signal Processing, vol. 66, no. 3, pp. 303-317, May 1998.

[SC96] J.R. Smith and B.O. Comiskey, “Modulation and information hiding in images,” in Preproc. Information Hiding, University of Cambridge, U.K., May 1996. Pg 9: 93/SC96, 73

[Shoe02] C.Shoemaker, Hidden Bits: A Survey of Techniques for Digital Watermarking, http://www.vu.union.edu/~shoemakc/watermarking .

[STO94] R.G. van Schyndel, A.Z. Tirkel, and C.F. Osborne, “A digital watermark,” in Proc. IEEE Int. Conf. Image Processing, vol. 2, Austin, TX, Nov. 1994, pp. 86-90.

[SW49] C.E. Shannon and W.W. Weaver, The Mathematical Theory of Communications Urbana, IL: Univ. of Illinois Press, 1949.

[VP96] G. Voyatzis and I. Pitas, “Applications of Toral automorphisms in image watermarking,” in Proc. ICIP-96, IEEE Int. Conf. Image Processing, vol. II, Lausanne, Switzerland, Sept. 16-19, 1996, pp. 237-240.

[Wan95] B. A. Wandell, “Foundations of vision,” Sinauer Associates, Inc., Sunderland, MA, 1995.

[XBA98] Xiang-Gen Xia, Charles G. Boncelet and Gonzalo R. Arce, Wavelet transform based watermark for digital images, 7 Dec. 1998, Vol. 3, No. 12, Optics Express, pp. 497-511.

[ZK95] J. Zhao, E. Koch, “Embedding robust labels into images for copyright protection”, 1995

54

Date post:	22-Oct-2015
Category:	Documents
Upload:	albertina-diana
View:	90 times
Download:	8 times

marcarea transparenta a datelor

Documents