+ All Categories
Home > Documents > Automatăa Informa iei

Automatăa Informa iei

Date post: 13-Apr-2022
Category:
Upload: others
View: 11 times
Download: 0 times
Share this document with a friend
24
Dr.ing. Ionuț Mironică Conf.dr.ing. Bogdan Ionescu TACAI - Tehnici de Analiză și Clasificare Automată a Informației LAPI Laboratorul de Analiza şi Prelucrarea Imaginilor Universitatea POLITEHNICA din Bucureşti Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei Note de laborator
Transcript
Page 1: Automatăa Informa iei

Dr.ing. Ionuț MironicăConf.dr.ing. Bogdan Ionescu

TACAI - Tehnici de Analiză și Clasificare Automată a Informației

LAPI – Laboratorul de

Analiza şi Prelucrarea

Imaginilor

Universitatea

POLITEHNICA din

Bucureşti

Facultatea de Electronică,

Telecomunicaţii şi

Tehnologia Informaţiei

Note de laborator

Page 2: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 2

Cuprins:

Fuzionarea descriptorilor

Analiza componentelor principale (PCA)

Exerciții

Laborator 3

Page 3: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 3

I. Fuzionarea descriptorilor

Introducere

În cele mai multe dintre cazuri, pentru reprezentareaconținutului multimedia este necesară combinarea mai multortipuri de descriptori.

De exemplu, continutul unui document video poate fireprezentat atat pe baza structurii temporale, cât și folosinddescriptori de mișcare, descriptori audio.

Strategiile de fuziune a datelor se bazează pe ipoteza conformcăreia o decizie obținută pe baza mai multor descriptori poateoferi performanțe superioare unei decizii bazate pe un singur tipde descriptor.

Page 4: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 4

• Tehnicile de tip ”early fusion” realizează agregarea datelor„timpuriu” în lanțul de prelucrare, înainte de a fi folosite laindexare sau în alte procese de analiză.

• Fuziunea datelor are loc în spațiul de caracteristici (și constăpractic în concatenarea propriu-zisă a tuturor descriptorilor fărăa ține cont de redundanța acestora.

I. Fuzionarea descriptorilor

Introducere

Page 5: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 5

Descriptor global

Concatenare

Decizie

Descriptor 1

Descriptor 2

Descriptor n

Extracție de

trăsături

Descriptor 1

normalizat

Descriptor n

normalizat

Descriptor 2

normalizat

Normalizare de

trăsături

Clasificator

Clasificare

I. Fuzionarea descriptorilor

Schemă fuzionare (early fusion)

Page 6: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 6

• De exemplu, dacă obiectul multimedia X este descris dedescriptorii de conținut desc1 = {a1, a2, ..., an}, desc2 = {b1, b2,..., bm} și respectiv desc3 ={c1, c2, ..., cl}, descriptorul agregateste dat de concatenarea valorilor și anume desce−f = {a1, ..., an,b1, ..., bm, c1, ..., cl}.

• Descriptori diferiți tind să aibă intervale de variație diferite alevalorilor, de la normalizări diferite, de exemplu valori între [0; 1]sau [a; b] (unde a și b sunt două valori cunoscute) până laintervale de valori variabile și care depind de tipul datelor.

I. Fuzionarea descriptorilor

Normalizarea descriptorilor

Page 7: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 7

Normalizarea min-max

Fie desc1 = {a11, a12, ..., a1n} descriptorul unui obiect multimedia.Descriptorul se va normaliza cu formula:

unde min{ai} și max{ai} reprezintă operatorii ce returneazăvaloarea minimă și respectiv maximă a tuturor valorilordescriptorilor (pentru toate obiectele multimedia considerate)pentru atributul ai.

Normalizarea min-max asigură o normalizare a valorilor înintervalul [0; 1].

I. Fuzionarea descriptorilor

Page 8: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 8

Normalizarea z-score

Fie desc1 = {a11, a12, ..., a1n} descriptorul unui obiect multimedia.Descriptorul se va normaliza cu formula:

unde operatorii medie{ai} și σ{ai} returnează valoarea medie șirespectiv abaterea pătratică medie a tuturor valorilordescriptorilor pentru atributul ai.

Normalizarea z-score realizează o normalizare a valorilor pe odistribuție de medie zero și dispersie unu.

I. Fuzionarea descriptorilor

Page 9: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 9

Introducere

În algoritmii de recunoaștere a formelor, selecţia caracteristicilorrelevante poate reprezenta o alegere decisivă pentru proiectareaoricărui clasificator.

Selecţia caracteristicilor poate fi văzută și ca un proces de„compresie de date”, fiind asimilată cu o transformare liniară dinspaţiul iniţial al observaţiilor într-un spaţiu cu mai puţinedimensiuni. O astfel de transformare este necesară deoarece poateconserva o mare parte din informaţie și permite aplicarea unoralgoritmi în timp real, algoritmi eficienţi fiind doar în spaţii cudimensiuni reduse.

II. Analiza componentelor principale

Page 10: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 10

Transformata Karhunen-Loéve

Transformata Karhunen-Loéve (Analiza Componentelor Principale -PCA) este o metodă liniară de selecţie a caracteristicilor.

Schemă algoritm• se calculează matricea de covariație a descriptorilor de intrare;• se calculează valorile proprii si se ordoneaza descrescator:

λ1>λ2>…> λn• se calculeaza vectorii proprii asociati valorilor proprii: [Φ1, Φ2, …,

Φn]• se construiește matricea K a vectorilor proprii: K= [Φ1, Φ2, …,

Φn]

II. Analiza componentelor principale

Page 11: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 11

Transformata Karhunen-Loéve

Schemă algoritm (continuare)• numărul "m" de trăsături care se reţin după transformarea

unitară se obţine din valoarea maximă admisibilă a erorii mediipătratice de estimare.

• fiecarei descriptor de intrare X i se va aplica transformareaKarhunen-Loève:Y = KX

• Se vor reţine numai m < n componente ale lui Y.

Pentru implementarea PCA se poate utiliza biblioteca Matlab Prtools(http://prtools.org/) sau Weka (secțiunea Preprocess).

II. Analiza componentelor principale

Page 12: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 12

Weka - PCA

II. Analiza componentelor principale

Choose

Page 13: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 13

Weka - PCA

II. Analiza componentelor principale

PrincipalComponents

Page 14: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 14

Weka - PCA

II. Analiza componentelor principale

Apply

Page 15: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 15

Weka - PCA

II. Analiza componentelor principale

Page 16: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 16

Weka - PCA

II. Analiza componentelor principale

Procent de informativeretinuta

Page 17: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 17

III. Exerciții

Pentru cele două baze de date (texturi și imagini naturale):

Realizați un program în Matlab care calculează rând pe rând ceitrei descriptori (Color Moments, LBP și HoG) și îi concateneazăîntr-un singur descriptor.

Apoi se încarcă în Weka și se testează rând pe rând performanțaclasificatorilor ZeroR, Nearest Neighbor (IBK), Naive Bayes, SVMși rețele neuronale.

Rețineți performanțele într-un fișier text.

Exercițiul 1

Page 18: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 18

III. Exerciții

Schemă algoritm Matlab:(imagePaths, labels) = Citește fișier de configurare (train.txt)

descriptors %inițializare matrice pentru export în fișier arff

pentru fiecare imagine din bază (contor i)

- im = citeșteImagine(i)

- desc1 = CalculDescriptor1(im);

- desc2 = CalculDescriptor2(im);

- desc3 = CalculDescriptor3(im);

- desc = concat(desc1, desc2, desc3);

- Adaugă variabilei descriptors -» concat (desc, labels(i))

Salvează variabila descriptors în fișier arff

Exercițiul 1 - continuare

Page 19: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 19

III. Exerciții

Pentru cele două baze de date (texturi și imagini naturale):

Realizați un program în Matlab care calculează rând pe rând ceitrei descriptori (Color Moments, LBP și HoG), îi normalizează(folosind min-max sau z-score) și îi concatenează într-un singurdescriptor.

Apoi se încarcă în Weka și se testează rând pe rând performanțaclasificatorilor ZeroR, Nearest Neighbor (IBK), Naive Bayes, SVMși rețele neuronale.

Rețineți performanțele într-un fișier text.

Comparați performanțele cu cele obținute în exercițiul anterior.

Exercițiul 2

Page 20: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 20

III. Exerciții

Schemă algoritm Matlab:

(imagePaths, labels) = Citește fișier de configurare (train.txt)

descriptors %inițializare matrice descriptori ne-normalizați

descriptorsNormalized %inițializare matrice pentru export în fișier arff

pentru fiecare imagine din bază (contor i)

- im = citeșteImagine(i)

- desc1 = CalculDescriptor1(im);

- desc2 = CalculDescriptor2(im);

- desc3 = CalculDescriptor3(im);

- desc = concat(desc1, desc2, desc3);

- Adaugă variabilei descriptors -» concat (desc)

Exercițiul 2 - continuare

Page 21: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 21

III. Exerciții

Schemă algoritm Matlab:

Calculează min, max, media, dispersie pentru descriptori;

pentru fiecare descriptor calculat (contor i)

- desc = Normalizează(descriptor(i));

- Adaugă variabilei descriptorsNormalized -» concat (desc, labels(i))

Salvează variabila descriptorsNormalized în fișier arff

Exercițiul 2 - continuare

Page 22: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 22

III. Exerciții

Pentru baza de date de imagini naturale:

Realizați un program în Matlab care calculează descriptorul HoG.

Încărcaţi fişierul în Weka și aplicaţi o transformare PCA (care sărețină rând pe rând 90%, 95% și 98% din descriptor).

Testaţi rând pe rând performanța clasificatorilor ZeroR, NearestNeighbor (IBK), Naive Bayes, SVM și rețele neuronale.

Rețineți performanțele într-un fișier text.

Comparați performanțele cu cele obținute în cazul în carefolosim doar descriptorul HoG singur.

Exercițiul 3

Page 23: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 23

IV. Exerciții

Să se facă salvarea în mod automat din Matlab a fișieruluiarff;

Să se rezolve exerciţiul 3 prin utilizarea bibliotecii prtoolspentru aplicarea algoritmului PCA.

Exerciții suplimentare

Page 24: Automatăa Informa iei

15.05.2018 TACAI – dr.ing. Ionuț Mironică 24

Spor!


Recommended