+ All Categories
Home > Documents > JMP Referat

JMP Referat

Date post: 29-Sep-2015
Category:
Upload: diana-raluca-cristea
View: 249 times
Download: 1 times
Share this document with a friend
Description:
jmp
22
Cibernetică, Statistică şi Informatică Economică
Transcript

Pachetul software statistic JMP: aplicaii

Cibernetic, Statistic i Informatic Economic13Pachetul software statistic JMP: aplicaiiPachete softwareCorcodel Ancua Elena, Cristea Diana Raluca, seria C, grupa 1054

Introducere

JMP avantajul explorrii grafice a datelor n analiz statistic

JMP este un software pentru grafic statistic interactiv i folosete o interfa grafic extraordinar pentru a afia i analiza datele. Software-ul ofer o varietate de metode statistice i grafice, organizate ntr-un numr mic de platforme interactive.

Cele mai importante aspecte care defines programul statistic JMP sunt: facilitatile de gestiune a datelor statistice, functiile de analiza statistica disponibile, facilitati de reprezentare grafica, interfata cu utilizatorul.

Facilitile de reprezentare grafic se refer n special la flexibilitatea n generarea graficelor bazate pe date i pe rezultate, dar i la facilitile de configurare i adaptare a reprezentrilor (prin culori, simboluri).

Interfaa cu utilizatorul asigur un echilibru ntre accesul rapid la cele mai utilizate funcii i flexibilitatea de adaptare a prelucrarilor conform cerintelor utilizatorilor.

Prezentarea rezultatelor se face n ferestre sau zone specializate, n diferite formate (tabular, text, grafic).

Cele mai importante aspecte care defines programul statistic JMP sunt: facilitatile de gestiune a datelor statistice, functiile de analiza statistica disponibile, facilitati de reprezentare grafica, interfata cu utilizatorul.

JMP ofer facilitati pentru analiza statistic i explorare, care permit utilizatorului: * S descopere : grafica interactiv pentru a observa modelele i relaiile dintre date; * S interactioneze : atunci cnd un produs este uor de utilizat, utilizatorul se concentreaz mai degrab asupra problemei, dect asupra programului folosit a vedea problema. * S inteleag mai multe : datorit graficii, utilizatorul observ modul n care datele i modelul lucreaz mpreun pentru a oferi rezultatul statistic.

Accesul la tabelele de date:

Toate exemplele din cadrul documentatiei JMP utilizeaza esantioane de date predefinite. Pentru a realiza accesul acestora selectezi Help > Sample Data. De aici poti realiza urmatoarele: Sa deschizi un director; Sa deschizi o lista ordonata alfabetic a tuturor tabelelor continand esantioanele de date; Sa gasesti o tabela intr-o categorie anume;

Despre tipurile de date necesare modelarii proceselor statistice:

Tipurile utilizate in procese transmit JMP-ului, cum sa se reactioneze in timpul analizei. Schimbarea tipului iti permit sa privesti o variabila din mai multe puncte de vedere in timpul analizei.

Descrierea tipurilor:ContinuuColoanele pot contine doar tipuri de date numerice. Valorile continue sunt tratate ca valori de masura continue. JMP utilizeaza valori numerice direct in calcule.

OrdinalColoanele pot contine fie tipuri numeric, fie tipuri caracter. Analizele JMP trateaza valorile ordinale ca niste categorii discrete care au o ordine. Daca valorile sunt numere, ordinea este cea normala. Daca valorile sunt caractere, ordinea este alfabetica.

NominalColoanele pot contine fie tipuri numerice, fie tipuri caracter. Toate valorile sunt tratate in analizele JMP daca sunt discrete fara o ordine implicita.

Alegerea tipului de analiza si lansarea programului

Tabelul urmator asigura cateva exemple pentru a alege o analiza si de a lansa platforma corespunzatoare. ScopulAnaliza

Analiza distributiei valorilorAnalyze > Distribution

Analiza relatiei dintre doua variabileAnalyze > Fit Y by X

Graficul variabilelor continue X si YGraph > Overlay Plot

Puncte mobile pe un grafic de imprastiere a datelor (scatterplot)Graph > Bubble Plot

Completarea unei ferestreDupa ce lansezi o platforma, va aparea o fereastra. Utilizeaza fereastra lansata pentru a-ti seta analiza prin mutarea coloanelor in roluri.Fereastra unui raport Odata ce ai completat fereastra de lansare (care ruleaza analiza) vei vedea o fereastra de raport. De exemplu, figura de mai jos. Poti folosii acest output pentru a realiza o interpretare a datelor.Platforma de distributie descrie distributia variabilelor utilizand histograme, grafice aditionale si rapoarte. Poti examina distributia mai multor variable o singura data. Continutul-raport al fiecarei variabile variaza, depinzand fie daca variabila este de categorie (nominala sau ordinala), fie continua.Fereastra de raport a distributiei este interactiva. Dand click pe orice bara evidentiata din distributie, este evidentiata aceeasi data in tabelul de date.Din histograma observam urmatoarele: Varstele nu sunt uniform distribuite. Pentru inaltime sunt 2 puncte cu valori extreme. Varstele corespunzatoare sunt evidentiate in histograma varstelor. Varsta potentiala este de 12 ani. Randurile corespunzatoare sunt evidentiate in tabelul de date. Numele potentiale sunt Lillie si Robert.

Histogramele afiseaza vizual datele tale. Pentru cele de categorie (nominale sau ordinale), histograma afiseaza cate o bara pentru fiecare nivel al variabilelei nominale sau cardinale. Pentru variabilele continue, histograma afiseaza cate o bara pentru fiecare grupa de valori ale variabilei continue.Mozaicul de imprastiereOptiunea Mosaic Plot afiseaza o diagrama mozaic pentru fiecare variablila de raspuns fie nominala, fie cardinala. Aceasta este o diagrama fixa unde fiecare segment este proportional cu grupul sau de frecventa.

Testarea probabilitatilor Utilizam testarea posibilitatilor pentru a introduce probabilitati ipotetice. Raportul de testarea probabilitatilor contine diferite optiuni, depinzand daca variabilele au mai mult decat doua niveluri, sau exact doua niveluri.Testul pentru probabilitati scaleaza valorile ipotetice pe care tu le introduci, astfel incat probabilitatile se insumeaza intr-una. Cea mai usoara cale sa iti testezi daca toate probabilitatile sunt egale este sa introduci cate una in fiecare camp. Daca doresti sa testezi un subset de probabilitati, atunci nu introduce o valoare pentru orice nivel care nu sunt implicate. JMP substituie probabilitatile estimate.

Normal Quantile plotUtilizam optiunea Normal Quantile plot sa vizualizam masura in care o variabila este normal distribuita. Daca o variabila este normal distribuita, quantila normala aproximeaza o linie diagonala dreapta. Acest tip de plot este de asemenea numit un plot quantila-quantila sau un plot Q-Q.

Testul medieiPentru a realiza media unei singure variabile se poate folosii optiunea Test Mean. Daca introducem o valoarea reala pentru abaterea standard programul realizeaza un test z. Altfel, esantionul pentru abaterea standard este folosit pentru a rula testul t. De asemenea, se poate face apel la un test fara parametric Wilcoxon.

Distributia variabilelorPentru a face mai usoara identificarea disttributiei unei variabile JMP traseaza o curba peste histrograma alaturi de un raport al estimarii parametrilor. JMP dispune de numeroase tipuri de distributii pentru: Variabilele continue: Normala, Logaritmarea Normalei, Weibull, Weibull cu prag si valori extreme, Exponentiala, Gamma, Beta, Johnson Su, Johnson Sb, Johnson SI si altele. Variabilele discrete: Poisson, Binomiala, Gamma Poisson, Beta BinomialaDistributia Normala este des utilizata pentru a masura daca modelul prezinta simetrie asupra valorilor din mijlocul curbei. Selectarea optiunii potrivirii normale pentru orice set de date arata cat de bine se incadreaza distributia normala asupra inregistrarilor.Distributia Gamma este realizata de JMP prin estimarea parametrilor specifici acestei distributii , si anume > 0 si >0. Parametrul , denumit alpha in raport, descrie forma sau curbura. Parametrul , denumit sigma, este parametrul de scala al distributiei. Un al treilea parametru, , denumit generic prag, este parametrul ce descrie cea mai mica valoare a distributiei. Acesta este setat cu valoarea 0, doar daca nu exista si valori negative ale datelor.

Diagnostic Plot Figura din dreapta prezinta optiunea de a aranja intr-un grafic quantila sau probabilitatea in mijlocul valorii variabilelor dupa cazul distributiei folosite.Distributia variabilei dependente Y de variabila independent XExista 4 tipuri de analiza: Analiza bivariata; Analiza singulara; Regresia logistica; Tabela anlizei contigentei;Analiza bivariata realizeaza graficul relatiei dintre dou variabile continue. Cea singulara analizeaza distributia variabilei continue Y in legatura cu o variabila nominala sau ordinal X . Regresia logistica foloseste variabila nominala sau ordinal Y in raport cu una continua X pentru a descrie probabilitatile de raspuns la categoriile lui Y. Ultimul tip de analiza, cel pe baza unei tabele de contingent foloseste atat Y cat si X ca variabile nominale sau ordinale.

DensitatiOptiunea Densitati ofera cateva posibilitati de a compara distributia si compozitia raspunsului la diferite niveluri ale lui X: Composition of Densities: arata suma densitatilor diferentiate de inaltimea data de numarul de inregistrari ale fiecarui grup. La fiecare valoare a lui X, graficul compozitiei densitatilor arata cu cat contribuie fiercare grup la total. Proportion of Densities: arata contributia grupului ca o proportie a totalului pe fiecare nivel al lui X.

Potrivirea coloanelorOptiunea Matching Column ofera 2 actiuni primare: Alcatuieste un model aditiv ( utilizand un algoritm iterativ de potrivire proportional ) ce include atat variabila de grupare X, cat si variabila de potrivire selectata. Algoritmul este superior datorita faptului ca poate lucre pe sute de subiecti, fata de algoritmul modelului liniar care este foarte lent si necesita resurse mari de memorie. Traseaza linii intre punctele ce leaga grupul. Daca exista multiple observatii cu acelasi ID, linile sunt desenate de la media grupului de observatii.

Norul de puncte 3DAcesta are la baza Analiza corespondentei pe o tabela de contingent. Figura prezinta urmatoarele aspecte: Pe axa c1, raspunsurile de la 1 la 5 apar la dreapta lui 0 ( sunt pozitive). Raspunsurile de la 6 la 9 apar in stanga lui 0 ( sunt negative). Pe axa c2, A si C apare la stanga lui 0 ( negative). B si D apar la dreapta lui 0 (pozitive). Pe baza acestor obsevatii putem spune ca c1 corespunde satisfactiei generale ( de la cel mai putin preferate la cele mai mult) si c2 corespunde unei calitati ce diferentiaza pe B si D de A si C.

Vizualizarea interactiva a datelor

HartaHarta reprezinta una din optiunile disponibile programului de a reda cat mai fidel si de a reprezenta vizual datele geografice. Aceasta optiune poate fi folosita utilizand instrumentul Graph Builder si folosind Shape. Pentru a creea o harta este nevoie de a asigna coloana ce reprezinta teritoriile geografice(tara,stat,provincie,judete,comitate, etc.)In figura de mai jos avem reprezentarea unor date statistice la nivelul Statelor Unite ale Americii unde fiecare stat este colorat corespunzator valorii variabilei de grupare. Daca variabila este continua culoarea va fi de tip gradient. Axele Y si X reprezinta latitudinea, respectiv longitudinea. Stacked bars Reprezinta modul de vizualizare a datelor sub forma unor linii ingrosate pe orizontala grupate dupa o variabila dependenta in functie de una sau mai multe variabile independente.

DiagrameDiagramele se pot utiliza folosind platforma Chart din cadrul meniului Graph. In cadrul acesteia avem diagrame pentru tipul variabilelor continue si pentru variabilele de categorie. Diagramele suporta cateva tipuri de reprezentare si aliniere. Cateva dintre acestea sunt : Coloane si coloane in stiva ( bar and stacked bar) Placinta (pie) Ac (needle) Liniara (line) Punct (point) In sir (range)

Norul de puncte 3DFata de norul de puncte 3D definit mai sus pe baza analizei de corespondenta, acesta se realizeaza din meniul grafic al JMP cu numeroase avantaje printre care rotirea modelului statistic in functie de cele trei variabile ( de cele trei axe de coordinate). Se pot definii in mai multe feluri putand fi construite doar pe baza a 2 variabile sub forma elipsoidala, dar intr-un mediu de lucru tridimensional.Cea mai utilizata este cea de mai jos in care se poate opta pentru a modifica culorile utilizate, transparent sau dimensiunea modelului 3D.

Bubble Plot (Diagrama de bule)Bubble Plot-ul este un nor de puncte ce reprezinta punctele sub forma unor cercuri sau bule. Acesta poate fi dinamic ( animat pe o perioada de timp) sau static ( bule fixate ce nu se deplaseaza). Aceasta diagrama are la baza urmatoarele: Animatia dinamica a bulelor folosind o variabila de timp, pentru a vedea sablonul si deplasarea acestuia in timp; Se foloseste dimensiuni si culori diferite pentru a distinge mai usor intre variabile; Datele sunt agregate intr-o singura bula pentru simplificare diagramei.

Concluzii

Programul JMP detinut de firma SAS Institute Inc. ofera un set complet si comprehensive asupra fenomenelor statistice precum si posibilitatea modelarii unor experimente si a controlului calitatii datelor statistice intr-un singur pachet. Lucrul cu diferite platforme de sisteme de operare si numeroase tipuri de fisier precum fisiere text, fisiere Excel, fisere baze de date SAS, fisiere baze de date de tip ODBC( Open Database Connectivity) , ii asigura un avantaj pe piata produselor software de tip modelarea statistica. Totodata JMP acorda utilizatorilor si un limbaj de script pentru a dezvolta diverse aplicatii denumit JSL (JMP Scripting Language). JSL este un limbaj interpretative ce se executa la compilare, oferind o manipulare coerenta si coordonata a obiectelor platformei de aplicatii JMP. Impreuna cu mediul de lucru, limbajul asigura o utilitate imensa in setarea aplicatiilor statistice.Prin urmare putem spune ca pachetul software JMP reprezinta una dintre cele mai bune solutii pentru dezvoltarea de modele statistice aplicabile in orice domeniu de interes, dar si a unor aplicatii interactive menite sa ofere utilizatorului o experienta totala.

Bibliografie

JMP Basic Analysis and Graphing 9.0.2 , SAS Campus Drive, Cary, NC 27513 JMP Using JMP 10 , SAS Campus Drive, Cary, NC 27513 http://en.wikipedia.org

15


Recommended