+ All Categories
Home > Documents > Statistic A Aplicata in Farmacie Si Studii Clinice Ed 2

Statistic A Aplicata in Farmacie Si Studii Clinice Ed 2

Date post: 11-Jul-2015
Category:
Upload: vlad-mihai
View: 306 times
Download: 0 times
Share this document with a friend

of 253

Transcript

Constantin Mircioiu

Roxana Colette Sandulovici

STATISTICA APLICATA IN FARMACIE SI STUDII CLINICEEditia a II a

EDITURA UNIVERSITARA CAROL DAVILA BUCURESTI, 2009

Prof. dr. farm., mat. CONSTANTIN MIRCIOIU Dr. farm., mat. ROXANA COLETTE SANDULOVICI

STATISTICA APLICATA IN FARMACIE SI STUDII CLINICEEditia a II - a pentru

cursul de biostatistica Facultatea de Farmacie, Universitatea de Medicina si Farmacie Carol Davila, Bucuresti cursul de biostatistica doctoranzi Universitatea de Medicina si Farmacie Carol Davila, Bucuresti

cursul de biostatistica si farmacocinetica Masterul de Biostatistica Facultatea de Matematica, Universitatea Bucuresti

EDITURA UNIVERSITARA CAROL DAVILA BUCURESTI, 2009

PREFATA La numai un an dupa prima aparitie a cartii de fata, conceput initial ca un curs pentru studentii din anul IV ai facultatii de farmacie, contextul stiintific si didactic s-a schimbat semnificativ statistic. In urma experientei cursurilor si seminariilor din cadrul facultatilor de farmacie si facultatilor de matematica a aparut necesitatea de a revizui o parte din material in scopul cresterii ponderii exemplelor din cadrul cercetarilor experimentale si studiilor clinice, mai dificile de urmarit decat exemplele ideale, dar mai ilustrative in ceea ce priveste modul de rezolvare a unor probleme reale, complexe. S-au adaugat in primul rand cateva capitole noi de biostatistica reala: estimarea bioechivalentei prin metode non-parametrice, problema amplu dezbatuta in acesti ani in contextul propunerii de a schimba regulile americane si europene de evaluare a bioechivalentei, estimarea retrospectiva a factorilor de risc in cazul bolilor rare, relatia intre evaluarea bioechivalentei si a echivalentei terapeutice, aplicarea ANOVA in estimarea modelelor liniare. Necesitatea acestor din urma capitole au aparut, in primul rand, in cadrul masteratului de Biostatistica organizat de Facultatea de Matematica in colaborare cu Facultatea de Farmacie si au facut obiectul unor dezbateri multidisciplinare la care au participat matematicieni, medici, farmacisti, chimisti si biologi in cadrul seminariilor de biostatistica aplicata la studiile clinice. O alta directie a dezvoltarii a privit evaluarea statistica a datelor clinice in cadrul unor studii clinice concrete analizate la cursurile si seminariile de biostatistica la scoala doctorala de pe langa Universitatea de Medicina si Farmacie Carol Davila. In final, dincolo de insusirea unor reguli de baza privind evaluarile statistice in capitolele mentionate s-a incercat sa se acrediteze conceptul fundamental privind validarea in spirala: validarea rezultatelor prin analiza statistica, validarea rezultatelor statistice prin evaluarea fenomenologica, remodelarea fenomenelor, extrapolarea experimentului, evaluarea statistica, s.a.m.d. Rezumand intr-o singura fraza bunele intentii ale autorilor - acestia au vrut sa transmita ideea ca aplicarea in analiza datelor clinice numai a bunului simt sau numai a regulilor formale de calcul te pot rataci si uneori chiar sminti. Autorii Bucuresti, 2009

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

1.1. CMPURI DE PROBABILITATE Teoria matematic a probabilitilor pornete de la faptul c fiecrui rezultat posibil al unui experiment aleator, rezultat pe care l vom denumi eveniment, i se asociaz o valoare numeric, numit probabilitatea evenimentului respectiv. Aceast valoare este o caracteristic obiectiv a evenimentului n condiiile experimentului dat. S efectum, de exemplu, un experiment de m ori. Dac n cele m experiene un eveniment A s-a produs de k ori, atunci 0 k m, de unde rezult pentru frecvena relativ: k 0 1 m adic frecvena relativ a unui eveniment este ntotdeauna un numr cuprins ntre 0 i 1. innd cont c frecvena relativ oscileaz n jurul probabilitii evenimentului considerat i c probabilitate este acea caracteristic a evenimentului care ne indic n ce proporii se produce evenimentul n cazul repetrii experimentului de un numr foarte mare de ori, rezult c i probalitatea este tot un numr ntre 0 i 1. Din definiia probabilitii ca generalizare a conceptului de frecven relativ, rezult c probabilitatea unui eveniment imposibil este 0, iar probabilitatea unui eveniment sigur este 1. Evenimentele pot fi simple, n sensul c nu se pot descompune mai departe, sau compuse din alte evenimente ce se petrec simultan. n acest context putem considera dou operaii ntre evenimente. Scriem A B i nelegem prin aceasta un eveniment care const n producerea evenimentelor A i B, simultan. Scriem A B pentru cazul cnd se produce cel puin unul din cele dou evenimente. Fiind date dou rezultate A i B ale unui experiment efectuat de n ori, s presupunem c A s-a obinut de k1 ori i B de k 2 ori. Evenimentul A B, deci obinerea unui eveniment din cele dou rezultate, s-a obinut ca k +k k k atare, de 1 2 = 1 + 2 ori, ceea ce sugereaz o regul de tipul n n n Probabilitate (A B) = Probabilitate (A) + Probabilitate (B) n cele ce urmeaz vom introduce o prezentare axiomatic a conceptului de probabilitate, dup Kolmogorov 1 .Andrei Nicolaevici Kolmogorov (1903-1987), fost profesor la Universitatea din Moscova, a avut contribuii deosebite n analiza matematic, analiza funcional i teoria1

1

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

1.1.1. Corp borelian 1.1.1.1. Definiie: Fie E o mulime i K o familie nevid de pri ale lui E, K (E) cu proprietile: 1. A K CA K 2. ( Ai )iN K

1

Ai K

3. E K Deci, este nchis la operaiile de complementare i reuniune. Se spune, n acest caz, c familia K, mpreun cu operaiile menionate, formeaz un corp bolerian. Denumirea de borelian vine de la matematicianul Emil Borel, unul dintre fondatorii teoriei probabilitilor. 1.1.1.2. Consecin: Un corp borelian este o familie nchis fa de operaiunea de intersecie, indiferent de numrul elementelor sale pe care le intersectm: ( Ai )iN K Ai K Demonstraia se face imediat folosind faptul c proprietile 1 i 2. 1.1.1.3. Propoziie: Fiind dat o familie de corpuri boreliene (Ki )i I , intersecia lor este tot un corp borelian. Demonstratia se face imediat, folosind proprietile corpului borelian i ale operaiilor de intersecie, reuniune i complementare. 1.1.1.4. Definiie:

A = C A i i i i

i

probabilitilor. Cartea sa Grundbegriffe der Wahrscheinlichketetsrechnung, Berlin, 1933, a nsemnat o revoluie n teoria probabilitilor, artnd c, formal, aceast teorie se poate trata ca un caz particular de teorie a integralei (sau teoria msurii).

2

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

Fie H o familie oarecare de pri ale unei mulimi E . H poate fi completat la un corp borelian, numit corpul generat de , dac i se adaug E i toate mulimile ce se formeaz prin reuniune, intersecie i complementare pornind de la elementele H . Dac lum pe dreapt, mulimea intervalelor deschise de forma ( , a ) , a R , corpul borelian generat se numete simplu borelianul pe dreapta i constituie baza teoriei probabilitilor, aa cum va fi ea abordat n prezenta lucrare. Deoarece orice interval nchis se poate obine prin operaiile meionate din intervale deschise i invers, orice interval deschis poate fi generat pornind de la intervale nchise, borelianul pe dreapta este n acelai timp generat de mulimea intervalelor nchise. ntr-adevr, se poate scrie:

[a, b] = =1 a 1 , b + 1 i (a, b ) = =1 a + 1 , b 1 n n n n n n

1.1.1.5. Definiie: O familie ( Ai )i I se numete desfacere a lui E dac: 1. I este cel mult numrabil; 2. i, j Ai Aj = 3. Ai = E 1.1.2. Spaii msurabile 1.1.2.1.1. Definiie O mulime E mpreun cu un corp borelian K formeaz un spaiu msurabil (E,K). Elementele lui K se numesc mulimi msurabile. 1.1.2.2. Definiie Fiind date (E,K) si (F,L) spaii msurabile, o funcie f: (E,K) (F,L) se numete funcie msurabil dac ndeplinete condiia: A, A L f-1(A) K sau, altfel spus: f-1(L) K 1.1.2.3. Proprieti a) Dac f i g sunt msurabile, atunci f g, f +g i f*g sunt msurabile. 3

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

b) Dac f este continu, atunci f este borelian msurabil. 1.1.2.4. Observaie Se poate face un paralelism ntre spaiile topologice i spaiile msurabile, ntre funciile continue i funciile msurabile. Astfel, o funcie este continu dac preimaginea oricrei mulimi deschise este o mulime deschis iar msurabil este atunci cnd preimaginea oricrei mulimi msurabile este msurabil. Deasemenea, dac f i g sunt dou funcii continue, atunci f + g i f*g sunt continue. 1.1.2.5. Definiie Se numete msur orice funcie pozitiv definit pe corpul mulimilor msurabile, : K R+ , aditiv pe orice familie ( Ai )i I numrabil de mulimi msurabile disjuncte: n, m, An Am = 1 An = 1 ( An )

(

)

a) ntr-adevr, dac lum A1 = A , A2 = ( ) = ( ) = 2 ( ) ( ) = 0

( ) = 0

1.1.2.6. Consecine

b) Fie un ir de mulimi A1 A2 ... i fie A = An , atunci ( An ) ( A) Demonstraie: Fie Bn = An + 1 \ An . Mulimile Bn sunt disjuncte i An = B1 B 2 ... Bn . n n Din aditivitatea lui rezult ( An ) = Bi = (Bi ) = sn i =1 i =1 sn s = i =1 Bi = n =1 An = ( A)

Altfel, An = {n, n + 1,...},

A = An i ( Ai ) < ( An ) < ( A)

(

) (

)

A

n

= dar ( An ) =

1.1.2.7. Exemple a) Fie definit dup cum urmeaz: ( A) = dac A este infinit i ( A) = numrul elementelor din A , dac A este finit. Aceast msur se numete n mod natural msura de numrare. b) Fie un punct exterior x0 E fixat. Definim: 4

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

x ( A) = 0 dac x0 A Msura este utilizat n mecanica cuantic i se numete msura lui Dirac.0

x ( A) = 1 dac x0 A i0

1.1.3. Probabilitate Vom defini probabilitatea ca o msur particular. 1.1.3.1. Definiie: Fiind dat un spaiu msurbil (E, K ) . O funcie P: K [0,1] cu proprietile: a) P msur i b) P (E ) =1 se numete probabilitate. Deci, probabilitatea ar fi o msur normat. 1.1.3.2. Proprieti: Pe baza proprietilor msurii i a faptului c P (E ) =1, se pot demonstra cu uurin urmtoarele proprieti: 1. A B P( A / B ) = P( A) P(B ) 2. (n ) , An An + 1 P( An ) = lim n P( An ) 3. (n ) , An An + 1 P( An ) = lim n P( An ) 4. P( A B ) = P( A) + P(B ) P( A B ) 6. P( ) = 0 7. P(CA) = 1 P( A) n contextul teoriei probabilitilor, mulimile msurabile devin evenimente, spaiul msurabil devine cmp de evenimente, iar E devine evenimentul total. 1.1.3.3. Definiie: Un cmp de evenimente (E, K ) nzestrat cu probabilitatea P, se numete cmp de probabilitate. 1.1.3.4. Definiie: Un eveniment care nu mai poate fi inclus n alt eveniment 5 5. P An P( An ) , numit subaditivitate numrabil

(

)

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

A K , B K , A B sau A B = se numete eveniment elementar sau atom. 1.1.3.5. Observaii Prezentarea axiomelor teoriei probabilitilor n contexul mai larg al teoriei msurii, dincolo de formalismul simplu i rigoare, ofer i avantajul unor interpretri fenomenologice i picturale pentru unele formule. Astfel, dac probabilitatea este o msur, la fel ca aria pentru figurile plane (Fig. 1), formula: P ( A B ) = P ( A) + P ( B ) P ( A B ) se poate citi ca: aria ( A B ) = aria ( A) + aria ( B ) aria ( A B )

ceea ce pare ca evident.

Fig. 1.

Definiia clasic elementar a probabilitii deriv n mod natural din noiunea de frecven, despre care am vorbit mai sus. Dac un eveniment A se poate realiza n m feluri diferite dintr-un numr total n de evoluii posibile (e j ) j =1, n , egal probabile, atunci :1 m i b) P ( A ) = n n 1.1.3.6. Exemplu Exemplul clasic de cmp de probabilitate finit l constituie evenimentele ce pot aprea atunci cnd, dintr-o urn n care se afl bile albe i negre se extrag n bile. Dac proporia bilelor albe n urn este p, i deci a celor negre este q = 1 p , probabilitatea evenimentului A, ca din n bile extrase, k s fie albe, conform definiiei clasice definite mai sus, se calculeaz imediat i este: k P ( A) = Cn p k q n k

a) P ( e j ) =

De exemplu, evenimentul ca din trei bile extrase, dou s fie albe a - i una s fie neagr - n - se poate descompune n felul urmtor : A = ( a a n ) ( a n a ) ( n a a ) i 6

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

P ( A) = P ( a a n ) + P ( a n a ) + P ( n a a ) = p 2 q + p 2 q + p 2 q = 3 p 2 q = C32 p 2 q321.1.4. Probabilitate condiionat Fie B un eveniment a crei probabilitate este diferit de 0. Probabilitatea unui eveniment A, reprezint proporia n care ne ateptm s se realizeze A n cadrul tuturor evenimentelor cmpului de probabilitate la care aparine A Probabilitatea lui A se mai poate analiza ns i n contextul n care tim c s-a produs anterior evenimentul B. Probabilitatea evenimentului A condiionat de B se noteaz, n acest caz, cu: P(A/B) sau PB(A). Dac s-a constatat experimental o frecven de apariie kA i, respectiv kB, pentru A i B, frecvena relativ de apariie a lui A, cnd deja a aprut B, va fi: kAB k AB = n P (A B ) kB kB P (B ) n n acest context apare natural definiia probabilitii evenimentului A, condiionat de B, prin formula: P (A B ) PB ( A) = P (B ) Un caz special l constituie acela n care probabilitatea de apariie a evenimentului A este aceiai, indiferent dac s-a produs sau nu evenimentul B: P(A) = PB(A) Spunem, n acest caz, c evenimentele A i B sunt evenimente independente. Observm c, rescriind formula anterioar P(A B ) P( A B ) = PB( A) * P(B ) = P( A) * P(B ) PB ( A) = P(B ) se poate lua ca definiie c dou evenimente sunt independente atunci cnd: P ( A B ) = P ( A) * P ( B ) 1.1.5. Formula probabilitii cauzelor (Bayes) Fie A1, A2,, An o desfacere a lui E pe care, n contextul teoriei probabilitilor, o numim sistem complet de evenimente. Ea reprezint n acelai timp o desfacere pentru E ct i pentru orice eveniment X E . E = Aj

X = ( Ai X )

7

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

S presupunem c i, P( Ai ) 0 . n aceste condiii avem urmtoarea teorem: 1.1.5.1. Teorema probabilitii cauzelor Probabilitatea producerii oricrui eveniment X, este egal cu suma probabilitilor de producere a lui X, condiionate de evenimentele complete ale sistemului ( Ai )i = 1, n i P(Aj )PAj (X ) PX ( Aj ) = P( Ai )PAi( X ) Demonstraie:

Dat fiind c evenimentele Ai X sunt disjuncte, avem P( X ) = P( Ai X ) .

P (X Aj ) P (X ) P ( Aj ) P ( X Aj ) P (X Aj ) P ( Aj ) deci, PX(Aj) = = = P( Ai X ) P ( Ai ) i P ( Ai X ) i P ( Ai )Din definiie avem PX(Aj) =

P( Aj )PAj ( X ) P( Ai )PAI ( X )

PX(Aj) poate fi interpretat ca fiind probabilitatea ca X s aib cauza Aj. n acest caz, formula calculeaz probabilitatea lui X n funcie de probabilitile cauzelor care ar fi putut determina evenimentul X. Probabilitile P(Ak) se numesc apriorice, pentru c ele se cunosc nainte de eveniment. Probabilitile PX(Aj) sunt probabilitile acelorai cauze, dar dup ce s-a ntmplat evenimentul X, i se numesc din acest motiv, probabiliti aposteriorice. Exemplu, cnd un pacient intoxicat este adus la urgen el prezint anumite simptome i medicul, folosind experiena sa, rezultatele determinrilor n snge i un sistem computerizat elaboreaz o list cu probabilitile ca intoxicaia s se fi fcut cu o anumit substan. n fizica statistic parametrii termodinamici sau cuantici ai unui sistem rezult din nsumarea unui numr foarte mare de evenimente. Probabilitatea de trecere de la o stare iniial la o stare final este dat de suma probabilitilor de trecere pe anumite ci Ai ponderate fiecare cu 8

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

probabilitatea, sau altfel spus ponderea lor, p(Ai). Deoarece numrul cilor poate fi de puterea continuului, n locul sumelor apar integrale. Sau, dac s-ar produce o crim, aposteriori, ne punem problema ierarhizrii suspiciunilor privind potenialii criminali. Problema nu este de loc teoretic dac suntem de exemplu o societate de asigurri sau dac testul este un test de malignitate. Bayer a fost un episcop care s-a preocupat de cauzele evenimentelor din lumea aceasta i legtura lor cu cauza final Dumnezeu. Formula probabilitii cauzelor ne arat cum se transform probabilitile apriorice n probabiliti aposteriorice, dup apariia evenimentului X. De exemplu, tiind c un medicament se absoarbe n, i se elimin din snge pe mai mult ci, cu diferite probabiliti date de considerente fizico-chimice i fiziologice, n funcie de rezultatul unor determinri a concentraiei ale acestora n sngele unui pacient, ne putem pune problema stabilirii ponderilor efective ale acestor ci, n scopul individualizrii tratamentului. 1.1.5.2. Observaie: Putem deasemenea s considerm cazul particular al desfacerii evenimentului total n dou evenimente A i complementul su CA. Formula lui Bayes devine n acest caz: PA( X )P( A) PX(A) = PA( X )P( A) + PCA( X )P(CA) 1.1.5.3. Aplicaie: Dac, de exemplu, P(B) este proporia (probabilitatea) unei boli n populaie i cunoscnd proporia n care un test diagnostic este pozitiv la bolnavi PB(+) i la sntoi PNB(+) putem calcula probabilitatea ca un pacient la care rezultatul testului este pozitiv s fie bolnav: PB ( + ) P ( B ) P+ ( B ) = PB ( + ) P ( B ) + PNB ( + ) P ( NB ) unde: PB ( + ) este probabilitatea ca un bolnav s fie catalogat pozitiv de ctre test i se numete sensibilitatea testului. PNB ( ) este probabilitatea ca un sntos s fie catalogat negativ de ctre test i se numete specificitatea testului. 9

I.

Elemente de teoria probabilitatilor Campuri de probabilitate

Problema devine teribil de important dac, de exemplu, este vorba de un test de depistare a cancerului

10

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.VARIABILE ALEATOARE 1.2.1. Definiii: a) Se numete variabil aleatoare (ntmpltoare sau statistic) o funcie real f definit pe mulimea K a evenimentelor, cu proprietatea c, oricare ar fi numrul real a, mulimea x K pentru care f ( x ) a este un eveniment din K . n termeni de teoria msurii, o variabil aleatoare este o funcie f : ( E , K , P ) ( R, B ) , msurabil. Practic vorbind avem definit probabilitatea ca variabila s aib valori mai mici dect orice numr dat a. b) O variabil aleatoare se numete variabil aleatoare simpl dac ia un numr finit de valori: f : E R , f ( E ) finit i P ( f ( x ) = xi ) = P ( f 1 ( xi ) ) = pi c) Vom lucra, n cele ce urmeaz, ca regul, cu variabile aleatoare independente, adic variabile ce iau valori independente una de cealalt: P (( f ( x ) = xi ) (g ( y ) = y j )) = P ( f ( x ) = xi ) * P (g ( y ) = y j ), xi , y j 1.2.2. Operatii cu variabile aleatoare: Se poate verifica uor c variabilele aleatoare formeaz o algebr, adic suma, i produsul a dou variabile aleatoare este tot o variabil aleatoare; mai mult compunerea a dou variabile aleatoare este tot o variabil aleatoare. Trebuie n acest context s fim ateni la independena sau nonindependena variabilelor aleatoare implicate n operaie. De exemplu putem citi X+X unde X este o variabil aleatoare n dou feluri. Putem, de exemplu, s considerm un experiment repetat de dou ori rezultatele fiind independente 1 2 1 2 2 3 4 1 1+1 1 = 1 1 1, 2 2 2 2 4 2 4 n timp ce, dac considerm c X i X nu iau valori independent, atunci 2 4 X + X = 2X = 1 1 2 2 11

I.

Elemente de teoria probabilitatilor Variabile aleatoare

Putem reprezenta grafic aceste probabiliti. 1 2 3 De exemplu, X = 1 1 1 apare sub forma 4 2 4

Fig. 2 Reprezentarea probabilitatilor

grafica

a

Fig. 3 Curba cumulativ a distribuiei

1.2.3. Functia de repartitie Funcia de repartiie asociat lui f este funcia F ( x ) , F : definit de formula: F ( x ) = P ( f x ) = P ( f 1 ( , x ) )

[ 0,1]

Importana acestei funcii const n faptul c, dac F ( x ) este dat se poate determina probabilitatea ca f s ia valori ntr-un interval I , oricare ar fi acel interval. 1 n cazul n care f ia un numr finit de valori, de exemplu { ,2,3}, cnd cunoatem P( f k ) k = 1,2,3 , cunoatem practic i P( f = k ) k = 1,2,3 . ntr-adevr, P( f = 1) = P( f 2) P( f = 2) = P(( f 3) ( f 2)) = P( f 3) * P( f 2) = P( f 3) * (1 P( f 2)) P( f = 3) = 1 P( f = 1) P( f = 2)

Ca regul general: P ( f = k ) = 1 P ( f k + 1) P ( f k ) Deci am determinat o distribuie de probabilitate care poate fi reprezentat sub forma unei matrici: 1 2 3 P( f = k ) = p p p 2 3 1

12

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.3.1.Proprieti Funcia de repartiie are urmtoarele proprieti: a) a b F ( a ) F ( b ) b) lim F ( a ) = 0 c) lim F ( a ) = 1a + a

d) F este continu la stnga.

1.2.3.2. Dac F este continu spunem c f este variabil aleatoare continu. n acest caz, probabilitatea ca f s ia orice valoare particular este 0 , P ( f ( x ) = ) = 0

1.2.3.3. Exemplu : Dac ne punem problema probabilitii ca temperatura n camer s fie t =20,347562 aceasta este evident zero i de fapt problema nici nu are sens n msura n care temperatura este o valoare medie n jurul creia avem fluctuaii continue. Dac ne punem problema ca temperatura s fie ntr-un anumit interval noiunea de funcie de repartiie capt un coninut concret. 1.2.4. Densitatea de repartitie Fie F ( x ) funcia de repartiie a unei variabile aleatoare . Dac exist o

funcie ( x ) , integrabil pe intervalul ( ,+ ) , cu proprietatea c pentruF x atunci, ( x ) se numete densitatea de repartiie sau densitatea de

orice x

este verificat egalitatea:

( x) =

probabilitate a variabilei aleatoare , n acest caz, probabilitatea ca variabila aleatoare s ia valori ntr-un interval ( , a ) este dat de formula:

P ( ( x ) a ) = F ( a ) = ( t )dt i respectiv:a

P ( b ( x ) a ) = F ( a ) F ( b ) = ( t )dt ( t )dt = ( t )dtb a b

a

13

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.5. Valoarea medie Se numete valoare medie (sau speran matematic) a unei valori aleatoare f, numrul M ( f ) = xipi , atunci cnd este o variabil aleatoare simpl i,

respectiv

M(f )=

+

x ( x )dx , atunci cnd este o variabil aleatoare continu,

cu densitatea de probabilitate . n literatur, operatorul de medie se mai noteaz i cu E, de la expectation speran n englez. n cazul variabilelor simple se observ c valoarea medie a variabilei f este media ponderat a valorilor sale xi, cu ponderile pi, care reprezint frecvenele de apariie ale valorilor respective.1.2.5.1.Proprieti ale mediei: Dac f i g sunt independente, atunci avem: a) M ( af ) = aM ( f )

b) M ( f + g ) = M ( f ) + M ( g ) c) M ( f * g ) = M ( f ) * M ( g ) Vom schia o demonstraie a proprietii b): M ( f + g ) = k ,l P ( Fk Gl )( xk + xl ) == k

( P ( F G )) x + ( l k l k l

k

P ( Fk Gl ) xl

)

Dar, pe de alt parte, folosind proprietile interseciilor i reuniunilor de mulimi, respectiv distributivitatea interseciei fa de reuniune i a interseciei fa de reuniune, i faptul c l Gl = E avem

P(Fl

k

Gl ) = P Fk k

(

( G )) = P ( F )l l k

i similar, Deci,

P(Fk

Gl ) = P ( Gl )

M ( f + g ) = k P ( Fk )xk + l P ( Gl )xl = M ( f ) + M ( g )

14

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.5.2. Definitie: a) Noiunea de medie se generalizeaz, definindu-se momentul de ordin k al unei variabile aleatoare: M k ( f ) = xik pi , atunci cnd este o variabil aleatoare simpl i

respectiv,

Mk ( f ) =

+

x k ( x ) dx , atunci cnd este o variabil aleatoare

continu. b) Se numete moment centrat de ordin k al variabilei aleatoare f momentul de ordinul k al abaterii sale fa de medie. k M kc ( f ) = (xi f ) p ic i respectiv, k =

[x M ( f )] (x )dx +

k

,n cazul unei variabile aleatoare

continue. Dispersia de selecie, sau varianta unui ir de rezultate numerice ale unui experiment este media aritmetic a ptratelor abaterilor acestor valori fa de media lor aritmetic X . Dac x1 , x2 ,..., xn sunt cele n valori ale seriei, dispersia de selecie a2 acestora, s X , este:2 sX

n Dup cum vom vedea mai departe la statistic, o formul mai utiln 1 Dispersia de selectie este indicatorul principal al mprtierii datelor unui experiment. Dispersia unei variabile aleatoare este conceptul ce generalizeaz dispersia de selecie.2 pentru dispersia de selecie este: s X

(x X ) =ii

2

(x X ) =

2

15

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.6. Dispersia Dispersia variabilei aleatoare X se noteaz cu D ( X ) sau 2 i este, n particular, momentul centrat de ordinul doi:+ 2 D ( X ) = 2 = M ( X M ( X ) ) = ( x M ( X ) ) ( x ) dx , atunci cnd variabila aleatoare este continua, i respectiv 2 2 2 = M ( X M ( X ) ) = ( xi X ) pi , atunci cnd variabila aleatoare este discret. Rdcina ptrat a dispersiei, , se numete abaterea medie ptratic a variabilei X, iar sx abaterea standard.

2

a) b)

1.2.6.1.Proprieti Pentru orice variabil aleatoare X i orice constante a i b D ( aX + b ) = a 2 D ( X )

Dac X, Y sunt dou variabile aleatoare independente D ( X + Y ) = D ( X ) + D (Y )

Demonstraie: Pentru orice dou variabile aleatoare X i Y , cu mediile X i respectiv Y , avem

D ( X + Y ) = M ( X + Y X Y ) = M ( X X ) + M (Y Y ) +2 2 2

+2M ( X X )(Y Y ) = D ( X ) + D (Y ) + 2M ( X X )(Y Y ) Dar, atunci cnd X i Y sunt independente M ( XY ) = X Y ,M ( X X )(Y Y ) = M ( XY X Y Y X + X Y ) = = X Y X Y X Y + X Y = 0

M ( X X )(Y Y ) = 0 i deci D ( X + Y ) = D ( X ) + D (Y )

c) ntre dispersie, valoarea medie i momentul de ordinul doi exist relaia:

D ( f ) = M ( f 2 ) ( M ( f ))

2

Demonstraie:

16

I.

Elemente de teoria probabilitatilor Variabile aleatoare2

2 2 = M ( f 2 ) 2 X + X = M ( f 2 ) ( M ( f ) )

2 D ( X ) = ( xi X ) pi = xi2 pi 2 xi X pi + X pi = 2

1.2.6.2.Observaie

Dac numim M ( f 2 ) media ptratului si

( M ( f ))

2

ptratul

mediei formula capt o formulare uor de reinut:Dispersia este egal cu media ptratului, minus ptratul mediei. 2 2 Relaia se mai poate scrie sub forma M ( X 2 ) = X + X i am putea s-o numim teorema lui Pitagora n probabilitate.1.2.6.3.Exemplu n modelul clasic al urnei cu bile pe care l-am prezentat mai sus, probabilitatea evenimentului din n bile extrase, k sunt albe era k p k = C n p k q nk . Media variabilei aleatore X care da numrul de bile albe din n bile extrase va fi, prin definiie, k M ( X ) = kCn p k q n k

Pentru a calcula aceast sum considerm urmtoarea identitate n ( pt + q ) = Cnk p k t k q nk , pe care o derivm n raport cu t

(( pt + q ) ) = ( Cn

k n

p k t k q n k )

np ( pt + q )

n 1

Am obinut, deci, M ( X ) = np Folosind aceiai identitate, dar derivnd de dou ori se arat c: D ( X ) = npq . Cunoaterea mediei i dispersiei unei variabile aleatoare d o indicaie asupra intervalului n care se afl valorile variabilei, cu cea mai mare probabilitate. Mai exact, dup cum arat teorema urmtoare, cu ct ne ndeprtm mai mult de valoarea medie, cu att valorile respective sunt mai puin probabile ca valori ale variabilei date.

k t = 1 np = Cn p k kq n k

k = Cn p k kt k 1q n k i apoi facem

17

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.7. Inegalitatea lui Cebev

Dac 2 este dispersia variabilei aleatoare X , probabilitatea ca modulul abaterii sale de la valoarea medie s ia valori mai mari dect un numr 0 este mai mic dect

2 . 2

2 P( x m ) 2 Demonstraie: 2 2 Pornim de la definiia dispersiei 2 = M ( xi m ) = ( xi m ) p i

[

]

i mprim suma n doi termeni: unul corespunztor valorilor xi pentru care

xi m i unul corespunztor valorilor lui xi pentru care xi m .

2 = ( xi m ) pi =2

xi m

( x m)i

2

pi +

xi m

( x m)i

2

pi

Dac neglijm primul termen al sumei i minorm nlocuindu-l cu n al doilea termen, se obine 2 2 pi = 2 p k1 + p k2 + ... + p kn ,xi m

xi m

(

)

cu p k1 + p k 2 + ... + p kn sumax ki m .

probabilitilor

valorilor

xk i pentru

care

2 2 P ( x m ) ceea ce implic urmtoarea relaie:P( x m )

Dar pk1 + pk2 + ... + pkn = P ( x m ) i deci am obinut

2 . 2 Deoarece suma ntre probabilitatea unui eveniment A i probabilitatea evenimentului contrar CA este 1, avem P ( CA) = 1 P ( A) i inegalitatea se mai poate scrie sub forma 2 P ( xi m ) 1 2

18

I.

Elemente de teoria probabilitatilor Variabile aleatoare

1.2.7.1.Exemplu:

Fie = 3 , atunci inegalitatea Cebev d: 1 8 P ( xi m 3 ) = 1 = = 0.88 9 9 Exprimat n cuvinte, aceast inegalitate aparent banal, spune din punct de vedere fenomenologic, enorm de mult:Probabilitatea ca orice variabil aleatoare s ia valori mai ndeprtate de valoarea sa medie dect de trei valori standard, este mai mic dect 0,12.

Vom vedea mai departe c, n cazul n care variabila aleatoare are suplimentar unele proprieti de regularitate, aceast probabilitate este chiar mult mai mic. Aceiai inegalitate ne permite nelegerea legturii ntre frecvena i probabilitate, legtura care exprim nsi fundamentarea statisticii pe teoria probabilitilor. S considerm variabila aleatoare care d numrul de bile albe ntr-o extracie de n bile din urn. Pentru aceast variabil avem urmtoarea teorem, care se generalizeaz n teoria probabilitilor n forme care depesc ns cadrul acestei lucrri.1.2.8. Teorema lui Bernoulli (legea numerelor mari):

Dac se noteaz cu p probabilitatea ca un eveniment A (de exemplu k apariia bilei albe) s se realizeze ntr-un experiment i f n = este n frecvena cu care se realizeaz evenimentul A n n experimente identice consecutive, irul ( f n ) converge ctre p n probabilitate. Altfel spus:Frecvena experimentala tinde n probabilitate la probabilitatea teoretic.

19

I.

Elemente de teoria probabilitatilor Variabile aleatoare

Demonstraie: k lim n P p = lim n P( k np n ) = lim n P( k M (k ) n ) n Dar, aplicnd inegalitatea lui Cebev: P ( k M (k ) n )

2 i deci n 2 2

k 2 lim n P p lim n 2 2 = 0 n n Teorema lui Bernoulli afirm numai c inegalitatea f n p nu

are ansa s fie realizat sau c inegalitatea f n p are anse mari s fie ndeplinit dac n este suficient de mare

20

I.

Elemente de teoria probabilitatilor Distributii de probabilitate

1.3. DISTRIBUII DE PROBABILITATE 1.3.1. Distribuia normal Spunem c o variabil aleatoare este normal repartizat N m, 2 , atunci cnd densitatea sa de probabilitate este data de formula:

(

)

1 2 (x, m, ) = e 2 2 O prim condiie ca ( x ) s fie distribuie de probabilitate este aceea

( x m )2

c

(x )dx = P( f (t ) +) = 1

+

Pentru a verifica aceast condiie, vom demonstra mai intai, folosind integrala dubl, ca:

+

e

x2 2

dx = 2+ x2 2 0

Fie I = e2 + 0

dx = e0

+

y2 2

dy , x2 + y 2 2

I = e

x2 2

dx * e0

+

y2 2

dy = eD

dxdy

Facem schimabarea de variabila: x = cos si y = sin unde

( 0 , ) si 0 , . 2 Vom obtine:

I =2

2 0

+

0

e

22

d d =20

2

+

0

e

22

d = e2

22

+ = 0 2

Am obtinut ca I 2 = Dar,

I =+ x2 2

2

=

2 22 = 2 2

+

e

x2 2

dx = 2* e

dx = 2* I = 2*

n cazul nostru, dac facem schimbarea de variabil u =

xm

(x )dx =

+

1 2

+

e

( x m )22 2

avem

dx =

1

2

+

e

u2 2

du = 121

I.

Elemente de teoria probabilitatilor Distributii de probabilitate

Vom arta n continuare c o variabil aleatoare normal repartizat are media m i dispersia 2 . S calculm mai nti media:

M [X ] = 1

1

2+

+

xe

( x m )22 2

dx =2

1

2

(x m + m)e

+

( x m )22 2

dx =

(x m) 2 = e 2

1 xm

dx + m =

1

2

+

ue

u2 2

2 du + m = 0 + m = m

Integrala este nul deoarece funcia de integrat este impar. Pentru calculul dispersiei ne folosim de identitatea: D ( X ) = M X M ( X ) = M ( X 2 ) M ( X ) 2 2

M X

( )2

==

1 21 2

+ + 1 1 2 2 = x 2e 2 dx = (m + u ) e 2 du = 2 2 2 2 u u u2 + 2 2 2 m e 2 + 2m u e 2 + u e 2 du = u2 2 + 2 2 m 2 + u e 2 du

( x m )2

u2

Calculm separat integrala rmas i obinem: 2 u2 u2 u2 u + + + + 2 2 2 2 2 u e du = u ue du = ue 1* e u2 2

du = 2

unde am integrat prin pri, lund u = i ue = 1 Deci am obinut M (X 2 ) = m 2 2 + 2 2 i nlocuind n 2 expresia lui D( X ) obinem: 1 D( X ) = m 2 2 + 2 2 m 2 = 2 2 Pornind de la proprietile operatorilor de medie i dispersie M ( X m) = M ( X ) m D( X m ) = D( X ) i

(

)

(

)

22

I.

Elemente de teoria probabilitatilor Distributii de probabilitate

X 1 D = 2 D ( X ) a a se obine c, dac o variabil aleatoare este normal repartizat N (m, ) , X m variabila aleatoare redus este repartizat N (0,1) , deci cu distribuia

de probabilitate

(x ) = e

x2 2t x2 2

Funcia de repartiie asociat este funcia (t ) = e

dx numit

funcia lui Laplace i ale crei valori se gsesc n tabelele din practic toate crile de statistic i probabiliti.

1.3.2. Distribuie binomial Distribuia binomial apare, aa cum s-a artat mai sus, la descrierea evenimentelor asociate extraciilor dintr-o urn cu bile albe i bile negre. Distribuia variabilei aleatoare numrul de bile albe din n bile extrase se poate reprezenta i sub form matricial: 1 k n 0 X = 0 0 n C p q C 1 p1 q n 1 ... C k p k q n k ... C k p n q 0 n n n n Dup cum am artat media i dispersia unei variabile aleatoare repartizate binomial sunt M = np si D = npq

Repartiia binomial apare ntotdeauna atunci cnd un experiment cu numai dou rspunsuri posibile se repet de n ori. Un caz particular l prezint experimentele care se repet de un numr foarte mare de ori, iar evenimentul n a crui apariie suntem interesai are o probabilitate foarte mic, categorisit uzual ca eveniment rar. La limit, cnd n , p 0 , dar np rmne constant, np = , se obine distribuia Poisson.

23

I.

Elemente de teoria probabilitatilor Distributii de probabilitate

1.3.3. Distribuia POISSON Considerm deci c np = i trecem la limit dup nlim n C p qk n k nk

= lim n

n ( n 1) ... ( n k + 1) k 1 = *lim n lim n 1 k k! n n n(n 1)...(n k + 1) dar lim n =1 nknk

n(n 1)...(n k + 1) k 1 k! nk n

nk

=

i

lim n 1 n

nk

n = lim n 1 n

nk ( ) n

= e i deci,nk

k! Deci, distribuia Poisson este dat de matricea k n 1 0 ... k n ... X = e e e e 1! k! n! Calculnd, dup definiie, media i dispersia unei variabile aleatoare distribuite Poisson i innd cont c

limn C p q

k n

k

=

k

e

k 1 kkk!

kk 0

k!

=e

,

k 0

k

kk!

= e

,

k 2

k (k 1)

kk!

= 2 e

,

= e se obine

M ( X ) = k 0 k

k e k!

=e

(k 1)! = e (k 1)! = e e = k 1 k 1

k

k 1

k 2k kk k = e k 0 2 k 0 + 2 k 0 = k! k! k! k! k k k = e k 1 [k (k 1) + k ] 2e = e k 2 k (k 1) + k 1 k 2 = k! k! k! = e (2e + e ) 2 = D( X ) = e k 0 24

(k )2 k

I.

Elemente de teoria probabilitatilor Distributii de probabilitate

1.3.3.1. Exemplu: Numrul evenimentelor adverse la un medicament dat este repartizat Poisson. Cel mai mult este utilizat distribuia Poisson n fizica statistic. 1.3.4. Aproximarea normal a distribuiei binomiale Ca o regul general, dac np i nq sunt mai mari sau egale cu 5, poate fi folosit aproximarea normal. Pentru distribuiile binomiale n care p 0 . n acest sens se folosete statistica SS FV = Inter Inter . SS Intra Intra 139

II.

Statistica matematica si biostatistica Estimarea efectelor prin ANOVA

Similar, celelalte efecte se pot testa cu ajutorul raportului intre suma erorilor corespunzatoare si SSint ra (pe post de SS R in modelul general). Sinteza formulelor de calcul este dat n tabelul urmator.Tabelul nr. 19: Analiza efectelor fixe cu ajutorul dispersiilor: Sursa de variatie Inter - subiecti Secventa (carry - over df SS MS F

Carry = 1

SS Carry

MS Carry = = SS Carry

FCarry = = MS Carry MS int er MS int er

Carry

Reziduale

Inter = n1 + n2 2

SS Inter

MS int er = = SS Inter

Fint er = = MS int ra

Inter F P

Intra - subiecti Efectul direct al medicamentului

F =1 P =1 Intra = n1 + n2 2 Total = 2(n1 + n2 ) 1

SS F

MS F = SS F MS P = SS P MS Intra = = SS Intra

FF = = MS F FP = = MS P MS int ra*

MS int ra

Perioada

SS P

Reziduale

SS Intra

Intra

Total*

SS Total

Formula este valid doar dac efectul carry-over este nul.

Observatii

Vom studia acum legtura dintre cele dou modele reprezentate in Tabelul nr.1 si Tabelul nr.4 140

II.

Statistica matematica si biostatistica Estimarea efectelor prin ANOVA

Dac factorul A este secvena de administrare a medicamentului si factorul B este perioada, atunci este suma intre efectul carry-over si FR FT efectul subiectilor, = ( P1 P2 ) este efectul perioadei si = FT FR este efectul interaciunii secvenei de administrare a medicamentului cu perioada (adic efectul direct al medicamentului formulation). Se observ c sunt verificate conditiile specificate la prezentarea modelului general: 1 + 2 = 0 = CR + CT

1 + 2 = 0 = P1 + P2 11 + 12 = 0 = FR + FT = 21 + 22 11 + 21 = 0 = FT + FR = 12 + 22Facem observatia, altfel esentiala, ca prezentarea in foarte multe lucrari de biostatistica si bioechivalenta a efectului medicamentului ca interactiune intre secventa si perioada este de neinteles in lipsa identificarilor de mai sus. In fapt, este vorba de combinatii intre variabile care sa permita separarea efectelor. Aceste combinatii pot aparea ca efecte ai unor factori ce nu se regasesc intr-un tablou farmacologic al determinantilor diferentelor intre formulari. Efectul de secventa (carry) ramane o piatra de incercare in experimentele de bioechivalenta si aparitia lui in studii efectuate pe baza de protocoale concepute astfel incat sa se evite complet aparitia efectelor reziduale, este de neexplicat.

141

II.

Statistica matematica si biostatistica Estimarea efectelor prin ANOVA

142

II. Statistica matematica si biostatistica Legatura intre ANOVA si testul t in compararea efectelor

2.12. Legatura intre ANOVA si testul t in compararea efectelor 2.12.1. Compararea intre modelul statistic general si modelul statistic specific cross over In esenta, diferenta intre cele doua modele se refera la alegerea termenului rezidual; 2 modelul 1 nu descompune pe S R ; modelul 2 distinge ntre reziduale intra-individuale i reziduale interindividuale. Mai exact: 2 2 2 2 SS T = S A + S B + S AB + S R = SS carry + SS P + SS drug + SS int ra + SS int er == (SS carry + SS int er ) + (SS P + SS drug + SS int ra ) = = SS between + SS within = SS total Aceast descompunere modific formulele statisticilor F . In modelul biostatistic se imparte cu un numar mai mic ( MSint ra ) ceea ce conduce la un interval de incredere mai larg pentru efectele de formulare si deci la cresterea probabilitatii de acceptare a egalitatii efectelor.

2.12.2. Testarea efectului secvenei de administrare folosind metoda ANOVA:MS carry = SS carry = 2n1 Y1 Y + 2n 2 Y2 Y2

(

)

2

(

)

2

n Y + n 2 Y2 = 2n1 Y1 1 1 n1 + n 2 2 n 2 n 12 Y 2 Y 1

2

n Y + n2 Y2 + 2n2 Y2 1 1 n1 + n2

2 2n1 n 2 Y1 Y2 = (n1 + n2 )2

(

)

2

+

(n 1

(

+ n2 )

)

2

2

2 n1 n 2 Y 2 Y 1 = n1 + n 2

(

) = 2(Y 1 Y1 )22 1

2

n1

+

n2

2 Y Y1 = 2 1 1 + n n 1 2

(

)

= 143

2

II. Statistica matematica si biostatistica Legatura intre ANOVA si testul t in compararea efectelor

2n1n2 n1 + n2

1 Y12 + Y22 Y11 + Y21 2

(

) (

)

= 2n1n2 U 1 U 2 n1 + n2

2

(

)

2

U 1 U 2 =2 1 1 + n1 n2 2

2

Deci,

MScarry MSint er

U U 2 = 2 1 1 1 n +n 2 1

* 1 = U 1 U 2 2 u2 1 1 + u n1 n2

2

Se observa ca decizia obtinuta prin ANOVA in ceea ce priveste efectul rezidual este acelasi cu rezultatul obtinut prin testul t. Incercam, in continuare, sa facem aceiasi comparatie intre cele doua metode de evaluare a efectului de perioada.2.12.3. Testarea efectului perioadei folosind ANOVA

SSP = Y j Y k j i

(

) = n (Y2 k k j

j

Y

)

2

= ( n1 + n2 ) Y 1 Y

= ( n1 + n2 ) n1n2n2 Y 1 Y 2 + n1n1n2 Y 2 Y 1 + + =Observatie:2 n12 + n2 Y 2 Y 1 n1 + n2

{

(

) + (Y2

2 2

2 Y

)

(

)

(

)

2

}

(

)

2

Observam ca

MS MS int ra

nu mai duce la acelasi rezultat ca in testul t efectuat

pentru variabilele O1 si O2 .

144

II. Statistica matematica si biostatistica Legatura intre ANOVA si testul t in compararea efectelor

Nepotrivirea apare din aceea ca nu stim exact cum sa calculam media Y j1 + Y j 2 perioadei: media least square Y j = sau media obisnuita 2 Y j Y j = n1 + n2 In acelasi context, al secventelor inegale, mai avem si media totala cand apare problema folosirii mediei mediilor secventelor (least square) sau media obisnuita. Mentionam ca in literatura formulele finale sunt date fara demonstratie, iar in aplicatiile efective sunt luate intotdeauna variante pentru cazul particular n1 = n2 (secvente egale). Problema isi are importanta deoarece, de cele mai multe ori, la finalul experimentului de bioechivalenta nu mai avem n1 = n2 .Concluzii:

n practic, n prezena efectelor carry over inegale, si deci a aparitiei efectelor de secventa, se recomanda a se folosi pentru a testa bioechivalena, datele din prima perioad. Nu trebuie s uitm insa urmtoarele consecine ale acestei proceduri: 1) puterea de detecie a diferenelor semnificative clinic este micorat datorit creterii dispersiei ( se inlocuieste dispersia intraindividuala cu cea interindividuala) i, 2) pierderea de informaie prin acceptarea existentei unor efecte de secventa si renuntarea la datele din perioada a 2 a. In fond se anuleaz avantajul major al experimentului crossover i anume faptul ca fiecare subiect este propriul sau martor. Analiza dispersionala (ANOVA) se aplica in toata lumea in evaluarea studiilor de bioechivalenta, dar in final rezultatele sale nu influenteaza in nici un fel decizia privind bioechivalenta. Efectele de perioada nu influenteaza estimarea efectelor de formulare. Aparitia efectelor de formulare nu semnifica nimic! Egalitatea nu implica bioechivalenta si nici bioechivalenta nu implica egalitatea. Aparitia efectelor de secventa invalideaza metoda de testare a efectelor de formulare. Pe de alta parte insa, testarea egalitatii duce la o informatie nesemnificativa. 145

II. Statistica matematica si biostatistica Legatura intre ANOVA si testul t in compararea efectelor

In acelasi timp este de mentionat ca toate ghidurile referitoare la analiza bioechivalentei recomanda utilizarea MSE mean square erorr in formula de testare a bioechivalentei. Dar aceasta iarasi nu inseamna nimic. In fond 2 2 2 MSE = 2 d si nimic nu ne impiedica sa estimam direct d prin S d care este mai usor calculat si rezultatul este acelasi. Ramane totusi ca ANOVA in cazul in care pune in evidenta efectele de secventa impune o examinare atenta a protocolului studiului si verificarea masurilor de indepartare a efectelor reziduale. Ca o concluzie finala, ANOVA nu este un instrument de decizie, rolul sau fiind informativ.

146

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

2.13. Estimarea bioechivalentei 2.13.1. Metode parametrice de estimare a bioechivalentei 2.13.1.1. Metoda intervalului de incredere Anterior a fost prezentata modalitatea de testare a ipotezei nule ca doua produse sunt egale intre ele dupa efectuarea unui experiment 2*2 cross-over, metoda care a fost criticata de multi autori. In locul acesteia a fost propusa de Metzler 1 o metoda bazata pe intervale de incredere. Daca intervalul de incredere (1 2 ) *100% pentru diferenta

T R sau pentru raportul

T se afla in limitele de acceptare impuse, R

atunci se accepta ca medicamentul testat este bioechivalent cu cel de referinta. Uzual se aplica regula 20% , iar = 0.05 si, in acest caz, 2 regula de acceptare devine: a) Produsele sunt bioechivalente daca intervalul de incredere 90% pentru T R este in limitele 20% din efectul produsului de referinta sau daca, b)

T este intre 80% si 125% cu probabilitatea 90%. R

Aici trebuie facuta observatia ca, in ambele cazuri, aplicarea regulii presupune cunoasterea lui R , ceea ce nu este niciodata cazul, si se ia din acest motiv YR pe post de R . 2.13.1.2. Metoda celor doua teste unilaterale, Schuirmann Ipoteza nula este ipoteza compusa din doua ipoteze simple, testul de bioechivalenta descompunandu-se de fapt in doua teste unilaterale: H 01 : T R I vs H a1 : T R I si H 02 : T R S vs H a 2 : T R S O biodisponibilitate mai mare a produsului testat decat cel de referinta, implica posibilitatea unor efecte secundare sau toxice crescute si o siguranta mai mica. Bioechivalenta implica o echivalenta atat in ceea ce priveste efectul cat si in ceea ce priveste siguranta.

1

C.Metzler, Bioavailabity: a problem of equivalence, Biometrics, 30, 209-317, 1974

147

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

Daca vrem sa testam ipotezele enuntate la un nivel de semnificatie , in conditiile in care presupunem ca datele sunt normal repartizate, putem aplica testul t. Echivalenta este stabilita atunci cand YT YR I YT YR S t ( , n1 + n2 2 ) TI = t( , n1 + n2 2 ) si TS = 1 1 1 1 + d + d n1 n2 n1 n2 2 MSE (MSE = Mean Square Error din ANOVA), d = 2 RMSE deci d = (RMSE = Root Mean Square Error) 2 Observam ca procedeul celor doua teste t unilaterale este echivalent cu metoda clasica de testare a includerii intervalului de incredere pentru T R cu probabilitatea (1 2 ) *100% in intervalul de acceptare.

(

)

(

)

2.13.1.3. Transformarea logaritmica a datelor Ghidurile de testare a bioechivalentei recomanda transformarea logaritmica a datelor. Daca datele initiale sunt repartizate normal si coeficientul de variatie este mic, atunci si datele transformate urmeaza aproximativ o distributie normala. X 2 2 Pentru a demonstra aceasta observam ca : D = 2 = CV X este aproximat de zero si : Daca CV este suficient de mic

X X X ln X ln = ln = ln1 + X Deci, ln X ln + ; E (ln X ) = ln si D(ln X ) = CV 2 Deci, ln X = N (ln , CV 2 ), adica datele transformate sunt distribuite normal cu media ln si dispersia CV 2 .Deci, coeficientul de variatie obtinut din datele netransformate este o estimare a dispersiei datelor transformate.

148

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

De obicei insa transformarea logaritmica are rostul de a corecta asimetria datelor initiale si a le restrange prin aceea ca 2 trece in

2 . 2

In cazul in care CV 2 nu este foarte mic lucrurile sunt cu mult mai complicate. Intervalul de incredere pentru diferenta mediilor datelor transformate T R sunt aproximativ egale cu cele pentru logaritmul raportului

mediilor netransformate ln T . R Intr-adevar, fie E ( X T ) = T ,D(ln X T ) = D(ln X R ) = Avem:2

E(X R ) = R ,

E (ln X T ) = T

si

T = E ( X T ) = E ( eln X

T

) E 1 + ln X R

T

+

1 2 ( ln X T ) = 2

1 1 2 2 = 1 + T + E ( ln X T ) = 1 + T + ( 2 + T 2 ) = e T + 2 2 2

Similar obtinem: R = e

+

222

e + 2 T 2 si cum este de asteptat sa fie = ln Ca urmare ln 2 R 2 T

2 foarte mic in raport cu e si e , avem : e T T ln ln = T R R R e R T

e

R

+

2.13.2. Metode non parametrice de testare a bioechivalentei Daca nu sunt verificate ipotezele necesare aplicarii ANOVA (si implicit a testului t), in particular ipotezele privind normalitatea si egalitatea dispersiilor, intervalul de incredere se determina folosind testele nonparametrice. Metoda se bazeaza pe compararea rangurilor. In analiza bioechivalentei, exista indoieli si incertitudini in ceea ce priveste natura distributiei parametrilor farmacocinetici . Timp de multi ani parametrii

149

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

bioechivalentei au fost analizati ca valori netransformate. Ulterior reglementarile oficiale au recomandat transformarea logaritmica a datelor. In prezent, analiza statistica se bazeaza pe transformarea logaritmica A a AUC si a valoarii C max . Deoarece ln A ln B = ln aceasta este o B analogie (dar nu acelasi lucru) cu analiza raportului parametrilor estimati. O metoda de calcul neparametric a intervalului de incredere pentru raportul parametrilor a fost data de Hollander si Wolfe 2 si extinsa ulterior alaturi de alte metode nonparametrice de Steinijens si Diletti 3 . Metodele sunt tentante dar, un lucru esential trecut de obicei sub tacere este acela ca se presupune ca nu apar efecte de perioada sau efecte de secventa. Pe de alta parte, chiar daca statistica arata aparitia unor astfel de efecte, nu avem nici o garantie ca acestea sunt reale. In fapt o decizie corecta privind aceste efecte se bazeaza numai pe evaluarea fenomenologica, pe baza proprietatilor fizicochimice ale substantelor active, a considerentelor fiziologice si a caracteristicilor designului experimentului clinic. Consideram N subiecti intr-un experiment cross-over cu doua perioade si doua secvente ( care insa nu se iau in calcul). In prima faza se determina diferentele pentru fiecare subiect (Testat Referinta). Pentru cazul unei transformari logaritmice a AUC se compara diferentele logaritmului raspunsurilor pentru fiecare subiect:

AUCT ln( AUCT ) ln( AUC R ) = ln AUC R Se pot calcula si rapoartele

=R

AUCT deoarece acestea sunt in relatie AUC R biunivoca cu diferentele logaritmurilor. Se compara R , media geometrica pentru rapoarte, pentru toate perechile posibile de N rapoarte individuale (R), unde N este numarul de N ( N + 1) astfel de perechi, incluzand si raportul R/R intre subiecti. Exista 2 un subiect si el insusi.Hollander M, Wolfe D A, Non-parametric Statistical Methods,Wiley, New York, 1973 Steinijens V W, Diletti E, Statistical Analysis of Bioavailability Studies: Parametric and Non-parametric Confidence Intervals, Eur. J. Clin. Pharmacol 24, 127-136,19833 2

150

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

Facem observatia ca media geometrica a rapoartelor este in corespondenta biunivoca cu media aritmetica al logaritmului valorilor :ln a + ln b + ln c = ln 3 abc , etc. 3

Valorile lui R sunt apoi ordonate crescator in functie de rang. Limita inferioara si superioara a intervalului de incredere nonparametric de 90%, respectiv 95%, sunt redate in tabelul privind intervalele de incredere folosind testul de rang Wilcoxon. In practica, nu este necesara compararea logaritmica deoarece noi suntem interesati de rapoartele dintre testat si referinta. Daca noi comparam N ( N + 1) pentru rapoartele si folosim media geometrica a perechilor 2 ranguri, obtinem un interval de incredere pentru rapoartele directe dintre testat si referinta.2.13.3. Compararea rezultatelor metodelor parametrice si non parametrice in estimarea bioechivalentei unor forme farmaceutice cu meloxicam Problema studiului de bioechivalenta privind supozitoarele cu MELOXICAM - medicamentul testat si MELOXICAM - medicamentul de referinta, a fost aceea ca aplicand procedurile statistice standard produsele apareau, dupa cum se poate vedea (fig. 8) chiar si cu ochiul liber ca fiind inechivalente.

Fig. 8. Curbele medii pentru produsul testat si cel de referinta

151

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

O examinare mai atenta insa a profilelor individuale (fig.9a si fig 9b) arata o distribuite omogena, relativ normala a profilelor in cazul medicamentului testat si o distributie absolut anormala in cazul produsului de referinta 4 .

Fig. 9a Curbele individuale pentru produsul de referinta

Fig. 9b Profilele individuale dupa administrarea medicamentului testat

4

A.Medvedovici, F.Albu, C.Georgita, C.Mircioiu, V.David, A non-extracting procedure for the determination of meloxicam in plasma samples by HPLC-diode array detection,Arzneimittel Forschung/Drug Research,.55 (6), 326-331 (2005).

152

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

Apare ca profilele medicamentului testat se imparte in 3 grupe diferite: un subiect cu valori aberant de mici, 5 voluntari cu valori mari si restul un grup mai omogen cu valori intermediare. In acest context, testarea uzuala a bioechivalentei parametrilor in cele doua populatii (R si T) si pe egalitatea dispersiilor, este departe de a fi cea mai indicata metoda.2.13.3.1. Estimarea egalitatii mediilor plasmatice folosind testul non parametric Wilcoxon La testarea egalitatii mediilor plasmatice a doua preparate farmaceutice (testat T si referinta R) continand MELOXICAM s-a constatat urmatoarea distributie a datelor:Subject AUC-R AUC-T Subject AUC-R AUC-T 1 36720,9 44936 13 24918,4 25216,9 3 64049,3 65279,3 15 21321,7 40641,6 5 47631,2 50453,6 16 29062,7 37064,5 6 3493,65 12607,7 17 25463,2 37006,7 7 24162,6 42293 18 17423,4 19996,4 8 21132,1 25032,7 19 48653,8 38427,8 10 21583,9 39923,9 20 19775,6 30947,5 11 40403,4 77950,8 21 31387,9 24931,7 12 24822,5 34553,1 23 23702,3 35726,4

Tabel 20

Studiem mai intai diferentele dintre AUC pentru medicamentul testat si referinta.Subject AUC-R AUC-T 1 36720,9 44936 8215 13 24918,4 25216,9 299 3 64049,3 65279,3 1230 15 21321,7 40641,6 19320 5 47631,2 50453,6 2822 16 29062,7 37064,5 8002 6 3493,65 12607,7 9114 17 25463,2 37006,7 11544 7 24162,6 42293 18130 18 17423,4 19996,4 2573 8 21132,1 25032,7 3901 19 48653,8 38427,8 -10226 10 21583,9 39923,9 18340 20 19775,6 30947,5 11172 11 40403,4 77950,8 37547 21 31387,9 24931,7 -6456 12 24822,5 34553,1 9731 23 23702,3 35726,4 12024

AUCT AUC RSubject AUC-R AUC-T

AUCT AUC R

Tabel 21

Valorile egale (diferenta este zero) sunt inlaturate din calculele urmatoare. Diferenta egala cu zero nu contribuie cu noi informatii privind diferenta dintre tratamente. Vom ordona crescator aceste diferente netinandu-se cont de semn (Tabel 22).Subject

AUCT AUC RRang Subject

13 299 1 12 9731 10

3 1230 2 19 -10226 11

18 2573 3 20 11172 12

5 2822 4 17 11544 13

8 3901 5 23 12024 14

21 -6456 6 7 18130 15

16 8002 7 10 18340 16

1 8215 8 15 19320 17

6 9114 9 11 37547 18

AUCT AUC RRang

153

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

Dupa ordonarea completa a diferentelor (netinandu-se cont de semne) se vor adauga semnele corespunzatoare diferentelor originale care au determinat aceste ranguri:Subject

AUCT AUC RRang + semn Subject

13 299 1 12 9731 10

3 1230 2 19 -10226 -11

18 2573 3 20 11172 12

5 2822 4 17 11544 13

8 3901 5 23 12024 14

21 -6456 -6 7 18130 15

16 8002 7 10 18340 16

1 8215 8 15 19320 17

6 9114 9 11 37547 18

AUCT AUC RRang + semn

Tabel 23

Astfel, subiectul 21 care avea inainte rangul 6 va capata rangul -6 deoarece diferenta pentru acest subiect este negativa. Acelasi lucru se va intampla si cu subiectul 19 care va capata rangul -11. Vom calcula suma rangurilor pozitive si suma rangurilor negative: R+ = 1 + 2 + 3 + 4 + 5 + 7 + 8 + 9 + 10 + 12 + 13 + 14 + 15 + 16 + 17 + 18 = 154 si R = 6 + 11 = 17 In tabelul de mai jos sunt prezentate valorile critice ale celor doua sume de ranguri necesare pentru nivelul de semnificatie 5%, respectiv 1%, pentru N valori (N se considera numarul de perechi excluzand perechile a caror diferenta este 0). Cea mai mica suma a rangurilor trebuie sa fie cel mult egala cu cea din tabelul de mai jos (tabel 24)pentru a considera cele doua grupuri de rezultate ca fiind diferite la nivelul de incredere specificat. Numarul de = 0,05 = 0,01subiecti N 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 2 3 5 8 10 13 17 21 25 30 35 40 46 52 0 1 3 5 7 10 13 16 19 23 28 32 37

154

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

In studiul analizat N = 18 , suma minima a rangurilor este R = 17 si 17 40 (valoarea corespunzatoare din tabel). De aceea, spunem ca cele doua medicamente realizeaza nivele plasmatice diferite pentru = 0,05 . Rezultatele acestui test sunt foarte aproape de cele obtinute cu testul t. Considerand ca ipotezele testului Wilcoxon sunt mai putin restrictive in comparatie cu testul t, atunci cand nu avem garantia inplinirii conditiilor de aplicare a testului t, testul de mai sus este un test de recomandat. Pentru valorile date aproximarea normala este mai la indemana pentru a compara mediile celor doua populatii: N ( N + 1) 4 N (2 N + 1)( N + 1) 24 R

Z=

unde R este suma rangurilor (poate fi utilizata oricare dintre suma rangurilor pozitive sau negative) si N este numarul de elemente (exceptand valorile egale). In cazul nostru, N = 18 si R = 154 , deci, 18 *19 154 4 Z= = 2,9832 . 18 *18,5 *19 12 In cazul in care se vor exclude subiectii 6 si 21 vom avea: N = 16 , R+ = 127 , R = 9 si 16 *17 127 4 Z= = 3,0508 16 *16,5 *17 12 Deci si aproximarea normala a distributiei rangurilor ne duce la aceiasi concluzie privind existenta unei diferente semnificative intre nivelele plasmatice ale lui R si T.

155

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

3.13.3.2. Estimarea bioechivalentei prin calculul non parametric al intervalelor de incredere La testarea bioechivalentei acelor doua preparate farmaceutice (testat T si referinta R) s-au obtinut urmatoarele valori pentru Cmax .Subiect C max R 1 923 1289 1,39 13 927 1048 1,13 3 1739 1856 1,06 15 641 1241 1,93 5 770 728 0,94 16 643 968 1,50 6 173 639 3,69 17 879 1132 1,28 7 795 1726 2,17 18 787 981 1,24 8 698 1028 1,47 19 1795 1654 0,92 10 918 1626 1,77 20 865 1590 1,83 11 707 799 1,95 21 1030 809 0,78 12 1381 1206 1,50 23 1401 1768 1,26

C max TT/R Subiect C max R

C max TT/R Tabel 25

adica R radicalul dintre produsul a doua rapoarte. Astfel: pentru subiectul 1 media geometrica este radicalul dintre produsul raportului subiectului 1 combinat cu el insusi: 1,39653 *1,39653 1,397 Pentru subiectul 1 combinat cu subiectul 2, media geometrica este radicalul produsului dintre raportul subiectului 1 si raportul subiectului 2: 1,397 *1,067 1,221 Acest rationament il vom aplica pentru fiecare dintre cei 18 subiecti. N ( N + 1) 18 * 19 Se vor determina = = 171 de combinatii diferite incluzand 2 2 si fiecare raport cu el insusi.

Vom determina media geometrica pentru fiecare raport T

156

II.

Statistica matematica si biostatistica Estimarea bioechivalentei

Mediile geometrice determinate sunt:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 1,397 1,221 1,149 2,271 1,741 1,434 1,573 1,652 1,452 1,257 1,644 1,450 1,341 1,319 1,134 1,602 1,047 1,328 2 1,221 1,067 1,005 1,985 1,522 1,254 1,375 1,444 1,269 1,098 1,437 1,268 1,172 1,153 0,992 1,401 0,916 1,161 3 1,149 1,005 0,945 1,869 1,433 1,180 1,294 1,359 1,195 1,034 1,353 1,193 1,103 1,086 0,933 1,318 0,862 1,092 4 2,271 1,985 1,869 3,694 2,832 2,332 2,558 2,686 2,361 2,043 2,674 2,358 2,181 2,146 1,845 2,606 1,703 2,159 5 1,741 1,522 1,433 2,832 2,171 1,788 1,961 2,059 1,810 1,567 2,050 1,808 1,672 1,645 1,414 1,998 1,306 1,655 6 1,434 1,254 1,180 2,332 1,788 1,473 1,615 1,696 1,491 1,290 1,689 1,489 1,377 1,355 1,165 1,645 1,076 1,363 7 1,573 1,375 1,294 2,558 1,961 1,615 1,771 1,860 1,635 1,415 1,852 1,633 1,510 1,486 1,278 1,804 1,179 1,495 8 1,652 1,444 1,359 2,686 2,059 1,696 1,860 1,953 1,717 1,486 1,945 1,715 1,586 1,560 1,342 1,895 1,239 1,570 9 1,452 1,269 1,195 2,361 1,810 1,491 1,635 1,717 1,509 1,306 1,709 1,507 1,394 1,372 1,179 1,666 1,089 1,380 10 1,257 1,098 1,034 2,043 1,567 1,290 1,415 1,486 1,306 1,131 1,479 1,305 1,207 1,187 1,021 1,442 0,942 1,194 11 1,644 1,437 1,353 2,674 2,050 1,689 1,852 1,945 1,709 1,479 1,936 1,707 1,579 1,553 1,336 1,886 1,233 1,563 12 1,450 1,268 1,193 2,358 1,808 1,489 1,633 1,715 1,507 1,305 1,707 1,505 1,392 1,370 1,178 1,663 1,087 1,378 13 1,341 1,172 1,103 2,181 1,672 1,377 1,510 1,586 1,394 1,207 1,579 1,392 1,288 1,267 1,089 1,539 1,006 1,275 14 1,319 1,153 1,086 2,146 1,645 1,355 1,486 1,560 1,372 1,187 1,553 1,370 1,267 1,247 1,072 1,514 0,989 1,254 15 1,134 0,992 0,933 1,845 1,414 1,165 1,278 1,342 1,179 1,021 1,336 1,178 1,089 1,072 0,921 1,301 0,851 1,078 16 1,602 1,401 1,318 2,606 1,998 1,645 1,804 1,895 1,666 1,442 1,886 1,663 1,539 1,514 1,301 1,838 1,202 1,523 17 1,047 0,916 0,862 1,703 1,306 1,076 1,179 1,239 1,089 0,942 1,233 1,087 1,006 0,989 0,851 1,202 0,785 0,996 18 1,328 1,161 1,092 2,159 1,655 1,363 1,495 1,570 1,380 1,194 1,563 1,378 1,275 1,254 1,078 1,523 0,996 1,262

Mediile geometrice considerate o singura data sunt:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 1,397 1,221 1,149 2,271 1,741 1,434 1,573 1,652 1,452 1,257 1,644 1,450 1,341 1,319 1,134 1,602 1,047 1,328 2 1,067 1,005 1,985 1,522 1,254 1,375 1,444 1,269 1,098 1,437 1,268 1,172 1,153 0,992 1,401 0,916 1,161 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0,945 1,869 1,433 1,180 1,294 1,359 1,195 1,034 1,353 1,193 1,103 1,086 0,933 1,318 0,862 1,092

3,694 2,832 2,332 2,558 2,686 2,361 2,043 2,674 2,358 2,181 2,146 1,845 2,606 1,703 2,159

2,171 1,788 1,961 2,059 1,810 1,567 2,050 1,808 1,672 1,645 1,414 1,998 1,306 1,655

1,473 1,615 1,696 1,491 1,290 1,689 1,489 1,377 1,355 1,165 1,645 1,076 1,363

1,771 1,860 1,635 1,415 1,852 1,633 1,510 1,486 1,278 1,804 1,179 1,495

1,953 1,717 1,486 1,945 1,715 1,586 1,560 1,342 1,895 1,239 1,570

1,509 1,306 1,709 1,507 1,394 1,372 1,179 1,666 1,089 1,380

1,131 1,479 1,305 1,207 1,187 1,021 1,442 0,942 1,194

1,936 1,707 1,579 1,553 1,336 1,886 1,233 1,563

1,505 1,392 1,370 1,178 1,663 1,087 1,378

1,288 1,267 1,089 1,539 1,006 1,275

1,247 1,072 1,514 0,989 1,254

0,921 1,301 0,851 1,078

1,838 1,202 1,523

0,785 0,996

1,262

157

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

Tabel 26 Intervalele de incredere folosind testul de rang Wilcoxon Numarul de subiecti (N) 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Rangul limitei inferioare 95% 90% 1 3 3 4 4 6 6 9 9 11 11 14 14 18 18 22 22 26 26 31 30 36 35 42 41 48 47 54 53 61 59 68 66 76 74 84 82 93 Rangul limitei superioare 95% 90% 21 19 26 25 33 31 40 37 47 45 56 53 65 61 74 70 84 80 95 90 107 101 119 112 131 124 144 137 158 150 173 164 188 178 203 193 219 208

Dupa cum se observa, limita inferioara, respectiv superioara a intervalului de incredere 95% este valoarea rangului 14, respectiv 65 al mediilor geometrice determinate anterior, deoarece numarul de subiecti este N = 18 . Pentru a determina un rang al mediilor geometrice vom construi, in EXCEL, tabelul mediilor geometrice luate o singura data Vom folosi functia small(array;k) care calculeaza valoarea de rang k dintr-un set de date (array). In cazul nostru array, in tabelul Exccel, a fost F3:Q20, k = 41 , respectiv 131 pentru intervalul de incredere CI 95% , deci am avut: =small(F3:Q20; 41)=1,194 =small(F3:Q20; 131)=1,696 ceea ce inseamna un interval de incredere CI 95% = (1,194 , 1,696) In cazul intervalului de incredere 90% limita inferioara va avea rangul 48, iar cea superioara rangul 124 corespunzand astfel intervalului CI 90% = (1,247 , 1,652) : =small(F3:Q20;48)=1,247 =small(F3:Q20;124)=1,652 158

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

Limitele inferioare si limitele superioare stabilite de FDA pentru bioechivalenta sunt (0,800 , 1,25) . In ambele situatii se constata ca nu putem demonstra bioechivalenta celor doua produse.

2.13.3.3. Estimarea bioechivalentei folosind testul non parametric Wilcoxon, pornind de la un model care ia in considerare si efectele de perioada

Fie, folosind notatiile standard de la modelul incrucisat cu doua perioade si doua secvente, diferenta intre formularile testate

= T R .Consideram testarea bioechivalentei folosind doua teste unilaterale: H 01 : L 0

vs

H A1 : L 0 unde L = L si

H 02 : U 0 vs H A 2 : U 0 unde U = U In vederea testarii ipotezelor enuntate consideram combinatia (contrastul):

d h ; h = L,U pentru subiectii din sec venta 1 bhik = ik , pentru subiectii din sec venta 2 d ik ;unde: i = 1, nk , k = 1,2 , reprezinta numarul de subiecti in cele doua secvente P P1 d ik = 2 este jumatate dintre diferentele intre cea de-a II a 2 perioada si prima perioada h = L sau U dupa cum ne referim la compararea cu limita inferioara sau cea superioara a intervalului de acceptare a bioechivalentei 159

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

Folosind rationamentul de la testarea efectelor in experimentul cross-over pentru diferenta d ik intre valorile pereche ale unui subiect dat vom obtine: 1 2 [(P2 P1 ) + ( 2 h )] pentru k = 1 E (bhik ) = 1 [(P2 P1 ) + ] pentru k = 2 2 D(bhik ) = D(d ik ) = =2 d

e22

Observam ca din definitiile de mai sus rezulta imediat ca: E (bhi1 ) E (bhi 2 ) = ( h ) = h Media sumei rangurilor este Wilcoxon).

n1 (n1 + n2 + 1) (s-a demonstrat la testul 4n1 n1

Consideram suma rangurilor: R L = R(bLi1 ) si RU = R (bUi1 ) si

n (n + 1) n (n + 1) variabilele aleatoare WL = RL 1 1 si WU = RU 1 1 . 2 2 n(n + 1) este testul Mann Inlocuirea sumei rangurilor R cu R 2 Whitney care insa este in esenta acelasi test. E (W L ) = E (WU ) =si

i =1

i =1

n1 (n1 + n2 + 1) n1 (n1 + 1) n1 n2 = 2 2 2 n1 n2 (n1 + n2 + 1) 12

D(W L ) = D(WU ) =

Tragem concluzia ca produsele sunt bioechivalente atunci cand amandoua ipotezele H 01 si H 02 sunt respinse. unde valorile w( ) se gasesc in tabele, iar valorile complementare se calculeaza cu formula: w(1 ) = n1 n2 w( ) , implica biochivalenta celor doua produse. 160 Deci, relatia: WU w( ) si WL w(1 )

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

In cazul in care avem si un numar k de cozi (valori egale), atunci valorile egale se inlocuiesc cu media rangurilor lor r si dispersiile devinD (W L ) = D (WU ) = 1 n1 n 2 (n1 + n 2 + 1 Q ) , 12

unde Q =

k 1 3 r r . (n1 + n2 )(n1 + n2 1) =1 Cand numarul de valori este suficient de mare (de exemplu, mai mare de 40) se poate folosi aproximatia normala:

(

)

ZL =

WL E (WL ) D(WL )

=

RL

1 n1 n2 (n1 + n2 + 1) 12 = RU

n1 (n1 + n2 + 1) 2 si

1 n1 n2 (n1 + n2 + 1) 12 Vom compara AUCtot pentru studiul de bioechivalenta privind produsul MELOXICAM testat(T) si referinta (R) efectuat pe 18 subiecti.Subiecti secv 1

ZU =

WU E (WU ) D(WU )

n1 (n1 + n2 + 1) 2

P1 P2Subiecti secv 2

1 RT 36721 44936 3 TR 65279 64049

6 RT 3494 12608 5 TR 50454 47631

7 RT 24163 42293 8 TR 25033 21132

10 RT 21584 39924 12 TR 34553 24823

11 RT 40403 77951 13 TR 25217 24918

15 RT 21322 40642 16 TR 37065 29063

19 RT 48654 38428 17 TR 37007 25463

20 RT 19776 30948 18 TR 19996 17423

21 RT 31387 24932 23 TR 35726 23702

P1 P2

P2 P1 = jumatate dintre diferentele intre cea de2 a II a perioada si prima perioada CalculamVom calcula d ik =

161

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

AUCR = =

AUCn1 + n2

R

=

36721 + 3494 + ... + 31387 + 64049 + 47631 + ... + 23702 = 44900 9+9 Determinam: L = U = 0,2 * AUC R = 8980 Deci, bL11 = d11 L = 4108 + 8980 = 13088 ,.., bL 91 = d 91 L = 3228 + 8980 = 5752

bU 11 = d11 U = 4108 8980 = 4872 ,, bU 91 = d 91 U = 3228 8980 = 12208 bL12 = bU 12 = d12 = 615 , ., bL 92 = bU 92 = d 92 = 6012 Ordonam descrescator valorile absolute ale lui bLik , respectiv bUik si vom determina rangurile corespunzatoare R(bLik ) , respectiv R(bUik ) . RL = R(bLi1 ) = 7 + 6 + 4 + 3 + 1 + 2 + 13 + 5 + 10 = 51n1 i =1

WL = RL n1 i =1

n1 (n1 + 1) 9 *10 = 51 =6 2 2 n1 (n1 + 1) 9 * 10 = 78 = 33 2 2R(bLik )7 6 4 3 1 2 13 5 10

RU = R(bUi1 ) = 6 + 8 + 18 + 16 + 3 + 14 + 1 + 10 + 2 = 78

WU = RU

secv 1 RT RT RT RT RT RT RT RT RT

P136721 3494 24163 21584 40403 21322 48654 19776 31387

P244936 12608 42293 39924 77951 40642 38428 30948 24932

d ik4108 4557 9065 9170 18774 9660 -5113 5586 -3228

bLi1 = d i1 L13088 13537 18045 18150 27754 18640 3867 14566 5752

bUi1 = d i1 U-4872 -4423 85 190 9794 680 -14093 -3394 -12208

R(bUik )6 8 18 16 3 14 1 10 2

162

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

secv 2 TR TR TR TR TR TR TR TR TR

P165279 50454 25033 34553 25217 37065 37007 19996 35726

P264049 47631 21132 24823 24918 29063 25463 17423 23702

d ik-615 -1411 -1950 -4865 -149 -4001 -5772 -1287 -6012

bLi 2 = d i 2-615 -1411 -1950 -4865 -149 -4001 -5772 -1287 -6012

R(bLik )17 15 14 11 18 12 9 16 8

bUi 2 = d i 2-615 -1411 -1950 -4865 -149 -4001 -5772 -1287 -6012

R(bUik )15 12 11 7 17 9 5 13 4

Din tabel avem: w( ) = W9;9; 0, 05 = 22 si w(1 ) = n1n2 w( ) = 9 * 9 22 = 59 Intrucat 22 33 w ( ) WU si 6 59 w (1 ) WL putem afirma ca produsele sunt bioechivalente nu

2.13.3.4.Calculul parametric LATIN SQUARE DESIGN : ANOVA TABLE for AUCtot LATIN SQUARE with Log (neperian) option SOURCE D.F SS MS F p Period 1 0.000350993 0.000350993 0.00114772 0.9734 NS Subject(Seq) 16 10.4047 0.650296 2.12643 0.07096 NS Formulation 1 0.320187 0.320187 1.04699 0.3214 NS Sequence 1 0.0100203 0.0100203 0.0327659 0.8586 NS Error 16 4.89306 0.305816 Total 35 15.6284 -------------------------------------------------------------------------------N Mean SD SEM GeoMean Geo SD Formulation:num = R 18 10.2755 0.850093 0.200369 29012.8 2.33987 Formulation:num = T 18 10.4641 0.421689 0.0993931 35035.2 1.52453 -------------------------------------------------------------------------------Root Mean Square Error = 0.553007 ; CV = 0.0533286 phi = 0.72353 Power of the test = 0.161064 1 - ( Power of the test ) = 0.838936 Minimum detectable difference = 0.188617

163

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

-------------------------------------------------------------------------------BIOEQUIVALENCE TESTS FOR Level R and level T Reference Confidence Interval: [ 0.8, 1.25] Geomean Ratio (Test/Reference) = 1.20758 90% standard confidence interval (around the ratio:[test form]/[ref form])=[ 0.87528, 1.666] t(0.05 - 16df) = 1.7459 Cannot conclude equivalence. -------------------------------------------------------------------------------TWO ONE-SIDED T-TESTS FOR Level R and level T Lower: t( 16df) = 0.1873 Upper: t( 16df) = 2.2338 t(0.05 - 16df) = 1.7459 Cannot conclude equivalence LATIN SQUARE DESIGN : ANOVA TABLE for Cmax LATIN SQUARE with Log (neperian) option SOURCE D.F SS MS F Period 1 0.18169 0.18169 3.02264 Subject(Seq) 16 4.71008 0.29438 4.89739 Formulation 1 1.22793 1.22793 20.4283 Sequence 1 0.0137681 0.0137681 0.229051 Error 16 0.961752 0.0601095 Total 35 7.09523 -------------------------------------------------------------------------------N Mean SD SEM Formulation:num = R 18 6.72375 0.494661 0.116593 Formulation:num = T 18 7.09312 0.316931 0.0747013 -------------------------------------------------------------------------------Root Mean Square Error = 0.245172 ; CV = 0.0354889 90% standard confidence interval (around the ratio:[test form]/[ref form])=[ 1.2544, t(0.05 - 16df) = 1.7459 Cannot conclude equivalence. 1.6687] p 0.1013 NS 0.001414 *** 0.000349 *** 0.6387 NS

GeoMean 831.927 1203.66

Geo SD 1.63994 1.37291

164

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

2.13.4.Compararea rezultatelor Este de observat ca testele neparametrice, la fel ca cele parametrice indica faptul ca cele doua produse nu sunt bioechivalente. Aceasta deoarece intr-adevar la aproape toti subiectii avem: R T AUC tot AUC tot Si totusi rezultatul este profund incorect deoarece intravariabilitatea si distributia non-normala a rezultatelor produsului de referinta indica foarte probabil si o intravariabilitate mare a produsului de referinta. Dupa cum se vede in fig. 10, fig.11. avem o diferenta foarte mare intre medicamentul de referinta si medicamentul testat dar aceasta diferenta este o combinatie intre intravariabilitatea lui R si cea a lui T.AUCtot vs TreatmentName40000001 05 07 10 12 15 17 19 21 03 06 08 11 13 16 18 20 23

Cmax vs TreatmentName200001 05 07 10 12 15 17 19 21 03 06 08 11 13 16 18 20 23

300000 A U C t o t (n g / m L * h )

1500 C m a x (n g / m L )

200000

1000

100000

500

0 R TreatmentName T

0 R TreatmentName T

Fig. 10Valorile AUCtot pereche pentru R si T

Fig. 11Valorile Cmax pereche pentru R si T

In acest caz, dupa cum au propus aproape toti cercetatorii in ultimii ani ar trebui introduse criterii scalate adica largirea limitelor de acceptare a bioechivalentei, in functie de intravariabilitatea referintei. Din pacate aceasta nu se poate obtine decat din experimente repetate, deci experimente in care medicamentul referinta este administrat de doua ori. In experimentul cross-over fara repetitie se obtine o intravariabilitate 2 S d sau SS int ra din ANOVA care sunt o combinatie a variabilitatilor pentru medicamentul testat si referinta si acestea nu se pot estima separat.

165

III.

Statistica matematica si biostatistica Estimarea bioechivalentei

166

II.

Statistica matematica si biostatistica Teste statistice de discordanta

2.14. TESTE STATISTICE DE DISCORDANTA In ceea ce priveste valorile anormale , se pun in principal trei probleme: decizia privind respingerea sau omisia acestor valori, analiza efectului lor de distorsionare a rezultatelor estimarilor parametrilor populatiei, existenta unor factori neluati in seama si necesitatea elaborarii unui alt model statistic, corespunzator realitatii. In vederea realizarii primului obiectiv se aplica testele de discordanta , numite si teste de respingere , dar decizia de respingere sau non-respingere nu poate fi luata fara examinarea si a celorlate doua probleme enuntate. Putem defini intuitiv notiunea de discordanta (outlier) astfel: o observatie care deviaza atat de tare de restul observatiilor incat poate fi suspectata ca a fost generata printr-un mecanism diferit. Cand este vorba de un set de date universale, caracteristica principala a unei observatii discordante este departarea sau deviatia (masurata) la o scara adecvata) fata de grupul majoritatii observatiilor (inlying observations). Cand este vorba de date multivaluate / structurate, discordanta inseamna abaterea de la modelul statistic (de ex. Regresia liniara) caruia i se supun celelalte valori. In general, putem spune ca, intr-un esantion, o valoare (sau o submultime de valori) este discordanta daca nu respecta patentul caruia ii apartin celelalte valori ( este inconsistenta cu restul observatiilor). In principiu exista doua mecanisme care pot da nastere unui esantion ce pare sa contina valori outlier (daca excludem factorul de eroare umana sau defectiunile aparaturii folosite). Aceste mecanisme dicteaza in buna masura felul in care vor fi tratate aceste valori speciale. a. Datele provin dintr-o distributie heavy tailed (graficul functiei de repartitie se apropie relativ incet de asimptota data de axa Ox) precum distributia Student T. In acest caz, valorile aparent indepartate de restul reprezinta un factor firesc, intrisec legii de repartitie. Acest fenomen nu este caracteristic distributiei normale sau distributiilor gamma (ce manifesta o apropiere rapida de asimptota Ox), drept pentru care nu vom discuta acest mecanism. b. Datele provin din doua distributii diferite. Una dintre acestea, distributia de baza genereaza observatii bune, in timp ce cealalta, distributia contaminata creeaza observatii discordante sau contaminanti. Daca distributia contaminanta are o descrestere asimptomatica mai lenta decat cea de baza, atunci va fi evidenta tendinta 167

II.

Statistica matematica si biostatistica Teste statistice de discordanta

contaminantilor de a se manifesta ca valori discordante, indepartate de restul observatiilor. n general exist o gam foarte larg de teste din care putem alege i n mod natural ne punem problema care sunt criteriile de a alege un test sau altul ntr-o situaie particular i cum putem defini performana testului ales. Sunt patru aspecte principale care trebuiesc luate n considerare. 1. Modelul de baz i determinarea semnificaiei. n orice context un test statistic poate fi construit pur i simplu pe baza intuiiei i s respingem sau s acceptm valorile extreme. Totui avem nevoie de un criteriu de respingere care s asigure o anumit semnificaie operaiei ceea ce impune n mod esenial elaborarea unor ipoteze de lucru privind distribuia testului statistic sau mcar s tim ceva despre distribuia de probabilitate pe coad. 2. Ipoteza alternativ care s ne permit definirea valorilor anormale. 3. Definirea performanei testului i a conceptului asociat de putere. Alegerea dintre mai multe teste ar trebui s fie bazat pe performana lor relativ. Evaluarea performanei relative, de exemplu calculul puterii trebuie sau poate fi fcut cnd avem definit ipoteza alternativ i distribuia testului statistic n condiiile ipotezei alternative. Probemele sunt foarte complicate motiv pentru care pn n ultimii ani ele au fost comple ignorate. 4. Care sunt proprietile dorite pentru testul de discordan. Astfel ne putem pune problema unui test uniform cel mai puternic sau mcar s ne mulumim cu o optimalitate local sau cu certitudinea unei nedeplasri sau cu satisfacerea unor proprieti de invarian. Alternativ putem s construim teste folosind o metod larg acceptat cum ar fi metoda verosimilii maxime a rapotului. 2.14.1. Construcia testelor de discordan Testele aplicabile au fost clasificate n apte clase. 1. Statistici bazate pe raportul exces / dispersie. Acestea sunt rapoarte ale diferenelor ntre valoarea aberant i vecinul su cel mai apropiat sau imediat dup acesta n ir i intervalul valorilor sau alte msuri ale dispersiei seleciei. Ca exemplu avem xn xn 1 xn x2 Propus de Dixon pentru examinarea unei valori aberante superioare i care evit valoarea x1 sau xn xn 1 168

II.

Statistica matematica si biostatistica Teste statistice de discordanta

unde este deviaia standard n modelul de baz. Testul presupunea cunoscut i o repartiie normal a probelor. Putem nlocui cu o estimare a sa dintr-o prob restrns din care s-au eliminat valorile bnuite ca aberante. 2. Statistici bazate pe raportul dintre lungimea domeniul de valori / dispersie. Testele se obin din cele de mai sus prin nlocuirea numrtorului cu lungimea domeniul valorilor. Ca exemplu avem xn x1 s unde s poate fi obinut din ntreg setul de valori sau dintr-un set restrns prin eliminarea valorilor bnuite a fi aberante sau poate fi cunoscut din alte msurtori. Dezavantajul acestor teste este acela c el nu face distincie ntre cazurile cnd avem o valoare aberant superioar, una inferioar sau de amndou tipurile. 3. Statistici bazate pe raportul deviaie / dispersie. Aceste teste nltur dezavantajul celor anterioare prin aceia c se nlocuiete lungimea domeniului de valori cu distaa dintre o valoare aberant i msur a tendinei centrale a datelor. De exemplu putem considera raportul x x1 s La fel ca i s , x poate fi calculat din intregul set de date sau dintr-o parte a acestuia. 4. Statistici bazate pe sume de ptrate. Aceste statistici se bazeaz pe suma ptratelor restricionate i suma ptratelor pentru ntregul set de valori. De exemplu raportul

(x xi =1 i n i =1 i

n2

n , n 1 2

)

2

( x x)unde x n ,n 1 =

,

poate fi folosit pentru testarea a dou valori aberante n2 superioare xn i xn-1 dintr-o populaie normal distribuit. 169

xi =1

n2

i

II.

Statistica matematica si biostatistica Teste statistice de discordanta

5. Statistici pe baza raportului ntre valorile extreme i valorile medii. Aceste statistici s-au dovedit n particular relevante pentru datele cu distribuie de tip Gamma. 6. Statistici bazate pe momente de ordin superior. Statistici care msoar asimetria sau curbura pot fi folosite i pentru testarea valorilor aberante.n xi x

(

)

3 3 2

x x i 2

(

)

i

n xi x

(

)

4 2

2 xi x

(

)

7. Statistici W. Aceste teste se bazeaz pe rapotul dintre ptratul unei combinaii liniare a tuturor datelor i suma ptratelor abaterilor fa de medie. ( wi xi )2 W = 2 xi x

(

)

(ponderile w , calculate in functie de parametrii selectiei , se gasesc in tabele). O situaie special apare atunci cnd avem un grup de valori anormale superior sau inferior i cnd testele enumerate mai sus nu pot pune n eviden aberaii datorit unui efect de mascare. De aceea s-au conceput teste pentru evaluarea mai multor valori aberante simultan (proceduri bloc). Alte teste examineaz valorile extreme secvenial. n fapt acestea examineaz n principal valoarea aberant maxim pe baza unui test deviaie / dispersie i dac xn se devedete valoare aberant el se repet operaia pentru xn-1 pe proba redus. Procedura se continu pn cnd se gsete o valoare neaberant. Aplicarea unui test sau altul ne poate duce la concluzii in general diferite, in final decizia privind declararea unei valori ca discordante tinand de analiza fenomenului. Exemplu: 1, 5, 11, 4, 2, 6, 3 O prima masura de precautie pe care trebuie sa o luam este aceea de a verifica faptul ca distributia datelor nu se modifica radical prin schimbarea unitatilor de masura, deci la schimbari liniare sau la schimbarea de la o distributie normala la una exponentiala.

170

II.

Statistica matematica si biostatistica Teste statistice de discordanta

Prima operatiune, indiferent de testul aplicat, este aceea de asezare a datelor in ordine crescatoare. 1, 2, 3 , 4, 5, 6 , 11 Rezultatul este bine sa fie vizualizat printr-o asezare a punctelor pe o dreapta.

Fig. nr. 6

Motivul pentru care o prima sau ultima valoare pot fi considerate ca discordante este acela ca aceste valori apar a fi foarte separate de de restul datelor , in raport cu imprastierea datelor din selectie. Aceasta ne duce in mod natural la ideia unei statistici bazata pe raportul A/D unde A este abaterea valorii extreme fata de restul datelor iar D este o masura a dispersiei datelor . Pe post de A putem lua de exemplu diferenta intre valoarea extrema si urmatoarea valoare, cea mai apropiata de ea x7 x6 , sau distanta intre aceasta si restul datelor considerate ca un grup x7 M , unde M este media celorlalte 6 valori. Pentru D putem considera fie lungimea intervalului de valori x 6 x1 , sau distanta intre urmatoarele doua valori x6 x5 care este cu mult mai mic decat x7 x6 , sau dispersia primelor 6 valori Consideraiile de mai sus sugereaz urmtoarele statistici pentru testarea valorilor extreme: x x x x 5 5 y ( 6, 7 ; 1, 6 ) = 7 6 = = 1 ; y ( 6, 7 ; 5, 6 ) = 7 6 = = 5 x6 x1 5 x6 x5 1 T = x7 x 11 3,5 = = 2,14 s 3,5

xs xr xq x p Am putea lua de exemplu, la numitor n prima statistic ntregul domeniu de variaie al valorilor x x 5 = 0,5 y ( 6, 7 ;1, 6 ) = 7 6 = x7 x1 10Statisticile sunt de forma y ( r , s ; p, q ) =

171

II.

Statistica matematica si biostatistica Teste statistice de discordanta

iar n loc de T =

x5 x x x sa folosim T = 5 , dar statisticile rmn n s s

esen aceleai. Consideram spre exemplu valorile concentratiilor maxime ale MELUOL , un metabolit activ al nicergolinei la 24 de voluntari sanatosi. Pentru a lua o decizie cat mai corecta, vom examina atat valorile individuale, cat si raportul valorilor pentru un acelasi voluntar. Mai mult decat atat, pentru a avea si o imagine a acestor valori si a raportului dintre ele, considera reprezentarile valorilor pentru medicamentul de referinta (R ) si pentru cel testat ( T ) precum si a raporturilor T/R si a dependentei T ( R ) ( care, daca valorile s-ar corela perfect, ar trebui sa fie o dreapta).Tabelul nr. 21:Subject 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16 17 18 19 20 21 22 23 24 N Mean CMAX,T (ng/ml) 65.70 7.85 10.11 3.94 29.54 10.58 6.84 14.79 17.29 11.61 27.48 5.24 32.11 12.49 4.23 7.01 1.96 3.09 15.91 21.54 3.34 3.75 12.67 23 14.31 CMAX,R (ng/ml) 48.98 6.73 21.76 2.65 22.60 14.84 5.95 16.54 6.57 8.75 14.82 3.72 36.33 20.29 4.60 14.96 1.76 3.03 15.01 14.94 4.30 6.72 14.08 23 13.475 T/R 134 117 46 149 131 71 115 89 263 133 185 141 88 62 92 47 111 102 106 144 78 56 90 media StDev T/R 46 47 56 62 71 78 88 89 90 92 102 106 111 115 117 131 133 134 141 144 149 185 263 111 48.6 CMAX,T (ng/ml) 2 3 3 4 4 4 5 7 7 8 10 11 12 12 13 15 16 17 22 27 30 32 66 14 14.2 CMAX,R (ng/ml) 2 3 3 4 4 5 6 7 7 7 9 14 15 15 15 15 15 17 20 22 23 36 49 13 11.4

172

II.

Statistica matematica si biostatistica Teste statistice de discordanta

Fig. nr. 770.00 60.00 50.00 40.00 30.00 20.00 10.00 0.00 0 5 10 15 20 25 30 CMAX,T (ng/ml) CMAX,R (ng/ml)60.00 R2 =0.7497 50.00

T(R)

40.00

30.00

20.00

10.00

0.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00

Fig. nr. 8T70 60

R

T/ R

30060 50

25050 40

20040 30 30

150

10020 20

5010 10

00 1 3 5 7 9 11 13 15 17 19 21 23 0 1 3 5 7 9 11 13 15 17 19 21 23

1

3

5

7

9

11

13 15

17 19

21 23

Observam dupa ordonare, ca valorile concentratiilor maxime pentru voluntarul 1 sunt cele mai mari si, cel putin pentru T, mult mai mari (aparent discordante) decat pentru ceilalti voluntari. Voluntarul 9 apare normal in contextul valorilor individuale pentru T si R dar raportul lor este cel mai mare, si probabil destul de indepartat de celelalte rapoarte. 173

II.

Statistica matematica si biostatistica Teste statistice de discordanta

In tabelul de mai jos sunt redate rezultatele aplicarii testelor Dixon si Tn pentru R, T si T/R . Din punct de vedere al testului Dixon, toate valorile sunt discordante. Aplicand testul Tn , voluntarul 9 este de eliminat dat fiind raportul T/R discordant. Tabelul nr. 22: voluntar 9 voluntar 1 voluntar 1 voluntar 1 voluntar 9 voluntar 1 voluntar 1 voluntar 1 T/R T/R = R T T/R T/R R T Dixon 134 Dixon Dixon Tn = Tn = Tn = Tn = (Xk-Xk-2)/(Xk-X3)= valoare normala (Xk-Xk-2)/(Xk-X3)= (Xk-Xk-2)/(Xk-X3)= ( Xk-Xmediu)/S= ( Xk-Xmediu)/S= ( Xk-Xmediu)/S= ( Xk-Xmediu)/S= 0.55 0.57 0.58 3.14 0.48 3.12 3.62 >0.41 >0.41 >0.41 >2.82 2.82 >2.82

Acelasi test arata insa ca voluntarul 1 este anormal din punct de vedere al celor doua valori, dar nu si din punct de vedere al raportului T/R. Dat fiind ca decizia privind bioechivalenta este influentata doar de intravariabilitate si nu depinde de intravariabilitate, voluntarul 1 nu este de eliminat. In final, decizia privind clasificarea unei valori drept discordante, depinde de analiza fenomenologica si mai putin de rezultatul testelor statistice.

174

II.

Statistica matematica si biostatistica Teste statistice de discordanta

2.14.2. Criteriul Dixon pentru respingerea outliers Tabelul nr. 23k 3

( ) r10 = X 2 X 1r10

(X k X 1 ) (X k X 1 )

Nivel de semnificatie 5% 1% 0.941 0.988

daca cea mai mica valoare este suspecta 4 5

( X X k 1 ) = k

0.765 0.642

0.889 0.780

daca cea mai mare valoare este suspecta 6 7 8

( ) r11 = X 2 X 1r11 = r21 =

( X k 1 X 1 )(X k X 2 ) ( X k 1 X 1 ) (X k X 2 )

0.560 0.507 0.554

0.698 0.637 0.683

daca cea mai mica valoar


Recommended