2.4. Teoria Structurii Retorice (RST)
2.4.1 Originea şi descrierea teoriei
Plecând de la ideile axiomatice prezentate anterior, Mann şi Thompson
elaborează şi descriu în 1988 [Mann şi Thompson, 1988] Teoria Structurilor
Retorice (Rhetorical Structure Theory – RST). Această teorie a devenit una
dintre cele mai populare printre lingvişti, fiind fie acceptată ca atare, fie
folosită ca punct de plecare pentru teorii ulterioare.
Ideea centrală a RST este noŃiunea de rela Ńie retoric ă ce leagă două
fragmente continue şi adiacente de text. Unitatea elementar ă de discurs , ce
se găseşte la nivelul cel mai de jos al reprezentării structurii RST este
identificată ca fiind o clauză ce cuprinde o predicaŃie. RelaŃiile leagă aceste
unităŃi într-o structură arborescentă, ce are ca frunze unităŃi elementare de
discurs şi ca noduri interioare grupuri de mai multe unităŃi elementare
adiacente în discurs.
RST identifică două tipuri mari de relaŃii retorice: paratactice şi
hipotactice. O relaŃie este paratactică, sau echinucleară, dacă leagă doi sau
mai mulŃi constituienŃi egali ca importanŃă şi hipotactică dacă leagă
constituienŃi ce nu sunt egali ca importanŃă. Între constituienŃii uniŃi de relaŃiile
hipotactice există întotdeauna unul singur mai important, numit nucleu, ceilalŃi
fiind numiŃi sateli Ńi. La relaŃiile paratactice, prin convenŃie se consideră că toŃi
constituienŃii sunt nuclei.
Aceste relaŃii sunt detaliate în 27 de tipuri ce diferă prin legătura
semantică dintre fragmentele legate şi de semnificaŃia individuală a
constituenŃilor. Un exemplu de astfel de relaŃie [după Mann şi Thompson,
1988] :
Numele relaŃiei: EVIDENCE
Constrângeri asupra N: Este posibil ca cititorul R să nu aibă
un grad de încredere satisfăcător
(pentru scriitor) asupra informaŃiei
conŃinute de nucleul N
Constrângeri asupra S: R este convins de adevărul
informaŃiei conŃinute de satelitul S
sau o crede credibilă
Constrângeri asupra N+S: ÎnŃelegerea de către R a informaŃiei
din S face ca încrederea R în
informaŃiei din N sa crească
Efectul: Încrederea R în N creşte
Locul efectului: N
Exemplu: [Adevărul este că presiunea
psihologică de a fuma este mai mare
în timpul liceului decât va fi în oricare
altă perioadă a vieŃii.]N[Ştim că 3000
noi adolescenŃi încep să fumeze în
fiecare zi.]S
Aceste relaŃii sunt legate pentru a forma arborele de discurs ce
acoperă întreaga lungime a discursului după cinci scheme [Mann şi
Thompson, 1988]:
CIRCUMSTANCE
S N
N N
CONTRAST
Mann şi Thompson descriu astfel analiza unui text în concepŃia RST ca
fiind o serie de aplicaŃii ale schemelor precedente asupra unor unităŃi
elementare de discurs sau asupra unor fragmente continue şi adiacente de
discurs, această analiză având proprietăŃile [Mann şi Thompson, 1988]:
Completivitate : Există o aplicare a unei scheme a cărei
rădăcină
acoperă întregul text
Conectivitate : Cu excepŃia rădăcinii, fiecare component al unei
aplicaŃii este fie o unitate elementară, fie rădăcina unei alte
aplicaŃii de schemă
N N
JOIN
MOTIVATION ENABLEMENT
S S N
SEQUENCE SEQUENCE
N NN
Unicitate : Fiecare rădăcină a unei aplicări de schemă acoperă o
altă zonă din discurs
Adiacen Ńă: Zonele de discurs implicate în aplicarea unei
scheme sunt adiacente
[Mann şi Thompson, 1988], ca şi [Moser şi Moore, 1996], dau
următoarele criterii de identificare a nucleului faŃă de satelit, valabile atât la
nivelul unităŃilor elementare de discurs cât şi la nivelul fragmentelor mai mari:
Testul ştergerii : cînd un satelit este şters, segmentul încă mai poate
îndeplini funcŃia iniŃială în text, deşi probabil acum ea este slăbită. Cînd un
nucleu este şters, textul este mult mai puŃin inteligibil.
Testul înlocuirii : un satelit poate fi înlocuit cu o altă informaŃie fără a
altera funcŃia segmentului, ceea ce nu e valabil în cazul nucleului. Există, ca
şi în cazul ştergerii, o puternică asimetrie între a înlocui un satelit şi a înlocui
un nucleu.
Un exemplu de structură RST [Cristea, 2001], pentru textul:
1. Când a ajuns Apolo în muntele Parnas,
2. dihania uriaşă s-a avântat spre dânsul,
3. dornică să-l ucidă.
4. Dar zeul şi-a întins arcul.
5. A tras prima săgeată.
6. Erau doar patru zile de când văzuse lumea,
7. şi întâia lui săgeată a şi nimerit monstrul.
din “Legendele Olimpului” de Alexandru Mitru
2-3 PURPOSE
CIRCUMSTANCE 1-3
1 CONCESSION 6-7 4 5
CONTRAST
SEQUENCE 4-7 SEQUENCE
1-7
Comment [D1]: Mai multe exemple. Vezi în [Moser, Moore, Gled., 1995]
2.4.2 Probleme şi soluŃii în RST
Principalul lucru ce i se reproşează teoriei lui Mann şi Thompson este,
aşa cum îl formulează Marcu [Marcu, 1997], lipsa unor criterii suficiente de
compoziŃionalitate care să elimine ambiguităŃile şi să garanteze posibilitatea
obŃinerii automate a structurii RST a oricărui discurs.
Descrierea modului de construcŃie a arborelui RST şi a modului de
identificare a relaŃiilor retorice este insuficient detaliată, lăsând loc pentru
interpretări personale şi variante multiple corecte pentru acelaşi discurs.
Un exemplu [după Moore şi Pollack , 1993]:
1. Întoarce-te la ora 5:00.
2. Atunci putem merge la magazin înainte de a se închide.
3. Astfel o sa putem termina rafturile în seara asta.
Există două reprezentări RST la fel de corecte:
Porblema îşi poate avea originea fie în descrierea insuficentă a
relaŃiilor retorice posibile, fie lipsa unei modalităŃi de a lua o decizie în cazuri
ambigue. Marcu [Marcu, 1997] propune soluŃii pentru ambele cauze: identifică
3
1
condition
2
condition
1
2
motivation
3
motivation
78 de tipuri noi de relaŃii mai puŃin ambigue decât cele 27 originale şi propune
un criteriu de compoziŃionalitate [Marcu, 1997]: ” Daca o relaŃie retorică R
există între două fragmente de text în reprezentarea sa ca arbore, atunci acea
relaŃie există şi între cele mai importante unităŃi ale acelor fragmente.”
ObiecŃii asupra RST au mai fost ridicate privind lipsa unei ontologii a
relaŃiilor retorice [Hovy, 1990, Maier, 1993] şi ignorarea fragmentelor
întrerupte de text [Cawsey, 1991].
Deşi insuficient de deterministă din puntul de vedere al generării
automate, RST are un potenŃial deosebit atât în crearea unor algoritmi de
interpretare şi generare automată a discursului cât şi ca punct de plecare
pentru alte teorii, aşa cum voi arăta în (2.2.1) şi (4.5).
2.5 Teoria Centrelor (CT)
2.5.1 Origine
ExistenŃa a cel puŃin două teorii acceptate asupra structurii globale a
discursului (RST 2.3, AST 2.6.1) a lăsat loc pentru definirea unei teorii asupra
coerenŃei locale a discursului. Deşi RST permite fomalizarea relaŃiilor dintre
unităŃile discursului şi modul în care contribuie ele la semnificaŃia şi forma
discursului, nu precizează nimic referitor la coerenŃa şi structura locală, din
interiorul acestor unităŃi elementare, şi nici nu explică de ce unele texte sunt
mai uşor de interpretat decât altele, fie de un analizor uman, fie de unul
automat.
IniŃial apărută ca idee încă din 1981 [Joshi şi Weinstein, 1981], Teoria
Centrelor a fost definită ca atare în 1995 [Grosz, Joshi şi Weinstein, 1995] şi
a dat prima descriere funcŃională a coerenŃei la nivel de unităŃi elementare de
discurs.
Principalul scop al CT, definit de autori [Grosz, Joshi şi Weinstein,
1995] este să explice de ce unele texte sunt mai greu de interpretat decât
altele. Fie exemplul :
a. George a jucat şah cu Victor.
b. El a câştigat repede, apoi Victor a plecat să joace fotbal.
c. El era un şahist talentat.
Acest text poate fi înŃeles cu uşurinŃă, nefiind probleme în a identifica
pronumele “el” din ultima propoziŃie ca refindu-se la George.
a. George a jucat şah cu Victor.
b. El a câştigat repede, apoi Victor a plecat să joace fotbal.
c. El a dat un gol.
.
În acest exemplu avem o dificultate în a identifica persoana referită de
pronumele din a treia propoziŃie. Putem recunoaşte pe “el” ca fiind Victor doar
pentru că acŃiunea realizată se leagă de acŃiunea sa din a doua propoziŃie.
CT presupune discursul împărŃit în unităŃi. Ce înseamnã unitate de
discurs nu este definit riguros în teorie. Autorii utilizeazã termenul utterance
(exprimare), în toate exemplele acestea fiind fraze, dar putem considera
aceeaşi unitate ca şi în cazul RST, respectiv o propoziŃie, uneori o clauză.
Expresiile referenŃiale cuprinse într-o unitate realizează centre . Un
centru este o entitate semantică, spre deosebire de o expresie referenŃială
care este o entitate lexicală.
CT explică această dificultate prin schimbarea centrului principal de
la propoziŃia a doua la a treia. Centrul unei propoziŃii este identificat ca find
entitatea principală a unei unităŃi de discurs, în general cea care are şi rol de
subiect şi apare la începutul propoziŃiei. Schimbarea centrului principal implică
o dificultate sporită la înŃelegerea textului.
În modelul formal propus de CT, pentru fiecare unitate de discurs Un se
construieşte o listă de centre anticipatoare (forward-looking centers) notată
Cf(Un) ce conŃine toate centrele din Un. Ordinea centrelor din Cf(Un) trebuie să
reflecte importanŃa lor în Un. Criteriul de ordonare folosit iniŃial de Joshi şi
Weinstein este:
subiect > obiect direct > obiect indirect > complemente > adjuncŃii
Elementele listei Cf(Un) sunt acele elemente despre care se vorbeşte în
Un, deci este cel mai probabil că se va continua a se vorbi şi în unitatea
următoare Un+1. Primul element din lista Cf(Un), deci şi cel mai important, se
notează cu Cp(Un) (principal center). Fiecărei unităŃi îi este de asemenea
asociat un centru retroactiv Cb(Un) (backward-looking center). Pentru prima
unitate (segment) a discursului Cb(Un) este considerat implicit ca fiind acelaşi
cu Cp(Un), pentru toate celelalte unităŃi el este primul element din Cf(Un) ce
apare în Cf(Un+1).
Definind aceste centre pentru oricare două unităŃi elementare
consecutive dintr-un discurs putem face o listă a variantelor de tranziŃii
posibile [Brennan, Friedmann şi Pollard, 1987, Grosz, Joshi şi Weinstein,
1995]:
Continuare (continuing): Cb(Un+1) = Cb(Un) şi Cb(Un+1) = Cp(Un+1), cu
alte cuvinte, între două unităŃi consecutive se păstrează acelaşi centru
retroactiv iar acesta este focusul unităŃii curente. Într-o altă exprimare, o
tranziŃie de tip continuare corespunde situaŃiei în care atît în Un cît şi în Un+1
se vorbeşte despre aceeaşi entitate şi este de aşteptat ca şi în unitatea
următoare să se vorbească despre ea. Exemplu [Cristea, 2001]:
Un: Ion i-a dat Mariei o floare.
Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]
Un+1: El a cerut-o apoi în căsătorie.
Cf = (el=[Ion], o=[Maria]) Cb = [Ion] Cp = [Ion]
Cb(Un+1) = Cb(Un) Cb(Un+1) = Cp(Un+1)
ReŃinere (retaining): Cb(Un+1) = Cb(Un) dar Cb(Un+1) ≠ Cp(Un+1), a cărui
interpretare este că deşi atît în Un cît şi în Un+1 se vorbeşte despre aceeaşi
entitate, este de aşteptat ca în unitatea următoare să se vorbească despre o
alta. Exemplu [Cristea, 2001]:
Un: Ion i-a dat Mariei o floare.
Cf = ([Ion], [Maria]) Cb = [Ion] Cp = [Ion]
Un+1: Ea i-a zîmbit.
Cf = (ea=[Maria], i=[Ion]) Cb = [Ion] Cp = [Maria]
Cb(Un+1) = Cb(Un) Cb(Un+1) ≠ Cp(Un+1)
Schimbare lin ă (smooth-shifting): Cb(Un+1) ≠ Cb(Un) dar Cb(Un+1) =
Cp(Un+1), cu semnificaŃia că deşi în Un şi în Un+1 nu se vorbeşte despre
aceeaşi entitate totuşi este de aşteptat ca în unitatea următoare să se
vorbească despre entitatea ce a fost în focus ultima oară. Exemplu [Cristea,
2001]:
Un: Ion i-a dat Mariei o floare.
Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]
Un+1: Ea i-a zîmbit lui Mihai.
Cf = (ea=[Maria], [Mihai]) Cb = [Maria] Cp = [Maria]
Cb(Un+1) ≠ Cb(Un) Cb(Un+1) = Cp(Un+1)
Schimbare abrupt ă (abrupt-shifting): Cb(Un+1) ≠ Cb(Un) şi Cb(Un+1) ≠
Cp(Un+1), cu semnificaŃia că în Un şi în Un+1 nu se vorbeşte despre aceeaşi
entitate şi este de aşteptat ca în unitatea următoare să se vorbească despre o
altă entitate decît ultima menŃionată. Exemplu [Cristea, 2001]:
Un: Ion i-a dat Mariei o floare.
Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]
Un+1: Mihai i-a zîmbit fetei.
Cf = ([Mihai], fata=[Maria],) Cb = [Maria] Cp = [Maria]
Cb(Un+1) ≠ Cb(Un) Cb(Un+1) ≠ Cp(Un+1)
Pe lângă noŃiunile şi formalizările prezentate anterior, Teoria Centrelor
mai defineşte două contsrângeri asupra centrelor şi tranziŃiilor dintre ele:
Regula 1 : Dacă există un element al listei Cf(Un) care să fie realizat ca
un pronume în Un+1 atunci Cb(Un+1) trebuie de asemenea să fie exprimat ca un
pronume.
Cu alte cuvinte această regulă interzice folosirea în Un+1 a pronumelor
ce referă centre realizate în Un dacă Cb(Un+1) nu este el însuşi realizat ca un
pronume. Abia după ce utilizez pronume pentru expresia lui Cb(Un+1) pot
eventual să mai folosesc alte pronume pentru expresia şi a altor centre
comune cu Un. Fie exemplul:
a. George este fratele Mariei.
b. El I-a dat o veste bună astăzi.
c. El I-a spus că ea va primi o vizită plăcută .
a’. George este fratele Mariei.
b’. El I-a dat o veste bună astăzi.
c’. George I-a spus că ea va primi o vizită plăcută .
CT stabileşte că cea de-a doua variantă e mai puŃin acceptabilă, adică
mai greu de procesat, decît prima. Folosirea referinŃei nominale George este
derutantă în condiŃiile în care pentru referirea personajului feminin se
foloseşte un pronume.
Regula 2 : SecvenŃele de continuări sînt preferabile secvenŃelor de
reŃineri, care sînt preferabile secvenŃelor de schimbări line, acestea fiind
preferabile secvenŃelor de schimbări bruşte: continuare < reŃinere < schimbare
lină < schimbare abruptă
Regula a doua se bazează pe presupunerea că anumite secvenŃe
produc o încărcare inferenŃială în ascultător mai mare decît altele. Exemplul
următor arată cum putem folosi această regulă pentru a interpreta un text
[după Grosz, Joshi şi Weinstein, 1983]:
1. Nu l-am văzut pe George de câteva zile.
2. Victor crede că el se pregăteşte pentru examenele sale.
3. Eu cred că el a plecat la mare cu Laura.
Problema constă în a afla cine este referentul pronumelui “el” din a
treia propoziŃie. Pentru primele două propoziŃii din secvenŃă avem situaŃia:
1. Nu l-am văzut pe George de câteva zile.
Cf = ([eu], “l” = [George], “George” = [George]) Cb = [Eu] Cp = [Eu]
2. Victor crede că el se pregăteşte pentru examenele sale.
Cf = (“Victor” = [Victor], “el” = [George], “examenele” = [examenele],
“sale” = [George]) Cb = [George] Cp = [Victor]
Pentru propoziŃia a treia următoarele două situaŃii sunt posibile: “el” =
[George] sau “el” = [Victor]. În primul caz situaŃia este următoarea:
3. Eu cred că el a plecat la mare cu Laura.
Cf = (“eu” = [eu], ”el”= [George], “mare” = [mare], “Laura” = [Laura]) Cb
= [George] Cp=[“eu”]
ceea ce determină a tranziŃie de tipul “reŃinere”, iar în cel de al doilea
caz:
3. Eu cred că el a plecat la mare cu Laura.
Cf = (“eu” = [eu], ”el”= [Victor], “mare” = [mare], “Laura” = [Laura]) Cb =
[Victor] Cp=[“eu”]
ceea ce determină a tranziŃie de tip “schimbare abruptă”. Cum regula a
doua a CT stabileşte că sunt de preferat tranziŃiile de tip “reŃinere” faŃă de cele
de tip “schimbare abruptă”, interpretarea preferată este aceea în care “el”
referă pe George nu pe Victor, ceea ce corespunde celei mai fireşti
interpretări.
Valoarea CT este evidentă în rezolvarea unei probleme importante ale
Lingvisticii ComputaŃionale, cum ar fi rezoluŃia anaforelor şi în special a
anaforelor pronomiale. CT oferă una dintre cele mai viabile metode de a
identifica referenŃii din propoziŃiile 2 şi 3 din exemplul anterior.
2.5.2 Probleme şi soluŃii în CT
Principalul punct slab al Teoriei Centrelor este aplicabilitatea sa doar la
nivel local, în interiorul unui fragment de discurs. Deşi oferă o metodă viabilă
de a analiza coerenŃa la nivel local, în aplicaŃiile practice de tipul
interpretoarelor şi generatoarelor automate de discurs sunt rare situaŃiile în
care se lucrează doar la nivelul la care CT se poate aplica.
O altă problemă, întâlnită şi la RST, este cea a identificării unităŃilor
elementare de discurs. Deşi sunt elemente centrale ale ambelor teorii, este
greu de dat o definiŃie precisă a lor, identificarea putând fi particularizată la
diferiŃi cercetători.
Există situaŃii în care CT eşează în a identifica corect referenŃii din text.
Un examplu (dupa Carberry S., 1996):
1. Ioana şi Ion au avut parte de o revedere deosebită weekendul
trecut.
2. Ioana s-a întâlnit cu bunica ei sâmbătă.
3. Ion s-a întâlnit cu ea duminică.
1. Ioana şi Ion au avut parte de o revedere deosebită weekendul
trecut.
Cf = ([Ioana], [Ion], …) Cb = [Ioana] Cp=[Ioana]
2. Ioana s-a întâlnit cu bunica ei sâmbătă.
Cf = ([Ioana], [bunica], …) Cb = [Ioana] Cp=[Ioana]
3. Ion s-a întâlnit cu ea duminică.
Prima interpretare:
Cf = ([Ion], [Ioana], …) Cb = [Ioana] Cp=[Ion]
TranziŃie “reŃinere”
A doua interpretare:
Cf = ([Ion], [bunica], …) Cb = [bunica] Cp=[Ion]
TranziŃie “schimbare abruptă”
CT interpretează deci propoziŃia 3 ca “Ion s-a întâlnit cu Ioana
duminică” în ciuda faptului că noi am fi găsit dimpotrivă că “Ion s-a întâlnit cu
bunica duminică” . SoluŃia pe care o propune Dan Cristea [Cristea, 2001] este
că aici intervine un alt criteriu ce are prioritate înainte de CT, un criteriu pe
care îl denumeşte constan Ńa pattern-ului compozi Ńional semantic . El este
enunŃat în felul următor: dacă două unităŃi succesive prezintă un pattern
compoziŃional similar atunci este probabil ca un număr cît mai mare de roluri
corespunzătoare să fie satisfăcute de referenŃi identici. În exemplu avem:
2. întălnit(Ioana, bunica, sâmbătă)
c. întălnit(Ion, X, duminică) conform criteriului X = bunica
CT nu este capabilă aici a infera referenŃii anaforici pronominali dar ea
prevede corect că 3 este dificil de procesat, pentru că tranziŃia dintre 2 şi 3
este o schimbare abruptă.
O importanŃa deosebită în prezicerile asupra încărcărilor inferenŃiale pe
care le avansează CT o are ordonarea elementelor listei centrelor
anticipatoare, pentru că în funcŃie de ordinea acestor elemente se calculează
Cb-ul, Cp-ul şi, de aici, tipul de tranziŃie. Mai multe studii s-au preocupat de
găsirea celui mai corect criteriu de ordonare a elementelor listei Cf.
O abordare foarte interesantă este datorată lui Michael Strube şi Udo
Hahn [Strube şi Hahn, 1996] care avansează teoria func Ńional ă a centrelor
(functional centering). Era clar că rolul sintactic nu putea satisface o limbă ca
germana cu o ordine variabilă a elementelor în frază şi în care informaŃia dată
de rolul sintactic e mult mai puŃin predictivă asupra importanŃei centrelor într-o
exprimare. Strube şi Hahn propun ca ordonarea să se facă conform structurii
informaŃionale funcŃionale a uniturilor în termenii legării ori a nelegării în
context a elementelor de discurs. Ei propun trei niveluri de relaŃii de ordine
care să funcŃioneze pentru ordonarea elementelor listei Cf într-o limbă ca
germana [Strube şi Hahn, 1996]:
Element legat >ISbase element nelegat
Anafora >ISbound (pronume posesiv xor antecedent eliptic) >Isbound
(expresie eliptică xor head de expresie anaforică)
Head nominal >prec head nominal >prec …>prec head nominal
RelaŃia globală este apoi definită astfel:
>IS := {(x, y) | x şi y sînt head-uri lexicale şi
dacă x şi y reprezintă ambele acelaşi tip de pattern al structurii
informaŃionale
atunci relaŃia >prec se aplică între x şi y,
altfel dacă x şi y sunt amândouă diferite forme de elemente legate
atunci relaŃia >ISbound se aplică între x şi y
altfel relaŃia >ISbase se aplică între x şi y}
Alte criterii se ordonare a elementelor listei Cf sînt propuse în literatură
pentru limbi precum japoneza, italiana şi româna unde apare fenomenul
pronumelor vide (cu precădere pe post de subiect). Toate acestea impun
necesitatea unui studiu riguros asupra criteriilor specifice de ordonare a listei
Cf pentru aplicarea CT la fiecare limbă în parte. În lipsa unui astfel de studiu,
observaŃii empirice lasă ca opŃiune implicită o ordonare ce urmăreşte
îndeaproape ordinea de suprafaŃă.
Deşi nu este perfectă, CT este unul din elementele principale în
evaluarea arborilor parŃiali (4.11.2) dezvoltaŃi de aplicaŃia prezentată, ordinea
elementelor din Cf fiind luată cea implicită.
2.6 Teoria Venelor (VT)
Dan Cristea, Nancz Ide şi Laurent Romary Propun în 1998 [Cristea, Ide
şi Romary, 1998] propun o generalizare a Teoriei Centrelor de la nivel local la
nivelul global al discursului. Astfel, în vreme ce CT se ocupă de problema
referenŃialităŃii între unităŃi de discurs adiacente şi situate în acelaşi fragment
al discursului (referinŃe locale), VT ia în consideraŃie relaŃiile dintre structurile
globale ale discursului şi rezoluŃia anaforei, identificând domenii de
accesibilitate ale referinŃelor pentru fiecare unitate de discurs peste structura
arborescentă a discursului.
VT are la bază următoarele principii, similar RST:
• Structura unui discurs poate fi reprezentată printr-un arbore, care în cazul
VT este binar
• Un nod terminal (frunză) din acel arbore reprezintă o unitate elementară a
discursului, considerată a fi o propoziŃie sau clauză
• Un nod intermediar din arbore reprezintă o mulŃime de unităŃi elementare
adiacente ce formează un fragment continuu de discurs care are o
structură proprie
• Nodurile arborelui sunt polarizate: ele pot fin nuclee sau sateliŃi funcŃie de
importanŃa lor relativ la semnificaŃia discursului
• VT nu identifică tipuri de relaŃii între nodurile arborelui, spre deosebire de
cele 27 identificate de RST
VT introduce o serie de noŃiuni importante:
Expresia “head” a unui nod este lista ordonată (în ordinea apariŃiei în
discurs) a celor mai importante unităŃi din fragmentul de discurs
corespounzător nodului. Aceasta se calculează “bottom-up” în felul următor:
• “head”-ul unui nod terminal este eticheta sa (a unităŃii elementare
respective)
• “head”-ul unui nod neterminal este concatenarea “head”-urilor nodurilor fii
nucleare
Expresia “head” proiectează unitaŃile importante în arbore până la nivelul
cla care ele ajung să facă parte dintr-un satelit sau până la rădăcina arborelui.
Expresia “ven ă” (vena) unui nod reprezintă lista ordonată (în ordinea
apariŃiei în discurs) a unităŃilor elementare ce sunt necesare pentru a înŃelege
semnificaŃia fragmentului de discurs acoperit de nod în contextul întregului
discurs. “Venele” se calculează “top-down” în felul următor:
• expresia “venă” a rădăcinii este aceeaşi cu expresia “head” a rădăcinii
• expresia “venă” a unui nod nuclear fără frate satelit la stânga este
aceeaşi cu expresia “venă” a nodului părinte
• expresia “venă” a unui nod nuclear cu frate satelit la stânga este
concatenarea expresiei “venă” a nodului părinte cu unităŃile marcate
din “head”-ul fratelui
• expresia “venă” a unui fiu stâng satelit este concatenarea “venei”
părintelui cu expresia “head” a nodului respectiv
• expresia “venă” a unui fiu satelit drept este concatenarea “venei”
părintelui, din care sunt eliminate unităŃile marcate, cu expresia “head”
a nodului respectiv
Un exemplu de calcul al acestor expresii şi de reprezentare a arborelui cu
“vene” marcate:
1. Când l-a auzit pe George în camera alăturată
2. Victor l-a chemat
3. ca să-I ceară ajutorul.
4. Însă Victor îl deranjase pe George
5. şi acesta se întoarse în camera sa.
6. Deşi George îl refuzase categoric,
7. Victor încă mai spera să îl ajute.
H=2 4 5 7 V=2 4 5 7
H=5 7 V=2 4 5 7
H=4 5 7 V=2 4 5 7
1
2 3
4 H=7
V=2 4 5 7 H=4
H=1 V=1 2 4 5 7
H=2 V=2 4 5 7
Cu “H” este notată expresia “head” iar cu “V” expresia “venă” a unui
nod. Cu linii îngroşate sunt marcate pe arbore liniile principale de
argumentaŃie în text, aşa cum sunt ele deduse din expresiile “venă” calculate.
O altă noŃine introdusă de VT este aceea de domeniu de
accesibilitate evocativ ă (DEA domain of evocative accesibility) al unui nod
terminal şi reprezintă o listă de unităŃi elementare de discurs, ordonate în
ordinea apariŃiei lor, în care este cel mai probabil să fie găsiŃi antecedenŃii
anaforici ai entităŃilor semantice din unitatea elementară desemnată de nod.
DEA se calculează, pentru unitatea “u” ca fiind prefixul venei unităŃii u luat
până la apariŃia unităŃii “u” (toate unităŃile apar în expresia “venă” a lor).
VT introduce pe baza noŃiunii de domeniu de accesibilitate evocativă,
trei tipuri de referinŃe posibile în discurs:
• Dacă A şi B sunt unităŃi în care apare aceeaşi entitate semantică,
referinŃa dintre cele două reprezentări lexicale ale entităŃii este
direct ă dacă A apare în DEA(B) şi antecedentul din A este cel mai
apropiat antecedent din discurs faŃă de anaforul din B
• Dacă A şi B sunt unităŃi în care apare aceeaşi entitate semantică,
referinŃa dintre cele două reprezentări lexicale ale entităŃii este
indirect ă dacă A apare în DEA(B) şi antecedentul din A nu este cel
mai apropiat antecedent din discurs faŃă de anaforul din B, ci există
un alt antecedent mai apropiat care face parte dintr-o unitate ce nu
apare în DEA(B)
• ReferinŃa dintre cele două reprezentări lexicale ale unei entităŃii
semantice din unitatea A este inferen Ńială dacă antecedenŃii ei nu
apar în nici o unitate din DEA(A)
Referitor la coeziunea discursului , Teoria Venelor defineşte
următoarea regulă: AntecedenŃii unui anafor se găsesc cel mai probabil în
domeniul de accesibilitate evocativă dat de expresia “venă” a unităŃii
elementare căreia îi aparŃine anaforul.
Dacă se asociază celor patru tipuri de tranziŃii definite de Teoria
Centrelor un scor conform regulii a doua a CT privind coerenŃa, de exemplu:
(CNT) continuare = 4
(RET) reŃinere = 3
(SSH) schimbare lină = 2
(ASH) schimbare abruptă = 1
putem calcula un scor de coeren Ńă global ă a unui discurs însumând
scorurile tranziŃiilor existente şi împărŃind această valoare la numărul total de
tranziŃii. Acest scor poate fi calculat folosind tranziŃiile dintre unităŃile
adiacente din discurs, sau folosind unitatea anterioară din expresia “venă” a
fiecăreia, obŃinând două scoruri pentru acelaşi număr de tranziŃii.
Privind coeren Ńa discursului , VT afirmă: Scorul de coerenŃă globală
calculat folosind unităŃile antecedente de pe vene este cel puŃin la fel de mare
ca cel folosind unităŃile antecedente din discurs.
Un exemplu de calcul al acestor două scoruri (pentru exemplul
anterior):
G = [George], ca = [camera], V = [Victor], a = [ajutorul]
Scorul folosind unităŃile precedente liniar:
1 2 3 4 5 6 7
Cf G,ca V,G G,a V,G G,c,G G,V V,V
Cb G G G G G G V
Tranz
RET CON RET CON CON ASH
Scor
3 4 3 4 4 1
Global 19/6 =
3.16
Scorul folosind unităŃile precedente pe “vene”
1
2
(pre 1)
3
(pre 2)
4
(pre 2)
5
(pre 4)
6
(pre 5)
7
(pre 6)
Cf G,ca V,G G,a V,G G,c,G G,V V,V
Cb G G G G G G V
Tranz
RET CON RET CON CON ASH
Scor
3 4 3 4 4 1
Global 19/6 =
3.16
Fiind încă o teorie nouă, VT are potenŃialul de a deveni un mijloc
funcŃional util de a pune în comun părtile importante din RST şi CT, adăugând
şi o modalitate validă de a eficientiza rezoluŃia anaforei.
Teoria Venelor este elementul central în două părŃi esenŃiale ale
aplicaŃiei dezvoltate în acest proiect, şi anume motorul de rezoluŃie a anaforei
(4.6.4) şi evaluarea arborilor (4.8.2).
2.7 Alte teorii importante asupra discursului
2.7.1 Grosz şi Sidner (AST)
Teoria Stărilor AtenŃionale [Grosz şi Sidner, 1986] reprezintă prima
tentativă semnificativă în desluşirea structurii discursului. Teoria postulează
legătura dintre intenŃiile vorbitorului, dinamica atenŃiei în recepŃionarea textului
(focusul) şi structura discursului. Un model al manierei în care discursul este
procesat este simultan elaborat.
Conform teoriei lui Grosz şi Sidner intenŃiile joacă rolul principal în
explicarea structurii discursului în timp ce dinamica atenŃiei joacă rolul
principal în explicarea procesării discursului. Structura discursului are trei
componente distincte dar strîns corelate:
• o structur ă lingvistic ă care face ca una sau mai multe propoziŃii, unităŃi
elementare să fie agregate într-un segment de discurs iar limitele dintre
segmente să fie indicate de expresii lingvistice, intonaŃie, schimbări ale
timpului şi aspectelor verbelor. Deşi două exprimări adiacente pot face
parte din acelaşi segment, este de asemenea posibil ca doua exprimări
consecutive să aparŃină la segmente diferite, după cum este posibil ca
două exprimări neconsecutive să aparŃină aceluiaşi segment.
• o structur ă inten Ńional ă care face să vedem discursul ca avînd un scop
global (SD – scopul discursului) care este scopul fundamental al
vorbitorului/scriitorului la emiterea discursului şi fiecare segment al său –
un scop al segmentului (SSD – scopul segmentului de discurs) care este
un subscop al scopului segmentului din care face el parte. Dintr-un punct
de vedere intuitiv SSD specifică cum contribuie respectivul subsegment la
realizarea scopului segmentului din care face el parte. Teoria recunoaşte
infinitatea intenŃiilor posibil a fi transmise de un discurs: nu există o listă
finită de scopuri ale discursului, care să facă posibilă o comparaŃie cu lista
categoriilor gramaticale, de exemplu. Însă deşi există un număr infinit de
intenŃii, numai un număr finit de relaŃii dintre ele pot fi puse în evidenŃă.
Conform teoriei două relaŃii structurale joacă un rol important în
compunerea structurii discursului: rela Ńia de dominan Ńă (dacă SSD1
domină SSD2 atunci SSD2 contribuie la SSD1, sau SSD2 este intenŃionată
a satisface parŃial SSD1 şi rela Ńia de satisfacere-preceden Ńă (SSD1
satisface-precede SSD2 dacă SSD1 trebuie satisfăcut înainte de SSD2);
• starea aten Ńional ă prin care se asociază un spaŃiu al entităŃilor aflate în
centrul atenŃiei fiecărui segment al discursului. Starea atenŃională este o
proprietate a discursului iar nu a participanŃilor la discurs. Ea reprezintă o
trăsătură dinamică a discursului, păstrînd obiecte, propriet ăŃi şi rela Ńii ce
sînt importante la fiecare moment al parcurgerii discursului. Starea
atenŃională e modelată printr-un set de spa Ńii ale centrelor aten Ńiei , în
timp ce schimbările ce pot avea loc în starea atenŃională sînt restricŃionate
de un set de reguli de tranziŃie care arată condiŃiile de adăugare şi
ştergere a spaŃiilor. ColecŃia tuturor spaŃiilor centrelor de atenŃie ce sînt
disponibile în fiecare moment al interpretării unui discurs formează o
structură a atenŃiei ce are dinamica unei stive .
AST s-a dovedit a avea multe elemente mai puŃin compatibile cu structura
discursurilor reale [Cristea, 2001], dar ea merită remarcată ca având o
contribuŃie importantă la dezvoltarea teoriilor ulterioare asupra discursului.
2.7.2 Hobbs Teoria propusă de Jerry Hobbs [Hobbs, 1996] este parte a unei teorii
complexe ce îşi propune să explice relaŃiile existente între interpretarea unui
discurs, evenimente reale şi bagajul de cunoştinŃe şi credinŃe ale vorbitorului
şi ascultătorului.
Principala diferenŃă dintre teoria lui Hobbs şi celelalte teorii este natura
relaŃiilor ce trebuie să fie prezente în discurs pentru a-l face coerent. Astfel, el
afirmă că un discurs este coerent atunci când în el se vorbeşte despre
evenimente reale coerente, când reflectă o structură raŃională de cunoştinŃe,
când ajută la legarea segmentelor discursului de cunoştinŃe anterioare ale
cititorului sau când ajută cititorul la recunoaşterea unor relaŃii inferenŃiale între
segmente ale discursului.
Similar RST, unităŃile elementare sunt clauze, relaŃiile retorice sunt fie
hipotactice, fie paratactice, iar structura discursului este reprezentată ca un
arbore. Metoda de analiză este însă diferită. Hobbs propune un algoritm “top-
down” : în primul pas, analizorul identifica intuitiv fragmentele mari ale
discursului, apoi procedeaza similar pentru fiecare până obŃine o structură
arborescentă ce acoperă întregul discurs. În continuare se procedează în
manieră “bottom-up” la etichetarea nodurilor neterminale cu relaŃii de coerenŃă
împreună cu cunoştinŃele şi presupunerile care au stat la baza etichetării
nodului respectiv cu acel tip de relaŃie de coerenŃă.
2.7.3 Polanyi Teoria propusă de Livia Polanyi [Polanyi, 1996] este deasemenea
compatibilă cu elementele esenŃiale ale RST: structura discursului este
arborescentă, unităŃile elementare sunt clauze distincte.
Polanyi propune o abordare incrementală a analizei discursului şi a
creării arborelui de struictură. Pentru asta, presupune că fiecare unitate
elementară trebuie privită împreună cu contextul ce cunprinde informaŃiile
necesare analizei şi interpretării sale corecte. Analiza acestui context permite
stabilirea exactă a nodului la care se va face ataşarea noii unităŃi la arborele
precedent, precum şi tipul de relaŃie ce o leagă de vecin: de coordonare, de
subordonare, sau egalitate. Odată cu adăugarea unui nod la arbore contextul
tuturor nodurilor superioare sale se va modifica pentru a Ńine cont de noile
informaŃii aduse de unitatea adăugată.
Dificultatea evidentă legată de aplicabilitatea acestei teorii este lipsa
unui mecanism determinist de construcŃie a arborelui de discurs pe baza
premiselor acestei teorii. Deşi poate explica natura şi mecanismul analizei,
practic nu rezolvă problemele importante ale construcŃiei arborelui de discurs.
2.7.4 Marcu Daniel Marcu a formulat o teorie asupra construcŃiei arborelui de
discurs [Marcu, 1997] având la bază RST. Astfel, unităŃile elementare sunt de
asemenea clauze, relaŃiile retorice sunt de aceeaşi natură, dar mai detaliate şi
structurate (78 faŃă de 27 la RST).
Arborele de discurs în teoria lui Marcu arată însă diferit de cel RST: el
este binar, frunzele sale sunt unităŃi elementare ale discursului, nodurile pot fi
nucleare sau sateliŃi, au ataşat o relaŃie retorică ce le leagă de arbore şi un
listă de promovare (promotion set) ce identifică unităŃile elementare cele mai
importante aflate sub acel nod. ConstrucŃia arborelui se face similar RST,
Marcu însă adaugă un criteriu de compozi Ńionalitate : ” Daca o relaŃie
retorică R există între două fragmente de text în reprezentarea sa ca arbore,
atunci acea relaŃie există şi între cele mai importante unităŃi ale acelor
fragmente.” Această regulă, precum şi detalierea relaŃiilor retorice, ajută la
eliminarea cel puŃin parŃială a nedeterminismului în construcŃia arborelui RST.