Post on 08-Feb-2018
transcript
Cursurile5-6Introducereîn
prelucrarealimbajuluinatural
Domeniul
• Lingvis'cacomputaţională(LC)–osaturateore=că– computa'onallinguis'cs
• Prelucrarealimbajuluinatural–zonaaplica=vă– naturallanguageprocessing– tehnologialimbajuluinatural,naturallanguagetechnology
– tehnologialimbajuluiuman,humanlanguagetechnology
2
Tehnologialimbajuluinatural
• Limbajulvorbit• Limbajulscris• Limbajulîncorelaţiecualtemodalităţideexpresie(mul=modalitate)
3
Tehnologiilelimbajuluivorbit
• Interpretareavocii– reprezentareasemnalelorvocale– recunoaştereavorbirii– analizaprozodiei– recunoaştereavorbitorului
• Sintezavocală
4
Prelucrareasemnaluluisonor
PrinbunăvoinţaAcad.H.N.Teodorescu5
Tehnologiilelimbajuluiscris
• Tehnologiiprimare– Analizaimaginiidocumentelor– Recunoaştereacaracterelorde=par– Recunoaştereacaracterelordemână
• Op'calCharacterRecogni'on(OCR)
6
Ms.45BARCluj-Napoca,secondhalfof17thcentury
Differenttypesofwri=ngintherevisedcopyofNicolaeMilescu’stransla=onofSeptuaginta,p.412-413
7
Tehnologiilelimbajuluiscris
• Analizaşiînţelegerealimbajului– prelucrărisub-sintac=ce
• unităţilelexicale• graniţeledefrază• granițeledepropoziții• parteadevorbireşimarcamorfologică• lema• numeledeen=tăţi• grupurile(nominale,verbale,prepoziţionaleetc.)şiatracţiilelexicale(colocaţii)
8
FrazeComisiajuridicăaCamereiDeputaţiloravotatluniîmpotrivaînceperiiurmăririipenaleaministruluidemisionaralFondurilorEuropene,RovanaPlumb,dupăceaceastaafostaudiată,alăturideavocat,aproxima=voorădecătredeputaţiijuriş=.|RovanaPlumbs-adeclarat,dinnou,laieşireadelaaudieriledincomisiajuridică,nevinovatădeacuzaţiileadusedeprocuroriian=corupţie.|
9
PropozițiiPe22septembrie,DNAaanunţatcă|vicepremierulSevilShhaidehestesuspectăde|săvârşireainfracţiuniideabuzînserviciu|cânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,|prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,|părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,|pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.|
10
UnitățilexicalePe22septembrie,DNAaanunţatcăvicepremierulSevilShhaidehestesuspectădesăvârşireainfracţiuniideabuzînserviciucânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.
11
En=tățicunumePe22septembrie,DNAaanunţatcăvicepremierulSevilShhaidehestesuspectădesăvârşireainfracţiuniideabuzînserviciucânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.
persoană
12
En=tățicunumePe22septembrie,DNAaanunţatcăvicepremierulSevilShhaidehestesuspectădesăvârşireainfracţiuniideabuzînserviciucânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.
repertemporal
dată
En=tățicunumePe22septembrie,DNAaanunţatcăvicepremierulSevilShhaidehestesuspectădesăvârşireainfracţiuniideabuzînserviciucânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.
ins=tuție
14
En=tățicunumePe22septembrie,DNAaanunţatcăvicepremierulSevilShhaidehestesuspectădesăvârşireainfracţiuniideabuzînserviciucânderasecretardestatlaMDRAP,într-undosarconformcăruia,în2013,prinacţiuneaconcertatăaunorpersoanecufuncţiipublice,părţidinInsulaBelinaşiBraţulPavelautrecutilegaldinproprietateastatuluiînproprietateajudeţuluiTeleormanşiînadministrareaCJTeleorman,pentruca,doarlacâtevazile,săfieînchiriatetotilegaluneifirmeprivate.
locațiigeografice
15
Lemașiparteadevorbire
Solicitat–solicita–vbsă–să–conjcomenteze–comenta–vbun–un–art.nehot.editorial–editorial–sbrecent–recent–adj...
16
• English
Adnotareamorfologică
0 1 He he subj:>2 @SUBJPRON2 did do v-ch:>4 @+FAUXVV3 not not neg:>2 @ADVLNEG-PART4 knowknowmain:>0 @-FMAINVV5 her she subj:>6 @OBJPRON6 namenameobj:>4@-FMAINVV
• Romanian
<TOKID="TOK478"root="Nu"pv="Par=cle"Type="nega=on">Nu</TOK><TOKID="TOK479"root="ş="pv="Verb"Type="main"Mood="indic."
Tense="imperfect"Person="third"Number="singular">ş=a</TOK><TOKID="TOK480"root="cum"pv="Adverb"type="int_rel">cum</TOK><TOKID="TOK481"root="el"pv="Pronoun"Type="pers"Person="third"
Gender="feminine"Number="singular"Case="accusa=ve">o</TOK><TOKID="TOK482"root="chema"pv="Verb"Type="main"Mood="indic."
Tense="present"Person="third">cheamă</TOK>
17
Grupurinominale
Solicitatsăcomenteze[uneditorialrecentallui[DinuPatriciu]],în[care][acesta]precizacănucredeîn[social-liberalism]şisăapreciezedacă,asxel,adat[oloviturăde[imagine]][USL],[Antonescu]aspuscănuş=edacă[Patriciu]s-areferitla[USL].
18
<NPID="NP903"HEADID="W3190"VERBPOS="W3191"><WID="W3190"POS="PRON"NUM="SG"GENDER="M"ROLE="SUBJ" LEMMA="he"LINK="W3191"LINKTYPE="subj">He</W></NP>
<WID="W3191"POS="V"ROLE="+FAUXV"LEMMA="do"LINK="W3193"LINKTYPE="v-ch">did</W>
<WID="W3192"POS="NEG-PART"ROLE="ADVL"LEMMA="not"LINK="W3191"LINKTYPE="neg">not</W>
<WID="W3193"POS="V"ROLE="-FMAINV"LEMMA="know"LINK="W3189"LINKTYPE="main">know</W>
<NPID="NP1188"HEADID="W3195"><NPID="NP904"HEADID="W3194"VERBPOS="W3189"> <WID="W3194"POS="PRON"NUM="SG"GENDER="F” ROLE="OBJ"LEMMA="she"LINK="W3195“LINKTYPE="subj">her</W></NP><WID="W3195"POS="V"ROLE="-FMAINV"LEMMA="name”LINK="W3193"LINKTYPE="obj">name</W></NP>
Adnotarelagrupurinominale
19
Tehnologiilelimbajuluiscris
• Analizaşiînţelegerealimbajului– prelucrărisintac=ce
• formalismegrama=cale• parsareaèstructurasintac=căafrazei
20
Ambiguităţisintac=ce
Mariapriveştecalulcuochelari.
VP
priveşte
S
Maria
NP
calul
PP
NP
cu ochelari
NP
VP
priveşte
S
Maria
NP
calul
NP
cu ochelari
NP
PP
21
InstrumentedebazăînPLN
• Tokenizer:determinăgranițeleunitățilorlexicale– intrare:text(șirdecaractere)– ieșire:<tok id=“...”>cuvânt</tok>– cum:prinexpresiiregulate
2222
InstrumentedebazăînPLN
• POS-Tagger:e=chetarelapartedevorbire(dezambiguizaremorfosintac=că)– intrare:<tok id=“...”>cuvânt</tok>– ieșire:<tok id=“...” POS=“...”>cuvânt</tok>– cum:exploatândfrecvențeledeaparițieaanumitorsecvențedepărțidevorbire=>op=mizareglobalăasecvențelordee=chete
Thesawmadenoise.
DET VN
NV
N
23
InstrumentedebazăînPLN
• Lema_zator:determinăformadebazăacuvintelor– intrare:<tok id=“...” POS=“...”>word</tok>– ieșire:<tok id=“...” POS=“...” lemma=“...”>word</tok>
– cum:pebazaunuidicționardelemeșiexploatândfrecvențedeaparițieasecvențelordeleme=>op=mizareglobală
Thesawmadenoise.
the sawsee
mademake
noise
24
InstrumentedebazăînPLN
• NP-Chunker:detecteazăgrupurinominale– intrare:secvențedeelemente<tok>– ieșire:<npid=“...”>...</np>– cum:aplicândexpresiiregulate
25
InstrumentedebazăînPLN
• NER(nameen_tyrecogniser):recunoașteșiclasificănumedeen=tăți– intrare:text– ieșire:<neid=“...”type=“...”>...</ne>– cum:pebazădeexpresiiregulateșilistefoartemaridenumedeen=tățispecializatepelimbi(gazeteers)
26
Tehnologiilelimbajuluiscris
• Analizaşiînţelegerealimbajului– Prelucrăriseman=ceşidediscurs
• dezambiguizareseman=căèsensurilecuvintelor• determinarearolurilorseman=cealeverbelor• structuraretoricăadiscursuluişidialogului• rezoluţiaanaforelor• rezumareatextelor
27
Lanțuri coreferențiale
Winston was just taking his place in one of the middle rows when two people whom he knew by sight, but had never spoken to, came unexpectedly into the room. One of them was a girl whom he often passed in the corridors. He did not know her name, but he knew that she worked in the Fiction Department.
28
Lanțuri coreferențiale
Winston was just taking his place in one of the middle rows when two people whom he knew by sight, but had never spoken to, came unexpectedly into the room. One of them was a girl whom he often passed in the corridors. He did not know her name, but he knew that she worked in the Fiction Department.
29
Lanțuri coreferențiale
Winston was just taking his place in one of the middle rows when two people whom he knew by sight, but had never spoken to, came unexpectedly into the room. One of them was a girl whom he often passed in the corridors. He did not know her name, but he knew that she worked in the Fiction Department
30
Lanțuri coreferențiale
Winston was just taking his place in one of the middle rows when two people whom he knew by sight, but had never spoken to, came unexpectedly into the room. One of them was a girl whom he often passed in the corridors. He did not know her name, but he knew that she worked in the Fiction Department.
31
Cuvinteleîşiprecizeazăsensulîncontext
• Ionseprinseînhorăcuofatăcucosiţelungi.• Cândfatăiapata?
• Mămaidauodatăpepâr'aroşie.• I-amdatunapestemână.• Mariaadatcarteaînapoi.
• M-amscos…• Mi-amscosmăseauademinte.
32
Pre-processing
TEXT
TOK
Tokeniser
TOK(POS,LEM)
POS-tagger+Lemma=ser
SENT
SENT-SPLITTER
33
NP-chunking,NER
TOK+NP
NP-chunker
TOK+NP+NE(PER)
TOK(POS,LEM)
TOK+NP+TIME
NER_=me
TOK+NP+NE(ORG)
NER_orgNER_person
TOK+NP+NE
merge
34
Coreference,syntac=cparsing
TOK+NP+NE+COREF
TOK+NP+NE
TOK+SENT+SYNT
TOK+NP+NE+COREF+SENT+SYNT
merge
RARE
TOK(POS,LEM) SENT
TOK+SENT
FDG-parser
merge
35
Events
EVENT-finder
TOK+NP+NE+COREF+SENT+SYNT
TOK+NP+NE+COREF+SENT+SYNT+EVENT
TEXT
EVENT
simplifica=on
manualannota=on
36
KinshipandSpace
KINSHIP-finder
TOK+NP+NE+COREF+SENT+SYNT
TOK+NP+NE+COREF+SENT+SYNT+KINSHIP
TEXT
KINSHIP SPACE
SPACE-finder
simplifica=onsimplifica=on
manualannota=on
manualannota=on
TOK+NP+NE+COREF+SENT+SYNT+SPACE
37
Relațiiderudenie:exemplu
-Lascăcu'nemărăfuiescdupă,îiscăpăprintredințiomuluieiDonca,nevastacălugăruluizbanghiuZuicu,care-IaduseselaelacasăpeIonșipepreședinte.
Apoziție:Per-X,Rel(atrib)Per-Ygen,=>marriage(X:person[sex:?],Y:person[sex:?])
marriage(Donca:person[sex:f],Zuicu:person[sex:m])
38
Relațiiderudenie:exemplu-VremedepatruzecideaniviațaElleiRubinstein1fusesecaoapăstătătoare…Soțulei1,David,eraunden'stdesucces…
Apoziție:RelPer-Xpron,gen,Per-Y,=>marriage(antecedent(X):person[sex:?],Y:person[sex:?])
marriage(EllaRubistein:person[sex:f],David:person[sex:m])
39
Relațiispațiale:exemplu
LacinciverstedeiurteleAremziansk,înmijloculrâuluiIrtâş,seaflăostrovulKuntai.SatulluiFilatovseaflăpemalulstângladouăverstedeostrov.
40
Cumsecalibreazăunmodul?
Săpresupunemcăvremsăconstruimunmodulcaresărealizezeunanumitobiec=v.Atunci,defapt,vatrebuisăfabricăm3module:§ Modululdeantrenare(TM)§ Modululpropriu-zis(X)§ Modululdeevaluare(EM)
41
• TMextragedintr-uncorpusdeantrenareunmodelcarevafiapoifolositdemolululX.
Modululdeantrenare(TM)
TrainingModuleTrainingCorpus
model
preferencesTraining.pref
42
• Xaplicăunalgoritmasuprauneiintrăripentruaotransformaînconformitatecumodelulînvățat.
ModululX
ThemoduleX output.xml
input.xml
preferencesX.pref
model
43
• EMevaluează(compară)unfișierTestfațădeunfișierconsideratcorect(deaur)Gold.
Modululdeevaluare(EM)
Evalua=onModule evalLog
preferencesEvalua=on.pref
output.xml
gold.xml
Test
44
Măsuriînevaluare
• Precision=#itemiîncomunînTest&Gold/#itemiînTest• Recall=#itemiîncomunînTest&Gold/#itemiînGold• F-measure=2*P*R/(P+R)
45
Arhitecturagenerală
TMTrainingcorpus
model
preferencesTraining.pref
X
EM
preferencesX.pref
preferencesEvalua=on.pref
input.xml
output.xml
gold.xml
evalLog
46
Sistemdecalibrare
TM
X
EM
configura=on.cfg
TrainingCorpus
input.xml
gold.xml
preferencesTraining.pref
preferencesX.pref
C
Op=malvalues
preferencesEvalua=on.pref
47
FormarecomandatăaunuiinstrumentNLPcarepar=cipăîntr-unlanțde
prelucrări
ModuleXstandardinput
standardoutput
outputinput
resourses
standardresourses
48
parameters
txt
Eventshappenin=me
Cândaintratîncamerăe1,Ionaaprinsluminae2.Dupăcinciminuteaieşite3.Laieşireas'nsluminae4.
49
Eventshappenin=me
Cândaintratîncamerăe1,Ionaaprinsluminae2.Dupăcinciminuteaieşite3.Laieşireas'nsluminae4.
Twotypesoftemporalexpressions:• instants...
e1:t1/e2:t1/e3:t2=t1+5min/e4:t2
time
e1
t1
e3
t2
e2 e4 50
Eventshappenin=me
Cândaintratîncamerăe1,Ionaaprinsluminae2.Dupăcinciminuteaieşite3.Laieşireas'nsluminae4.
Twotypesoftemporalexpressions:• ...andintervals:
time
e1
t1
e3
t2
e2 e4
5 minutes
51
Eventscanbe...
• Instantaneous:Ionaieşitdincameră.Marias-aîntâlnitcuprofuldemate.
• Take=me:Ionaci'ttoatăseara.Afarăplouă.
time t
e
time t1
e
t2
52
Signalsfortemporalrela=ons
Cândaintratîncamerăe1,Ionaaprinsluminae2.Dupăcinciminuteaieşite3.Laieşireas'nsluminae4.
cândei,ejèt(ei)=t(ej)ei.După<interval>ejèt(ej)=t(ei)+<interval>La<reference(ei)>ejèt(ei)=t(ej)
timp
e1
t1
e3
t2
e2 e4
5 minute
53
Typeofreasoningwhere=mema�ers
2. [Falimentul firmei] a avut loc la un an după [înfiinţarea ei].
un an
1. Samurai S.R.L. a luat fiinţă la 23 ianuarie 1984.
Când a falimentat Samurai S.R.L.?
54
Processingstatements
a luat fiinţă
Samurai S.R.L.(id=obj1) subj
la
23 ianuarie 1984
compl
PP ev1
23ianuarie1984
ISA aluafiinţă
SamuraiS.R.L. REC
TIME
evenimential representation
<object ID=“obj1” ISA=“companie” NAME=“Samurai S.R.L.”/>
<event ID=“ev1” ISA=“a_lua_fiinţă” REC=“obj1” TIME=“23.01.1984”/>
55
simplificări
a avut loc
falimentarea subj
la
an
compl
atrib. genit? firmei
un după
înfiinţarea
ei
PP
atrib. genit?
det
a avut loc
falimentarea subj
la
an
compl
atrib. genit? obj1
un după
înfiinţarea
obj1
PP
atrib. genit?
det
rezoluţia anaforelor
a falimenta subj
la
an
compl obj1
un după
ev1
PP
det
dacă are_loc falimentarea lui X atunci X falimentează
referinţă anaforică la un eveniment deja menţionat
56
Processingstatements
evenimential representations
a falimenta subj
la
an
compl obj1
un după
ev1
PP
det temporal expression
anchored in another event
<event ID=“ev2” ISA=“a_falimenta” REC=“obj1” TIME=“timex1”/>
<timex ID=“timex1” TYPE=“after” REF=“ev1” DUR=“1” UNIT=“year”/>
57
Compu=ng=me<objectID=“obj1”ISA=“companie”NAME=“SamuraiS.R.L.”/><eventID=“ev1”ISA=“a_lua_fiinţă”REC=“obj1”TIME=“23.01.1984”/><eventID=“ev2”ISA=“a_falimenta”REC=“obj1”TIME=“=mex1”/><=mexID=“=mex1”TYPE=“a�er”REF=“ev1”DUR=“1”UNIT=“year”/><eventID=“ev2”ISA=“a_falimenta”REC=“obj1”TIME=“23.01.1985”/>
58
Corpusul‘QuoVadis’
59
Uncorpusdeen=tățișirelațiiseman=ce
• Tipurideen=tăți:– persoane– zei– grupuridepersoaneșizei– părțifizice
• Relațiiseman=ceexprimateîntreaceste=purideen=tăți
60
En=tăți• Personaje(MarcusVinicius,Ligia),grupuri (creș'nii,soldații);
• La nivelul textului: grupuri nominale (tânărulpatrician,fiulconsulului);
• En=tățiincluse:[Te]1[iubesc;REALISATION=INCLUDED]2,Marcus!• Expresiireferențialeimbricate:[fiica[luiAulus]2]1
61
Tipuriderelații
• Anaforice• Seman=ce
– rudenie– afec=ve– sociale
62
Relațiianaforice• coref• coref-interpret• member-of,has-as-member(inverse)• isa,class-of(inverse)• part-of,has-as-part(inverse)• subgroup-of,has-as-subgroup(inverse)• has-name,name-of(inverse)1:[Acteea]...2:[tânăralibertă]...=>[2]coref[1]1:[mâna2:[lui]dreaptă]=>[1]part-of[2]
63
Relațiiderudenie• parent-of• child-of(inverseofparent-of)• grandparent-ofandgrandchild-of(inverse)• sibling(symmetrical)• ant-uncle-of,nephew-of(inverserela=on)• cousin-of(symmetrical)• spouse-of(symmetrical)• unknown
1:[celuide-aldoileasoț2:[alPopeii]]=>[1]spouse-of[2]1:[soralui2:[Petronius]]=>[1]sibling-of[2]
64
Relațiisociale
• superior-of• inferior-of• incoopera'on-with• colleague-of• incompe''on-with• opposite-toEliberând-1:[o],2:[Nero]…=>[2]superior-of[1]1:[Tânărul]luptasesubcomanda2:[luiCorbulon]=>[1]inferior-of[2]
65
Relațiiafec=ve• love• loved-by• hate• hatedby• upset• friendship• worship• angerPe1:[Vinicus]îlcuprinseomânienăprasnicăîmpotriva
2:[împăratului]șiîmpotriva3:[Acteii]=>[1]anger[2],[1]anger[3]
66
<ENTITYID="E8"TYPE="PERSON"><Wid="28"LEMMA="Marcus">Marcus</W><Wid="29"LEMMA="Vinicius">Vinicius</W></ENTITY><Wid="30"LEMMA="fi">era</W><KINSHIPID="KIN57"FROM="E12"TO="E11"TRIGGER="31"
TYPE="child-of"><ENTITYID="E12"TYPE="PERSON"><Wid="31"LEMMA="fiu">fiul</W><KINSHIPID="KIN53"FROM="E11"TO="E10"TRIGGER="32"
TYPE="sibling-of"><ENTITYID="E11"TYPE="PERSON"><Wid="32"LEMMA="soră">surorii</W><ENTITYID="E10"TYPE="PERSON"><Wid="33"LEMMA="său">sale</W></ENTITY><Wid="34"LEMMA="mai">mai</W><Wid="35"LEMMA="mare">mari</W></ENTITY></KINSHIP></ENTITY></KINSHIP><Wid="36"LEMMA=",">,</W><KINSHIPID="KIN59"FROM="E13"TO="E15"TRIGGER="44"
TYPE="spouse-of"><ENTITYID="E13"TYPE="PERSON"><Wid="37"LEMMA="care">care</W></ENTITY><Wid="38"LEMMA=",">,</W><Wid="39"LEMMA="cu">cu</W><Wid="40"LEMMA="an">ani</W><Wid="41"LEMMA="în_urmă">înurmă</W><Wid="42"LEMMA=",">,</W><Wid="43"LEMMA="sine">se</W>
<Wid="44"LEMMA="căsători">căsătorise</W><Wid="45"LEMMA="cu">cu</W><KINSHIPID="KIN61"FROM="E15"TO="E14"TRIGGER="46"TYPE="parent-of"><ENTITYID="E15"TYPE="PERSON"><Wid="46"LEMMA="tată">tatăl</W><ENTITYID="E14"TYPE="PERSON"><Wid="47"LEMMA="acesta">acestuia</W></ENTITY></ENTITY></KINSHIP></KINSHIP><SOCIALID="SOC9"FROM="E17"TO="E16"TRIGGER="49"TYPE="inferior-of"><ENTITYID="E17"TYPE="PERSON"><Wid="49"LEMMA="consul">consul</W><Wid="50"LEMMA="pe">pe</W><Wid="51"LEMMA="vreme">vremea</W><Wid="52"LEMMA="el">lui</W><ENTITYID="E16"TYPE="PERSON"><Wid="53"LEMMA="Tiberiu">Tiberiu</W></ENTITY></ENTITY></SOCIAL><Wid="54"LEMMA=".">.</W><REFERENTIALID="REF37"FROM="E12"TO="E8"TYPE="coref"/REFERENTIAL><REFERENTIALID="REF38"FROM="E13"TO="E11"TYPE="coref"/REFERENTIAL><REFERENTIALID="REF39"FROM="E14"TO="E8"TYPE="coref"/REFERENTIAL><REFERENTIALID="REF40"FROM="E17"TO="E15"TYPE="class-of"/REFERENTIAL>
Adno
tarea
Sta=s=ciasupracorpusului
• 7.281fraze• 146.822cuvinteșisemnedepunctuație• 24.636mențiunideen=tăți• 22.301relațiireferențiale• 755relațiiAKS(Affec=ve+Kinship+Social)• 752triggere
68
Example:relațiileloveșiworship
69
Relațiileafec=vefear-ofșihate
70
RelațiileluiViniciuscualtepersonaje
71
Distribuțiarelațiilorseman=ceîncareesteimplicatpersonajulVinicius
72
Linguis'csLinkedOpenData(LLOD)
- Dezvoltareadetehnicicarevorpermitedescifrareaconținutuluiseman_caltextelor- rezumate(generale,parțiale,focalizatepepersonaje),- liniinara=ve(e.g.evoluțiasen=mentelordintreViniciusșiLigia)
- conexiunista=ceîntreen=tăți(e.g.arborigenealogici),- sta=s=ciasupraen=tăților(e.g.sen=mentelemajoritarealecreș=nilorcomparatecucelealeromanilor)
73
Linguis'csLinkedOpenData(LLOD)
- Generareadeontologiidincolecțiidetratate- aplicațiicare“citesc”tratateleunuidomeniușiformalizeazăconcepteleșiinstanțeleacestora
- Căutaredocumentarăinteligentă- asistențipersonalizațiaiac=vitățiidecercetare
74