Descrierea corpusului
Acesta este German Drama Corpus (GerDraCor), o colectie de piese in limba germana codificate TEI P5 din 1730 pana in anii 1940. Corpusul este publicat in temeiul derogarii Creative Commons Zero privind drepturile de autor (CC0).
Daca doriti sa citati corpusul, va rugam sa utilizati aceasta publicatie:
- Fischer, Frank si colab. (2019) . Corpuri programabile: Prezentarea DraCor, o infrastructura pentru cercetarea dramaturgiei europene. In Proceedings of DH2019: “Complexities” , Utrecht University, doi: 10.5281 / zenodo.4284002.
Am inceput sa construim corpusul extragand toate piesele din TextGrid Repository (TGRep). Sursa pentru versiunile din TGRep a fost colectia de text zeno.org. Cu toate acestea, conversia TGRep din XML-ul proprietar al zeno.org in TEI a cauzat unele erori si neconcordante pe care le-am remediat pentru GerDraCor intr-un proces mai lung intre 2017 si 2019. Toate remedierile noastre, inclusiv imbunatatirile, sunt documentate pe Wiki GerDraCor. Dupa acest proces de curatare, GerDraCor este acum in masura sa creasca luand noi piese din surse precum Deutsches Textarchiv, Project Gutenberg, Projekt Gutenberg-DE, Wikisource sau Google Books.
GerDraCor este un corpus autonom si va fi intretinut independent. Totusi, este, de asemenea, integrat pe site-ul dracor.org, vitrina pentru noul nostru concept „Corpuri programabile” .
porno india maduras sensuales
largeporntube porno español trios
incestoxxx porno español abuelas
coños ricos abuelas por el culo
follando en el trastero maduras gozando
peleas xxx masajes porno en español
pollas peludas porno españolas peludas
inciesto español española viciosa
porno loco peliculas porno subtituladas en español
porno gay primera vez creampie española
chicas haciendo el amor videos porno corridas internas
pornoamater incesto abuelas
viejas tetonas alexa grace
pornox porno traducido al español
porno del bueno maduras gordibuenas
vecinas cachondas megan montaner follando
revistas xxx taboo.com
zoofilia con cabras chica se masturba
vieja gorda follando videos chicas gratis
maduras españolas masturbandose parejitas españolas follando
Daca doriti doar sa descarcati corpusul in starea sa actuala in XML-TEI, faceti acest lucru:
export svn https://github.com/dracor-org/gerdracor/trunk/tei
Relatii de caracter
Relatiile de caractere codifica informatiile furnizate in dramatis personae si o fac lizibila de masina. Este vorba in principal de relatii familiale si de putere.
Urmatoarele relatii au fost adnotate (de Nathalie Wiedmer si colab.):
Eticheta relatiei Regizat / Nedirectionat Descriere parinte_de regizat Un personaj este parinte al celuilalt iubit_de regizat Pentru iubitorii inruditi_cu regiati Alte relatii de familie (de exemplu, unchi) asociati_cu regia Pentru personaje clar asociate (de exemplu, majordomi) frati nedirectionati Caractere care au cel putin un parinte in sotii obisnuiti Nedirectionati Personaje in prieteni casatoriti (sau logoditi) nedirectionati Personaje marcate ca fiind prieteni
Toate relatiile sunt marcate in XML in elementul <listPerson> din <listRelation>. Relatiile directionate sunt codificate cu un atribut activ si pasiv in care partea activa este intotdeauna cea din fata relatiei, daca este exprimata ca o propozitie. De exemplu, Odoardo este parintele lui Emilia :
Relatiile nedirectionate folosesc atributul reciproc pentru a colecta toate ID-urile care fac parte dintr-o relatie:
Eticheta din tabelul de mai sus este continuta in atributul name.
API
O modalitate usoara de a descarca datele de retea (in loc de fisierele TEI reale) este utilizarea API-ului nostru (documentatie aici). Daca aveti jq instalat, ar functiona astfel:
Pagina de informatii API este la https://dracor.org/api/info. De asemenea, va spune ce versiune de eXist-db rulam pe dracor.org.
Vizualizare simpla cu R
Pentru a arunca o prima privire asupra distributiei numarului de difuzoare per redare in timp, puteti introduce tabelul de metadate in R:
Rezultat:
Iata un complot care arata numarul de piese pe deceniu:
Un pic de istorie
Pana cand ne-am reconstruit corpul de lucru sub noul sau nume GerDraCor, am lucrat cu un format intermediar pentru a ne efectua cercetarile. Acest format continea doar informatii structurale, nu textele in sine. Pe atunci, grupul nostru de cercetare se numea DLINA (analiza retelei literare cu capacitate digitala). Deoarece accentul nostru s-a extins, am incetat sa folosim acest nume. Eforturile noastre viitoare se vor deplasa sub pavilionul Corpurilor programabile .
(README ultima actualizare pe 5 ianuarie 2021.)








