Home PROIECTE PN-III-P4-ID-PCE-2016-0826
PDF Imprimare Email

PN-III-P4-ID-PCE-2016-0826

Raport ştiinţific 2017

În perioada 12.07.2017 – 31.12.2017, după obţinerea ultimei aprobări privind proiectul nostru de cercetare, s-a desfăşurat o serie de operaţii administrative legate direct de demararea activităţii și care țin de managementul de proiect, dar și de pregătirea desfășurării propriu-zise a proiectului, cu începere din 2018.

– Completarea echipei de lucru cu încă trei cercetători, conform cu numărul de membri prevăzut în proiect, pe lângă cei doi care erau deja cuprinşi în proiect (dr. Monica Busuioc, director de proiect, şi dr. Nicoleta Mihai, membru al echipei).

Astfel, au fost respectate procedurile legale în vederea organizării concursului de angajare pentru cele trei posturi (anunţarea la ziar şi pe cele două site-uri din pachetul de informaţii al concursului; alegerea bibliografiei şi a tematicii concursului; fixarea datei de concurs, a comisiei de concurs şi a comisiei de contestaţie).

În data de 28 august 2017, s-au prezentat la concurs următoarele trei persoane, în vederea ocupării celor trei posturi vacante: dr. Carolina Popuşoi, dr. Anghelina Alexandru Dan şi drd. Diana Cărburean.

Concursul a constat într-o lucrare scrisă cu o temă legată de profilul proiectului de cercetare: „Rolul corpusurilor electronice în elaborarea lucrărilor lexicografice. Cazul DLR”.

Cei trei candidaţi au obţinut nota maximă şi au fost angajaţi începând cu data de 01.09.2017.

Dr. Anghelina Alexandru Dan a fost ales secretar al echipei de lucru, pentru a se ocupa de chestiuni financiar-administrative şi ştiinţifice.

– Alegerea primului set de opere literare de referinţă, în acord cu bibliografia DLR, în număr de 100, care vor face parte din corpus.

Operele au fost selectate astfel încât să ilustreze evoluţia limbii române, sub diversele ei aspecte funcționale, de la cele mai vechi texte scrise în română până la epoca contemporană.

S-au discutat, de asemenea, procentele de reprezentativitate ale diverselor stiluri funcționale în elaborarea unui corpus de referință al limbii române.

S-a pus un accent deosebit pe opere literare aparţinând perioadei de după 1990, când se constată o îmbogăţire fără precedent a vocabularului, ca urmare a influenţei exercitate în special de limba engleză. Acest grup de texte recente este necesar pentru completarea listei de cuvinte din vocabularele anterioare.

S-a discutat, de asemenea, introducerea în corpus a unui număr reprezentativ de texte jurnalistice, precum și a unui set de manuale școlare pentru reperarea terminologiilor etc.

– Pregătirea operelor selectate pentru începerea activităţii de digitalizare, folosindu-se, cu limitările actuale, aparatura şi instrumentele de lucru din dotare (înaintea achiziționării celor necesare desfășurării proiectului). Aceste activităţi constau în:

·                     scanarea cărților și publicaților în format PDF

·                     eliminarea imperfecţiunilor rezultate în urma scanării (în funcție de calitatea și vechimea originalului)

·                     ocerizarea cu softurile existente

·                     analiza rezultatelor ocerizării

·                     alegerea celui mai performant soft de ocerizare

·                     soluții de antrenare a acestuia la limba română

– Testarea și îmbunătățirea unui program de corectură asistată, adaptat limbii române, pentru formatul PDF ocerizat:

·                     posibilitatea comparării textului ocerizat cu imaginea scanată

·                     calculul procentului de fiabilitate al ocerizării

·                     corectarea automată a formelor sistematic aberante, rezultate din neadaptarea softului de OCR la particularitățile limbii române

·                     crearea unei listei de forme lingvistice și simbolice absente din corector, inclusiv a cuvintelor sau expresiilor străine

·                     crearea unei liste de substantive proprii absente din corector

·                     soluții de corectare automată a greșelilor sistematice

·                     pregătirea unor soluții de retroalimentare a corectorului

·                     analiza unor situații aberante din punct de vedere ortografic sau de punctuație pentru a fi semnalate sau corectate automat

·                     implementarea unor reguli suplimentare ortografice și ortoepice desprinse din analiza textelor ocerizate

·                     posibilități de tratare a caracterelor speciale

·                     posibilități de formatare a textului ocerizat

·                     posibilități de separare a notelor de subsol

·                     separarea blocurilor de text pentru limitarea corectă a paragrafelor

·                     analiza citatelor, a motto-urilor și a oricărui alt alotext folosit de autor

·                     importul și exportul textelor corectate

– În vederea bunei desfăşurări a proiectului, s-au început demersurile pentru achiziţionarea produselor prevăzute în rubrica Logistică din proiect.

– Organizarea periodică de şedinţe de lucru (MLW) în care s-au urmărit perfecţionarea şi familiarizarea membrilor echipei cu metodologia de lucru și cu programele necesare digitalizării, corectării și asocierii de metadate, precum şi estimări de sarcini pentru membrii echipei în vederea elaborării normelor de lucru pentru 2018.

– Decizia privind angajarea, în 2018, a unui expert-colaborator în echipa proiectului

– Decizia privind lansarea oficială a proiectului în luna mai 2018.

Director de proiect,

Dr. Monica Busuioc

11.12.2017

Ultima actualizare în Joi, 14 Februarie 2019 11:11
 


Motorizat de Joomla!. Designed by: joomla 2.5 themes  Valid XHTML and CSS.