ReTeRom

Resurse și tehnologii pentru dezvoltarea interfețelor om-mașină în limba română.

Corpus bimodal pentru limba română adnotat pe multiple niveluri (COBILIRO)

Obiectiv

CoBiLiRo are ca obiectiv general crearea unui tezaur cu resurse audio și textuale, adnotate pe diferite niveluri de realizare acustică, respectiv lingvistică, care să constituie cea mai importantă referință de acest tip pentru limba română

Activități

  • inventarierea atentă a resurselor bimodale existente la parteneri
  • armonizarea formatelor de reprezentare, adnotare și metadate
  • proiectarea, realizarea și testarea infrastructurii care va găzdui resursele
  • dezvoltarea instrumentele de prelucrare și acces ale consorțiului
  • augmentarea corpusului voce-text, cu completarea lui cu metadate, alinieri și adnotări
  • efectuarea de studii statistice asupra corpusului, exploatarea pentru cercetare și producție, precum si larga diseminare a corpusului bimodal, valorizare și utilizare cecuri de tip A1, A2, B

Aplicabilitate

Resursele de date audio și text adnotate vor reprezenta fundamentul pentru dezvoltarea tehnologiilor de interfețe om mașină în limbaj natural în limba română:

  • TEPROLIN
  • TADARAV
  • SINTERO