Torna a les notícies
El Corpus Textual Informatitzat de la Llengua Catalana de l’IEC s’actualitza
28/07/2020

S’ha instal·lat al web de l’Institut d’Estudis Catalans (IEC) una nova aplicació de consulta del Corpus Textual Informatitzat de la Llengua Catalana (CTILC), que permet obtenir informació a partir de textos en català publicats entre el 1832 i el 2008. 

En la seva configuració inicial, el CTILC contenia cinquanta-dos milions de mots i cobria el període cronològic comprès entre el 1832 i el 1988. L’any 2015, l’IEC va emprendre el projecte d’actualització del CTILC i, des d’aleshores, s’ha completat amb textos publicats fins al 2008 (uns vint milions de mots més), de manera que el Corpus consultable actualment té un volum total de setanta-dos milions de mots.

D’altra banda, es preveu que a finals del 2021 s’hagi actualitzat el Corpus amb textos publicats fins al 2018. A partir d’aquest moment, s’espera portar a terme un pla de treball que permeti l’actualització permanent del CTILC. 

La nova aplicació de consulta del CTILC s’integra plenament en el portal de dades lingüístiques de la Secció Filològica, i ha substituït les dues plataformes anteriors (anomenades consulta bàsica i consulta avançada, respectivament). L’accés al Corpus es pot fer directament (a través de l’adreça web ctilc.iec.cat) o bé mitjançant consultes realitzades sobre els altres recursos del portal (DIEC, DDLC, DCVB, Diccionari de sinònims, CiT, TERMCAT) clicant sobre el botó corresponent.

Els resultats que l’usuari pot obtenir de la consulta del CTILC es presenten bàsicament sota l’opció «Concordances», el patró de selecció de les quals pot ser de diferent naturalesa: lema, forma, lema (amb formes seleccionables), coocurrències (una seqüència encadenada de diferents elements lingüístics) i noms propis; també es pot obtenir informació quantitativa sobre les combinacions lèxiques que un determinat lema manté amb la resta de lemes del Corpus (opció «Col·locacions»); finalment, l’opció «dades numèriques» dona informació quantitativa sobre el volum del Corpus.