L'objectiu general del Diccionari del Català Contemporani (DCC) és la creació d'un diccionari descriptiu electrònic de la llengua catalana contemporània dividit en dues grans etapes:
La primera etapa té com a finalitat la creació de recursos lingüístics per a ser utilitzats com a font del diccionari descriptiu:
- Constitució d’un corpus de referència de la llengua catalana escrita en els darrers cent cinquanta anys aproximadament: el Corpus textual informatitzat de la llengua catalana (CTILC), l’extensió del qual supera els 52.000.000 mots; aquest corpus permet utilitzacions múltiples no solament en el camp de la lexicografia, sinó també en la recerca sobre altres aspectes de la llengua; constitueix, per tant, una infraestructura bàsica de recerca lingüística. Conté textos corresponents al període cronològic que va de 1832 a 1988. Aquesta fase es va desenvolupar entre els anys 1985 i 1997. Posteriorment, a partir de l’any 2015 s’ha iniciat el projecte de continuació del CTILC amb textos publicats a partir de 1989 ençà.
- Constitució de la Base de dades lexicogràfica (BDLex) que conté, degudament informatitzats, codificats i disposats en forma de base de dades, els tretze diccionaris que han estat considerats més significatius dels segles XIX i XX; aquesta base de dades fou concebuda com un recurs auxiliar dins el projecte general i té una utilitat específica en l’elaboració del diccionari descriptiu.
La segona etapa del projecte, que és en curs avançat de realització, consisteix en l’elaboració d’un diccionari descriptiu, el Diccionari descriptiu de la llengua catalana (DDLC), basat fonamentalment en l’esmentat corpus, a partir de la idea, cada vegada més estesa, que l’estudi sistemàtic dels diferents contextos en què ocorren les unitats lèxiques és la millor manera d’establir-ne el significat.
El DDLC té per objecte la definició i la caracterització de les unitats lèxiques de la llengua des del punt de vista del contingut i de la utilització reals, sense restriccions basades en criteris prescriptius o d’altra naturalesa. L’elaboració d’un diccionari descriptiu d’aquestes característiques per part de l’acadèmia de la llengua es justifica sobretot per la creença que les decisions prescriptives seran tant més ben fonamentades com més ben coneguda sigui la llengua en la seva realitat fàctica; en el cas de l’Institut d’Estudis Catalans la justificació és doble, per tal com entre les seves missions estatutàries té no solament l’establiment de la normativa lingüística, sinó també “ocupar-se de l’estudi de la llengua”. Amb l’elaboració d’un diccionari d’aquestes característiques l’Institut d’Estudis Catalans no sols produeix una obra concebuda d’acord amb els principis assumits per la lexicografia contemporània més avançada, sinó que es dota d’un instrument molt valuós a l’hora d’exercir la seva activitat com a institució acadèmica encarregada de l’establiment i de l’actualització de la normativa lingüística.
L’edició electrònica del diccionari fou posada a disposició del públic en el web de l’Institut el mes de gener de 2005, quan el nombre d’articles redactats era de 18.000; Les tasques de redacció dels articles previstos inicialment en el DDLC es completaren el febrer de 2015, amb un total de més de 107.000 articles. A partir d’aquest moment s’han escomès tasques complementàries de validació estructural i millora del DDLC, i l’anàlisi de la nomenclatura inicialment desestimada amb vista a incorporar al diccionari aquelles entrades que resultin de més interès lexicogràfic.
Abstract
The Diccionari del Català Contemporani (DCC) is a lexicographical project which has been developed since 1985 and brings together Catalan lexicographical data. In this context, it is worth mentioning two linguistic resources used for the DCC works:
- Corpus Textual Informatitzat de la Llengua Catalana (CTILC), a reference corpus of the contemporary Catalan language
- Base de dades lexicogràfica (BDLex), a lexicographical data base.
The specific objective of the second phase of the DCC project is to develop the Diccionari Descriptiu de la Llengua Catalana (DDLC) mainly based on the analysis and exploitation of CTILC.