Según el DRAE, un corpus es un "conjunto lo más extenso y ordenado posible de datos o textos científicos, literarios, etc., que pueden servir de base a una investigación", pero... ¿cuál es su aplicación práctica? Estas colecciones de textos son muy útiles a la hora de aprender un idioma, pues proporcionan ejemplos reales de lengua en uso. En un nivel inicial, los más útiles son los que cuentan con una versión informatizada y gratuita. Asimismo, cuantos más datos ofrezcan, mayores serán las posibilidades para trabajar con ellos. Así, los corpus se clasifican según la modalidad de la lengua (orales u escritos), el número de lenguas (monolingües, bilingües, multilingües, comparables, paralelos y alineados) y la especificidad de los textos que contienen (generales, especializados, genéricos, canónicos, diacrónicos o históricos, sincrónicos). Un factor que debe tenerse en cuenta es la gratuidad del servicio. Los más usados son los corpus de la RAE, tanto el Corpus de Referencia del Español Actual (CREA) como el Corpus Diacrónico del Español (CORDE). Otras opciones recomendables son el Corpus del Español del profesor Mark Davies y el Spanish Web Corpus (disponible en Sketch Engine).
Enlaces de interés:
Lingüística de Corpus -http://www.scribd.com/doc/81823/Linguistica-de-Corpus
Tipos de Corpus -http://www3.unileon.es/dp/dfh/Milka/LCII/Tipos_corpus.htm
Corpus del español - http://www.corpusdelespanol.org/
Excelente aportación! Yo no tenía todos estos links.
ResponderEliminarGracias!
Os paso un link para más información sobre Corpus: http://www.ict4lt.org/en/en_mod3-4.htm
ResponderEliminar