EL CORPUS

El corpus recopilado por el equipo de investigación está formado por 6453 CSL (1885-2020) de 37 columnistas conformando un total de 44 columnas difundidas a través de 16 periódicos nacionales, regionales; en papel y digitales.

METODOLOGÍA. PROCEDENCIA DEL CORPUS Y ORGANIZACIÓN

El proceso de recopilación del corpus ha consistido en: (1) Vaciado de textos de la prensa digitalizada, organización y ordenación. En casos de difícil accesibilidad, se han utilizado los libros publicados que recopilan las columnas; (2) Establecimiento de protocolos de edición, revisión y regularización; (3) paso de formatos originales -pdf, imagen, microfilm- a Word.

PROTOCOLO Y ETIQUETADO

Para poder incorporarse a la base de datos, los deben tener formato Word/pdf, identificarse y etiquetarse. El protocolo de etiquetaje identificador es el siguiente:

METADATOS

Nombre, Apellidos, Título general de la Columna, periódico, Lugar, día mes año, página, papel/digital, idioma, país Acrónimo: 1ª sílaba del apellido, primera del periódico (o acortamiento), 1ª sílaba título general, fecha y año seguidos Título de la columna Cuerpo del texto:

EJEMPLO
Calvo, Luis, Diálogo de la lengua, ABC, Madrid, 08 noviembre 1980, p. 53, papel, español, España
CalABCDialen08111980
Destacar y agredir
 
Cada día que pasa se bota más el color de las jergas de arrabales, profesionales y provinciales,
jergas que saltan de repente, como los gatos y los monos, y desaparecen como las ardas
(ardillas) y fuínas de los valles de Chile […]
ETIQUETADO MANUAL

Se han establecido 14 campos cada uno de ellos con subcampos desplegables que proporcionan un total de 88 variables de marcación manual que se pueden recuperar en la base de datos.

CRITERIOS DE ESTABLECIMIENTO DE LAS ETIQUETAS

Los trabajos realizados sobre el corpus METAPRES, han puesto en evidencia la existencia, en el columnismo lingüístico español de patrones comunes composicionales y pragmático-enunciativos, y de una reiteración de temas y de actitudes ante la lengua. Así, (A) desde un punto de vista textual y pragmático-discursivo se proponen dos tipos de categorías caracterizadoras: (a) categorías que atienden a la existencia de patrones formales y composicionales; y (b) categorías analíticas que señalan la recurrencia de recursos pragmático-enunciativos en esos mismos textos. Por su parte, (B) desde una perspectiva semiótica y social del texto se distinguen las (c) ideologías lingüísticas y temas que caracterizan el discurso sobre la lengua y vinculan a las CSL con el contexto sociocultural en el que se elaboran y publican.

A partir de estas categorías y tras la investigación llevada a cabo por el equipo METAPRES desde 2016 (http://metapres.es/), se han seleccionado los siguientes campos:

  1. Profesión:
    • Lingüista
    • Periodista
    • Corrector/a de estilo
    • Académico/a de la lengua
    • Filólogo/a
    • Traductor/a
    • Escritor/a
    • Otro
  2. Estilo:
    • Prescriptivo
    • Descriptivo
    • Lúdico
    • Didáctico
    • Divulgativo
  3. Política lingüística
    • Lenguas de España
    • Lenguaje de género y no sexista
    • Política panhispánica (ASALE, RAE)
    • Política educativa
    • Toponimia
    • Multilingüismo
  4. Dimensión lingüística:
    • Fonética
    • Ortografía/Tipografía
    • Morfología
    • Sintaxis
    • Semántica
    • Léxico
    • Terminología
    • Retórica y Discurso
    • Traducción
    • Variedades lingüísticas
  5. Procedimientos pragmáticos y metapragmáticos :
    • Ironía
    • Humor verbal
    • Cortesía
    • Descortesía
    • Metáfora
    • Metonimia
    • Analogía
    • Evidencialidad
    • Polifonía
    • Dialogicidad
    • Atenuación
    • Intensificación
  6. Préstamos:
    • Anglicismo
    • Galicismo
    • Germanismo
    • Italianismo
    • Arabismo
    • Latinismo
    • Helenismo
    • Otro
  7. Neologismo
    • Neologismo semántico
    • Neologismo de forma
    • Neologismo por préstamo
  8. Formación de palabras:
    • Acortamiento
    • Acronimia
    • Composición
    • Prefijación
    • Sufijación
    • Siglación
    • Parasíntesis
    • Sintagmación
  9. Fraseología
    • Locuciones
    • Colocaciones
    • Paremias
    • Fórmulas rutinarias
  10. Etimología
    • Etimología
    • Etimología popular
  11. Estrategias argumentativas
    • Comparación
    • Explicitación
    • Reformulación
    • Ejemplificación
    • Cita de autoridad
    • Datos
    • Causa-Consecuencia
    • Concesión-Refutación
    • Ad personam
  12. Tipos de discursos analizados
    • Discurso lexicográfico
    • Discurso normativo
    • Discurso de la política
    • Discurso de los medios de comunicación
    • Discurso digital
    • Discurso de la publicidad
    • Discurso del deporte
    • Discurso económico
    • Discurso jurídico-administrativo
    • Discurso científico-técnico
    • Discurso poético-literario
    • Otros
  13. Reseña