Corpus orales del castellano de Cataluña

Queremos hacer accesibles a la comunidad científica textos orales transcritos del castellano hablado en las regiones catalanohablantes. Si está interesado en la inclusión de sus propias transcripciones de textos orales, póngase en contacto con nosotros.

Puesto que se trata de muestras de corpus procedentes de una serie de estudios realizados con diferentes objetivos, las transcripciones no se realizaron siguiendo los mismos criterios. Por ello, aparte de una breve descripción del texto (informaciones sobre los hablantes, contexto, registro, etc.) se indica el sistema de transcripción utilizado en cada uno de los textos.

Para abrir los documentos con las transcripciones hace falta el programa Acrobat Reader accesible aquí.

 

1. Corpus oral de profesionales de la lengua castellana, Barcelona 1999

 

1.1 Título

Carsten Sinner (2001): Corpus oral de profesionales de la lengua castellana en Barcelona.

 

1.2 Constitución del corpus

Registro: formal

Se trata de once entrevistas realizadas en Barcelona en 1999 para un estudio empírico en el marco de la tesis doctoral de Carsten Sinner (2001), El castellano de Cataluña. Aspectos cualitativos y cuantitativos; Universidad de Potsdam, publicada en 2004: El castellano de Cataluña. Estudio empírico de aspectos léxicos, morfosintácticos, pragmáticos y metalingüísticos. Tübingen: Niemeyer. (Beihefte zur Zeitschrift für romanische Philologie ; 320).

 

1.3 Transcripción de las entrevistas

Se transcribió orientándose en la ortografía de las lenguas implicadas (castellano y catalán, en ocasiones alemán, francés e inglés) y señalando la realización fónica sólo cuando parecía indicado. Como referencia de las transcripciones no se tomó la norma escrita, puesto que la opción de "estandarizar el texto oral con la normativa escrita puede llevar a transformaciones más profundas que malinterpreten o deformen incluso las características dialectales, sociales o situacionales del texto" (Caravedo, Rocío (1996): "La escritura de la oralidad. Reflexiones críticas y autocríticas sobre la transcripción de un corpus", Lexis. Revista de lingüística y literatura 10, 1-2, 221-235, 224). Se respetaron las convenciones respecto de las separaciones de palabras y, en general, de su integridad ortográfica; por mor de una mayor legibilidad, no se representaron las elisiones (cf. Caravedo 1996:226). No se indicaron las particularidades fonéticas como, por ejemplo, la realización pensao en vez de pensado (cf. Koch, Peter / Wulf Oesterreicher (1990): Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch, Tübingen: Niemeyer, 27 quienes tachan este tipo de transcripción de inaceptable). Sin embargo, en casos en que pareció necesaria la transcripción fonética, se empleó el alfabeto de la Association Phonétique Internationale (API), indicándose la sílaba tónica con un apóstrofe antes de la sílaba en cuestión: ['munik]. No se sigió la práctica común en transcripciones de grabaciones de lengua hablada de indicar ciertos fenómenos, como el alargamiento de sílabas, subrayando la sílaba en cuestión; en vez de ello, se procuró visualizar el alargamiento de las sílabas mediante la repetición de las vocales o consonantes en cuestión (cf.Ehlich, Konrad / Bernd Switalla (1976): "Transkriptionssysteme ­ Eine exemplarische Übersicht", Studium Linguistik 2, 78-105 y Kallmeyer, Werner / Fritz Schütze (1976): "Konversationsanalyse", Studium Linguistik 1, 1-28).

Se establecieron las siguientes convenciones para la transcripción de las entrevistas:

Impresionante. sílaba muy acentuada, marcada por levantamiento de tono, etc.
¿Tú te crees? entonación interrogativa desde ¿ hasta ?; en caso de que se indique un signo sólo, se entiende que la frase empieza o termina con entonación interrogativa
¡Encima! entonación exclamativa desde ¡ hasta !; en caso de que se indique un signo sólo, se entiende que la frase empieza o termina con entonación interrogativa
Entonces yo la querí/ le quería ayudar interrupción de un enunciado o una palabra, autocorrección

A: Mira lo que/

B01: // A ver.

interrupción del interlocutor; en caso de enunciados paralelos, // indica el principio del enunciado que interrumpe el otro
Mira, te digo una cosa. pausas muy cortas, debidas a la entonación de la frase
Mira <...> te digo una cosa. pausa de menos de dos segundos; pausas más largas se indican en segundos:
<riendo>; <tose>, <apunta para el libro> comentarios adicionales, explicaciones de acontecimientos que acompañan los enunciados o que sirven para indicar aspectos paralingüísticos, cinésicos, extralingüísticos , etc.
<ininteligible>; <frase ininteligible> partes de las entrevistas incomprensibles
<?> palabra <?> partes de las entrevistas no del todo comprensibles y/o sólo inteligibles por el contexto
No me acabo [sic] de quedar muy muy claro. para marcar las partes de la oración que podrían confundir al lector y hacer pensar en errores tipográficos
[...]; [habla de su último libro]; [nombre del padre] partes de la entrevista no transcritas, por ejemplo para no revelar la identidad de los entrevistados; para garantizar la comprensión de la entrevista, indicamos la razón o damos un resumen de las partes omitidas siempre que parecía necesario
Y le digo 'qué te has creido'.

para marcar citas textuales, discurso indirecto, títulos de libros, etc., así como grupos de palabras, ejemplos, etc. marcados, por ejemplo, por medio de la entonación como unidades, para evitar la interpretaciones erróneas de las frases:

B16: Eeeeeh 'basura aquí no', indistintamente, basuras o basura ¡eh? pondría.

A: ¿Y 'basuras no'?

Ah. Ih. Eh. vs. A. I. E. 'h' marca la diferencia entre vocales simples e interyecciones
Ssssí. Nooooo. Bueeeno. repetición de letras marca la pronunciación alargada de consonantes o vocales
pijõ nasalización
tener que°; haber de ° perífrasis computada en el análisis de frecuencia
A entrevistador
M01 - M20 informador residente en la provincia de Madrid
B01 - B20 informador residente en la provincia de Barcelona

 

1.4 Caracterización del corpus

sexo edad profesión duración horas transcripción páginas transcripción palabras
B01 f 28 periodista (prensa y televisión) 1,5 37 14268
B02 m 38 editor, traductor 1,75 42 17638
B04 f 32 traductora (guiones / televisión), intérprete 2 48 18934
B06 f 34 traductora, correctora de estilo 1,75 41 15432
B08 f 36 filóloga, editora, correctora de estilo (técnico de editorial), prensa 1,75 43 17389
B09 f 37 traductora, intérprete, autora 2,25 47 19716
B12 f 28 traductora (guiones/ televisión) intérprete, correctora 1,75 39 13998
B13 f 36 periodista (prensa), autora 1,75 34 13585
B14 m 42 profesor de castellano (instituto) 2 44 17476
B15 m 41 periodista (radio, prensa), maestro de primaria 1,75 37 15023
B16 f 26 traductura, correctora 1,75 41 15222

1.5. Material adicional del corpus: fotografías y dibujos empleados en los tests durante la entrevista

El material empleado durante las entrevistas puede consultarse aquí.

Prof. Dr. Carsten Sinner
Universität Leipzig
Institut für Angewandte Linguistik und Translatologie
Iberoromanische Sprach- und Übersetzungswissenschaft
Beethovenstr. 15
04107 Leipzig
Tel. 0049-341-9737602

http://www.carstensinner.de
sinner @ rz.uni-leipzig.de