|
HACIA LA CONSTITUCIóN DE UN CORPUS DIACRóNICO DEL ESPA OL DE CHILE TOWARDS CHILEAN SPANISH LANGUAGE DIACHRONIC CORPUSKeywords: Lingüística del corpus , corpus diacrónico , Espa ol de Chile , Corpus linguistics , diachronic corpus , Chilean Spanish language Abstract: Este artículo describe y analiza la constitución de corpus diacrónicos hispánicos (espa oles e hispanoamericanos) con el objeto de situar el marco de referencia del CorDECh (Corpus Diacrónico del Espa ol de Chile). El trabajo presenta una intersección entre disciplinas tradicionales, como la filología y la paleografía, con especialidades lingüísticas que se han revitalizado en los últimos a os, como es el caso de la lingüística del corpus, en virtud de la conformación de un corpus diacrónico del espa ol de Chile. Además, en este texto se da cuenta de los criterios de constitución de este corpus (cronológico, de selección y transcripción documental, diatópico y de variedad de registros); asimismo, se discuten aspectos de la automatización del corpus y las implicancias y proyecciones para el análisis del mismo. Finalmente, se repasan los criterios de etiquetación del corpus, de acuerdo con los aspectos de la Text Encoding Initiative (TEI), adoptados por la RAE en el Prontuario de Marcación SGML, utilizado para el CORDE (Corpus Diacrónico del Espa ol), junto con presentar algunos ejemplos de estos aspectos, para lo cual se utilizó el editor XML/ XSLT Cooktop 2.5. The conformation of Hispanic diachronic corpora (Spanish and Hispano-American) in order to place the framework of the CorDECh (Corpus Diacrónico del Espa ol de Chile) is described and analyzed in this paper. The work shows an intersection between traditional disciplines, such as the philolology and the paleography, with linguistic disciplines that have been revitalized in the last years, such as corpus linguistics, in order to shape a Chilean Spanish diachronic corpus. In addition, the criteria of corpus formation is presented in this text (chronological, documentary selection and transcription, diatopics and register varieties); in the same way, some aspects of corpora automatization and the implications and projections for its analysis is discussed here. Finally, the criteria for corpus labelling are reviewed, according to the Text Encoding Initiative (TEI), adopted for the RAE in the Prontuario de Marcación SGML, used for the CORDE (Spanish Language Diachronic Corpus), together with showing some examples of these aspects, for which the Cooktop 2.5 XML/XSLT editor was used.
|