All Title Author
Keywords Abstract


Ambigüedad en nombres hispanos Ambiguity in Hispanic names

Keywords: Ambigüedad , secuencia denominativa , gramática generativa , asociación , composición , Ambiguity , denominative sequence , generative grammar , association , composition

Full-Text   Cite this paper   Add to My Lib

Abstract:

La constitución de los nombres hispanos presupone en muchos casos un grado de ambigüedad. La estructura de las secuencias denominativas en países hispanos conlleva a la presencia de cinco problemas fundamentales que obstaculizan su interpretación: (1) la doble deducción de sexo en nombres personales, por ejemplo 'Guadalupe'; (2) la asociación de nombres y/o apellidos en un solo elemento, como en 'Jorge Luis', cuyos constituyentes existen aisladamente; (3) la composición de los elementos mediante un conectivo; (4) la dualidad nombre/apellido; y (5) la omisión permitida de alguno de los elementos en la secuencia denominativa. Nuestro estudio está orientado a detectar y analizar la ambigüedad mencionada de manera automática. Se desarrolló una gramática formal que determina las interpretaciones válidas de las cadenas nominales, por medio de un etiquetado automático de todos los elementos que la componen. Además, se presentan gráficas que muestran la distribución de los nombres y apellidos, de lo cual, el hallazgo más importante es que la frecuencia de estos cumple con la ley de Zipf. Se utilizó como fuente de conocimiento un corpus con 745.084 registros personales, de los cuales se extrajeron 93.998 nombres y 13.779 apellidos únicos, entre simples, compuestos y asociados. Partiendo de estos, se detectaron 77.162 fuentes de ambigüedad en nombres y 2.739 en apellidos, lo que representa el 82% y el 20% respectivamente. Del total de los registros personales estudiados, 241.922 presentan al menos dos interpretaciones válidas en la denominación, lo cual corresponde al 33% de la muestra. The constitution of Hispanic names assumes a degree of ambiguity in many cases. The structure of the denominative sequences in Hispanic countries presents five fundamental problems that obstruct their interpretation: (1) the double sex deduction in personal names, as in Guadalupe; (2) the association of names and/or surnames in one name, as in Jorge Luis, whose components exist separately; (3) the composition of the elements by means of a connector; (4) the name/surname duality; and (5) the accepted omission of some of the elements of the denominative sequences. This study focuses on the automatic detection and analysis of these types of ambiguities (uncertainties). A formal grammar that determines valid interpretations of the nominal chains was developed by means of the automatic labeling of all the elements of which this grammar is composed. Furthermore, graphs of the distribution of the names and surnames are presented, the most important of which reveals that the frequency abi

Full-Text

comments powered by Disqus