|
Evaluación del rendimiento de tesauros espa oles en sistemas de recuperación de informaciónKeywords: information retrieval , thesauri , performance of thesauri , free text vs. controlled vocabulary , recuperación de información , tesauros , evaluación de tesauros , lenguaje libre vs. lenguaje controlado Abstract: The article describes an experimental test developed in Spanish databases. The test compares the performance between different thesauri and the natural language, in the process of information retrieval. The test was carried out with the combination of the analytic and sampling methods. The searches were made interactively, the records were evaluated, and the search strategies modified based on the parcial results. The references obtained with each kind of language were evaluated on the basis of the precision and recall ratios. The results point out that free text obtained a precision ratio of 63.4 % and a recall of 59.5 %; with the help of the thesauri both ratios improved: the precision reached a 86.8 % and the recall a 61.6 %. The conclusion is that the controlled vocabulary experiences lower levels of noise than the free text, at the same time it can develop high ratios of recall as the controlled one. Also, it is possible to conclude that the controlled vocabulary neutralizes the deficiences of the free text and vice versa, so both are complementary. El artículo describe un estudio experimental desarrollado en bases de datos espa olas en el que se establece la comparación del rendimiento entre diferentes tesauros y el lenguaje natural, en el proceso de recuperación de la información. El test se llevó a cabo mediante la combinación de los métodos analítico y de muestreo y validación de datos. Las consultas se realizaron de modo interactivo, evaluándose los registros y modificándose las estrategias a la vista de los resultados. Las referencias recuperadas en cada modalidad se valoraron en base a las tasas de precisión y exhaustividad. Los resultados muestran que en lenguaje libre se consiguió una precisión del 63,4 % y una exhaustividad del 59,5 %; con la ayuda del tesauro ambos índices mejoraron: en precisión se alcanzó un 86,8 % y en exhaustividad un 61,6 %. Se concluye que el lenguaje controlado consigue más bajos niveles de ruido que el libre al tiempo que puede llegar a aportar tan altos índices de exhaustividad como aquél; igualmente, a la vista de los resultados de la comparación se puede concluir que el lenguaje controlado neutraliza las deficiencias del libre y viceversa y, por tanto, ambos son complementarios.
|