%0 Journal Article %T Modelo Ac¨²stico y de Lenguaje del Idioma Espa£¿ol para el dialecto Cucute£¿o, Orientado al Reconocimiento Autom¨¢tico del Habla %J - %D 2017 %R https://doi.org/10.14483/23448393.11616 %X Abstract (es_ES) Contexto: El reconocimiento autom¨¢tico del habla requiere el desarrollo de modelos de lenguaje y modelos ac¨²sticos para los diferentes dialectos que existen. El objeto de esta investigaci¨®n es el entrenamiento de un modelo ac¨²stico, un modelo de lenguaje estad¨ªstico y un modelo de lenguaje gramatical para el idioma espa£¿ol, espec¨ªficamente para el dialecto de la ciudad de San Jos¨¦ de C¨²cuta, Colombia, que pueda ser utilizado en un sistema de control por comandos. Lo anterior motivado en las deficiencias que presentan los modelos existentes para el idioma espa£¿ol, para el reconocimiento de la frecuencia fundamental y contenido espectral, el acento, la pronunciaci¨®n, el tono o simplemente al modelo de lenguaje de la variante dial¨¦ctica de esta regi¨®n. M¨¦todo: Este proyecto utiliza el sistema embebido Raspberry Pi B+ con el sistema operativo Raspbian que es una distribuci¨®n de Linux, y los softwares de c¨®digo abierto CMU-Cambridge Statistical Language Modeling toolkit de la Universidad de Cambridge y CMU Sphinx de la Universidad Carnegie Mellon; los cuales se basan en los modelos ocultos de Markov para el c¨¢lculo de los par¨¢metros de voz. Adem¨¢s, se utilizaron 1913 audios grabados por locutores de la ciudad de San Jos¨¦ de C¨²cuta y el departamento de Norte de Santander para el entrenamiento y las pruebas del sistema de reconocimiento autom¨¢tico del habla. Resultados: Se obtuvo un modelo de lenguaje que consiste de dos archivos, uno de modelo de lenguaje estad¨ªstico (. lm), y uno de modelo gramatical (. jsgf). Con relaci¨®n a la parte ac¨²stica se entrenaron dos modelos, uno de ellos con una versi¨®n mejorada que obtuvo una tasa de acierto en el reconocimiento de comandos del 100% en los datos de entrenamiento y de 83% en las pruebas de audio. Por ¨²ltimo, se elabor¨® un manual para la creaci¨®n de los modelos ac¨²sticos y de lenguaje con el software CMU Sphinx. Conclusiones: El n¨²mero de participantes en el proceso de entrenamiento de los modelos ac¨²sticos y de lenguaje influye significativamente en la calidad del procesamiento de voz del reconocedor. Para obtener una mejor respuesta del sistema de Reconocimiento Autom¨¢tico del Habla es importante usar un diccionario largo para la etapa de entrenamiento y un diccionario corto con las palabras de comando para la implementaci¨®n del sistema. Teniendo en cuenta que en las pruebas de reconocimiento se obtuvo una tasa de ¨¦xito mayor al 80% es posible usar los modelos creados en el desarrollo de un sistema de Reconocimiento Autom¨¢tico del Habla para una aplicaci¨®n orientada a la asistencia de personas %K speech recognition %K acoustic models %K language models %K CMU Sphinx %K Raspberry Pi. reconocimiento del habla %K modelos ac¨²sticos %K modelos de lenguajes %K CMU Sphinx %K Raspberry Pi. %U https://revistas.udistrital.edu.co/index.php/reving/article/view/11616