全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

Communication Interface for Mexican Spanish Dysarthric Speakers

Keywords: Dysarthric speech , assistive technology , automatic speech recognition.

Full-Text   Cite this paper   Add to My Lib

Abstract:

La disartria es una discapacidad motora del habla caracterizada por debilidad o poca coordinación de los músculos del habla. Esta condición puede ser causada por un infarto, parálisis cerebral, o por una lesión severa en el cerebro. Para mexicanos con esta condición hay muy pocas, si es que hay alguna, tecnologías de asistencia para mejorar sus habilidades sociales de interacción. En este artículo presentamos nuestros avances hacia el desarrollo de una interfazde comunicación para hablantes con disartria cuya lengua materna sea el espa ol mexicano. La metodología propuesta depende de (1) dise o especial de un corpus de entrenamiento con voz normal y recursos limitados, (2) adaptación de usuario estándar, y (3) control de la perplejidad del modelo de lenguaje para lograr alta precisión en el Reconocimiento Automático del Habla (RAH). La interfaz permite al usuario y terapéuta el realizar actividades como adaptación dinámica de usuario, adaptación de vocabulario, y síntesis de texto a voz. Pruebas en vivo fueron realizadas con un usuario con disartria leve, logrando precisiones de 93%-95% para habla espontánea. Dysarthria is a motor speech disorder due to weakness or poor coordination of the speechmuscles. This condition can be caused by a stroke, cerebral palsy, or by a traumatic braininjury. For Mexican people with this condition there are few, if any, assistive technologies to improve their social interaction skills. In this paper we present our advances towards the development of a communication interface for dysarthric speakers whose native language is Mexican Spanish. We propose a methodology that relies on (1) special design of a training normal-speech corpus with limited resources, (2) standard speaker adaptation, and (3) control of language model perplexity, to achieve high Automatic Speech Recognition (ASR) accuracy. The interface allows the user and therapist to perform tasks such as dynamic speaker adaptation, vocabulary adaptation, and text-to-speech (TTS) synthesis. Live tests were performed with a mildly dysarthric speaker, achieving accuracies of 93%-95% for spontaneous speech.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133