|
Linguamática 2010
Vencendo a escassez de recursos computacionais. Carvalho: Tradutor Automático Estatístico Inglês-Galego a partir do corpus paralelo Europarl Inglês-Português.Keywords: Corpus paralelo , Inglês , Galego , Português , Tradu o Automática Estatística Abstract: à hora de desenvolver muitas ferramentas estatísticas de Processamento da Linguagem Natural torna-se essencial a utiliza o de grandes quantidades de dados. Para salvar a limita o da escassez de recursos computacionais para línguas minorizadas como o galego é necessário desenhar novas estratégias. No caso do galego, importantes romanistas têm teorizado que galego e português s o variantes do português europeu. De um ponto de vista pragmático, esta hipótese poderia abrir uma nova linha de investiga o para fornecer ao galego ricos recursos computacionais. Partindo do corpus paralelo inglês- português Europarl, imaxin|software compilou um corpus paralelo inglês-galego que utilizamos para criar um protótipo de tradutor automático estatístico inglês-galego, cuja performance é comparável a Google Translate. Mantemos que é possível implementar esta estratégia para desenvolver uma grande variedade de ferramentas computacionais para línguas, como o galego, intimamente relacionadas com línguas que já contam com um grande repertório de recursos computacionais.
|