|
Linguamática 2012
Cria o e Acesso a Informa o Semantica Aplicada ao Governo EletrónicoKeywords: extra o de informa o , governo eletrónico , semantica , conhecimento Abstract: Os cidad os, empresas ou servi os públicos - os clientes - que procuram informa es no contexto do Governo Eletrónico visam obter respostas objetivas às suas quest es. Para isso é necessário que os sistemas de pesquisa consigam manipular a informa o de modo a que seja disponibilizada de uma forma eficaz e adequada às necessidades de cada cliente. Uma vez que grande parte dos documentos do governo est o escritos em formatos n o estruturados e em linguagem natural, é necessário desenvolver métodos para obter e estruturar este tipo de informa o. A alternativa seria indexar pelo seu texto a grande quantidade de documentos existente, uma solu o desadequada no contexto do Governo Eletrónico, uma vez que assim seriam retornados frequentemente muitos resultados a cada pesquisa. Este artigo apresenta um primeiro protótipo de uma aplica o que gera informa o semantica a partir de textos escritos em Português. A informa o semantica gerada corresponde a um domínio de conhecimento definido por um operador humano através de uma interface gráfica, de modo a que o sistema seja adaptável às diferentes áreas de atua o do Governo Eletrónico. O conteúdo é acessível através de uma interface em linguagem natural e através de uma interface de pesquisa que aceita entradas SPARQL. Deste modo é possível aos clientes aceder diretamente ou integrar este sistema com os seus próprios sistemas de informa o. A aplica o está organizada em três grandes módulos: Representa o do Conhecimento que permite definir domínio de conhecimento e sua semantica e criar exemplos semente, nos textos, de conceitos do domínio de conhecimento; Processamento de Linguagem Natural que permite obter estruturas sintáticas associadas às frases em linguagem natural; e Extra o e Integra o Semantica que utiliza os exemplos semente para treinar classificadores estatísticos a identificar nas estruturas sintáticas os conceitos do domínio de conhecimento, que utiliza os classificadores treinados para detetar esses conceitos em estruturas sintáticas de novas frases, e que contém as interfaces para pessoas e máquinas. Neste artigo apresentamos igualmente exemplos ilustrativos da utiliza o do sistema e os resultados de uma primeira avalia o de desempenho. O sistema funciona para o Português e foi construído reutilizando software do estado da arte, maioritariamente desenvolvido visando o Inglês. A sua modularidade permite alterar a língua base do sistema, de Português para outra, alterando o módulo de Processamento de Linguagem Natural e sem ser necessário alterar os restantes módulos da aplica o.
|