|
Linguamática 2010
Estratégias de Sele o de Conteúdo com Base na CST (Cross-document Structure Theory) para Sumariza o Automática MultidocumentoAbstract: O presente trabalho apresenta a defini o, formaliza o e avalia o de estratégias de sele o de conteúdo para sumariza o automática multidocumento com base na teoria discursiva CST (Cross-document Structure Theory). A tarefa de sele o de conteúdo foi modelada por meio de operadores que representam possíveis preferências do usuário para a sumariza o. Estes operadores s o especificados em templates contendo regras e fun es que relacionam essas preferências às rela es CST. Em particular, definimos operadores para extrair a informa o principal, apresentar informa o de contexto, identificar autoria, tratar redundancias e identificar informa o contraditória. Nossos experimentos foram feitos usando um córpus jornalístico de textos escritos em português brasileiro e mostram que o uso da CST melhora a qualidade do conteúdo selecionado para os sumários, já que se exploram as rela es entre os conteúdos dos diferentes textos.
|