%0 Journal Article %T Aprendizaje de selecci車n de acciones en un mundo simple pero impredecible %A Rojas Sergio A. %A Mart赤nez Jos谷 J. %J Ingenier赤a e Investigaci車n %D 2002 %I Universidad Nacional de Colombia %X Uno de los principales problemas estudiados en la simulaci車n de agentes artificiales aut車nomos es el de la selecci車n de acciones: un mecanismo que le permita al sistema escoger la acci車n m芍s apropiada para la situaci車n en que se encuentre, de tal forma que maximice su medida de 谷xito. El aprendizaje por refuerzo representa un enfoque atractivo para atacar este problema, ya que se basa en la b迆squeda de se ales de premio y la evasi車n de se ales de castigo mediante un proceso de ensayo y error. En este art赤culo presentamos al PAISA 1, una criatura artificial que aprende a comportarse (seleccionar acciones) utilizando una t谷cnica de aprendizaje por refuerzo (aprendizaje Q) para optimizar la cantidad de comida que puede encontrar en un mundo impredecible, aunque con un espacio estado-acci車n peque o. One of the main problems studied in simulation of artificial autonomous agents is the action-selection: a mechanism that allows the system to choice the more suitable action for the specific situation where it is located, in such a way that maximises his success measure. The reinforcement learning represents an attractive approach to attack this problem, cause it is based in the searching of awards signals and the refusing of punishments by a trial and error process. In this paper we present the PAISA 1, an artificial creature that learns to behave (that is, action-selection) using a reinforcement learning technique known as Q-learning, to optimise the amount of food that he can find in an unpredictable world, although in a small state-action space. %K Aprendizaje por refuerzo %K Aprendizaje Q %K Agentes aut車nomos %K Animats %U http://www.revistas.unal.edu.co/index.php/ingeinv/article/view/21404