Aprendizaje por Refuerzo (Reinforcement Learning)


Para entender el concepto de “Aprendizaje por Refuerzo”, también conocido como “Reinforcement Learning”, hay que definir el término “inteligencia”. La inteligencia siempre se ha relacionado con el rápido aprendizaje, por lo que se puede decir que los niños son inteligentes. Teniendo en cuenta el método enseñanza para los niños, es decir, cuando un niño hace algo mal, se le castiga (refuerzo negativo) y cuando hace algo bien se le premia (refuerzo positivo). El “Reinforcement Learning” se basa en esta afirmación. Dicho de una manera simple, el algoritmo a entrenar prueba diferentes resultados, si el resultado se aleja de una de las respuestas correctas se le da un refuerzo negativo, y si se acerca uno positivo.

Para realizar el “Reinforcement Learning” existen diferentes algoritmos para el control de aprendizaje, en esta entrada se definirá el Q-learning:
 El Q-learning es una técnica que comprueba como de buena es una acción, e indica cual es la mejor acción teniendo en cuenta la situación/estado. Una de las características más atractivas de esta técnica es que no hace falta ningún modelo del sistema. El objetivo de la técnica es que los individuos aprenden solos, y que sigan aprendiendo durante toda su vida acumulando experiencia, a diferencia de los algoritmos genéticos.

Comentarios

Entradas populares de este blog

Tarea del TEMA 3: Estación Meteorológica

Resumen de la primera clase del TEMA 3