Aprendizaje por Refuerzo (Reinforcement Learning)
Para entender el
concepto de “Aprendizaje por Refuerzo”, también conocido como “Reinforcement
Learning”, hay que definir el término “inteligencia”. La inteligencia siempre
se ha relacionado con el rápido aprendizaje, por lo que se puede decir que los
niños son inteligentes. Teniendo en cuenta el método enseñanza para los niños,
es decir, cuando un niño hace algo mal, se le castiga (refuerzo negativo) y
cuando hace algo bien se le premia (refuerzo positivo). El “Reinforcement
Learning” se basa en esta afirmación. Dicho de una manera simple, el algoritmo
a entrenar prueba diferentes resultados, si el resultado se aleja de una de las
respuestas correctas se le da un refuerzo negativo, y si se acerca uno
positivo.
Para realizar el
“Reinforcement Learning” existen diferentes algoritmos para el control de
aprendizaje, en esta entrada se definirá el Q-learning:
El Q-learning es una técnica que comprueba como
de buena es una acción, e indica cual es la mejor acción teniendo en cuenta la
situación/estado. Una de las características más atractivas de esta técnica es
que no hace falta ningún modelo del sistema. El objetivo de la técnica es que
los individuos aprenden solos, y que sigan aprendiendo durante toda su vida
acumulando experiencia, a diferencia de los algoritmos genéticos.
Comentarios
Publicar un comentario