Zpětnovazební učení – Reinforcement Learning

< 1 min čtení

Odborné vysvětlení: Zpětnovazební učení je typ strojového učení, kde se agent učí optimální chování prostřednictvím interakcí s prostředím. Agent dostává odměny nebo tresty za své akce a snaží se maximalizovat celkovou odměnu v dlouhodobém horizontu. 
Vysvětlení pro laiky: Zpětnovazební učení je jako učení psa novým trikům pomocí odměn. Počítač (nebo AI) zkouší různé věci a dostává “pochvalu” za dobré výsledky a “pokárání” za špatné. Časem se naučí, co dělat, aby dostal co nejvíce pochval a co nejméně pokárání. 
Reinforcement Learning is a type of machine learning where an agent learns optimal behavior through interactions with an environment. The agent receives rewards or punishments for its actions and tries to maximize the overall reward in the long run.

Jak se vám líbil tento článek?