random read

Q-обучение # разновидность технологии машинного обучения с подкреплением. Цель Q-обучения заключается в том, чтобы найти такую политику, которая будет указывать агенту, какие действия следует предпринимать в тех или иных определённых обстоятельствах. При этом не требуется модели окружающей среды, среды обитания, проблемы могут решаться с учётом стохастических, случайных переходов из состояния в состояние и с выдачей наград (reward) в случае успеха, без необходимости адаптации. Буква Q (от quality) в названии термина означает функцию, которая возвращает награду, используемую для подкрепления обучения, – как качество действия, предпринимаемого в данной ситуации

Связные термины

agent, artificial neural network, DQN, environment, machine learning, policy, reinforcement learning

Все термины