Записная книжка

Компьютерное зрение, машинное обучение, нейронные сети и т.п.

Задача о "многоруком бандите" (часть 2)

Продолжим разбираться с многоруким бандитом. Разберем способ оценки математического ожидания в случае когда распределение случайной величины меняется со временем, а также посмотрим как влияет на жадную стратегию выбор начальной оценки математического ожидания награды.

Читать дальше...