Доброго времени суток. нужна небольшая помощь с задачкой на динамическое программирование. По решению учителя оценка за предмет будет выставляться согласно следующим правилам: студент подбрасывает кубик (6-ти гранный) и у него есть 3 попытки. Студент может остановиться в любое время (на любой из попыток) Если студент решает бросать все 3 раза последний результат будет решающим. Оценка за курс выставляется по след. критериям. Если на кубике выпадает 1 - студент получает 0 баллов; 2-60, 3-70, 4-80, 5-90, 6-100. Студент заинтересован получить наибольший балл. Требуется 1) определить Этап, состояние и переменная решения (stage, state, decision variable) Это у меня есть - этап это номер подбрасования кубика (n -1, 2, 3); состояние это на каком этапе мы остановились, чтобы принять решение; переменная это - продолжать или остановиться
А вот со второй частью загвоздка - 2) решить задачу с помощью подходящей таблицы динамического программирования и отметить оптимальное решение. То есть я понимаю, что в идеале студент кидает 6-ку с первого раза и уходит, но в реальной жизни, должен быть у него какой-то минмакс же? подстраховочный вариант, где он не прогорит и не получит 0, так?? А как выразить это математически полная загвоздка
Заранее всем спасибо