Еще о теореме Байеса: задачка Монти Холла
Jun. 16th, 2015 09:00 pm
В комментариях к предыдущей записи
cheeha напомнила
классическую задачку Монти Холла. Я хочу показать, что байесовское
решение не только проще классического, но и позволяет увидеть неявное
допущение в последнем.
Итак, перед нами три двери. За одной приз, две другие пусты. Вы выбираете дверь A, ведущий, который знает, где приз, показывает, что за дверью B пусто. Следует ли настаивать на A или открыть C?
Пусть A, B, C - события, которые состоят в том, что приз находится за соответствующей дверью. Пусть OB - событие, которое состоит в том, что ведущий открыл дверь B после того, как игрок выбрал дверь A. Найдем P(C|OB) (вычислить P(A|OB) можно аналогично и предоставляется читателю в качестве упражнения).
По теореме Байеса P(C|OB) = P(OB|C)P(C)/P(OB). A priori P(C)=1/3. Если приз лежит за дверью C, то ведущий обязательно выберет дверь B, поэтому P(OB|C)=1. А как вычислить P(OB)?
Очевидно, что P(OB) = P(OB|A)P(A) + P(OB|B)P(B) + P(OB|C)P(C). В этой сумме второй член равен нулю, а третий 1/3. Как быть с первым? Иначе говоря, что делает ведущий, если обе оставшиеся двери пусты?
Если ведущий подбрасывает монетку, выбирая одну из двух пустых дверей, то P(OB|A)=1/2. Тогда теорема Байеса дает P(C|OB)=2/3. Это и есть ответ, который обычно приводят.
Но что, если мы знаем, что ведущий очень ленив и стоит у двери C? Иначе говоря, мы знаем, что он всегда открывает ее, если только за ней нет приза. Это значит, что P(OB|A)=0, и P(C|OB)=1. Что понятно: если ведущий преодолел лень и пошел открывать дверь B, значит, за дверью C точно лежит приз. Аналогично если ведущий очень ленив и стоит у двери B, то P(C|OB)=1/2. Тут поучительно рассмотреть, как в этом случае меняется P(A|OB) по сравнению с априорным P(A).
Можно рассмотреть случай, когда ведущий не очень ленив, и иногда идет к другой двери без необходимости. В итоге можно доказать, что смена выбора игроком никогда не ухудшает его позиции, но может ее улучшить.
Мы видим, что байесовское решение не только проще, но и глубже "обычного".
no subject
Date: 2015-06-17 01:08 am (UTC)no subject
Date: 2015-06-17 01:42 am (UTC)no subject
Date: 2015-06-17 02:05 am (UTC)Если ведущий ленивый, кстати, он может всегда класть приз за дверь А, что тоже может быть замечено.
no subject
Date: 2015-06-17 02:30 am (UTC)no subject
Date: 2015-06-17 02:46 am (UTC)no subject
Date: 2015-06-17 03:37 am (UTC)По-моему, это решение явно проще. Но, конечно, выигрывая в простоте - проигрываем в глубине.
Схожая задачка, которая проще решается от предположения, что первым своим ходом "игрок" достигает поставленной цели - это известная задачка про круговую дуэль.
no subject
Date: 2015-06-17 03:43 am (UTC)no subject
Date: 2015-06-17 04:31 am (UTC)no subject
Date: 2015-06-17 10:48 pm (UTC)простейшее решение элементарно: после первого выбора нахождение приза 1/3 в выбранной опции и 2/3 в остальных.
т.к. ведущий открывает гаранта™, де-факто вероятность нахождения приза НЕ меняется. 1/3 в выбранной опции и 2/3 в оставшейся единственной опции.
no subject
Date: 2015-06-17 01:47 pm (UTC)no subject
Date: 2015-06-17 05:18 pm (UTC)no subject
Date: 2015-06-17 05:22 pm (UTC)а если ведущий предлагает поменять только когда игрок выбрал правильно?
no subject
Date: 2015-06-17 05:27 pm (UTC)Приведённое в посте решение верно (точнее - оптимально) даже в том случае, если в игру никогда раньше не играли и никогда больше не будут играть.
no subject
Date: 2015-06-17 05:45 pm (UTC)мы почему-то решаем, что оно равно 0.
no subject
Date: 2015-06-17 06:04 pm (UTC)Даже если мы точно знаем, что корреляция есть, но не знаем ничего о её значении (грубо говоря, ведущий с утра бросил монетку, чтобы решить, менять или не менять, но нам известно лишь, что выпал "орёл"), любой выбор предположений, отличный от независимости, является "информацией из ниоткуда", то есть - дезинформацией.
no subject
Date: 2015-06-17 06:22 pm (UTC)в каком смысле наше решение является оптимальным? в предположении, что распределение возможных значений этой самой корреляции симметрично относительно 0?
no subject
Date: 2015-06-17 06:50 pm (UTC)Оптимально - в конечном итоге, следует формальным правилам индуктивного мышления, любое отклонение от которых гарантировано приведёт к отклонениям от того, что мы в быту называем здравым смыслом (например - высасывание из пальца информации, которой на самом деле нет). Звучит, наверное, несколько сумбурно, но за этим скрывается вполне себе неиллюзорное смысловое содержание, которое очень хорошо изложено в книге Джейнса Probability Theory: The Logic of Science - http://www.med.mcgill.ca/epidemiology/hanley/bios601/GaussianModel/JaynesProbabilityTheory.pdf
no subject
Date: 2015-06-17 07:15 pm (UTC)есть неизвестная нам переменная, которая легко и непринужденно может изменить наш ответ до наоборот.
давайте, чтоб что-то сказать, назначим ей 0.0. не верю (С).
>Это вполне логично: в первом случае у нас нет информации о корреляции ведущего и приза. Во втором мы знаем, что такой информации нет в природе, то есть у нас её таки по-прежнему нет :)
а вот нет ли в этом рассуждении неявной предпосылки, что отсутствие корреляции является "нормальным", типичным случаем, а вот ее ненулевое значение надо специально оговаривать?
PS почему 0 (ноль) отображается как o? или это только у меня???
она у меня как раз в телефон закачана - но не начинал читать еще :-)
no subject
Date: 2015-06-17 07:48 pm (UTC)Это параметр_в_модели, а не переменная_в_реальности. Значение о.о этого параметра как раз и означает - "[у нас] нет [взаимной] информации [между положениями ведущего и приза]". Появится информация - будет другое значение.
> а вот нет ли в этом рассуждении неявной предпосылки, что отсутствие корреляции является "нормальным", типичным случаем, а вот ее ненулевое значение надо специально оговаривать?
Нет такой неявной предпосылки. Есть вполне себе явная констатация факта, что у нас здесь сейчас в данном конкретном случае нет информации о такой корреляции. Действительно, любое другое значение подразумевает наличие такой информации, и тогда неплохо было бы мочь её, так скть, предъявить. Иначе мы вместо реального мира рассуждаем о каких-то вымышленных вселенных :)
Вот если мы проведём дополнительные наблюдения и увидим наличие такой корреляции, тогда мы по-байесиански эту информацию учтём и получим новое постериорное распределение - учитывающее в себе всю полноту информации, имеющейся у нас на тот момент в будущем.
> она у меня как раз в телефон закачана - но не начинал читать еще :-)
Большой респект за благие намерения ;) Там всё это по-человечески написано :)
no subject
Date: 2015-06-17 08:21 pm (UTC)подозреваю, что это неважно - но я говорил о другом - о решении ведущего выбрать вариант игры с открыванием двери за которой нет приза и предложением изменить выбор и корреляции этого решения с удачностью исходного выбора двери А. просто априорно выглядит разумным подозревать существование корреляции действий ведущего с нашим выбором (он нам хочет то ли помочь, то ли помешать, но вот мы не знаем что именно :-)
>нет информации о такой корреляции
и поэтому, ничтоже сумняшеся, в модель вобьем 0. вот здесь я не понимаю.
мы не знаем значения переменной и поэтому давайте будет 0. у меня все время складывается впечатление, что эта самая корреляция непростая какая-то, а чем-то философски отличается от других всяких параметров.
вот задачка: пролетит ли свободно падающее тело с начальной скоростью 0 больше 40000м за первые 100 сек?
можно конечно посчитать для случая g ~ 9.8 m/c^2, а можно сказать, что вообще-то оснований считать, что дело происходит на поверхности Земли у нас особых нет и ограничиться выводом формулы с переменной g.