О мальчиках, девочках и теореме Байеса
Jun. 16th, 2015 06:31 pmИспользование векторной алгебры позволяет многие задачи синтетической геометрии решать "автоматически". Вместо нетривиальных рассуждений ad hoc мы тупо пишем уравнения, упрощаем и получаем ответ. Что, возможно, и не так красиво, зато эффективно. Аналогично можно сравнить школьную алгебру и школьную арифметику образца 19 века (последнюю уже и не преподают толком в обычной школе: зачем, если все эти задачи про купцов и цыбики чая значительно упрощаются с введением иксов и игреков?).
Мне иногда кажется, что применение теоремы Байеса позволяет аналогичным образом "автоматизировать" многие задачи элементарной теории вероятностей. В качестве иллюстрации я приведу два решения одной задачи: классическое и байесовское.
Задача взята в фейсбуке Кости Кнопа; так как в комментариях уже есть ответы, я позволю себе привести тут решение - точнее, два решения.
Задача
Два мальчика (логическая задача)
Вы наверняка слыхали про вероятностную задачу "У мистера Брауна два ребенка, хотя бы один из них мальчик. Какова вероятность, что оба ребенка - мальчики". Классика. Ответ в ней 1/3, если вдруг кто позабыл. [Для дотошных и въедливых. Рассматриваются все семьи с двумя детьми, среди которых есть хотя бы один мальчик. Какую долю из них составляют семьи с двумя мальчиками?]
А теперь - намного менее известная вариация (придуманная 3-4 года назад). "У мистера Грина два ребенка. Один из них - мальчик, родившийся в среду. Какова вероятность того, что оба ребенка - мальчики?"
При решении этой задачи вероятность рождения детей в каждый день недели следует считать одинаковой, вероятности рождения мальчика и девочки считать одинаковыми, рождением близнецов пренебречь и т.п. В общем - чистая логика и чистый теорвер.
Прежде чем решать, попробуйте прикинуть ответ, а потом сравните свою прикидку с ответом, полученным вами в результате вычислений. Ну и поделитесь результатами прикидок, пожалуйста.
Я буду рассматривать ниже "неделю" из k дней. При k=1 мы получаем задачу про мистера Брауна, при k=7 - про мистера Грина, при k=365 - задачу "По крайней мере один из детей мистера Блю - мальчик, рожденный 1 апреля".
Классическое решение
Подсчитаем сначала вероятность того, что в семье есть девочка.
Пусть в мальчик, родившийся в среду - старший ребенок. Тогда для второго ребенка у нас 2k вариантов (мальчик родился в понедельник, девочка родилась в понедельник, мальчик родился во вторник...), из них k - девочки. Аналогично мы имеем 2k и k вариантов для старшего ребенка, если мальчик, родившийся в среду - младший. На первый взгляд кажется, что вероятность девочки (k+k)/(2k+2k). Но на самом деле мы в знаменателе один вариант подсчитали дважды: когда в семье два мальчика, и при этом каждый родился в среду. Поэтому истинная вероятность того, что в семье есть девочка, (k+k)/(2k+2k-1) = 2k/(4k-1). Значит, вероятность того, что оба ребенка - мальчики, 1-2k/(4k-1) = (2k-1)/(4k-1). При k=1 это 1/3, при k=7 это 13/27, а в пределе при большом k получается 1/2.
Байесовское решение
Я слегка переформулирую задачу в духе байесовского подхода. У нас есть прибор, который чувствует мальчиков по запаху, но плохо. Если к прибору подходит мальчик, то лампочка прибора загорается с вероятностью 1/k (и уже не тухнет, пока ее не выключить). Когда к прибору подошли два ребенка Гринов, лампочка загорелась, но мы не успели заметить, после какого именно ребенка это произошло. Какова апостериорная вероятность того, что они оба - мальчики?
Пусть событие M2 - то, что у Гринов два мальчика, а событие L - то, что лампочка загорелась. Тогда теорема Байеса говорит, что P(M2|L) = P(L|M2)P(M2)/P(L).
Априорная вероятность того, что оба ребенка - мальчики, P(M2)=1/4. Если известно, что ребенок - мальчик, то лампочка, когда он подойдет к прибору, не загорится с вероятностью 1-1/k, а если пол неизвестен, то с вероятностью 1-1/(2k). Отсюда P(L) = 1 - [1-1/(2k)]^2, P(L|M2) = 1 - (1-1/k)^2. После простых преобразований получаем P(L|M2) = (2k-1)/(4k-1).
Только ли мне кажется, что первое решение красивее, но второе эффективнее и в чем-то проще? И верно ли, что в преподавании теории вероятностей педагогически правильно как можно раньше вводить байесовский подход?
no subject
Date: 2015-06-16 10:49 pm (UTC)no subject
Date: 2015-06-16 10:54 pm (UTC)И, кстати, байесовское решение указывает на одно неявное допущение "обычного" решения, которое обычно не проговаривается - а оно важно!
no subject
Date: 2015-06-17 12:18 am (UTC)no subject
Date: 2015-06-17 12:21 am (UTC)Подсказка: как именно ведущий выбирает дверь, если он знает, что обе пустые? Как изменится задача, если его алгоритм - не подбрасывание монетки?
no subject
Date: 2015-06-17 01:01 am (UTC)no subject
Date: 2015-06-16 11:40 pm (UTC)no subject
Date: 2015-06-17 12:15 am (UTC)no subject
Date: 2015-06-16 11:09 pm (UTC)no subject
Date: 2015-06-16 11:19 pm (UTC)no subject
Date: 2015-06-16 11:28 pm (UTC)no subject
Date: 2015-06-16 11:30 pm (UTC)no subject
Date: 2015-06-16 11:57 pm (UTC)Например, если в задаче про Грина заменить "родившейся в среду" на "родившейся под звуки флейты", то неужели нужно строить-перебирать всем возможные варианты музыкальных инструментов?!
no subject
Date: 2015-06-17 12:05 am (UTC)no subject
Date: 2015-06-17 12:06 am (UTC)no subject
Date: 2015-06-17 12:12 am (UTC)Второй путь может быть и не проще, но он... благороднее что-ли.
---
^ условность, расчёт может быть сложнейшим.
no subject
Date: 2015-06-17 12:16 am (UTC)no subject
Date: 2015-06-17 12:30 am (UTC)кое-какая интуиция есть
Date: 2015-06-17 10:13 am (UTC)Так что повальная неграмотность в отношении вероятностей скорее говорит о недостатках языка.
no subject
Date: 2015-06-17 01:45 am (UTC)no subject
Date: 2015-06-17 01:49 am (UTC)no subject
Date: 2015-06-17 02:54 am (UTC)no subject
Date: 2015-06-17 02:01 am (UTC)Поэтому чтобы действительно разобраться в задаче (а не просто посчитать), надо понять (и уметь объяснить), что в условии задачи вносит корреляцию между, казалось, независимыми событиями. Пока это не проговорено - мы занимаемся формализмом.
no subject
Date: 2015-06-17 02:47 am (UTC)Ну да. Условие, в котором встречаются слова "один из" скоррелировано с вопросом "какая вероятность, что два". Поскольку условие нетривиально (в отличие от, скажем, "один из них - человек"), условная вероятность отличается от безусловной.
no subject
Date: 2015-06-17 04:25 am (UTC)И это именно то что в основе непонимания, и в чем должна быть суть объяснения - откуда взялась корреляция между А и B ?
Почему фиксирование среды как дня рождения имеет какую то связь с количеством мальчиков ? Все остальное - техника
no subject
Date: 2015-06-17 05:14 am (UTC)no subject
Date: 2015-06-17 09:59 am (UTC)no subject
Date: 2015-06-17 02:54 pm (UTC)Мы нигде не пользовались, что день именно среда. Поэтому 13/27 будет для каждого дня недели, они равновероятны. Это означает, что в какой бы день не родился старший брат, вероятность двух мальчиков 13/27, почти 1/2.
Однако, если исключить знание в какой день недели было рождение с самого начала, то вероятность двух мальчиков 1/3 а не 1/2.
no subject
Date: 2015-06-17 03:19 pm (UTC)no subject
Date: 2015-06-17 03:27 pm (UTC)Но ведь недели можно оказаться любым - от этого 13/27 не изменится. Если Грин нам скажет что первый его сын родился в среду - то вероятность 13/27. Если Грин скажет что его первый сын родился в пятницу - тоже 13/27. Какой бы день Грин не назвал - 13/27. Значит можно Грина не спрашивать о дне недели - во всех случаях будет 13/27... и Грин превращается в Брауна.
no subject
Date: 2015-06-17 12:04 am (UTC)В задачке Монти-Холла про три двери и приз я представляю себе, что игрок указав в первый раз на закрытую дверь затем отвернулся и не смотрит на ведущего показывая пальцем на всю ту же дверь, что он там открывает еще ведущий не имеет значения... очевидно, что вероятность 1/3 не меняется.
А что в данной задаче? Если человек услышал начало фразы про "один из них - мальчик", а про среду прослушал. То выходит, что несмотря на то, что мальчик в любом случае родился в КАКОЙ ТО день недели (это очевидно) эта бесполезная и банальная информация все таки важна и человек даст неправильный ответ.
Далее, можно добавить, что мальчик родился зимой, в J роддоме из M возможных, последняя цифра в номере свидетельства о рождении = 8. Как эти данные меняют вероятность того, что второй - тоже мальчик, который мог родиться в любое время года, в любом роддоме и иметь любую последнюю цифру в свидетельстве о рождении?
no subject
Date: 2015-06-17 12:07 am (UTC)no subject
Date: 2015-06-17 06:43 pm (UTC)в снижении вероятности того, что оба мальчика подходят под это условие
no subject
Date: 2015-06-17 03:11 am (UTC)https://m.facebook.com/comment/replies/?ctoken=10205282849964319_10205287585762711&count=3&ft_ent_identifier=10205282849964319&gfid=AQA1ZoOBlursqe4u&refid=52
По-моему, очень хорошо иллюстрирует (и да, хоть я и понял твое объяснение, но картинкой мне вштырило больше ;-).
не открывается :(
Date: 2015-06-17 10:25 am (UTC)Все клетки содержат одинаковое число семей, по 1/14^2 от общего числа.
Условием задачи выбирается объединение клеток одного столбца с клетками одной строки, причем общая клетка - это семьи с 2 "средовыми" мальчиками, так что в этом объединение всего клеток 28-1, а клеток с двумя мальчиками – 14-1. Получается, их доля 13/27, меньше 1/2.
Re: не открывается :(
Date: 2015-06-17 01:39 pm (UTC)И да, картинка там именно такая - квадратик 2x2 для первого случая и 14x14 для второго. И выделены строка и столбец, и сразу видно, откуда получается 13 и 27.
no subject
Date: 2015-06-17 04:59 am (UTC)Сколько есть вариантов двух детей с минимум одним мальчик-среда?
1-й мальчик-среда, 2-й-- любой: 2*7=14
2-й мальчик-среда, 1-й-- любой: 14
оба -- мальчик-среда: 1
Значит минимум один мальчик-среда: 14+14-1=27
Сколько есть вариантов оба мальчика с минимум одним мальчик-среда?
1-й мальчик-среда, 2-й-- любой мальчик: 7
2-й мальчик-среда, 1-й-- любой мальчик: 7
оба -- мальчик-среда: 1
Значит, оба мальчика с минимум одним мальчик-среда: 7+7-1=13.
Условная вероятность: 13/27
Прикинуть я не пытался, до того, как посчитал.
no subject
Date: 2015-08-08 12:29 am (UTC)Потом решил погуглить, и нашел эту ветку.
А Вы делаете комбинаторно -- почему? Как преп -- так студентам легче, или еще почему-то?
no subject
Date: 2015-08-11 11:47 pm (UTC)no subject
Date: 2015-06-17 07:57 am (UTC)no subject
Date: 2015-06-17 08:13 am (UTC)no subject
Date: 2015-08-20 10:52 pm (UTC)Т.е. 0.5-то как раз довольно интуитивна. Это 1/3 требует усилия, и потом возврат к "почти 1/2" можно даже воспринимать, в некотором смысле, как долгожданный роздых.
no subject
Date: 2015-06-17 05:12 pm (UTC)Не читали E.T. Jaynes - Probability Theory: The Logic of Science? Замечательная книга. Там как раз классические результаты теории вероятностей и статистики выводятся из теоремы Байеса. Точнее, из небольшого набора простых принципов индуктивного мышления, из которых теорема Байеса выпадает практически автоматом. Джейнс постоянно (и не стесняясь в выражениях) подчёркивает, насколько проще получаются эти выводы и как они выявляют неявные предположения, используемые в "ортодоксальных" выводах.
no subject
Date: 2015-06-20 01:45 am (UTC)no subject
Date: 2015-06-26 09:32 pm (UTC)no subject
Date: 2015-08-20 10:50 pm (UTC)