scholar_vit: (knot)
[personal profile] scholar_vit

Использование векторной алгебры позволяет многие задачи синтетической геометрии решать "автоматически". Вместо нетривиальных рассуждений ad hoc мы тупо пишем уравнения, упрощаем и получаем ответ. Что, возможно, и не так красиво, зато эффективно. Аналогично можно сравнить школьную алгебру и школьную арифметику образца 19 века (последнюю уже и не преподают толком в обычной школе: зачем, если все эти задачи про купцов и цыбики чая значительно упрощаются с введением иксов и игреков?).

Мне иногда кажется, что применение теоремы Байеса позволяет аналогичным образом "автоматизировать" многие задачи элементарной теории вероятностей. В качестве иллюстрации я приведу два решения одной задачи: классическое и байесовское.

Задача взята в фейсбуке Кости Кнопа; так как в комментариях уже есть ответы, я позволю себе привести тут решение - точнее, два решения.

Задача

Два мальчика (логическая задача)

Вы наверняка слыхали про вероятностную задачу "У мистера Брауна два ребенка, хотя бы один из них мальчик. Какова вероятность, что оба ребенка - мальчики". Классика. Ответ в ней 1/3, если вдруг кто позабыл. [Для дотошных и въедливых. Рассматриваются все семьи с двумя детьми, среди которых есть хотя бы один мальчик. Какую долю из них составляют семьи с двумя мальчиками?]

А теперь - намного менее известная вариация (придуманная 3-4 года назад). "У мистера Грина два ребенка. Один из них - мальчик, родившийся в среду. Какова вероятность того, что оба ребенка - мальчики?"

При решении этой задачи вероятность рождения детей в каждый день недели следует считать одинаковой, вероятности рождения мальчика и девочки считать одинаковыми, рождением близнецов пренебречь и т.п. В общем - чистая логика и чистый теорвер.

Прежде чем решать, попробуйте прикинуть ответ, а потом сравните свою прикидку с ответом, полученным вами в результате вычислений. Ну и поделитесь результатами прикидок, пожалуйста.

Я буду рассматривать ниже "неделю" из k дней. При k=1 мы получаем задачу про мистера Брауна, при k=7 - про мистера Грина, при k=365 - задачу "По крайней мере один из детей мистера Блю - мальчик, рожденный 1 апреля".

Классическое решение

Подсчитаем сначала вероятность того, что в семье есть девочка.

Пусть в мальчик, родившийся в среду - старший ребенок. Тогда для второго ребенка у нас 2k вариантов (мальчик родился в понедельник, девочка родилась в понедельник, мальчик родился во вторник...), из них k - девочки. Аналогично мы имеем 2k и k вариантов для старшего ребенка, если мальчик, родившийся в среду - младший. На первый взгляд кажется, что вероятность девочки (k+k)/(2k+2k). Но на самом деле мы в знаменателе один вариант подсчитали дважды: когда в семье два мальчика, и при этом каждый родился в среду. Поэтому истинная вероятность того, что в семье есть девочка, (k+k)/(2k+2k-1) = 2k/(4k-1). Значит, вероятность того, что оба ребенка - мальчики, 1-2k/(4k-1) = (2k-1)/(4k-1). При k=1 это 1/3, при k=7 это 13/27, а в пределе при большом k получается 1/2.

Байесовское решение

Я слегка переформулирую задачу в духе байесовского подхода. У нас есть прибор, который чувствует мальчиков по запаху, но плохо. Если к прибору подходит мальчик, то лампочка прибора загорается с вероятностью 1/k (и уже не тухнет, пока ее не выключить). Когда к прибору подошли два ребенка Гринов, лампочка загорелась, но мы не успели заметить, после какого именно ребенка это произошло. Какова апостериорная вероятность того, что они оба - мальчики?

Пусть событие M2 - то, что у Гринов два мальчика, а событие L - то, что лампочка загорелась. Тогда теорема Байеса говорит, что P(M2|L) = P(L|M2)P(M2)/P(L).

Априорная вероятность того, что оба ребенка - мальчики, P(M2)=1/4. Если известно, что ребенок - мальчик, то лампочка, когда он подойдет к прибору, не загорится с вероятностью 1-1/k, а если пол неизвестен, то с вероятностью 1-1/(2k). Отсюда P(L) = 1 - [1-1/(2k)]^2, P(L|M2) = 1 - (1-1/k)^2. После простых преобразований получаем P(L|M2) = (2k-1)/(4k-1).

Только ли мне кажется, что первое решение красивее, но второе эффективнее и в чем-то проще? И верно ли, что в преподавании теории вероятностей педагогически правильно как можно раньше вводить байесовский подход?

Date: 2015-06-16 10:49 pm (UTC)
From: [identity profile] cheeha.livejournal.com
Мне очень нравится задачка о призе: имеются три двери (или дверцы), за одной из них спрятан приз. Вы указываете на одну из них, ведущий, который знает, где находится приз, открывает другую дверь, за которой нет приза. Вам даётся шанс изменить своё решение. Мистер Х не меняет своего решения, но легкомысленная мисс Y тут же передумала и указала на другую закрытую дверь. У кого больше шансов получить приз?

Date: 2015-06-16 10:54 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
Кстати, и в этой задаче байесовское решение дает ответ проще, чем классическое.

И, кстати, байесовское решение указывает на одно неявное допущение "обычного" решения, которое обычно не проговаривается - а оно важно!
Edited Date: 2015-06-16 11:02 pm (UTC)

Date: 2015-06-17 12:18 am (UTC)
From: [identity profile] cheeha.livejournal.com
Она очень хорошо демонстрирует, как владение косвенной информацией повышает шансы на приз. :)

Date: 2015-06-17 12:21 am (UTC)
From: [identity profile] scholar-vit.livejournal.com
Не только.

Подсказка: как именно ведущий выбирает дверь, если он знает, что обе пустые? Как изменится задача, если его алгоритм - не подбрасывание монетки?

Date: 2015-06-16 11:40 pm (UTC)
From: [identity profile] egh0st.livejournal.com
эта задача элементарная, просто обычно люди решающие её решают другую задачу :)

Date: 2015-06-17 12:15 am (UTC)
From: [identity profile] cheeha.livejournal.com
Естественно, элементарная, она для middle school. :))

Date: 2015-06-16 11:09 pm (UTC)
From: [identity profile] ksega.livejournal.com
Мне кажется, в этой задачке нужна не теорема Байеса, а тот факт, что P(A|B) =P(AB) / P(B) (это конечно почти и есть теорема Байеса, но не совсем...) (во всяком случае, я так решал)

Date: 2015-06-16 11:19 pm (UTC)
From: [identity profile] misha-b.livejournal.com
Конечно, нужна именно условная вероятность. Вещь весьма полезная, но "неклассическим" назвать такое решение трудно.

Date: 2015-06-16 11:28 pm (UTC)
From: [identity profile] rotozeеv (from livejournal.com)
Один из них родился в среду, а другой может в среду, а может и нет, или _только_ один из них родился в среду, а другой- обязательно в другой день недели?

Date: 2015-06-16 11:30 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
По крайней мере один родился в среду. Возможно, и оба.

Date: 2015-06-16 11:57 pm (UTC)
From: [identity profile] nighteagleowl.livejournal.com
Возможно я плохо к ночи соображаю, но разве вероятность что в семье двое мальчиков (общее число детей тоже двое) хоть как-то зависит от даты-места-дня недели рождения первого ребёнка?!

Например, если в задаче про Грина заменить "родившейся в среду" на "родившейся под звуки флейты", то неужели нужно строить-перебирать всем возможные варианты музыкальных инструментов?!

Date: 2015-06-17 12:05 am (UTC)
From: [identity profile] rotozeеv (from livejournal.com)
только набрал свой длинный ответ, как ту же мысль написали

Date: 2015-06-17 12:06 am (UTC)
From: [identity profile] scholar-vit.livejournal.com
Вот именно из-за таких вопросов я предпочитаю байесовский подход, где вероятность - это мера нашего незнания, как неустранимого (в какую из двух ловушек попадется электрон?), так и устранимого (в какую из двух ловушек попался электрон?). Тогда ответить на этот вопрос очень просто: новое знание может изменить наше представление о действительности.

Date: 2015-06-17 12:12 am (UTC)
From: [identity profile] nighteagleowl.livejournal.com
Однако полагаю эта два разных подхода. В одном случае ("ответить на этот вопрос очень просто: новое знание может изменить наше представление о действительности") это простое "надо трясти, нечего думать". Т.е. мы просто 'тупо'^ считаем что получится в итоге. В другом же случае, мы не считаем пока не сообразим что считать действительно нужно.
Второй путь может быть и не проще, но он... благороднее что-ли.

---
^ условность, расчёт может быть сложнейшим.

Date: 2015-06-17 12:16 am (UTC)
From: [identity profile] scholar-vit.livejournal.com
У нормального человека очень плохая вероятностная интуиция, как демонстрируют задачи вроде приведенной. Именно поэтому я и задаю вопрос о правильном преподавании теории вероятностей.

Date: 2015-06-17 12:30 am (UTC)
From: [identity profile] nighteagleowl.livejournal.com
Если изначальный посыл - об-инженерить задачу, свести её в более практическую плоскость и дать ученику более-менее универсальный алгоритм 'разгрызающий' большую часть ждущих его на практике задач, то соглашусь, аналитическая геометрия, условная вероятность байеса и т.п. будут удобнее. Только этот путь большинства - суть путь ремесленника (это ни уничижительный эпитет, а указание на ограниченность применимости, о которой практикующий ремесленник даже не будет догадываться).

кое-какая интуиция есть

Date: 2015-06-17 10:13 am (UTC)
From: [identity profile] v-phi.livejournal.com
даже у 2-летних детей в опыте, где из прозрачного ящика, полного теннисных мячей двух цветов, белых и красных, экспериментатор на глазах у подопытного ребенка доставал несколько мячей, заметно предпочитая мячи более редкого цвета (например, 2 из 5, тогда как в ящике доля мячей редкого цвета была лишь 1/3), а потом просил ребенка принести ему еще 1 мяч из этой коробки – и ребенок обычно приносил мяч более редкого цвета.
Так что повальная неграмотность в отношении вероятностей скорее говорит о недостатках языка.
Edited Date: 2015-06-17 10:13 am (UTC)

Date: 2015-06-17 01:45 am (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Довольно очевидно, что чем менее вероятное условие приведено для рождения одного мальчика, тем сильнее истинность этого условия отбирает семьи с двумя мальчиками из генеральной совокупности, потому вероятность и увеличивается вплоть до 1/2 с увеличением невероятности условия.

Date: 2015-06-17 01:49 am (UTC)
From: [identity profile] scholar-vit.livejournal.com
И опять навязший вопрос: насколько очевиднее это, если преподавать "по-байесовски"?

Date: 2015-06-17 02:54 am (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Я не уверен, что существенно, если вообще, ведь рассуждение совершенно умозрительное.

Date: 2015-06-17 02:01 am (UTC)
From: [identity profile] dmpogo.livejournal.com
Хм, нет так уж очевидно. А именно, дополнительная условие может оказывать эффект на рассчитываемую вероятность, только если оно коррелировано с тем что спрашивается. То есть, конечно интересует условная вероятность P(A|B) (в чем и point всех этих задачах), но если А и B некореллированы, то ничего нового нет, P(A|B) = P(A).

Поэтому чтобы действительно разобраться в задаче (а не просто посчитать), надо понять (и уметь объяснить), что в условии задачи вносит корреляцию между, казалось, независимыми событиями. Пока это не проговорено - мы занимаемся формализмом.

Date: 2015-06-17 02:47 am (UTC)
spamsink: (Default)
From: [personal profile] spamsink
только если оно коррелировано с тем что спрашивается

Ну да. Условие, в котором встречаются слова "один из" скоррелировано с вопросом "какая вероятность, что два". Поскольку условие нетривиально (в отличие от, скажем, "один из них - человек"), условная вероятность отличается от безусловной.

Date: 2015-06-17 04:25 am (UTC)
From: [identity profile] dmpogo.livejournal.com
Здесь легкая путаница в словах. Условие может быть нетривиальным, мало вероятным (то есть выбирающим существенно меньший подансамль), но при том некоррелированым с тем что спрашивается (вы, судя по всему в данном контексте тривиальностью называете некоррелированность).

И это именно то что в основе непонимания, и в чем должна быть суть объяснения - откуда взялась корреляция между А и B ?
Почему фиксирование среды как дня рождения имеет какую то связь с количеством мальчиков ? Все остальное - техника

Date: 2015-06-17 05:14 am (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Эта корреляция умозрительно понятна всем, кто понимает, что покупка большего количества лотерейных билетов увеличивает вероятность выигрыша, даже если выигрышный номер выбран заранее.

Date: 2015-06-17 09:59 am (UTC)
From: [identity profile] nighteagleowl.livejournal.com
Как мы выясняли выше - эта корреляция (её наличие) как раз не понятно и не очевидно. Один подход - просто посчитать, не задумываясь, условную вероятность (пусть даже и окажется в итоге P(A|B)=P(A). Второй подход - сразу из условия сообразить и объяснить, что так именно и будет - события независимы - и потому все эти дополнительные якобы условия в данном случае можно сразу проигнорировать при расчёте P(A).

Date: 2015-06-17 02:54 pm (UTC)
From: [identity profile] nighteagleowl.livejournal.com
Вот смотрите, пусть у нас не очень уникальное условие - среда, так что вероятность (как нам тут сказали) 13/27 близко к 1/2.

Мы нигде не пользовались, что день именно среда. Поэтому 13/27 будет для каждого дня недели, они равновероятны. Это означает, что в какой бы день не родился старший брат, вероятность двух мальчиков 13/27, почти 1/2.

Однако, если исключить знание в какой день недели было рождение с самого начала, то вероятность двух мальчиков 1/3 а не 1/2.

Date: 2015-06-17 03:19 pm (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Этому "не очень уникальному условию" не соответствует 6/7 всех мальчиков. Вот и 13/27 не сильно отличается от 1/3+(1/2-1/3)*6/7.

Date: 2015-06-17 03:27 pm (UTC)
From: [identity profile] nighteagleowl.livejournal.com
> Этому "не очень уникальному условию" не соответствует 6/7 всех мальчиков

Но ведь недели можно оказаться любым - от этого 13/27 не изменится. Если Грин нам скажет что первый его сын родился в среду - то вероятность 13/27. Если Грин скажет что его первый сын родился в пятницу - тоже 13/27. Какой бы день Грин не назвал - 13/27. Значит можно Грина не спрашивать о дне недели - во всех случаях будет 13/27... и Грин превращается в Брауна.

Date: 2015-06-17 12:04 am (UTC)
From: [identity profile] rotozeеv (from livejournal.com)
И вот непонятно, в чем же смысл этой дополнительной информации о среде?

В задачке Монти-Холла про три двери и приз я представляю себе, что игрок указав в первый раз на закрытую дверь затем отвернулся и не смотрит на ведущего показывая пальцем на всю ту же дверь, что он там открывает еще ведущий не имеет значения... очевидно, что вероятность 1/3 не меняется.

А что в данной задаче? Если человек услышал начало фразы про "один из них - мальчик", а про среду прослушал. То выходит, что несмотря на то, что мальчик в любом случае родился в КАКОЙ ТО день недели (это очевидно) эта бесполезная и банальная информация все таки важна и человек даст неправильный ответ.

Далее, можно добавить, что мальчик родился зимой, в J роддоме из M возможных, последняя цифра в номере свидетельства о рождении = 8. Как эти данные меняют вероятность того, что второй - тоже мальчик, который мог родиться в любое время года, в любом роддоме и иметь любую последнюю цифру в свидетельстве о рождении?

Date: 2015-06-17 06:43 pm (UTC)
From: [identity profile] efimpp.livejournal.com
>И вот непонятно, в чем же смысл этой дополнительной информации о среде?
в снижении вероятности того, что оба мальчика подходят под это условие

Date: 2015-06-17 03:11 am (UTC)
From: [identity profile] Лев Горенштейн (from livejournal.com)
Там в ФБ у Кости появился очень симпатичный комментарий с весьма наглядной картинкой:

https://m.facebook.com/comment/replies/?ctoken=10205282849964319_10205287585762711&count=3&ft_ent_identifier=10205282849964319&gfid=AQA1ZoOBlursqe4u&refid=52

По-моему, очень хорошо иллюстрирует (и да, хоть я и понял твое объяснение, но картинкой мне вштырило больше ;-).

не открывается :(

Date: 2015-06-17 10:25 am (UTC)
From: [identity profile] v-phi.livejournal.com
Я когда решал представил себе картинку: двухдетные семьи распиханы по клеткам таблицы 14 на 14 с учетом пола и дня недели рождения ребенка, первого и второго.
Все клетки содержат одинаковое число семей, по 1/14^2 от общего числа.
Условием задачи выбирается объединение клеток одного столбца с клетками одной строки, причем общая клетка - это семьи с 2 "средовыми" мальчиками, так что в этом объединение всего клеток 28-1, а клеток с двумя мальчиками – 14-1. Получается, их доля 13/27, меньше 1/2.

Re: не открывается :(

Date: 2015-06-17 01:39 pm (UTC)
From: [identity profile] Лев Горенштейн (from livejournal.com)
Черт, я не знаю, как вставлять ссылки из фэйсбука ;-( Буду благодарен, если найдете и вставите - комментарий от Zavjalov Vladislav.

И да, картинка там именно такая - квадратик 2x2 для первого случая и 14x14 для второго. И выделены строка и столбец, и сразу видно, откуда получается 13 и 27.

Date: 2015-06-17 04:59 am (UTC)
From: [identity profile] yakov-a-jerkov.livejournal.com
Я так считал. Отличие от первой задачи в том, что у ребенка теперь два атрибута, а не один, пол и день недели.

Сколько есть вариантов двух детей с минимум одним мальчик-среда?

1-й мальчик-среда, 2-й-- любой: 2*7=14
2-й мальчик-среда, 1-й-- любой: 14
оба -- мальчик-среда: 1

Значит минимум один мальчик-среда: 14+14-1=27

Сколько есть вариантов оба мальчика с минимум одним мальчик-среда?

1-й мальчик-среда, 2-й-- любой мальчик: 7
2-й мальчик-среда, 1-й-- любой мальчик: 7
оба -- мальчик-среда: 1

Значит, оба мальчика с минимум одним мальчик-среда: 7+7-1=13.

Условная вероятность: 13/27

Прикинуть я не пытался, до того, как посчитал.
Edited Date: 2015-06-17 05:00 am (UTC)

Date: 2015-08-08 12:29 am (UTC)
From: [identity profile] kum-tykva.livejournal.com
Интересно. Мне давеча ее подкинули, и я начал тоже с комбинаторики, но вопрос был, как она получается из классической(без вторника), и сразу голова переключилась на решение в духе автора корневого поста -- объединение двух полосок будет площади 4х-х^2, квадрат "два мальчика" вырежет из него(этого объединения) "маленький крест" площадью 2х-х^2, и условная вероятность поэтому будет (2-х)/(4-х), и дальше, меняя х от единички(вообще никаких ограничений на мальчика) до нуля(безобразно уникальный мальчик), мы и получим ее изменение от трети до половины(в том числе, при одной седьмой, и наши 13/27). И "физический смысл" сразу вполне прозрачен: для не слишком редкого мальчика работает и событие "два таких сразу"(поэтому почти треть, как без ограничений), а для уникального -- вопрос сводится только к "какого пола у него сиблинг", и понятно, что половина.
Потом решил погуглить, и нашел эту ветку.
А Вы делаете комбинаторно -- почему? Как преп -- так студентам легче, или еще почему-то?

Date: 2015-08-11 11:47 pm (UTC)
From: [identity profile] yakov-a-jerkov.livejournal.com
Просто потому, что это метод, который я знаю. Задачу "один из двух детей мальчик, найти вероятность, что и другой -- мальчик" я так же решал. Про квадраты я даже не думал, но интересно.

Date: 2015-06-17 07:57 am (UTC)
From: [identity profile] rotozeеv (from livejournal.com)
Получается, если добавить уточнение, что _старший_ из детей - мальчик, родившийся в среду, то решение выходит тривиальным, ибо убирается "интерференция".

Date: 2015-06-17 08:13 am (UTC)
From: [identity profile] el-heneral.livejournal.com
Вы так однозначно пишете, что ответ в задаче про двух мальчиков 1/3, что может создасться впечатление, что парадокс Гарднера вовсе и не парадокс.

Date: 2015-08-20 10:52 pm (UTC)
From: [identity profile] komelsky.livejournal.com
Да, у меня сходное сомнение возникло. Студентам приходится долго объяснять почему в задаче с "один из них - мальчик" ответ 1/3, поскольку "исходно" студенты обеих детей помечают как уникальных. Их приходится приучать к мысли о том, что дети не уникальны. (И, кстати, довольно сложно придумать жизненный пример в котором утверждение "один из них - мальчик" было бы сделано в чистом виде, без дополнительной информации).

Т.е. 0.5-то как раз довольно интуитивна. Это 1/3 требует усилия, и потом возврат к "почти 1/2" можно даже воспринимать, в некотором смысле, как долгожданный роздых.

Date: 2015-06-17 05:12 pm (UTC)
From: [identity profile] darth-vasya.livejournal.com
> Только ли мне кажется, что первое решение красивее, но второе эффективнее и в чем-то проще? И верно ли, что в преподавании теории вероятностей педагогически правильно как можно раньше вводить байесовский подход?

Не читали E.T. Jaynes - Probability Theory: The Logic of Science? Замечательная книга. Там как раз классические результаты теории вероятностей и статистики выводятся из теоремы Байеса. Точнее, из небольшого набора простых принципов индуктивного мышления, из которых теорема Байеса выпадает практически автоматом. Джейнс постоянно (и не стесняясь в выражениях) подчёркивает, насколько проще получаются эти выводы и как они выявляют неявные предположения, используемые в "ортодоксальных" выводах.

Date: 2015-06-20 01:45 am (UTC)
From: [identity profile] scholar-vit.livejournal.com
Не читал - спасибо за ссылку. Любопытно, что мы пришли к схожим выводам.

Date: 2015-06-26 09:32 pm (UTC)
From: [identity profile] darth-vasya.livejournal.com
Кстати, помимо теоремы Байеса автоматом из этих "простых принципов" (desiderata) выводится и даже само понятие вероятности со всеми её математическими свойствами. Прекрасная книга, надо бы самому перечитать.

Date: 2015-08-20 10:50 pm (UTC)
From: [identity profile] komelsky.livejournal.com
Интересная книга, спасибо за наводку!

Profile

scholar_vit: (Default)
scholar_vit

January 2019

S M T W T F S
  12345
678 9101112
13141516171819
20212223242526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 25th, 2026 02:21 am
Powered by Dreamwidth Studios