scholar_vit: (Default)
scholar_vit ([personal profile] scholar_vit) wrote2011-02-04 01:16 pm

Смок Беллью 21 века

Герой Джека Лондона Смок Беллью сумел победить рулетку в салуне "Олений рог". Старое колесо рассохлось, и движения шарика стали предсказуемыми. Смок выиграл сорок пять тысяч долларов, а потом владельцы игорных домов города заплатили ему тридцать тысяч за "систему" - и очень обрадовались, узнав, что "никакой системы не существует", и за другим столом Смок "не выиграл бы и кислого яблока".

Я вспомнил этот эпизод, когда сын прислал мне ссылку на статью в Wired. Герой этой статьи, Мохан Шривастава, живет в Торонто и занимается геологической статистикой. Как-то он случайно обратил внимание на билеты "мгновенной лотереи" - знаете, где нужно соскрести защитный слой и узнать размер выигрыша. Билеты лотереи в Онтарио выглядели как вариант игры в "крестики-нолики": слева были квадратные решетки с разными числами в ячейках, а справа последовательность чисел, покрытая защитным слоем - "призовые числа". Если три призовых числа окажутся идущими на решетке подряд, как крестики или нолики в игре, билет выигрывает.

Шривастава предположил, что компьютер рисует эти числа не совсем случайным образом. Его исследования показали, что это действительно так: числа, которые встречались слева реже других, имели больше шансов попасть в "призовую последовательность" справа. В статье не говорится прямо, зачем это делается - но мне кажется, что это такая попытка минимизировать выигрыш. В итоге получалось, что если на билете какие-нибудь три числа встречались слева только по одному разу, они с высокой вероятностью оказывались под защитным слоем справа. Поэтому если такие числа шли слева подряд, то билет оказывался выигрышным.

Естественно, первая мысль Шриваставы была: "Теперь я разбогатею!" Но затем он стал считать. Если покупать лотерейные билеты по магазинам и тратить на подсчет вероятности выигрыша каждого билета по 45 секунд, то ежедневный заработок составит около $600. Это не так уж плохо, но как консультант он зарабатывал больше - и работа была поинтереснее. Вместо этого Шривастава сообщил о своем открытии организаторам лотереи - в надежде, что они предложат ему работу. Кстати, достучаться до руководства оказалось непросто: они просто не отвечали на звонки и письма. В конце концов Шривастава послал им пакет с двумя пачками новеньких лотерейных билетов: отдельно кандидаты на выигрыш, отдельно на проигрыш. Он отправил его в 10 утра - и в полдень ему позвонили лотерейщики, а на следующий день все билеты "крестиков-ноликов" были изъяты из продажи: Шривастава верно предсказал 19 из 20 выигрышных билетов. В статье не сказано, сколько заплатили Шриваставе и предложили ли ему постоянную должность консультанта. Впрочем, статья в Wired, надо думать, обеспечит ему хорошую рекламу.

Шривастава заинтересовался другими типами "мгновенных лотерей" и нашел способы выиграть во многих из них. Что не удивительно: эти игры в США и Канаде разрабатывают всего несколько компаний, которые затем продают их организаторам лотерей (обычно это правительства штатов и провинций).

Интересно, что соображения Шриваставы о невыгодности бизнеса работают только для кустарной постановки дела: когда изобретатель ходит по магазинам и вручную отбирает билеты. Простенький сканер с лаптопом позволяет сильно сократить время на проверку каждого билета. Конечно, в магазине могут косо посмотреть на типа с компьютером, отбирающего лотерейные билеты - но есть способы это обойти. Например, некоторые организаторы конференций и совещаний закупают лотерейные билеты оптом на призы для участников, а потом возвращают обратно нераспроданные остатки. Вполне можно представиться таким организатором, закупить пару тысяч билетов, отобрать нужные и вернуть остаток. Ещё проще, если ты сам - владелец или работник магазина.

Шривастава говорит, что статистика выигрышей в некоторых лотереях наводит на мысль, что именно это и происходит. Вполне возможно, что кто-то натолкнулся на открытие давно - и в отличие от Шриваставы, не стал сообщать об этом лотерейщикам.

Открытие Шриваставы - подтверждение известного криптоаналитикам факта, что невозможно по-настоящему случайный процесс сделать "ещё случайнее". Вмешательство в такой процесс понижает энтропию - а значит, дает шанс тому, кто играет против него. Компания, разработавшая лотерейный билет, хотела снизить вероятность выигрыша, и для этого сделала билеты неслучайными - и тем самым повысила вероятность выигрыша.

ext_605364: geg MOPO4 (Default)

[identity profile] gegmopo4.livejournal.com 2011-02-09 04:28 pm (UTC)(link)
Это не важно, главное, что есть корреляция между наблюдаемым признаком билета и вероятностью выигрыша.

Допустим выпускаются билеты двух видов -- синие и зелёные. Среди зелёных выигрышных намного больше. Если выбрасывать "лишние" выигрышные билеты, то чаще выбрасываться будут именно зелёные. Ну и что? Тот, кто знает этот секрет и умеет отличить зелёный от синего, будет скупать только зелёные билеты (хоть их стало и меньше) и будет выигрывать чаще среднего.

[identity profile] faceted-jacinth.livejournal.com 2011-02-09 05:29 pm (UTC)(link)
> Допустим выпускаются билеты двух видов -- синие и зелёные. Среди зелёных выигрышных намного больше.

Ну и о чём тут можно говорить, если изначально есть такая утечка информации? Надо покупать зелёные.

Уменьшение процента выигрышных билетов не вносит в никаких изменений в шансы, возьмите сами пример со скажем 100 синих билетов (из которых 10 выигрышных) и 50 зелёных (из которых 30 выигрышных). Ну выкинем 9/10 выигрышных билетов не глядя на цвет. Шансы из 1/10 и 3/5 превратились в 1/100 и 3/50 соответственно. И чё?
ext_605364: geg MOPO4 (Default)

[identity profile] gegmopo4.livejournal.com 2011-02-09 06:12 pm (UTC)(link)
Так дело в том, что остальные не различают синий и зелёный и не догадываются, что есть зависимость с вероятностью выигрыша. А статистик догадался.

И чё? И то, что выбросили 9 синих и 27 зелёных, но вероятность выиграть, если брать зелёный (3/23), всё равно выше средней вероятности (6/96).

[identity profile] faceted-jacinth.livejournal.com 2011-02-09 08:05 pm (UTC)(link)
Ё. Смотрите, идея в том что изначально мы генерим билеты рандомно. Если генерить билеты рандомно, то довольно просто гарантировать, что никаких внешних признаков, отличающих выигрышные от невыигрышных, нет. Ну, взяли и гарантированно случайно раскидали цифры по полям для крестиков-ноликов, потом так же случайно выбрали секретные цифры. Там не может быть закономерностей по определению.

Всё равно можно какую-нибудь фигню сделать неподумав, конечно. Типа, может оказаться, что выигрышных билетов слишком много или слишком мало, и возникнет соблазн генерить публичную часть случайно, а секретную -- хитроумно подбирать. Так делать нельзя, но и не нужно -- в задаче вполне достаточно свободных параметров (хоть само количество допустимых чисел) чтобы подобрать дающие приблизительно нужный процент. Или допустим может оказаться, что разным публичным частям соответствуют разные количества секретных частей, делающих их выигрышными. Ну, никто не обещал, что дуракам жить на свете должно быть легко.

Тем не менее после того как мы получили генератор билетов, дающий приблизительно нужный процент статистически неопределимых выигрышных (ну, там, с точностью до пары порядков), применение к результатам олгоритма "нагенерить достаточно, выкинуть лишнее до получения точного процента" никаких дополнительных закономерностей не вносит. Более того, он устойчив в том смысле, что даже если там есть какие-то закономерности, он их гарантированно не усиливает.

Вот я и говорю, что утверждение [livejournal.com profile] scholar_vit насчёт того, что любые попытки поиграться с результатами случайного потока уменьшают его энтропию, хотя формально и верно, но в данном случае не применимо, так как грамотный олгоритм хоть и уменьшает энтропию потока, но не уменьшает энтропию отдельных билетов так, чтобы можно было статистически отличать выигрышные.

[identity profile] scholar-vit.livejournal.com 2011-02-09 08:09 pm (UTC)(link)
Ну, взяли и гарантированно случайно раскидали цифры по полям для крестиков-ноликов, потом так же случайно выбрали секретные цифры. Там не может быть закономерностей по определению.

Это утверждение неверно.

Задача: даны числа в "крестиках-ноликах". Найти вероятность выигрыша при произвольном наборе призовых чисел. Зависит ли ответ от чисел, если они могут повторяться?

[identity profile] faceted-jacinth.livejournal.com 2011-02-09 08:12 pm (UTC)(link)
> Или допустим может оказаться, что разным публичным частям соответствуют разные количества секретных частей, делающих их выигрышными. Ну, никто не обещал, что дуракам жить на свете должно быть легко.

Я предусмотрительный ^^
ext_605364: geg MOPO4 (Default)

[identity profile] gegmopo4.livejournal.com 2011-02-09 08:44 pm (UTC)(link)
Ну вы сами произнесли слова, которые хотел сказать я -- разным публичным частям соответствуют разные количества секретных частей, делающих их выигрышными. Именно так и есть в данном случае. Произошло ли это потому, что изначально так было в схеме (автор был слаб в ТВ) или позже некий Левша решил "улучшить" рандом -- другой вопрос.

Просто выкидывать выигрышные билеты не получится, если нужно гарантировать определённый процент по закону. А вот подстроиться под человеческую психологию так, чтобы количество выигрышных билетов осталось тем же, но выигрывали в массе меньше -- можно. Вот только теперь некто может играть против толпы и подбирать редковыбираемые, но частовыигрываемые билеты.