scholar_vit: (Default)
[personal profile] scholar_vit

Одна из моих любимых книг - The Visual Display of Quantitative Information, Edward R. Tufte. Тьюфт очень подробно рассматривает изысканное искусство рисовать графики и диаграммы (если вы думаете, что эту премудрость вы и так знаете, почитайте - не пожалеете!). Одна из глав этой книги посвящена честности - и её противоположности. Автор разбирает приёмы передёргивания на диаграммах, приводя примеры из газет и показывая, как сбитый ноль или замена двумерных пропорций одномерными позволяет манипулировать представлениями читателя. Он ранжирует газеты по степени вранья. В отдельный, совершенно особый класс, у него попала газета "Правда" начала 1980-х годов: практически диаграммы в этом издании старались обмануть читателя. С тех пор прошло много времени, но традиции советской журналистики живы. Недавно опубликованные результаты мониторинга ФОМ украинской политики это блестяще доказывают.

Итак, посмотрим на карты, опубликованные на сайте ФОМ. Я прошу обратить внимание на те из них, где представлен уровень доверия населения к политикам. Так и написано: "Доверяют В. Януковичу", "Доверяют В. Ющенко", "Доверяют Ю. Тимошенко". Для удобства карты раскрашены в контрастные цвета: зелёные оттенки, если доверяют, жёлтые, если не доверяют. Очень красиво сделанные карты. Они показывают, что Украина безнадёжно расколота: западные области не доверяют Януковичу, но доверяют Ющенко и Тимошенко и наоборот. Рыжий свет на одних картах соответствует зелёному на других. Такая вот взаимная дополнительность. Доверие к одному сочетается с недоверием к другому. Два мира, два Шапиро.

У этой замечательной картинки есть только один недостаток. Она не имеет отношения к действительности. Как заметила глазастая [livejournal.com profile] ella_p, на самом деле цвета на разных картах соответствуют разным уровням доверия. На карте, посвящённой Януковичу, переход од рыжего к зелёному происходит на уровне 14-36%, на карте, посвященной Ющенко - 28-40%, на карте, посвящённой Тимошенко - 30-37%. Так же сдвинуты остальные цвета. Если бы шкала была постоянной, то вместо картинки расколотой Украины появилась бы совсем другая картинка: страна, где Януковича реально поддерживает только несколько областей (но там поддерживают, по-видимому, единодушно, выводя его на относительно высокий средний уровень). Страна, где разочарование в Ю и Т (там, где оно было) вовсе не вылилось в поддержку их противников. В общем, совсем не то, что хочет сказать ФОМ. Более того, совершенно очевидно, что задача сказать именно это была в уме у картографов до изучения данных: сначала была нарисована карта расколотой Украины, а уже потом под неё подгонялись шкалы на каждой картинке. Как нерадивый студент подгоняет под ответ измерения на лабораторной работе.

На мой взгляд, самое печальное в этой истории - это реакция замечательной [livejournal.com profile] ella_p. Она вначале посчитала этот обман "тонкостью оформления", и лишь потом признала, что имели место манипуляция и передёргивание - но и это не представлялось ей большим грехом. Это глубокое убеждение и авторов, и читателей, что и газета, и социологический центр - прежде всего коллективный агитатор и пропагандист, - и есть самое тяжёлое наследие советской журналистики.

Crossposted to [livejournal.com profile] correctura

Date: 2006-02-02 04:40 am (UTC)
From: [identity profile] ezoran.livejournal.com
Самое забавное, что "ответственные товарищи" будут по таким картам ориентироваться во время грядущей избирательной кампании! С соответствующим КПД. А потом объяснять результаты "происками".

Date: 2006-02-02 03:55 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
Переход обмана в самообман - это очень интересная штука. Яркий пример тут - польская кампания времён гражданской войны. Идея идти двумя колоннами, за которую во времена оттепели долго ругали Сталина, на самом деле вполне разумна - ЕСЛИ исходить из того, что поляки мечтают о социалистической революции. Две колонны идут ножницами, а революционный пролетариат устраивает мятёж между лезвиями. Фишка в том, что поляки об этом имели совсем другое мнение. Пропаганда о большевистских симпатиях поляков обманула самих обманщиков.

Date: 2006-02-02 04:42 am (UTC)
From: [identity profile] ppl.livejournal.com
Совершенно замечательный пример.

Date: 2006-02-02 11:38 am (UTC)
From: [identity profile] ivanov-petrov.livejournal.com
Предлагаю общую формулировку проблемы: Не карты красят человека, а человек красит карты.

Date: 2006-02-02 04:36 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
Мне больше нравится пасхальный вариант: не яйца красят человека, а человек яйца.

Date: 2006-02-02 07:01 pm (UTC)
From: [identity profile] ivanov-petrov.livejournal.com
Меж ними существенное различие: яйца требуют для различения минимально двух цветов, а карта - четырех. Карта вдвое менее экономна. чем яйца - если я. конечно. не заблудился в подсчете

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-02 07:47 pm (UTC) - Expand

(no subject)

From: [identity profile] ivanov-petrov.livejournal.com - Date: 2006-02-02 08:05 pm (UTC) - Expand

Не верю я в конспирологию.

Date: 2006-02-02 11:45 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Это - хуже, чем преступление, это - ошибка, как говаривал Талейран.

Насколько я могу судить (а у меня и некоторый опыт, и некоторое образование по части построения картограмм есть), мы здесь имеем не намеренную подтасовку, а элементарную техническую безграмотность.
Взял человек какой-то примитивный инструмент вроде Excel и стал картограммы рисовать. Каждую по отдельности, но с использованием общей цветовой шкалы. Эта софтина по каким-то своим соображениям разбила каждый ряд на пять интервалов, а человек не проверил, и не позаботился (а может и интерфейс там был настолько ублюдский, что это было сделать трудно).

Одна из причин, почему я думаю именно так, это то, как отличаются интервалы на картах про Тимошенко и Ющенко. Если бы была намеренная подтасовка, то человеку вряд ли пришло бы в голову делать
на одной карте от 30 до 37, а на другой - от 28 до 40. Человек бы обе границы интервала в одну сторону сместил.
From: [identity profile] mi-b.livejournal.com
если сравнить три карты, то для каждого цвета число областей данного цвета отличается не более, чем на 1. что заставляет меня думать, что алгоритм выбора интервалов пытается сохранять постоянным информацию, содержащуюся в каждой раскраске. Довольно разумный принцип.

Поэтому мне кажется, что единственный конспирологический вопрос - это почему выбран именно этот принцип, а не какой-нибудь другой, например, единый между тремя картами.
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Вы привели замечательный аргумент в поддержку моей точки зрения. Я-то контура считать поленился.
Собственно, если "разумный принцип" выставлен в программе в качестве умолчания, программа, которая, естественно, ничего не знает о том, что эти три картограммы между собой содержательно связаны, нарисует именно так.

Более того, скорее всего в программе не предусмотрена возможность сказать "вот эти три картграммы на одну территорию показывают величины одинаковой размерности, и должны использовать единую систему интервалов". Вероятно, там есть возможность создать равномерную/логарифмическую шкалу с явно указанными пределами, или ввести границы интервалов вручную. Но это же надо сначала головой подумать, а потом несколько кнопок нажать.
From: [identity profile] scholar-vit.livejournal.com
http://scholar-vit.livejournal.com/78856.html?thread=1872904#t1872904

Я ещё готов поверить, что человек нарисовал нечто в плохом инструменте, но оставил без изменений, потому что результат был таким, "как надо". Но что это "как надо" получилось случайно - это надо напрячься, чтобы поверить.
From: [identity profile] scholar-vit.livejournal.com
Да, вариант с безграмотностью тоже существует. Но, если честно, мне очень трудно вообразить, как люди, много лет занимавшиеся представлением численных данных, настолько непрофессиональны. Аргумент с 37% (как и аргумент [livejournal.com profile] mi_b про алгоритм) выглядит убедительно, но опять же - а вдруг картографу надо было закрасить как раз область с 37%? И ещё, я Экселом, понятно, не пользовался, но неужели программисты в Микрософте настолько плохи? Я ведь тоже не из лесу вышел, и программки, закрашивающие карты, когда-то и сам писал (приятели в НАСА говорят, они там до сих пор бегают). Выбор "круглого" интервала для цвета - это первое, о чём думаешь, это на автомате. И почему у них цвета такие контрастные, как правильно заметил [livejournal.com profile] yba, маленькая разница - и цвет резко меняется с зелёного на оранжевый?

Я ещё готов поверить, что человек нарисовал нечто в плохом инструменте, но оставил без изменений, потому что результат был таким, "как надо". Но что это "как надо" получилось случайно - это надо напрячься, чтобы поверить.
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Оторвался ты в своих НАСАх от российских реалий. У нас и в лучшие-то времена смежным специальностям учили плохо. Например, у нас на кафедре не было курса по Sampling planning. Я и русского термина-то для этого не знаю. А это МГУ. Картографии нас учили - благо специальность почти прямая, но почти уверен что на психфаке или откуда там у нас нынче социологи берутся, ей не учили.

Кроме того, в организациях подобных ФОП-у работают как правило не то чтобы лучшие кадры.

Программисты у Микрософта хорошие. Даже очень хорошие. А вот постановщики задач там, мягко говоря, странные. Их продукты рассчитаны на совршенно определенную аудиторию, поэтому, например, метод наименьших квадратов в excel делается через задницу (хотя в более ранних таблицах вроде Lotus или Quattro - делается прямо). Изготовление ажно трех ВЗАИМОСВЯЗАННЫХ диаграмм явно выходит за пределы возможностей целевой аудитории MS, поэтому и не предусмотрено.

А соторудники ФОМ наверняка про эти продукты знают только то, что написано в книге "для дубовых чайников за 21 минуту", где более-менее сложные вещи не затрагиваются. И уж точно не затрагиваются вопросы консистенности получаемого результата.
From: (Anonymous)
Подтасовка не на уровне раскрашивания карт (это безграмотность элементарная), а на уровне соцю опросов. Они, в большинстве своем непрезенатативны в силу возрастных ососбенностей распределения доверия. Да и сама по себе постановка вопроса не верна.
"Есть собаки белые и черные.
- Вы за белых?-- Нет.
- Пишу за черных. -- Подождите, подождите, я за серых.
- Извините, такого цвета нет, да и вписал я вас уже. До свидания."

А вы тут про эксел....
--
GVF

Date: 2006-02-02 03:54 pm (UTC)
From: [identity profile] ella-p.livejournal.com
Мы с вами не сошлись не столько в оценке происходящего, сколько в определениях. То есть, я ведь мягко попеняла ФОМу ровно за то же самое, за что Вы его с наслаждением ошельмовали, не так ли?

Мои определения такие:

Передергивание - изложение реальных фактов в наиболее удобной излагающему подаче. Например, сделать одинаковые карты с разными легендами (возможно, как пишет витус_вагнер, просто невольное передергивание, но всяко оно самое), или когда человек пишет "ella_p" признала то-то и то-то": я действительно сказала именно то, что вы пишете, но слово "признала", гм, на мой взгляд не является самым естественным описанием ситуации; хотя притянуть его за уши тут, бесспорно, можно.

Вранье - изложение фактов, не имевших места быть, или выражение уверенности, для которой нет достаточных фактических оснований. Например: "совершенно очевидно, что задача сказать именно это была в уме у картографов до изучения данных" - здесь неправда в словах "совершенно очевидно", тогда как на самом деле речь идет о вашей экстраполяции чужих намерений. Или: "Это глубокое убеждение (...) что и газета, и социологический центр - прежде всего коллективный агитатор и пропагандист" - тут вы с уверенностью приписываете другим людям глубокие убеждения, в то время как на самом деле можете об убеждениях только догадываться.

Называть вещи своими (а не самыми гнусными из возможных) именами имеет смысл просто ради того, чтобы не терять координат. Например: передергивать, конечно, очень нехорошо, но врать - намного хуже.

Date: 2006-02-02 05:02 pm (UTC)
From: [identity profile] bobtenelli.livejournal.com
Шельмование оппонента - приём распространенный, но чести Вам не делающий.

Date: 2006-02-02 06:23 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
А в каком смысле ФОМ мне оппонент? У меня нет лошади на этих скачках, и спорить о настроениях Украины я не собирался. Единственное, за что я в данном случае стою - за честность в изложении фактов. Если Вы полагаете, что ФОМ мне в этом оппонент - тогда да. "Ты сказал".

Date: 2006-02-02 05:23 pm (UTC)
From: [identity profile] bakhtin.livejournal.com
Я лет 5 назад в журнале Chance читал статью какого-то западного статистика (может, и того-же Тафта, не помню), где он рассказывал, как решил найти какие-нибудь статистические передёргивания у Ленина (что там газета "Правда"!)для рассказов студентам. И он вместо этого нашёл грамотное использование статистики Лениным и якобы два гениальных примера графической подачи информации, которые всегда теперь рассказывает студентам. Я один из этих примеров помню, а второй забыл. Но даже тот, что помню, в комменте мне не нарисовать. Сайт журнала --- http://www.amstat.org/publications/chance/ , но на нём только избранные статьи, а жаль. Посмотрю в библиотеке...

Date: 2006-02-02 07:35 pm (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Ленин вообще был бы неплохим эконом-географом, если бы не лез в политику, а особенно - в философию.

Date: 2006-02-02 07:40 pm (UTC)
From: [identity profile] syarzhuk.livejournal.com
Расскажите тот, что помните, интересно же

Date: 2006-02-02 05:44 pm (UTC)
From: [identity profile] bakhtin.livejournal.com
Мне, кстати, не кажется, что с этими картами произошла ГРУБАЯ подтасовка. Вывода о расколе, конечно, сделать нельзя, но ведь "некоторый тренд есть", не так ли? Пороги явно были выбраны именно для большей контрастности (и, возможно, автоматически). То есть каждого цвета на каждой карте по 4-6 областей, в основном по 5. Чтобы карта цветастей получилась. Так иногда делают, если хотят подробнее информацию представить --- разбивают по квантилям (возможно, с учётом населённости).

Это не оправдание недобросовестности составителей. Карта всё-таки преувеличивает существуюшую контрастность.

Date: 2006-02-02 06:36 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
Я про ФОМ мало что знаю, поэтому буду говорить про то, что помню: про СССР. Там были издания, которые говорили неправду грубую и очевидную. А были издания, которым позволялось сохранять респектабельность и ради этого подтасовывать не очень грубо. Такие вот как бы оппозиционеры. И вроде не совсем правду сказали, но соврали вроде бы не так уж чтобы очень.

Date: 2006-02-02 06:01 pm (UTC)
From: [identity profile] m-p.livejournal.com
ой. на самом деле, это стандартный подход к картам, и он чисто эстетический - шкалы выбираются в зависимости от возможного результата. в данном случае метод quantiles (фактический range или даже 0-100% делится на равные части) эстетически (да и логически) неприемлем - в более высокую категорию попадет слишком мало областей, и карта будет "плохо выглядеть". Тут, похоже, был выбран другой метод - equal count, когда общее имеющееся количество областей (minimum mapping units) поделены на желаемое количество категорий (bins) (по выбору картографа - тут, вроде, 5, я не обратила внимания), а соответствующие mins and maxs категорий посчитаны автоматически картографическим пакетом (что они там использовали - какой-нибудь ArcView), и для разных распределений они получатся разными. Это нормально - на карте важней относительные различия (тут меньше, там больше), чем абсолютные. Я подозреваю, что намеренного обмана не было.
Есть и другие способы, например, custom intervals - которые можно было бы в данном случае использовать, но это более сложный подход.
Для конкретного случая карт есть интересная книжка How to Lie with Maps. :)

Date: 2006-02-02 06:41 pm (UTC)
From: [identity profile] scholar-vit.livejournal.com
Ну хорошо, будем соблюдать презумпцию невиновности. Никто никого не обманывал, а помещенные рядом карты случайно рисовали в разных шкалах. Чтоб красивше получалось.

Практический вывод, однако, будет тот же, что и из гипотезы злонамеренности: графикам ФОМ доверять нельзя. То ли потому, что они сознательно обманывают, то ли потому, что такие безграмотные, что не понимают, что у карт, помещенных РЯДОМ, интервалы должны быть одинаковы.

Date: 2006-02-02 07:41 pm (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Все гораздо хуже. Не только выводам ФОМ доверять нельзя, поскольку если они допускают такие ляпы в оформлении результатов, кто сказал что они не допускают аналогичных ляпов в сборе материала.

А вот насчет того что у карт, помещенных РЯДОМ интервалы должны быть одинаковы, ты не прав. Дело не в том, что эти карты РЯДОМ, дело в том что они отображают СРАВНИМЫЕ параметры.

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-02 08:50 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-02 08:03 pm (UTC) - Expand

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-02 09:12 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-02 10:40 pm (UTC) - Expand

(no subject)

From: [identity profile] wandering-.livejournal.com - Date: 2006-02-02 11:16 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 12:25 am (UTC) - Expand

(no subject)

From: [identity profile] wandering-.livejournal.com - Date: 2006-02-03 12:59 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 02:24 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 02:40 am (UTC) - Expand

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-03 04:59 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 03:38 pm (UTC) - Expand

(no subject)

From: [identity profile] wandering-.livejournal.com - Date: 2006-02-03 08:52 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 03:53 pm (UTC) - Expand

(no subject)

From: [identity profile] wandering-.livejournal.com - Date: 2006-02-03 07:10 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 07:23 pm (UTC) - Expand

(no subject)

From: [identity profile] wandering-.livejournal.com - Date: 2006-02-03 09:30 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 03:28 pm (UTC) - Expand

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-03 07:56 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 08:17 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-03 08:41 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-03 08:48 pm (UTC) - Expand

(no subject)

From: [identity profile] scholar-vit.livejournal.com - Date: 2006-02-03 09:32 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-04 11:34 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-04 12:10 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-04 12:22 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-04 01:07 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-04 02:08 pm (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-06 04:13 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-06 05:47 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-06 09:54 am (UTC) - Expand

(no subject)

From: [identity profile] m-p.livejournal.com - Date: 2006-02-06 01:25 pm (UTC) - Expand

(no subject)

From: [identity profile] myjj.livejournal.com - Date: 2006-02-07 03:21 pm (UTC) - Expand

Profile

scholar_vit: (Default)
scholar_vit

January 2019

S M T W T F S
  12345
678 9101112
13141516171819
20212223242526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 12th, 2026 03:48 pm
Powered by Dreamwidth Studios