Парадокс Симпсона

Парадокс Симпсона

— Дамы и господа, я пригласил вас потому, что мы должны обсудить одну ммм... проблему, решение которой не терпит отлагательства.
 
Хольгер Эрманн, ректор Высшей переводческой школы города Эрланген, придал своему лицу серьезность, приличествующую государственному человеку. Перед ним четыре руководителя факультетов этой языковой школы: Герд Мисганг, который курирует отделение русского языка; Кэтлин Кросс, преподаватель английского языка; Франц Фоглер, представитель преподавателей испанского языка, и Ивана Кампанола от самого маленького факультета,  на  котором  преподают  итальянский  язык.  Рядом  с  ректором сидит  молодая  женщина  в  модных  очках,  с  темными  волосами, зачесанными назад. Она сосредоточенно листает стопку компьютерных распечаток. 
 
—  Вы все наверняка знакомы с госпожой Вайсер, представительницей женского комитета нашей Высшей школы. Несколько дней тому назад она обратила мое внимание на серьезную проблему, решение которой не терпит отлагательства. Госпожа Вайсер,  пожалуйста.  
—  Алина  Вайсер  призывно  оглядывает  общество, которое собралось за столом.
 
— Вероятно, вы еще не имели со мной дела и не очень грустите  по  этому  поводу.  Большинство  людей  считают,  что  меня беспокоят только такие вещи, как отсутствие дискриминирующих фраз  в  формулярах.  Это  не  основная  моя  работа,  хотя  сами  по себе такие фразы никуда не денутся.
 
Фоглер  и  Мисганг  обмениваются  взглядами,  отчего  Алина Вайсер выпрямляет спину.
 
— Вы все знаете, что в последние годы в немецких школах девушки и молодые женщины успешно догнали юношей по успеваемости  и  стали  в  среднем  получать  аттестат  зрелости  с  лучшими оценками, в том числе и в области изучения иностранных языков. И можно предположить — я тоже придерживаюсь этого мнения, — что эта тенденция продолжится и в стенах Высшей школы.
 
— Это так, — вставил Фоглер. — Во всяком случае, для моего факультета я могу это подтвердить. Мои лучшие студенты — девушки. 
—  Позвольте  мне,  пожалуйста,  договорить  до  конца,  господин Фоглер, — язвительно отвечает ему представительница женского  комитета.  —  Речь  не  идет  об  успехах  в  учебе,  речь  идет о том, что мы не предоставляем возможности многим молодым женщинам обучаться у нас.
— У нас?
— Да, у нас, — подтвердила госпожа Вайсер решительно. 
— Уже  несколько  лет  мы  находимся  в  том  счастливом  положении, когда можем сами выбирать себе учащихся. Прошли времена, когда мы должны были обращать внимание только на средний балл в аттестате зрелости.
— Давно пора, — подал голос ректор Эрманн.
— Однако весомость школьных оценок — это же... так сказать...
— По сути они ничего не значат, — подсказывает Фоглер. — Но само собой разумеется, что языковая школа подбирает студентов по их способностям к обучению языкам. А как же еще?
 
Госпожа Вайсер напоминает: 
 
— В теории это звучит прекрасно. Но действительно ли мы отбираем согласно квалификации? В этом у меня есть сомнения, и довольно основательные.
 
Никто из сидящих за столом не понял, о чем она говорит, поэтому ей пришлось выразиться яснее: 
 
— У нас дискриминированы женщины.
—  Когда?  Как?  Чем?  —  спрашивает  Кэтлин  Кросс  озадаченно.
—  Для  того  мы  сегодня  и  собрались  здесь,  дорогие  коллеги, — приторно отвечает госпожа Вайсер, — чтобы убедиться в этом.
 
За  столом  возникло  волнение  и  послышался  возмущенный ропот.
 
— Прошу вас, коллеги, — призывает ректор. — Давайте же позволим  госпоже  Вайсер  спокойно  привести  свои  доказательства. Продолжайте, пожалуйста, госпожа Вайсер.
 
Не  без  некоторой  доли  драматизма  представительница  женского комитета вынимает из своей папки документ.
 
— В последний зимний семестр нам подали заявление о приеме на учебу 2175 юношей и 849 девушек.
— У нас нет никакой возможности влиять на то, кто подает нам заявление о приеме, — добавляет ректор.
— Речь идет даже не о количестве подавших заявления о приеме, хотя я думаю, что не помешало бы нам в дальнейшем ярче подчеркивать, что могут именно женщины ожидать от обучения в нашем университете. 
 
Ректор Эрманн играет с цепочкой своих очков и не замечает того призывного взгляда, который посылает ему госпожа Вайсер. 
 
Она продолжает: 
 
— Поговорим о квотах приема в университет. Из подавших заявление о приеме юношей были приняты 47%, а из девушек — только  31%. Разница  слишком  велика,  чтобы  быть  случайной. В последние три года цифры были примерно такими же. — Некоторое время она ожидает реакции на свои слова и с удовольствием констатирует, что они произвели впечатление.
 
— Из этого я делаю вывод, что при приеме предпочтение оказывается мужчинам. И поскольку я не могу себе представить, что мужчины в таком количестве более квалифицированны, считаю, что это представляет для нас проблему.
 
Первой  нарушила  молчание  Ивана  Кампанола.  С  приятным итальянским акцентом она сказала: 
 
— Только не у нас. В прошлом семестре мы смогли принять только 46 студентов, из них половина женщин и половина мужчин, а заявлений было в десять раз больше. А квоты... минуточку..., — она перелистала потертый блокнот.— Вот, были приняты 6% мужчин и 7% женщин из числа тех, кто подал заявление. Другие тоже стали перелистывать свои документы — никто не хотел принять на себя обвинение в дискриминации женщин.
 
—  На  факультет  английского  языка  мы  принимаем  много больше  кандидатов,  мы  же  факультет  массовый,  —  сообщает Кэтлин Кросс. — Более 600 учащихся каждый год. К мужчинам мы были повышенно критичны. Из подавших заявление на обучение получили место 62% мужчин и 82% женщин.
 
Это  впечатляющие  данные;  Кэтлин  Кросс  удалось  передать черную метку дальше. Теперь была очередь обоих руководителей факультетов — мужчин — представлять отчет. Начал Мисганг: 
 
—  Я  не  знаю,  почему  так  мало  женщин  интересуется  русским  языком.  Возможно  потому,  что  русский  не  очень  сексуален. — Он выжидательно осматривается по сторонам, не находит нигде поддержки и, вздохнув, продолжает. 
— Заявление о приеме подали  650  мужчин  и  только  25  женщин.  Но  квоты  по  приему были и в этом случае для женщин выше: 68% среди женщин против 63% среди мужчин. Так что в дискриминации виноват не я. Ситуация выглядит не очень хорошо для моего уважаемого коллеги Фоглера.
— Вам бы не помешало проявить больше мужской солидарности,  коллега,  —  ответил  профессор  испанского  языка.  Между прочим, на последнем заседании глав факультетов он предположил,  что  пора  бы  уже  ввести  должность  уполномоченного  и  по правам  мужчин.  
—  Вот  мои  данные:  792  заявления,  мужчин  на несколько человек больше, чем женщин. Места получили 35% заявителей-женщин и 33% заявителей-мужчин.
 
Ни  у  кого  больше  нет  желания  подшучивать,  преобладает скорее  всеобщая  растерянность,  поскольку  никакого  сомнения  в приведенных данных нет.
 
Ректор берет слово: 
 
— Результаты говорят сами за себя. На всех четырех факультетах процент принятых среди женщин выше, чем среди мужчин. Это, собственно, повод для обращения в прессу и полностью противоречит тому курсу, против которого — с присущим ей очарованием — предостерегала нас уважаемая госпожа Вайсер.
 
Все взгляды обратились на представительницу женского комитета. Невысказанный вопрос был ей вполне понятен. 
 
— Мои показатели правильны, — шипит она, — по крайней мере, они актуальны, получены только сегодня утром в секретариате из компьютера. Но я согласна: общий результат совершенно необъясним.
 
Фогель  думает:  «Результат  необьясним?  По-моему,  ты  сама себе вырыла яму, девочка». Эрманн подводит итог: 
 
— Это действительно звучит немного парадоксально. Я предлагаю пока отложить эту тему. В следующую среду мы все опять встретимся, и я приглашу прийти господина Вайнгартена из вычислительного центра. Для этого человека числа — основа его существования. По этому случаю мне припомнилось классическое высказывание Черчилля: «Не доверяй статистике, которую ты не сам подделал».
 
— Протестую! — возразила ему Кэтлин Кросс. — Это немецкий миф. Это высказывание не принадлежит Черчиллю, во всяком случае,  это  остроумное  выражение  у  нас  в  Англии  совершенно неизвестно.
 
Парадокс господина Симпсона
 
Профессору  Эрманну  данные  показались  парадоксальными.  Такие  странные  результаты  в  математике  называют  «парадоксом Симпсона».  Математик  Эдвард  Симпсон  впервые  описал  его  в 1951 году, объяснить его несложно.
 
Прежде  чем  обратиться  к  женским  вопросам,  рассмотрим один  простой  пример.  Два  спортсмена,  А  и  В,  участвуют  в  своего рода упрощенном триатлоне, в котором они должны сначала бежать,  а  потом  плыть,  в  общей  сложности  10  км.  Спортмен  А бегает  со  скоростью  15  км/ч,  а  спортмен  В  медлительнее,  он бежит  со  скоростью  только  12  км/ч.  Плывет  А  тоже  быстрее  В:  4 км/ч против 3 км/ч. Несмотря на это, спортмен В преодолевает весь путь за 1 час 40 минут, а спортсмену А требуется 2 часа и 8 минут, это гораздо больше. Как же так? 
 
Дело  в  том,  что  у  обоих  атлетов  спортивные  дисциплины были по-разному распределены. А должен был пробежать 2 км и проплыть 8 км, а В — наоборот! И поэтому неудивительно, что В пришел к цели раньше, хоть его показатели в каждой из дисциплин были хуже, чем у А.
 
Эту  ситуацию  можно  представить  на  графике  зависимости времени от расстояния для А (черный цвет) и В (серый цвет).
 
 на  графике  зависимости времени от расстояния
 
Наклон участка на графике соответствует скорости: чем круче наклон, тем выше скорость. На графике видно: хотя и участок, обозначенный Б (бежать), и участок, обозначенный П (плыть), у А круче, В в целом все же быстрее. 
 
Что и неудивительно, ведь такое состязание нечестно. Так же обстоит дело в истории с поступающими в Высшую переводческую школу. Данные здесь настоящие: в 1970-х годах в калифорнийском университете Беркли шли дискуссии о том, что женщин якобы дискриминируют. В научном журнале «Science» даже вышла статья, доказывающая, что все дело тут в парадоксе Симпсона.  Я  просто  привел  данные  из  этой  публикации  по  четырем факультетам, правда, изменив имена руководителей факультетов. 
 
 на  каждом  факультете  процент принятых  женщин  выше,  чем  процент  принятых  мужчин
 
Еще  раз  можно  убедиться:  на  каждом  факультете  процент принятых  женщин  выше,  чем  процент  принятых  мужчин, но в сумме женщины проигрывают — лишь 31 процент из них поступают. Означает ли это, что женщин дискриминируют? Возвращаясь к спортсменам: заставляют ли женщин плавать там, где мужчинам разрешено бегать?
 
В действителъности дело в том, что женщины в большинстве своем выбирают «трудные» факультеты. Из таблицы видно, что на аглийский  факультет  принимают  большинство  кандидатов  (около 64%), а на итальянский — только 6,5%. Но если мужчины тяготеют к факультетам с большими шансами («бег»), то женщины к двум более трудным («плавание»). Неудивителъно, что в сумме проходит меньшая доля женщин. Это тоже можно представить на рисунке.
 
Проценты приема и крутизна кривых
 
Для сравнения кривая для женщин на этом графике масштабирована по-другому, она так же широка, как и кривая для мужчин. Проценты приема и крутизна кривых при этом сохраняются.
 
Из графика видно: отдельные участки у женщин имеют больший наклон, но средний наклон меньше! Во  всех  вариантах  парадокса  Симпсона  есть  «скрытый  параметр» — некое обстоятельство, не учтенное при объединении данных. У спортсменов — это неравные доли плавания и бега, в случае с университетом — это неодинаковые предпочтения кандидатов. 
 
Такое дополнительное условие часто бывает трудно заметить. Вот еще пример из жизни: американские авиалинии каждый год публикуют «таблицы точности». В них на 30 избранных аэродромах изучается количество опозданий. Судя по таблице, компания American  West  (теперь  она  поглощена  US  Airways)  всегда  была лучше, чем Alaska Airlines. Следует ли из этого, что первая компания пунктуальнее второй? 
 
«Скрытым параметром» в данном случае является частота посещения аэропортов самолетами авиакомпании. У каждой компании есть свои «центры» — главные аэропорты, из которых линии в другие города расходятся подобно звезде. У American West это Феникс, Аризона — там небо всегда безоблачное. У маленькой же Alaska Airlines, которая вообще летала только на пять аэродромов из  30,  перечисленных  в  списке,  это  Сиэттл,  расположенный  на крайнем севере и почти всегда скрытый туманом. Так выглядели результаты компаний в 1991 году для тех аэропортов, которые посещались обеими компаниями:
 
На  всех  пяти  аэродромах  показатели  Alaska  Airlines  лучше, тем не менее в сумме лучше показатели American West
 
На  всех  пяти  аэродромах  показатели  Alaska  Airlines  лучше, тем не менее в сумме лучше показатели American West. Но какой взгляд лучше: общий или детальный? И тут следует определенно  сказать:  безусловно  детальный.  Он  показывает,  что  маленькая авиакомпания пунктуальнее как в хорошую, так и в плохую погоду. Пример  с  биатлоном  тоже  можно  отмести  как  нечестный. 
 
Ну а что делать с университетом? На вопрос «дискриминируют женщин или нет?» нужно заметить: женщины ведь сами выбрали, на какой факультет подать заявку, они сами выбрали трудный путь, и университет в этом не виноват. Единственное, что можно сделать, — это либо расширить факультеты, на которые многие женщины подают заявки (что маловероятно, учитывая современный спрос на языки), либо лучше ориентировать женщин перед подачей заявки, но это уже вне пределов математики.
 
Результат: из общей картины нельзя вывести факт дискриминации. Дополнительная информация переворачивает эту картину вверх ногами, при этом гораздо точнее отображая реальность.
 
Теперь  ваша  очередь.  Следующая  таблица  показывает данные  реального  исследования,  которое  проводилось в Великобритании между 1972 и 1994 годами. Его цель — изучить  зависимость  случаев  смертельных  исходов  у  курящих и некурящих. В каждой возрастной группе наблюдали, сколько курящих и сколько некурящих умерли через 20 лет. Получили следующие результаты:
 
данные говорят о том, что курящие живут дольше некурящих
 
Выделенные жирным шрифтом данные говорят о том, что курящие живут дольше некурящих! Корректна ли такая интерпретация?

«Счастье дается только знающим. Чем больше знает человек, тем резче, тем сильнее он видит поэзию земли там, где ее никогда не найдет человек, обладающий скудными знаниями»

Константин Паустовский

Файлы

Головоломки проблемы сознания: концепция Дэниела Деннета

Возможности вычислительных машин и человеческий разум

Психология критического мышления

Устройство нашей Вселенной