Подобное происходит с землетрясениями, пожарами и наводнениями, что усложняет страховым компаниям задачу управления рисками. Такая же математическая модель описывает число погибших в результате войн и террористических атак, а также другие, гораздо более мирные вещи, такие как количество слов в романе или число сексуальных партнеров у человека.
Хотя прилагательные, используемые для описания длинных хвостов, выставляют их в не слишком выгодном свете, «хвостатые» распределения гордо несут свои хвосты. Жирный, тяжелый и длинный? Да, это так. Но в таком случае покажите, какой нормальный?
23. Шансы — это…
Вам когда-нибудь снился страшный сон, будто вам нужно сдать экзамен по предмету, который вы не изучали? Преподавателям обычно снятся «противоположные» сны: что они читают лекцию по дисциплине, о которой ничего не знают.
Такое случается со мной, когда я веду курс теории вероятностей94. Меня никогда ей не учили, и то, что мне приходится читать лекции по этому предмету, — страшно, смешно и очень похоже на дом с привидениями в парке развлечений.
Однако чаще всего мое сердце колотится, когда я сталкиваюсь с темой условной вероятности, то есть вероятности того, что некое событие А произойдет при условии, что произойдет некое событие B. Это скользкое понятие легко спутать с вероятностью наступления B при условии A. Однако это разные вещи, и нужно быть очень внимательным при вычислении их вероятностей. В качестве примера рассмотрим следующую задачу.
Прежде чем отправиться на недельный отдых, вы просите приятеля поливать ваши комнатные цветы, которые и так еле живы. Если их не поливать, то вероятность того, что они погибнут, составит 90%. Если поливать регулярно, то вероятность их гибели будет равна 20%. Вероятность того, что ваш друг забудет их полить, составляет 30%. Вопрос А: какова вероятность того, что ваши растения не погибнут за эту неделю? Вопрос В: если по возвращении вы обнаружите, что они засохли, какова вероятность того, что ваш друг забыл их полить? Вопрос С: если ваш друг забыл их полить, какова вероятность того, что они погибнут к вашему возвращению? Хотя вопросы В и С звучат похоже, они разные. В действительности в условии задачи уже содержится ответ на вопрос С — 90%. Однако как учесть все вероятности, чтобы получить ответы на вопросы В и А?95
Естественно, на протяжении нескольких первых семестров преподавания этой темы я засел за книги и стал делать медленные, но верные успехи. И постепенно начал кое-что замечать. Многие мои студенты не использовали теорему Байеса, которой я их обучал, а решали задачу равноценным способом, казавшимся им более простым.
Открытия, год за годом совершаемые изобретательными студентами, стали для меня лучшим способом размышления над условными вероятностями. В предложенных способах решения студенты прибегали к помощи интуиции, вместо того чтобы отвергать ее. Трюк состоял в том, чтобы мыслить натуральными числами, а не абстрактными категориями, такими как процентное соотношение, шансы или вероятности. Как только вы перестроите свое сознание, туман рассеется.
Это главная идея захватывающей книги Calculated Risks («Просчитанные риски») Герда Гигеренцера, когнитивного психолога из Института человеческого развития Макса Планка в Берлине. В ряде исследований, посвященных медицинским и правовым проблемам, от консультаций больных СПИДом до анализа ДНК по отпечаткам пальцев, Гигеренцер изучает заблуждения при подсчетах рисков и неопределенности. Однако вместо того чтобы брюзжать и оплакивать человеческую слабость, он демонстрирует, как избежать заблуждений, переводя задачи условной вероятности на язык натуральных чисел, подобно тому как это делали мои студенты.
В одном из исследований Гигеренцер и его коллеги проводили опрос врачей в Германии и США, в ходе которого просили оценить вероятность того, что женщина с положительной маммографией больна раком груди, даже если она входит в группу с низким уровнем риска, то есть ее возраст от 40 до 50 лет, отсутствуют симптомы и наследственная предрасположенность96. Чтобы конкретизировать вопрос, врачей также просили привести следующую статистику в процентах и степени вероятности: данные о распространенности рака груди среди женщин этой категории, а также о чувствительности маммографии и вероятности ложноположительных результатов.
Вероятность того, что у одной из этих женщин рак груди, составляет 0,8%. Если же женщина действительно больна, то вероятность того, что ее маммография будет положительной, равна 90%. Тем не менее, если женщина здорова, вероятность того, что ее маммография окажется положительной, составляет 7%. Допустим, у женщины положительная маммография. Какова вероятность того, что она действительно больна раком груди?
Гигеренцер описывает реакцию первого опрошенного им врача, заведующего отделением университетского госпиталя, имеющего более тридцати лет профессионального опыта.
Было очевидно, что он очень нервничал, пытаясь проанализировать все цифры. И в конечном итоге пришел к выводу, что вероятность того, что у женщины рак груди, при условии положительной маммографии, составляет 90%. Он нервно добавил: «Боже, полный абсурд. Я не могу с этим согласиться. Попробуйте задать вопрос моей дочери, она учится на врача». Он знал, что его оценка ошибочна, однако не знал, как это аргументировать. Потратив 10 минут на обдумывание ответа, он не смог просчитать, какое заключение сделать из имеющихся вероятностей.
Гигеренцер задал тот же вопрос двадцати четырем немецким врачам; их оценки варьировались от 1 до 90%. Восемь посчитали, что вероятность составляет 10 и менее процентов, еще восемь назвали результат 90%, а предположения еще восьмерых колебались в пределах 50–80%. Представьте, каково было бы пациентке слышать столь противоречивые мнения.
Что касается американских врачей, девяносто пять из ста решили, что вероятность того, что женщина больна, равна примерно 75%.
Правильный ответ: 9%.
Как получилось, что процент столь низкий? Гигеренцер утверждает, что анализ становится практически прозрачным, если перевести исходную информацию из процентного соотношения и вероятностей в натуральные числа возможных исходов.
У восьми женщин из тысячи рак груди, причем у семи из них положительная маммография. Среди оставшихся 992 женщин положительную маммографию будут иметь примерно 70. Возьмем женщин, обследование которых дало положительный результат. Сколько из них действительно больны раком груди?
Так как всего в группу риска попало 77 (7 + 70 = 77) женщин — но только семь из них на самом деле больны раком груди, — вероятность того, что у женщины рак груди, при условии положительной маммографии, составляет 7 из 77, или 1 из 11, то есть примерно 9%.
Отметим два упрощения в приведенных выше подсчетах. Во-первых, мы округлили десятые доли до целых чисел. Так бывает в случаях, подобных тому, где мы сказали «Из восьми женщин, больных раком груди, семь имеют положительную маммографию». В действительности надо было сказать: 90% из 8 женщин, или 7,2. Таким образом, мы немного пожертвовали точностью для большей ясности изложения.
Во-вторых, мы исходили из того, что все происходит именно с той частотностью, которая предполагается данной вероятностью. Например, поскольку вероятность рака груди составляет 0,8%, мы предположили, что им больны именно 8 женщин из 1000 нашей гипотетической выборки. Но эти цифры могут не совпадать с реальностью. События не обязаны соответствовать вероятности своего наступления, ведь, если подбросить монетку 1000 раз, необязательно 500 раз выпадет орел. Но, решив, что так и будет, мы получим правильный ответ для подобных задач.
Обычно такая логика считается несколько сомнительной, поэтому ученые мужи смотрят свысока на данный подход в сравнении с более строгой, но сложной в использовании теоремой Байеса. Однако ясность ответа является достаточным аргументом для его применения. Когда Гигеренцер провел повторный опрос еще среди двадцати четырех врачей, на этот раз используя целочисленные вероятности, практически все ответили правильно.
Хотя перевод данных в натуральные числа возможных исходов оказывает нам огромную услугу, задачи по условной вероятности могут ставить в тупик по другим причинам97. Здесь существует опасность неверной постановки вопроса или подсчета правильной, но вводящей в заблуждение вероятности.
Этим грешили как обвинение, так и защита во время судебного процесса над О. Дж. Симпсоном в 1994–1995 годах98. Обе стороны попросили суд рассмотреть ложную условную вероятность.
Обвинение в течение первых десяти дней процесса доказывало, что Симпсон неоднократно проявлял насилие в отношении своей бывшей жены Николь Браун: регулярно избивал, унижал и прилюдно раздевал, говоря окружающим: «Это принадлежит мне». Однако каким образом эти действия относились к процессу об убийстве? Аргументом обвинения было то, что насилие в семье выступало как мотив убийства. По словам одного из обвинителей, «удар — это прелюдия убийства».