Именно к ряду вопросов, связанных со статистикой, и обращался Лаплас. Он не знал о существовании теории Байеса и, следовательно, вынужден был придумать ее снова. Как только Лаплас сформулировал теорию, встал следующий вопрос: имеется ряд измерений; каково наилучшее предположение, какое можно сделать из истинного размера измеренной величины, и какова вероятность того, что это предположение будет «близко» к истинному размеру, какие бы требования вы ни предъявляли к степени этой «близости»?
Лаплас с головой ушел в исследования; работа, начатая в 1774 г., затянулась на сорок лет. Вообще Лаплас был человеком неплохим, не чуждым широких жестов, однако иной раз неосознанно заимствовал идеи из чужих работ и без устали рекламировал себя. Лаплас располагал гибкостью травы на ветру — легко прогибался, что позволяло ему во время своего эпохального труда не отвлекаться на происходившие вокруг бурные события. Еще до Французской революции Лаплас занял выгодную должность преподавателя в Военной академии, где ему посчастливилось принимать экзамен у способного шестнадцатилетнего юноши по имени Наполеон Бонапарт. В 1789 г., когда грянула революция, Лаплас некоторое время находился под подозрением, однако не в пример многим другим уцелел, заявив о своей «страстной ненависти к королевскому дому», и позднее был не раз награжден уже республиканским правительством. Далее, когда в 1804 г. Наполеон провозгласил себя императором, Лаплас туг же забыл о своих республиканских взглядах; в 1806 г. ему дали титул графа. Когда же к правлению вернулась династия Бурбонов, Лаплас раскритиковал Наполеона в своем труде «Аналитическая теория вероятностей» издания 1814 г., написав: «падение империй, притязавших на вселенское господство, могло бы быть предсказано с очень высокой долей вероятности человеком, сведущим в вычислениях вероятностей{118}». Предыдущее же издание, 1812 г., было посвящено «Наполеону Великому».
От гибкости Лапласа в политических вопросах только выиграла математика, поскольку анализ Лапласа оказался глубже и полнее, чем анализ Байеса. Имея в качестве основы работу Лапласа, мы в следующей главе оставим мир вероятности и познакомимся с миром статистики. Их область слияния является одной из самых важных во всех естественных науках — это колоколообразная кривая или же график нормального распределения. Кривая, а также сопутствующая ей новая теория измерения и станут темами следующей главы.
Глава 7
ИЗМЕРЕНИЕ И ЗАКОН РАСПРЕДЕЛЕНИЯ ОШИБОК
Не так давно мой сын Алексей, вернувшись из школы, сообщил об оценке по английскому, полученной им за последнее сочинение. Ему поставили 93 балла. Будь все как обычно, я бы поздравил его с высшей оценкой — A. Но поскольку в пределах A это невысокий балл, а я знаю, что он способен на большее, я бы не преминул добавить: оценка говорит о том, что если в следующий раз он приложит чуть больше усилий, то получит более высокий балл. Однако все было отнюдь не как обычно, и я счел 93 балла возмутительной недооценкой сочинения. Здесь вам, верно, подумалось, что предыдущие несколько предложений говорят больше обо мне, нежели об Алексее. Что ж, вы совершенно правы. На самом деле, вся эта история обо мне, потому что сочинение за Алексея написал я.
О да, позор на мою голову! В свою защиту должен сказать, что в более мирных обстоятельствах скорее дотянулся бы за Алексея пяткой до подбородка на его занятиях по кунг-фу, чем писал бы за него сочинение. Но дело в том, что Алексей подошел ко мне с просьбой взглянуть на его работу как обычно, поздно вечером, в день перед сдачей сочинения. И я пообещал взглянуть. Начав читать сочинение с экрана компьютера, я поначалу внес несколько незначительных изменений — ничего такого, на что стоило бы обратить внимание. Однако затем редактор во мне начал шаг за шагом переставлять и перефразировать то и это, а когда дошел до конца, оказалось, что Алексей уже спит крепким сном, а я по сути написал новое сочинение. На следующее утро, смущенно признавшись, что поленился сохранить файл под новым именем, я сказал ему, чтобы он просто сдал мой вариант.
Сын протянул мне проверенное сочинение, похвалив его весьма сдержанно. «Неплохо, — сказал он. — Оно, конечно, 93 балла — это скорее A с минусом, чем A, но было уже поздно, и если бы у тебя не слипались глаза, наверняка справился бы лучше». Не сказать, чтобы я был рад. Во-первых, мало приятного в том, что твой пятнадцатилетний сын говорит тебе те самые слова, которые ты прежде обращал к нему, и при этом они кажутся тебе совершенно пустыми. Но кроме того, как могло мое сочинение — труд человека, которого даже собственная мать считает профессиональным писателем, — не получить достойной оценки у школьного учителя английского? Понятное дело, я был не одинок. Уже потом мне рассказали о другом писателе, с которым приключилась точно такая же история, с той лишь разницей, что его дочь получила еще более низкую оценку — B. Тексты, выходившие из-под пера этого писателя с докторской степенью по английскому языку, вполне удовлетворяли даже столь взыскательные издания, как «Роллинг Стоун», «Эсквайр» и «Нью-Йорк Таймс», но только не учителя средней школы. Алексей попытался утешить меня, поведав еще одну историю. Как-то раз двое его друзей сдали одно и то же сочинение. Сын решил, что они сглупили, и их немедленно разоблачат. Однако перегруженная учительница не только не заметила удвоения, но и поставила за одно сочинение 90 баллов (A), а за другое — 79 (C). На первый взгляд, странно, но только если вам не доводилось, как мне, ночь напролет проверять здоровенную стопку работ, гоняя по кругу, чтобы ненароком не заснуть, музыку из «Стар Трек».
Числам всегда приписывается особый вес. Рассуждение, во всяком случае, неосознанно, строится примерно так: если учитель оценивает сочинение по сто-балльной шкале, эти незначительные различия и в самом деле что-то значат. Но если десять издателей сочли, что рукопись первого тома «Гарри Поттера» не заслуживает публикации, то каким образом бедная миссис Финнеган (на самом деле ее зовут не так) проводит тонкое различение между двумя школьными сочинениями, ставя за одно 92 балла, а за другое 93? Если мы допускаем, что качество сочинения в принципе поддается определению, то нам придется признать, что оценка — не описание качества сочинения, но его измерение, а измерение, как ничто другое, подвержено случайности. В случае с сочинением измерительный инструмент — учитель, а в выставляемых им оценках, как и в любом измерении, проявляются случайная дисперсия и ошибки.
Еще один вид измерения — голосование. В этом случае мы измеряем не столько количество людей, поддерживающих того или иного кандидата на момент выборов, сколько количество тех, кто не поленился прийти в избирательный участок и проголосовать. В этом измерении тоже множество источников случайной ошибки. Одни законные избиратели, приходя в участок, обнаруживают, что их имя не внесено в списки для голосования. Другие по ошибке голосуют не за того, за кого собирались. Конечно же, ошибки возникают и при подсчете голосов. Часть бюллетеней ошибочно признается недействительными или, напротив, действительными. Еще часть может быть утеряна. Как правило, даже все эти факторы в совокупности не могут повлиять на исход выборов. Однако в случае выборов, где у соперников шансы на победу приблизительно равны, они могут сыграть свою роль, и тогда голоса обычно подсчитываются не один, а несколько раз, как если бы второй или третий подсчет были меньше подвержены влиянию случайной ошибки, чем первый.
Например, в 2004 г. во время выборов губернатора штата Вашингтон победителем в конечном счете был объявлен кандидат от демократов, хотя при первом подсчете кандидат от республиканцев обходил его на 261 из приблизительно 3 млн голосов{119}. Поскольку результаты обоих кандидатов были столь близки друг к другу, по закону штата требовался повторный подсчет голосов. По результатам этого подсчета республиканец вновь обошел демократа, но только на 42 голоса. Неизвестно, счел ли кто-нибудь дурным предзнаменованием тот факт, что разница в 219 голосов между первым и вторым подсчетами в несколько раз превосходила новое значение перевеса в количестве голосов, но в итоге состоялся третий подсчет голосов, на сей раз полностью «вручную». Перевес в 42 голоса получался благодаря лишь одному голосу на каждые 70 000, а потому ручной пересчет голосов можно сопоставить с попыткой попросить 42 человек посчитать от 1 до 70 000 в надежде, что каждый сделает в среднем меньше 1 ошибки. Естественно, результат вновь изменился. На сей раз получился перевес в 10 голосов в пользу демократа. Впоследствии он вырос до 129 голосов, когда в подсчет было включено 700 вновь обнаруженных «утерянных бюллетеней».