Нормальное распределение описывает то, каким образом многие явления варьируют вокруг центрального значения, которое представляет собой их наиболее вероятный исход; в своем труде «Опыт философии теории вероятностей» Лаплас заявлял: эта новая математическая дисциплина может быть применена при оценке свидетельских показаний, расчете процента браков, начислении страховых взносов. Однако к моменту выхода последнего издания «Опыта» Лапласу было уже больше шестидесяти, поэтому развивал его идеи ученый помоложе. Им был Адольф Кетле, родившийся в Генте, Фландрия, 22 февраля 1796 г{163}.
Кетле занялся исследованиями вовсе не потому, что его живо интересовали законы, по которым существует общество. Диссертация Кетле, за которую он в 1819 г. получил в Гентском университете первую степень доктора, касалась теории конических сечений — темы из геометрии. Далее Кетле заинтересовался астрономией и около 1820 г. активно поддержал движение за основание новой обсерватории в Брюсселе, где и преподавал. Кетле был человеком амбициозным и наверняка рассматривал обсерваторию как ступеньку на пути к основанию научной империи. Шаг был дерзкий, не в последнюю очередь потому, что Кетле плохо знал астрономию и совсем не умел обращаться с обсерваторией. Но, видимо, он сумел настоять на своем, потому что средства выделили не только на обсерваторию, но и на поездку Кетле в Париж, где он в течение нескольких месяцев ликвидировал пробелы в знаниях. Оказалось, что деньги были потрачены не зря: Королевская обсерватория Бельгии существует до сих пор.
В Париже Кетле увлекся темой хаотичности в жизни и резко сменил направление своих интересов. Его роман со статистикой начался с того, что он познакомился с выдающимися французскими математиками, среди которых оказались Лаплас и Фурье, и под руководством последнего начал изучать статистику и вероятность. Под конец у Кетле, хотя он и узнал все тонкости обращения с обсерваторией, появилась другая цель — использование математических методов астрономии применительно к социологическим данным.
Вернувшись в Брюссель, Кетле принялся собирать и анализировать демографические данные и вскоре остановился на отчетности по преступности, которую французское правительство начало публиковать в 1827 г. В двухтомном труде «О человеке и развитии его способностей, или Опыт социальной физики», вышедшем в 1835 г., Кетле напечатал погодовую сводку убийств, совершенных во Франции в период с 1826 по 1831 гг. Он заметил: число убийств из года в год почти не менялось, как и соотношение убийств, совершаемых разными способами: с помощью пистолетов, мечей, ножей, тростей, камней, режущих и колющих инструментов, пинков и ударов, удушения, утопления и поджога{164}. Кроме того, Кетле проанализировал смертность с точки зрения возраста, географического местоположения, времени года, рода деятельности, а также изучил случаи смертей в госпиталях и тюрьмах. Он просмотрел статистические данные по утонувшим, сошедшим с ума и умершим насильственной смертью. И обнаружил статистические закономерности, просматривая случаи самоубийств путем повешения в Париже и количество браков в Бельгии между женщинами за шестьдесят и мужчинами за двадцать.
Подобные исследования проводились и до Кетле, однако Кетле сделал с цифрами нечто большее, чем просто изучил средние значения, — он внимательно присмотрелся к тому, каким образом данные отклоняются от среднего значения. И всюду находил нормальное распределение: в предрасположенности к преступлению, браку и самоубийству, в высоте роста американских индейцев, в размерах грудной клетки шотландских солдат (на данные обмеров 5 738 солдат он наткнулся в старом номере «Эдинбургского журнала по медицине и хирургии»). Что касалось данных по росту 100 тыс. молодых французов призывного возраста, то в отклонениях от нормального распределения он также обнаружил определенные закономерности. Если изобразить данные по числу призывников и данные по их росту в виде графика, то колоколообразная кривая получится искаженной: слишком мало новобранцев, чей рост превышал 158 см, зато тех, чей рост оказался чуть меньше, в качестве компенсации наблюдалось в избытке. Кетле счел, что разница — около 2 200 лишних «коротышек» — получилась в результате мошенничества или, мягко говоря, те, чей рост оказался ниже 158 см, были освобождены от службы.
Десятилетия спустя великий французский математик Пуанкаре воспользовался методом Кетле, чтобы поймать нечистого на руку булочника, который обвешивал покупателей. Пуанкаре, каждый день покупавший буханку свежего хлеба, решил взвесить буханки и заметил: в среднем они весят 950 г, а не обозначенный в прейскуранте 1 кг. Стоило Пуанкаре пожаловаться властям, как ему стали продавать буханки большего веса. Но Пуанкаре все равно не отпускало ощущение, будто хлеб его «не кошерный». И вот он с терпением, какое присуще только ученым великим или же с приличным стажем, принялся взвешивать буханки: каждый день в течение года. Да, теперь по весу буханки в среднем приблизились к 1 кг; однако если булочник в самом деле давал Пуанкаре первую попавшуюся буханку, число буханок большего веса и меньшего веса, которые должны быть у булочника — об этом я говорил в главе 7 — должно сократиться в соответствии с колоколообразной кривой закона ошибок. Вместо этого Пуанкаре обнаружил слишком мало буханок меньшего веса и избыток буханок большего веса. Из чего сделал вывод: булочник продолжал свое дело, просто теперь, стремясь усыпить бдительность Пуанкаре, продавал ему буханки побольше. Полиция вновь навестила булочника-мошенника, который, судя по словам свидетелей, оказался совершенно не готов к такому визиту и, по-видимому, дал слово исправиться{165}.
Кетле наткнулся на полезное открытие: характер распределения случайностей настолько надежен, что в определенных социологических данных его искажение может быть воспринято как свидетельство правонарушения. В наше время подобным образом анализируют данные, слишком обширные для анализа времен Кетле. В последние годы такое «статистическое выслеживание» распространилось, возникло даже новое направление — судебная экономика, — самым известным примером которой является изучение статистической информации с целью выявления компаний, проводящих свои опционные гранты задним числом. Идея проста: компании предоставляют опционные гранты — право покупки акций — позже по цене этих акций на дату предоставления права — в качестве поощрения менеджеров. Если гранты проводятся задним числом, на дату особенно низкой стоимости акций, менеджеры соответственно получают максимальные доходы. Ловко придумано, однако тайное исполнение этой придумки выливается в нарушение законодательства по ценным бумагам. Кроме того, остаются статистические «отпечатки пальчиков», которые уже привели к раскрытию подобной практики в десятке крупных компаний{166}. В менее известном случае Джастин Вулферс, экономист из бизнес-школы Уортона, обнаружил свидетельства мошенничества в результатах более 70 тыс. баскетбольных игр, сыгранных между колледжами{167}.
Вулферс обнаружил аномальность, сравнивая форы лас-вегасских букмекеров с истинными исходами игр. Когда одна команда является фаворитом, букмекеры предлагают форы, чтобы привлечь примерно одинаковое число ставок на обе команды. Предположим, что баскетбольную команду Калифорнийского технологического посчитали лучше команды Калифорнийского университета в Лос-Анджелесе (что до спортивных фанатов колледжа, то да, так оно и было в 1950-х гг.). Чем заключать пари с неравномерным распределением, букмекеры могли предложить ставки с равными шансами на победу, однако выплачивать только в том случае, если, к примеру, Калифорнийский технологический выигрывал у Калифорнийского университета с перевесом в 13 и более очков.
Хотя форы устанавливаются букмекерами, на самом деле они зависят от тех, кто делает ставки, поскольку букмекеры выстраивают свою «линию» так, чтобы уравновесить спрос. (Букмекеры зарабатывают на марже, которую закладывают в свои прогнозы, поэтому им выгодно, чтобы по каждому участнику соревнования получалась равная сумма ставок — таким образом, они не остаются в накладе при любом исходе игры.) Чтобы определить, насколько умело оценивают обе команды те, кто делает ставки, экономисты используют число, называемое ошибкой прогнозирования — оно представляет собой разницу между преимуществом команды-фаворита и форой букмекера. Может показаться неудивительным, что ошибка прогнозирования, будучи ошибкой определенного типа, распределяется в соответствии с принципом нормального распределения. Вулферс обнаружил, что ее среднее — 0, то есть форы не стремятся ни переоценить, ни недооценить команды, и их среднее отклонение равно 10,9 очкам маржи победы. (При изучении футбольных игр профессиональных команд получился сходный результат: среднее — 0 и среднее отклонение — 13,9 очков.){168}