Физик Фрэнк Бенфорд в 1920-х гг. работал в компании General Electric в городе Скенектади. В то время для научных расчетов использовались таблицы логарифмов. Бенфорд заметил: первые страницы книжки с таблицами логарифмов истрепались от многократного использования, а последние выглядели почти новыми. Именно это случайное наблюдение, а не работа, за которую ему платила General Electric, послужило причиной того, что имя Бенфорда осталось в истории.
Числа, которые требовались Бенфорду, обычно начинались с маленьких величин, а именно они находятся в начале логарифмических таблиц. Так, например, Бенфорд обнаружил, что около 30 процентов чисел, с которыми имеют дело ученые и инженеры, начинаются с цифры 1. И только 5 процентов – с цифры 9. Поэтому последние страницы книги с таблицами логарифмов оставались практически нетронутыми.
Бенфорд рассказал об открытии химику Ирвингу Ленгмюру (будущему лауреату Нобелевской премии). Ленгмюр убедил его опубликовать статью на эту тему. Отличавшийся методичностью Бенфорд исследовал непонятную закономерность еще десять лет. Выяснилось, что она справедлива не только для научных расчетов. Бенфорд попытался проанализировать первые цифры бейсбольной статистики и обнаружил такое же распределение. Он выписал все числа, встречавшиеся в журнале Reader’s Digest. То же самое. Счет теннисных матчей, котировки на бирже, длина рек, атомные веса, счета за электричество на Соломоновых островах и числа, встречающиеся на первой странице New York Times – все подчинялось одной и той же закономерности. Похоже на теорию заговора. Все взаимосвязано.
Наконец, в 1938 г. Бенфорд опубликовал результаты в журнале Proceedings of the American Philosophical Society. В статье он привел точную формулу для вычисления пропорции чисел, начинающихся с каждой цифры. Вот они:
Вы можете спросить, почему здесь отсутствует цифра 0. Бенфорд анализировал только первые ненулевые цифры. Поэтому числа 7129600 и 0,000072002 начинаются с одной и той же цифры 7.
Формула Бенфорда также предсказывает распределение вторых, третьих и так далее цифр числа. В этих случаях уже присутствует 0. Однако преобладание низких величин здесь уже менее выражено. По этой причине выявленную Бенфордом закономерность иногда называют законом первой цифры.
Сам Бенфорд выбрал для статьи другое название, «Закон аномальных чисел» (The Law of Anomalous Numbers). В настоящее время он известен как закон Бенфорда. Как выяснилось, это несправедливо. Данное явление обнаружил (и опубликовал статью) другой, гораздо более известный ученый – астроном Саймон Ньюком. Его статья в номере журнала American Journal of Mathematics за 1881 г. начиналась с констатации факта: «То, что десять цифр встречаются с разной частотой, должно быть очевидно всякому, кто часто пользуется логарифмическими таблицами и замечает, насколько первые страницы истрепаны сильнее последних».
Мне кажется, это очередное доказательство того, как трудно придумать что-то свое и как часто остаются незамеченными даже оригинальные идеи. По какой-то причине о статье Ньюкома вскоре забыли, а статья Бенфорда получила поддержку. Одно из возможных объяснений в том, что статья Бенфорда «выехала» на знаменитой статье физика Ханса Бете, которая была помещена в журнале сразу же вслед за ней.
В настоящее время известно, что закон Бенфорда применим ко всем видам данных, которые не догадался проверить даже сам неутомимый автор. Известно также, что закон Бенфорда не применим ко многим числовым комбинациям (телефонные номера, обозначение возраста и веса, номера карточек социального страхования, коэффициенты умственного развития, победившие номера лотерейных розыгрышей и почтовые индексы). Примером может служить вес взрослых американцев. Совершенно очевидно, что 1 – самая распространенная первая цифра, ее доля гораздо выше, чем 30 процентов, предсказанных законом Бенфорда. Самая редкая – шестерка, даже реже, чем в распределении Бедфорда: немногие мужчины весят от 60 до 69 и от 600 до 699 фунтов.
Неприменим закон Бенфорда и к назначенным номерам, таким как номер телефона или карточки социального страхования. Тот, кто назначает номера, использует все или почти все возможные варианты. Номера, начинающиеся на 1, встречаются так же часто, как и те, которые начинаются с любой другой цифры.
Те, кто обладает математической интуицией, могут прийти к тому же выводу самостоятельно. Для всех остальных это неразрешимая загадка. Почему закон Бенфорда применим к номерам домов на улице, но не применим к почтовым кодам? Откуда в газете New York Times знают, будто числа, начинающиеся на 1, нужно упоминать в шесть раз чаще, чем те, которые начинаются на 9?
Закон Бенфорда справедлив для некоторых чисел, отражающих результаты измерений, например, городского населения или сумм, списанных с кредитных карт. Попробуем привести быстрое и интуитивное объяснение. Представьте, что вы положили на счет для инвестиционных операций 1000 долларов, которые удваиваются каждые десять лет. Первая цифра баланса вашего счета будет оставаться 1 на протяжении первых десяти лет. Сумма будет увеличиваться до 1100, 1200, 1300 долларов и так далее, до 1900, пока в конце первого десятилетия не достигнет 2000 долларов.
До следующего удвоения пройдет еще 10 лет. За это время сумма на счете постепенно увеличится с 2000 до 3000, а затем до 4000 долларов. Это значит, что на 2 и 3 в качестве первых цифр баланса счета приходится столько же времени, сколько на цифру 1.
В третьей декаде сумма на счете увеличится с $4000 до $8000, причем первыми цифрами будут 4, 5, 6 и 7. На протяжении четвертого десятилетия сумма увеличится до 16 000, и первыми цифрами сначала будут 8 и 9, а остальное время снова 1.
Итак, в сумме на инвестиционном счете 1 будет присутствовать больше времени, чем 2, 2 больше, чем 3, и так далее. Если выбрать случайный момент времени, то вероятность каждой из девяти цифр оказаться на первом месте будет точно соответствовать распределению Бенфорда.
В нашем мире есть множество вещей, от колоний микроорганизмов до социальных сетей, которые растут экспоненциально, хотя и не обязательно так занудно, как в моем примере. Но когда естественный рост рассеивает числа на несколько порядков величины, они приближаются к распределению Бенфорда. Если бы шимпанзе бросала дротик дартса в листок с финансовыми отчетами или ценами на бирже, то попадания с достаточной точностью соответствовали бы закону Бенфорда.
Закон Бенфорда напоминает, что числа – это искусственный способ отображения количественных соотношений в окружающем нас мире. Как писал сам Бенфорд, «в действительности это теория явлений и событий, а числа всего лишь играют незначительную роль безжизненных символов живого».