«Я подумал, что если предсказуемые закономерности для чисел действительно существуют, то аудиторы, наверное, смогут определить, какие данные соответствуют действительности, а какие вымышлены», – вспоминал Марк Нигрини.
Бухгалтеры и налоговые органы были бы рады иметь формулу для определения, какие цифры показаны честно, а какие нет. Нигрини быстро решил: его диссертация будет посвящена применению закона Бенфорда для выявления финансового мошенничества.
Он обнаружил, что после статьи Бенфорда на эту тему почти ничего не написано. Единственным, кто увидел практическую ценность открытия, оказался Хэл Вэриан (в настоящее время главный экономист Google). В 1972 г. Вэриан предложил использовать закон Бенфорда в качестве «индикатора чепухи». В политике решения основываются на сложных прогнозах издержек и выгод. Цифры в этих прогнозах должны соответствовать распределению Бенфорда, утверждал Вэриан. Если это не так, значит, составитель прогноза брал цифры с потолка или подгонял в соответствии со своими целями.
Вэриан не стал развивать эту идею – как и другие. Это подогрело энтузиазм Нигрини, но не его руководителя. «Он хотел бы, чтобы я был восьмидесятым ученым, исследовавшим этот вопрос», – объяснял Нигрини. Он настоял на теме диссертации, однако одобрение получил только после того, как написал две трети текста. Четыре месяца спустя работа была закончена.
Идея Вэриана и Нигрини может быть проиллюстрирована. Имея массив чисел, вы можете нарисовать столбиковую диаграмму (гистограмму), показывающую, сколько раз каждая цифра появляется первой. Просто сосчитайте, сколько чисел начинается с цифры 1, сколько с 2 или 3, и так далее. Для честных данных, подчиняющихся закону Бенфорда, диаграмма будет выглядеть так:
Закон Бенфорда
Гладкая кривая – это закон Бенфорда в визуальной форме.
Блестящая идея Вэриана и Нигрини состояла в том, что люди, фальсифицирующие цифры, не знают о законе Бенфорда. У растратчика или налогового мошенника нет причин думать, что какая-либо цифра должна встречаться чаще, чем другие. Поэтому массив искусственных чисел должен иметь равномерное распределение первых цифр.
Как бы то ни было, это упрощенная идея. Эксперименты по имитации случайности (о них не было широко известно) уже показали, что в сфабрикованных числах все цифры почти никогда не используются в равной мере. Альфонс Чапанис представил гистограммы полученных результатов, и распределение в них равномерным не было.
Другая проблема в том, что честные финансовые данные чаще всего в точности соответствуют кривой Бенфорда, но иногда – нет. И заранее бывает трудно сказать, с каким случаем вы имеете дело. Одним из таких примеров могут служить данные продаж магазина, где все товары стоят 99 центов. Анализ выявит большое количество девяток. Как замечает Нигрини, это указывает, что цены выдуманы, специально разработаны людьми как часть маркетинговой стратегии. Но если вы руководите таким магазином, это ваша реальность, а не мошенничество. Можно найти множество других ситуаций, когда природа бизнеса способствует распределению первых цифр, не отвечающему закону Бенфорда – по абсолютно невинным причинам.
Тем не менее, основная идея Нигрини оказалась верна: придуманные цифры отличаются от настоящих. Он стал частым гостем в здании суда Цинциннати, где разбирал преступления, в которых фигурировали цифры.
Один из первых исследованных им случаев мошенничества произошел в Аризоне. Уэйн Джеймс Нельсон, 43-летний менеджер отделения государственного казначейства в Аризоне, начал короткую карьеру растратчика с того, что выписал чек на 1927,48 доллара от штата Аризона на имя фиктивного поставщика. За следующие несколько дней он выписал еще 22 фальшивых чека на общую сумму почти 1,9 миллиона долларов.
Будучи пойманным, Нельсон утверждал: он выписывал чеки из благородных побуждений, чтобы продемонстрировать уязвимость принятой в Аризоне системы предъявления чеков к оплате. Он просто «забыл» проинформировать сотрудников казначейства об этих недостатках, а деньги направлял на собственные счета.
Последние две цифры: 500 придуманных чисел
Первые цифры чеков растратчика
На первый взгляд в чеках, выписанных Нельсоном, присутствовали некоторые закономерности.
Нельсон был «анти-Бенфордом», как выразился Нигрини. Все суммы на чеках, за исключением двух, начинались с больших цифр 7, 8 и 9. Нельсон не превышал порога $100 000, вероятно, потому, что числа с шестью нулями привлекли бы нежелательное внимание.
Последние цифры чеков растратчика
Ниже приведена гистограмма первых цифр в чеках Нельсона.
Фальшивые числа обычно смешиваются с настоящими. Аудитор будет анализировать не только суммы фальшивых чеков (откуда ему знать, что они фальшивые?). Он проверит все чеки Нельсона или все суммы, проходившие через его отдел. Но даже в этом случае предпочтение Нельсоном цифр 8 и 9 в фальшивых счетах выделит цифры 8 и 9 и в общем массиве данных. И это влияние можно выявить.
Нигрини обнаружил: в чеках Нельсона проявляются те же типичные особенности, что и в остальных придуманных числах. Предположим, мы пытаемся подсчитать последние (самые правые) цифры в чеках. Это единицы центов, и с финансовой точки зрения они Нельсона явно не интересовали. Тем не менее, в них наблюдается определенная закономерность. Нельсон отдавал предпочтение таким последним цифрам, как 6 и 7. Цифра 4 вообще не встречается.
Эта гистограмма очень похожа на гистограммы Чапаниса. Точно так же, как добровольцы Чапаниса, Нельсон повторялся, не отдавая себе в этом отчета. В 23 чеках он умудрился повторить 87, 88, 93 и 96 в качестве двух первых цифр. Аналогично, в качестве центов повторялись числа 16, 67 и 83.
Внутренняя налоговая служба США продает исследователям информацию из налоговых деклараций, предварительно удалив личные данные. Нигрини приобрел 100 000 налоговых деклараций за 1985 и 1988 г. и начал анализировать их на университетской мини-ЭВМ VAX. Он хотел проверить, можно ли определить, кто из налогоплательщиков жульничает.
Многие записи в налоговой декларации представляют собой сумму, разницу или производную других записей. Рассматривать их нет смысла, поскольку компьютеры налоговой службы проверяют правильность вычислений. Другие записи подтверждаются документацией третьей стороны, например, форма W-2 для заработной платы или 1099-INT для дохода от процентов. Это обеспечивает полезную возможность сравнения. Нигрини обнаружил: данные о доходе от процентов с высокой точностью соответствуют закону Бенфорда. Однако выплаченные проценты не соответствовали кривой. В то время ипотечные заимодатели не сообщали о процентах в налоговую службу. Проценты по потребительскому кредиту подлежали вычету из налогооблагаемой базы (и тоже не подтверждались документами). Это означало, что налогоплательщики испытывали искушение преувеличить выплаченные проценты, надеясь, что их не проверят. Анализ Нигрини показал, что многие именно так и поступали.