Многие записи в налоговой декларации представляют собой сумму, разницу или производную других записей. Рассматривать их нет смысла, поскольку компьютеры налоговой службы проверяют правильность вычислений. Другие записи подтверждаются документацией третьей стороны, например, форма W-2 для заработной платы или 1099-INT для дохода от процентов. Это обеспечивает полезную возможность сравнения. Нигрини обнаружил: данные о доходе от процентов с высокой точностью соответствуют закону Бенфорда. Однако выплаченные проценты не соответствовали кривой. В то время ипотечные заимодатели не сообщали о процентах в налоговую службу. Проценты по потребительскому кредиту подлежали вычету из налогооблагаемой базы (и тоже не подтверждались документами). Это означало, что налогоплательщики испытывали искушение преувеличить выплаченные проценты, надеясь, что их не проверят. Анализ Нигрини показал, что многие именно так и поступали.
Во время президентской кампании Билл Клинтон опубликовал свои налоговые декларации начиная с 1977 г. Нигрини сумел отбраковать из налоговых деклараций Клинтона 380 сумм дохода и 511 сумм вычетов, относящихся к системе доверия. Он не обнаружил ничего подозрительного, за исключением преобладания круглых чисел – весьма распространенное явление. Так, например, старый мужской костюм, пожертвованный благотворительной организации, был оценен в 100 долларов. Совершенно очевидно, что сумма эта приблизительна – одним из признаков служит круглое число. Но указать $100 – честнее, чем придумывать точную цену вроде $107,03.
Одним из первых, кто поверил Нигрини, был Роберт Бертон, главный финансовый инспектор из прокуратуры Бруклина. В 1995 г. Бертон использовал программное обеспечение Нигрини для анализа чеков семи компаний, подозреваемых в связях с преступным миром. Бертон обнаружил свидетельства придуманных чисел и после дальнейшего расследования обвинил в мошенничестве бухгалтеров и сотрудников, выписывавших чеки. Действия инспектора удостоились хвалебной статьи в Wall Street Journal. Закон Бенфорда был назван «инструментом, достойным Шерлока Холмса». Приводились также слова Бертона: «В точку. Это мошенничество».
Статья в Wall Street Journal принесла славу закону Бенфорда, но в то же время породила миф, что он представляет собой нечто вроде волшебного детектора лжи. С тех пор метод Нигрини получил широкое распространение в правоохранительных и налоговых органах, а также в частном секторе. Сегодня повседневный анализ данных о потребителях позволяет без труда выделить для дальнейшего изучения подозрительные числа. Тем не менее, анализ цифр остается относительно новым методом, недостаточно проверенным. Очень важно понимать, чего можно, а чего нельзя добиться с его помощью.
«Я регулярно расстраиваюсь, читая о том, как люди неправильно используют закон Бенфорда», – признался мне Нигрини. Вне всякого сомнения, человек услышал о законе Бенфорда, просмотрел статью в «Википедии» и решил, что любые числа, первая цифра которых не соответствует кривой распределения, – фальшивые. Этот вывод ни в коем случае нельзя назвать верным. Существует множество причин, когда первые цифры легитимных чисел могут не подчиняться распределению Бенфорда, и поэтому проверка первой цифры редко бывает полезной. Нигрини считает, что гораздо эффективнее анализ первых двух. В результате получается гистограмма из 100 столбиков. При достаточном массиве информации (тысячи чисел) соответствующие распределению Бенфорда данные образуют на графике гладкую кривую.
Другой полезный тест анализирует две последние цифры больших чисел. Это даже не проверка «закона Бенфорда». Таким способом выявляются характерные особенности придуманных чисел, выявленные Чапанисом. Обратите внимание что тест последних двух цифр работает даже в том случае, когда данные не должны подчиняться закону Бенфорда.
В руках профессионала анализ цифр состоит из множества разных тестов, а также вычисления их статистической значимости. Первичным этапом сравнения должна быть история одного и того же набора данных. Расходы текущего квартала должны сравниваться с расходами предыдущих кварталов. Нигрини называет этот принцип «Мое правило» – по модели базовых имен, предложенных программным обеспечением для новых файлов («Мой файл», «Моя таблица» и так далее). «Мое правило» позволяет избежать самой распространенной ошибки дилетантской нумерологии, предполагающей, что все числовые базы данных в точности описываются законом Бедфорда. Это ошибочное допущение. Признаки придуманных чисел, выявленные Чапанисом, тоже не обеспечивают стопроцентной защиты. По необъяснимым причинам эти методы могут оказаться применимыми или не применимыми в каждой конкретной ситуации. Проще и надежнее использовать в качестве основы прошлые распределения цифр.
В конце концов, любое мошенничество начинается в какой-то момент времени. Если Стэн из бухгалтерии начнет жульничать в следующий вторник, это изменит распределение цифр в его суммах – независимо от того, насколько настоящие данные близки к «случайным» или соответствовали кривой Бенфорда.
В качестве иллюстрации «Моего правила» Нигрини приводит эксперимент, придуманный в 2011 г. на занятиях по математике 17-летним студентом Ка Буи из немецкого города Кобленц. Класс был поделен на пять групп по четыре студента в каждой. Одним группам выдали газеты и предложили составить список из 500 чисел, встреченных в новостях. Другим группам предложили придумать 500 чисел. Смысл эксперимента в том, чтобы проверить, можно ли отличить числа, взятые из новостей, от придуманных, только по распределению составляющих их цифр.
Чтобы максимально затруднить задачу, группам, придумывавшим числа, предложили имитировать те, что могли быть найдены в газете (в противоположность случайным). В этом случае усиливалось сходство с настоящим мошенничеством, ведь преступник похож на хамелеона.
Ни один из пяти наборов данных, настоящих и поддельных, не соответствовал кривой Бенфорда, однако с первого взгляда можно было определить, что они составляют две группы. В одной наблюдались «высокие пики» – пары двух первых цифр, встречавшиеся гораздо чаще, чем ожидалось. Во второй пики были меньше, и распределение в большей степени соответствовало кривой Бенфорда. Как мы уже убедились, повторяющиеся пары цифр могут свидетельствовать о неосознанности – или о мошенничестве. Вы можете подумать, что группа с «маленькими пиками» состояла из настоящих чисел, взятых из газет. И ошибетесь.
Вспомните, что фальшивые числа придумывали группы из четырех человек. Из-за того, что разные люди неосознанно предпочитают разные цифры, вклад каждого члена группы делился на четыре. Это затруднило выявление обмана.