Развод на миллион. Как мошенники используют уязвимости нашего мозга и что делать, чтобы не попасться на их крючок - Дэниел Саймонс. Страница 19


О книге
до 2 дойдем только в том случае, если ранее были на 1. Если мы остановимся в какой-то случайной точке, то скорее дойдем до 1, чем до любой более высокой цифры. Если мы пройдем мимо однозначных цифр, то следующие десять чисел – с 10 по 19 – будут иметь первую цифру 1. Таким образом, ведущая цифра 1 встречается одиннадцать раз в первых девятнадцати числах, или в 58 % случаев. После 99 следующие сто чисел (100–199) будут начинаться с 1. Если увеличивающееся число с равной вероятностью остановится в любой точке и мы должны пройти через первую цифру 1, прежде чем перейти к любой другой, то на каком бы числе мы ни остановились (например, какое бы количество подписчиков в социальной сети ни было в любой конкретный момент времени), оно скорее начнется с 1, чем с любой другой цифры.

ОДНИХ ПРОБЛЕМНЫХ ЦИФР РЕДКО БЫВАЕТ ДОСТАТОЧНО ДЛЯ ПОДТВЕРЖДЕНИЯ ФАЛЬСИФИКАЦИИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЙ, ОСОБЕННО ПОТОМУ, ЧТО ОПУБЛИКОВАННАЯ НАУЧНАЯ ЛИТЕРАТУРА НЕИЗБЕЖНО СОДЕРЖИТ МНОЖЕСТВО НЕВИННЫХ ОШИБОК.

Закон Бенфорда описывает точную вероятность для каждой цифры, которую мы должны ожидать увидеть в таких данных. Его отличительной чертой является то, что цифра 1 встречается первой примерно в 30 % случаев, при этом вероятность появления чисел, начинающихся с 2 до 9, уменьшается. Когда данные должны соответствовать закону Бенфорда, но не соответствуют, существует большая вероятность того, что они являются результатом мошенничества.

Специалист по информатике из Мэрилендского университета Дженнифер Голбек является экспертом по социальным сетям. Она отслеживает закономерности в Интернете, включая распространение теорий заговора и работу бот-сетей. Когда она проанализировала количество друзей, которые есть у людей в социальных сетях, она обнаружила, что эти подсчеты соответствуют закону Бенфорда. Количество подписчиков в социальных сетях всегда начинается с одного человека, со временем оно возрастает; число людей, у которых несколько подписчиков, больше тех, у кого несколько тысяч. Предположим, вы подписаны в социальной сети на тысячу человек. Если вы изучите каждый из этих аккаунтов и посмотрите на количество людей, на которых подписан каждый из них, то количество подписчиков также будет соответствовать закону Бенфорда [34].

Боты, в отличие от пользователей-людей, как правило, не следуют закону Бенфорда, поскольку количество их подписчиков не генерируется естественным процессом роста. Чаще всего боты подписаны на одно и то же количество аккаунтов, иногда это аккаунты других ботов, и они публикуют заранее разработанный контент или репосты других пользователей. Голбек идентифицировала ботов, посмотрев на количество подписчиков второго порядка – количество подписчиков аккаунтов, за которыми следили сами боты. Оно не соответствовало закону Бенфорда. Этот тревожный сигнал послужил поводом для дальнейшего изучения данного набора учетных записей, почти все из которых, по-видимому, были частью одной и той же сети, управляемой одними и теми же людьми [35].

Иногда, когда люди впервые узнают о законе Бенфорда, они чрезмерно усердно применяют его к случаям, в которых данная модель не работает. Например, некоторые сторонники Дональда Трампа утверждали, что нашли доказательства мошенничества на президентских выборах 2020 года, показав, что итоги голосования Джо Байдена на избирательных участках не соответствовали закону Бенфорда. Но стандартная версия этого закона не должна применяться в таких условиях. Избирательные участки намеренно спроектированы таким образом, чтобы охватывать сегменты населения одинакового размера – они не могут бесконечно увеличиваться, поэтому распределение размеров участков не будет соответствовать степенному закону. Более того, итоги голосования за Байдена ограничивают возможные итоги голосования за Трампа, и наоборот. Представьте себе избирательный округ в Чикаго с 1000 избирателями, на котором Байден получил 900 голосов. Если бы не было кандидатов от третьей партии, Трамп получил бы 100 голосов. В ряде таких округов у Трампа довольно часто подсчет голосов может начинаться с 1 или 2, что создает видимость работы закона Бенфорда. Итоги голосования Байдена на этих участках обязательно будут иметь гораздо больше исходных 8 и 9 баллов, чем можно было бы ожидать в соответствии с законом Бенфорда. Это не свидетельство мошенничества – это математическое следствие того факта, что Байден и Трамп разделили фиксированное общее количество голосов [36].

Даже для данных, к которым действительно применим закон Бенфорда, иногда красный флаг – это ложный сигнал тревоги. Например, доходы и расходы компании в целом соответствуют закону Бенфорда. Но если компания часто покупает продукт стоимостью 49,95 долларов, в ее отчетах о расходах доля записей, начинающихся с 4, будет выше, чем предсказывает закон. Анализ показал бы потенциальную проблему, но это несоответствие можно легко устранить, проверив, были ли эти расходы законными. Иногда расследование нарушений выявляет незначительные странности в данных.

Однако в других случаях это свидетельствует о неправомерном поведении. В Соединенных Штатах налоги на прибыль раньше рассчитывались с использованием таблицы с отсечениями с шагом в 50 долларов. В конце 1970-х годов превышение лимита в 50 долларов увеличило задолженность по налогам на 7 долларов. В своей книге о применении закона Бенфорда к бухгалтерскому учету Марк Нигрини проанализировал данные из налоговых деклараций тех времен и обнаружил переизбыток декларируемых доходов непосредственно под пороговыми значениями – цифры, оканчивающиеся на 49 или 99, – и нехватку цифр непосредственно над пороговыми значениями (51 и 101). В совокупности люди были готовы слегка обмануть налоговую службу, чтобы сэкономить 7 долларов, и это мошенничество было видно как отклонение от ожидаемого распределения цифр [37].

Как показал Нигрини и другие, многие случаи мошенничества в бухгалтерском учете выявляются отчасти потому, что в бухгалтерских книгах содержатся цифры, которые отклоняются от закона Бенфорда. Люди, подсчитывающие продажи или выручку, вероятно, понимают, что им не следует придумывать слишком много круглых цифр, но они могут не знать о более тонких закономерностях, которые раскрывают их подделку, и не будут гарантировать, что распределение начальных цифр соответствует ожидаемому шаблону. И даже если люди знакомы с законом Бенфорда, подделать данные таким образом, чтобы они соответствовали ему, непросто. Как оказалось, данный закон применим к любой используемой базовой системе счисления. Даже если вы изощренный мошенник, нелегко сфабриковать данные, которые выглядели бы естественно.

ЧТО БОЛЬШЕ ВСЕГО ДВИЖЕТ ОЖИДАНИЯМИ

Ожидания играют важную роль: без них мы ничего не смогли бы воспринять или понять. Поиск чего-либо там, где мы ожидаем это найти (в отличие от поиска случайным образом), – это стратегия, которая обычно работает; мы помним случаи, когда это не удавалось только потому, что мы оставляли что-то в неочевидном месте. Без ожиданий мы бы никогда не удивлялись, а удивление запускает процесс обучения. Во многих обстоятельствах наш разум автоматически сравнивает то, что мы ожидали, с тем, что произошло на самом деле, что

Перейти на страницу: