Несколько лет назад, когда я сказал А., одному тогдашнему властелину мира, что его послужной список значит меньше, чем он думает, он так оскорбился, что бросил в меня зажигалку. Этот эпизод многому меня научил. Помните, никто не приписывает случайности свой успех, только неудачу. Его эго взорвалось, поскольку он возглавлял департамент великих трейдеров, которые тогда временно разбогатели на рынке и приписывали этот факт прочности своего бизнеса, своим идеям или своему уму. Один за другим они лопнули суровой нью-йоркской зимой 1994 года (это был крах рынка облигаций, последовавший за неожиданным повышением ставок Аланом Гринспеном). Интересно то, что мало кто из них торговал несколько лет спустя (эргодичность).
Вспомните, ошибка выживаемости зависит от размера изначальной популяции. Сама по себе информация о том, что индивидуум получил прибыль в прошлом, не значима. Нам нужно знать размер популяции, к которой он принадлежал. Другими словами, не зная, сколько менеджеров сошло с дистанции, мы не сможем оценить качество его послужного списка. Если в популяции было десять менеджеров, я бы передал победителю половину своих сбережений не моргнув глазом. Если бы их было 10 тыс., я бы просто игнорировал его результат. Последняя ситуация обычна, в наши дни на финансовые рынки приходит слишком много людей. Многие выпускники университетов вначале выбирают карьеру трейдера, терпят неудачу и поступают учиться на стоматологов.
Если, словно в сказке, эти вымышленные менеджеры материализовались бы в виде человеческих существ, один из них стал бы тем человеком, с которым я встречаюсь завтра в 11:45. Почему я выбрал это время? Потому что собираюсь расспросить его о том, как он торгует. И сказать, что срочно должен ехать на встречу за ланчем, если мой знакомый будет слишком напирать на свой послужной список.
Жизнь состоит из совпадений
Далее мы рассмотрим, как наша ошибка в понимании распределения совпадений проявляется в реальной жизни.
Таинственное письмо
Второго января вы получаете анонимное письмо с информацией, что в течение этого месяца рынок будет идти вверх. Прогноз сбывается, но вы не придаете этому значения, списывая рост на хорошо известный «эффект января» (исторически в этом месяце цены растут).
Затем, первого февраля, вы получаете другое письмо, в котором говорится, что рынок пойдет вниз. И снова так происходит. Первого марта приходит новое письмо — та же история. К июлю вы заинтригованы даром предвидения анонима и соглашаетесь на предложение инвестировать в специальный офшорный фонд. Вы направляете туда все свои сбережения. Два месяца спустя вы теряете эти деньги. Вы идете к соседу и рыдаете у него на плече, а он говорит вам, что помнит два таких же таинственных письма. Но второе было последним. Он вспоминает, что в одном был верный прогноз, а в другом — ошибочный.
Что же произошло? Фокус вот в чем. Мошенник выбирает 10 тыс. фамилий из телефонного справочника. Затем одной половине выборки направляет письма с «бычьим» предсказанием, а второй — с «медвежьим». В следующий месяц он отбирает фамилии тех, кому послал письма со сбывшимся вариантом предсказания, то есть 5 тыс. человек. Еще через месяц их остается 2500, а потом список сузится до 500 человек. И 200 из них станут жертвами. Инвестиции в несколько тысяч долларов на почтовые марки превращаются в несколько миллионов.
Прерванная игра в теннис
Всякий, кто смотрел по телевизору соревнования по теннису, сталкивался с бомбардировкой рекламы фондов, которые (до этого момента) зарабатывали на несколько процентов больше остальных в течение некоторого периода. Зачем кому-то давать рекламу, если он не получил прибыль выше рынка, не так ли? Высока вероятность, что к нему придут инвестиции, даже если успех вызван исключительно случайностью. Это явление экономисты и страховщики называют «неблагоприятный отбор». Из-за этой ошибки селекции нужно более тщательно оценивать те варианты инвестиций, которые кто-то предлагает вам, чем те, которые вы находите самостоятельно. Например, если я обращусь к когорте из 10 тыс. менеджеров, у меня будут 2/100 шансов наткнуться на выжившего победителя. Если я останусь дома и буду ждать звонка в дверь, вероятность того, что неожиданный визитер окажется выжившим победителем, будет близка к 100 %.
Другие выжившие
До этого момента мы обсуждали выживших победителей, та же логика применима к способному человеку, чьи шансы высоки, но который все равно заканчивает дорогой на кладбище. Этот эффект прямо противоположен ошибке выживаемости. Подумайте, ведь в отрасли инвестиций достаточно двух неудачных лет, чтобы закончить карьеру, и даже при наличии везения такой результат очень возможен. Что делать людям, чтобы выжить? Они максимизируют свои шансы остаться в игре, принимая риски «черного лебедя» (как Джон и Карл), которые большую часть времени низки, но могут вызвать катастрофу.
Парадокс дня рождения
Наиболее понятный интуитивно способ описать проблему глубинного анализа данных человеку, далекому от статистики, — сделать это с помощью так называемого парадокса дня рождения, хотя это и не парадокс вовсе, а просто причуда восприятия. Если вы знакомитесь с кем-то случайно, есть один из 365,25 шансов, что у вас день рождения в один день, и значительно меньше — что вы родились еще и в один год. Поэтому одинаковый день рождения — повод поговорить за ужином. Теперь давайте рассмотрим ситуацию, когда за столом сидят 23 человека. Каковы шансы того, что среди них есть двое, родившихся в один день? Около 50 процентов. Поскольку мы не уточняем, у кого из них совпадают дни рождения, то пара может быть любой.
Как тесен мир!
Подобное же ошибочное восприятие вероятностей возникает в результате случайных встреч с родственниками или друзьями в самых неожиданных местах. «Как тесен мир!» — часто произносят с удивлением. Но это не такой уж невероятный случай, а мир гораздо больше, чем мы думаем. Дело в том, что неправильно оценивать шансы встретиться с определенным человеком в определенном месте и в определенное время. Нужно рассчитывать вероятность любой неожиданной встречи, с любым знакомым нам человеком в любом месте, которое мы посетим в рассматриваемый период времени. Эта вероятность значительно выше, возможно, в несколько тысяч раз выше.
Когда статистики изучают данные, чтобы протестировать взаимосвязь например, выведать наличие корреляции между определенным событием, скажем, политическим заявлением и волатильностью фондового рынка, эти результаты, скорее всего, будут восприняты серьезно. Но когда компьютер используют для анализа данных в поисках вообще любых взаимосвязей, тогда, конечно, будет обнаружена ложная зависимость вроде того, что судьба фондового рынка определяется длиной женских юбок. И люди будут этому удивляться, как и совпадению дней рождения.
Анализ данных, статистика и шарлатанство
Каковы ваши шансы дважды выиграть в лотерею Нью-Джерси? Один на 17 триллионов. Но это произошло с Эвелин Адамс, которая, как может решить читатель, должна чувствовать себя особенно обласканной фортуной. Используя описанный выше метод, исследователи Мерси Уоррен Диаконис и Чарльз Фредерик Мостеллер оценили как 30 к 1 вероятность того, что кто-то где-то вообще окажется столь же везучим!