Психологи называют период предвкушения, ожидания, работы за награду «аппетитной» стадией, а фазу, начинающуюся наградой, – «конечной». Результаты Шульца показывают, что если вы знаете, что ваши аппетиты будут удовлетворены, то удовольствие больше связано с аппетитом, чем с удовлетворением. Этот феномен напомнил мне ужасно циничное замечание однокурсника, у которого один разрушительный роман сменялся другим: «Отношения – это цена, которую ты платишь за предвкушение».
Получается, мы только что разгадали нейрохимию того, как люди выдерживают ипотеку на 30 лет. Когда зажигается лампочка, происходит выброс дофаминергического удовольствия, и все, что нужно, – это тренироваться на возрастающих промежутках между лампочкой и наградой, чтобы всплески дофамина от предвкушения подпитывали все больше нажатий на рычаг. Одна из недавних статей заполняет ключевой пробел в этой истории. На страницах журнала Nature описано, как Пол Филлипс с коллегами из Университета Северной Каролины использовали невероятно замысловатые технологии, чтобы с миллисекундной точностью измерить выбросы дофамина в мозгу крыс, и с максимальным доступным временным разрешением показали, что выброс происходит непосредственно перед началом действия. Затем они искусственно стимулировали выбросы дофамина (вместо того чтобы вызывать их лампочкой) – и крысы стали нажимать на рычаг. Дофамин запускает поведение.
Все это, похоже, объясняет сценарий, по которому могли бы развиваться события в саванне, если бы Ионафан и Ревекка действовали по схеме «если… то…». Ионафан дремлет на экваториальном солнышке. Если на другой конец поля эффектно выходит Ревекка – мех развевается на ветру и все такое, – то в мозгу Ионафана зажигается пробуждающая аппетит лампочка, его вентральная область покрышки набирает обороты, высвобождая дофамин, как ненормальная, и дает префронтальной коре сигнал вести его к ней через поле, под музыку Вагнера, с предвкушаемой уверенностью, что она позволит ему груминг.
Но там не было «если… то». Там было «если может быть». Ионафан увивается за Ревеккой, ухаживания срабатывают лишь иногда. И это чертовски его подстегивает. Почему жеманство так работает? Почему нерегулярное подкрепление соблазняет сильнее гарантированного? Почему так затягивают азартные игры? Во второй статье, опубликованной в Science, Кристофер Фиорилло и его коллеги (в том числе Шульц) объяснили это с помощью блестящего эксперимента.
Вернемся к предыдущему сценарию. Зажигается лампочка, нажимается рычаг, выдается награда. Теперь формализуем сценарий с Ревеккой – введем «может быть». Зажигается лампочка, нажимается рычаг, через несколько секунд выдается награда… но в среднем только в 50 % случаев. Ровно на грани неопределенности – может, да, а может, нет. И примечательно, что суммарная продукция дофамина увеличивается. А еще примечательнее – как именно. В сценарии c 50 на 50 зажигается лампочка, следует стандартный выброс дофамина, запускающий нажатие на рычаг. Затем, после нажатия, начинается вторая фаза высвобождения дофамина: он постепенно растет, достигая максимума около того времени, когда должна появиться награда (если она вообще появляется). Предположим, экспериментаторы снизили бы степень неопределенности, непредсказуемости: зажигается лампочка, нажимается рычаг – но теперь вероятность награды 25 или 75 %. Заметьте разницу между 25 и 75 % – они отражают противоположные тенденции шанса на выигрыш. Но их объединяет то, что в них меньше «может быть», чем в схеме 50 на 50. И теперь вторичная дофаминовая волна менее интенсивна. Общий объем выделяемого дофамина больше всего в условиях наибольшей неопределенности того, будет ли награда.
И это объясняет, почему нерегулярное подкрепление способно так усиливать желание. И почему шанс получить огромную награду, самое неправдоподобное «может быть», настолько чреват зависимостью, что игроки, широко раскрыв глаза, спускают в казино деньги, отложенные на еду для детей.
Эти выводы отлично согласуются с литературой по физиологии стресса, показывающей темную сторону «может быть». Мы видим, что награда, на которую есть неплохие шансы, может стимулировать больше, чем полностью предсказуемая. И наоборот: наказание, на которое есть неплохие шансы, бывает намного тяжелее гарантированного. Для одного и того же, по сути, наказания непредсказуемость дает больший риск повышения кровяного давления и уровня гормонов стресса и вызванных им заболеваний. Пример из природы: приматолог Джоан Силк из Калифорнийского университета в Лос-Анджелесе приводит свидетельства, что один из навыков, выработанных альфа-самцами павианов для того, чтобы пощекотать нервы конкурентам, – это проявление случайной непредсказуемой грубой агрессии. Весь ужас терроризма – оранжевый уровень опасности в мире, когда неизвестно, когда, где и что именно случится.
Мы, приматы с большой корой головного мозга, изо всех сил трудимся, чтобы разобраться в причинно-следственных связях окружающего мира. Установить их в случае, если А вызывает Б лишь иногда, непростая задача. Как в когнитивной науке, так и в экономике распространен миф, что мы пытаемся понять причинность логическим путем. Но на самом деле вся эта сверкающая разумная кора сдобрена маринадом из гормональных и аффективных воздействий, которые могут превратить любые рациональные суждения в иррациональные. И вот мы оцениваем возможное наказание хуже, чем неизбежное. А с другой стороны, если джекпот лотереи достаточно велик, мы думаем, что нам непременно повезет (неважно, каковы шансы) – и мы скоро окажемся в раю социального груминга.
А как там наши Ионафан и Ревекка? Ну, ее больше интересовали самцы в расцвете сил и более высокого ранга, и со временем он успокоился. За исключением одной бешеной двадцатичетырехчасовой брачной связи, которая произошла у них через несколько лет, когда она была в самом разгаре овуляции. Но это уже другая история.
Примечания и дополнительная литература
Две упомянутые статьи – Phillips P., Stuber G., Heien M., Wightman R., Carelli R., “Subsecond dopamine release promotes cocaine seeking,” Nature 422 (2003): 614); и Fiorillo C., Tobler P., Schultz W., “Discrete coding of reward probability and uncertainty by dopamine neurons,” Science 299 (2003): 1898. Обзор огромного вклада Шульца в понимание работы лобной коры см. в: Schultz W., Tremblay L., Holerman J., “Reward processing in primate orbitofrontal cortex and basal ganglia,” Cerebral Cortex 10 (2000): 272. Недавняя потрясающе умная статья показывает, что лобная кора играет важную роль в изменении поведения в зависимости не только от ожиданий, но и от сожалений: Camille N., Coricelli G., Sallet J., Pradat-Diehl P., Duhamel J., Sirigu A., “The involvement of the orbitofrontal cortex in the experience of regret,” Science 304 (2004): 1167.
Если задумываться о роли лобной коры в регуляции и ограничении поведения при ожидании и откладывании награды, нужно немедленно задаться вопросом: что происходит при повреждении префронтальной коры? Все чаще это оказывается ареной столкновения науки и юридической системы. Обсуждение этого вопроса можно найти в статье: Sapolsky R., “The frontal cortex and the criminal justice system,” Transactions of the Royal Philosophical Society, Biological Sciences (2004): 359, 1787.