Согласно одному из немногих исследований, продемонстрировавших вообще какую-то эффективность информации о калорийности в ресторанных меню, скромное снижение жирности заказываемых блюд, почти целиком отнесенное на счет еды, наблюдалось в Starbucks
[364]. Это шестипроцентное снижение (от 247 до 232 калорий в среднем за заказ) в основном стало следствием сокращения количества заказываемых блюд, а не менее калорийных продуктов. Но клиенты сетевых кофеен приходят туда, как правило, не за едой.
Значимо шестипроцентное сокращение или нет, зависит также от того, компенсируют ли клиенты недобранные калории в другое время. Тогда любое исследование, выявившее наличие эффекта, возможно, не учитывает рестораны другого типа, которые подают иную пищу и обслуживают посетителей с непохожими запросами. Даже если мы обнаружим, что заказы людей различаются, все равно не сможем тут же отнести этот факт на счет представленной информации о калориях. Может же случиться, что рестораны изменили состав меню, снизив жирность некоторых блюд или удалив какие-то позиции еще до того, как проставили данные о калориях
[365]. Хотя в каком-то смысле это может означать, что принятие закона увенчалось успехом, так как его следствием стало предложение более здоровой еды, но, скорее всего, воздействие печатных расчетов калорий на поведение потребителей преувеличено.
* * *
Как перейти от причин к решениям? Знания о том, что пробежки благотворно влияют на сердечно-сосудистую систему, вовсе не достаточно, чтобы решать, заниматься бегом или нет. Знания о том, что потребление соли у некоторых людей вызывает гипертензию, недостаточно, чтобы вынести решение о реализации политики в масштабах всей страны по поводу количества соли в пище. Будь мир идеален, мы бы решали, что делать, исходя из неопровержимых результатов тщательно спланированного эксперимента. Но в реальности мы вынуждены действовать на основе неполной и несовершенной информации. В одних случаях эксперимент невозможен, а в других может не хватать времени или ресурсов, чтобы дожидаться однозначных результатов.
В общем, информация бывает различной. В этой главе мы попытаемся увязать рассмотренные теории в единый комплекс соображений, которые следует принимать в расчет при оценке каузальных утверждений. Мы посмотрим, какого рода информация нужна для подтверждения причинной зависимости и что такое хорошее доказательство, в котором наличествуют необходимые свойства. Причина повышает вероятность следствия – это неотъемлемое свойство каузальности. Но различные способы это продемонстрировать могут привести к неожиданным выводам.
Выявление причин, разумеется, первый шаг, но для успешной выработки политики в отношении каждого человека и всего населения понадобится больше данных. Когда мы решаем предпринять некое действие, будь то смена значков ресторанного меню для поддержки здорового образа жизни или определение лекарства для снятия головной боли, мы выбираем из множества путей, ведущих к желаемому следствию. Причина, дающая результат в одном месте, может абсолютно не сработать в другом или вызвать побочные эффекты (как позитивные, так и негативные). Мы обсудим, как предсказать последствия вмешательства и сделать лучший выбор.
Не все причины равно поддаются вмешательствам, а наши воздействия не всегда и не только обусловливают реализацию причины, не меняя больше ничего.
Мы рассмотрим, почему нужно думать, какую причину использовать, чтобы вызвать к жизни следствие (например, печатать данные о питательной ценности или в обязательном порядке требовать считать калории в блюдах), а также как реализовать саму причину (например, бонусы за указание жирности или штрафы за невыполнение этого требования) и предсказать, что еще может измениться в итоге (например, переделка ресторанного меню ведет к росту потребления низкокалорийных подсластителей).
Оценка каузального утверждения
Не существует однозначного теста на причинную зависимость, работающего во всех случаях, однако на практике все равно приходится делать и оценивать каузальные утверждения.
Правдиво ли заявление, что телешоу 16 and Pregnant на канале MTV снижает уровень подростковой беременности в регионах, где его показывают?
[366]
Никто не проводил рандомизированного эксперимента по просмотру этого телешоу, и по большей части мы даже не знаем, смотрели ли его конкретные люди. Хотя теоретически можно случайным образом создать выборку молодых людей, любящих различные телешоу, подростковая беременность – явление не слишком распространенное, так что создавать достаточно крупную выборку для анализа следствия нерационально.
Мы обсуждали, как с успехом проводить выборочные эксперименты для выявления причин, однако во многих ситуациях это невозможно, и приходится оценивать другие доказательства, чтобы определить вероятность причинного характера зависимости. Есть различие между тем, что мы можем узнать посредством совершенного, идеально спланированного выборочного эксперимента, и данными любого реального эксперимента, который может выполняться не «вслепую», на базе малой выборки и большинство участников которого не доходят до его конца.
Кроме того, неправда, что ВКЭ (выборочный контролируемый эксперимент) в любом случае и наверняка превосходит любое исследование методом наблюдения
[367]. Если речь о том, что конкретный человек должен сделать выбор между различными вариантами лечения, долговременное наблюдение пациентов с аналогичными характеристиками может дать более ценную информацию, чем эксперимент на основе небольшой группы без сопутствующих патологий, как у этого человека, и о которых нельзя сказать, что после приема нескольких других лекарств не было никакого эффекта, как у него. Здесь мы как раз имеем дело с проблемой внешней валидности, которую рассматривали в главе 7.
Если ВКЭ неприменим в обстоятельствах, которые мы измеряем, то его результаты для этой цели не будут лучшими доказательствами. Даже если условия аналогичны: то, что реально в рамках исследования наблюдением (где можно повторно использовать данные, например, из электронных медицинских карт), будет отличаться от условий ВКЭ. Если мы хотим узнать, какое влияние оказывают на старение годы постоянных занятий спортом, чтобы разработать государственную политику в этой области, тогда данные наблюдений за 50 лет за десятками тысяч людей могут быть полезнее, чем двухлетний ВКЭ с сотней участников. Хотя ВКЭ позиционируется как золотой стандарт подтверждающей информации для каузальных утверждений, мы можем научаться причинности и без исследований, но для этого нужно знать, как оценивать неэкспериментальные свидетельства
[368].