Если два параметра как-то связаны, это ещё не значит, что одно причина другого.
Перевод: Алексей Лоскутов
Редактура: Алексей Малов
Озвучка: Дмитрий Валуев
Монтаж видео: Джон Исмаилов
Обложка: Андрей Гавриков
Источник
Разрешение на публикацию
Скрытый текст
Как думаете, какая связь между тем, сколько людей ежегодно тонет в бассейнах и количеством фильмов с Николасом Кейджем, вышедшим в тот же год? Так вот, зависимость между этими цифрами – шестьдесят шесть и шесть процентов.
А еще, более чем на девяносто девять процентов коррелируют количество разводов и объемы потребления маргарина в штате Мэн.
Дальше больше — девяносто девять и восемь процентов – такова зависимость между расходами на науку и числом самоубийств в результате удушения и повешения.
То, что между двумя явлениями есть корреляция ещё не значит, что одно – причина другого. Это пример ложного заключения, и всё же мы верим заголовкам типа “Те, кто чаще занимаются сексом, больше зарабатывают”.
К сожалению одно не всегда означает другое. Несмотря на статистику, потребление сыра вряд ли связано с тем, сколько людей погибает, запутавшись в простыне. Но есть менее очевидные примеры.
Многие исследования показали, что у женщин, которые во время менопаузы проходят заместительную гормонотерапию, ниже риск заболеваний сердца. Врачи предположили, что такая терапия предотвращает сердечно-сосудистые заболевания, однако, рандомизированные испытания выявили обратное – на самом деле терапия повышает риск их появления.
Повторный анализ показал, что у принимавших гормоны — выше социально-экономический уровень, а значит они хорошо питались и следили за здоровьем, что и снижало риск сердечных заболеваний.
Когда-то предполагали, что использование ночника в детстве, повышает риск близорукости. Оказалось, что миопия может достаться ребенку от родителей, которые из-за своего слабого зрения чаще оставляют слабый свет в детской спальне.
Так себя проявляет скрытая переменная, когда А — это не причина Бэ, но вместе они — следствие Цэ.
Это всё равно что думать “Ага, у этих людей рак лёгких… и они носят в кармане зажигалку. Значит, зажигалки вызывают рак!” Здесь не учитывается скрытая переменная — курение.
Учёные стараются всячески избегать этой ошибки. Но СМИ усугубляют ситуацию тем, что эксплуатируют потенциально случайные корреляции.
Провели даже исследование о пользе шоколада для похудения, специально, чтобы показать, как искажаются научные данные.
Один журналист со степенью в микробиологии провёл реальное клиническое исследование разделив испытуемых на три группы: с низкокалорийной диетой, с низкокалорийной диетой плюс плитка шоколада и группу, которая питалась как обычно.
К концу третьей недели у группы, которая ела шоколад, и правда снизился вес. Но дело в том, что журналист намеренно отобрал всего пятнадцать испытуемых и при этом включил в опыт большое число параметров: потерю веса, холестерин, качество сна, давление, благополучие и так далее.
Но если измерять кучу всего в маленькой группе людей, скорее всего получишь статистически значимый результат (кстати, об этом есть классное видео на канале Веритасиум).
Выводы вполне могли быть и другими — например, “шоколад понижает кровяное давление”. Строго говоря, работа не выдерживала никакой критики.
Но автор отправил статью в сомнительный журнал, заплатил шестьсот евро и указал в работе выдуманный институт: “Институт диетологии и здоровья”. После чего он разослал пресс-релиз в печатные и интернет издания — заголовки тут же запестрели сенсациями о пользе шоколада.
Но несмотря на это, нельзя списывать корреляцию со счетов. Корреляционный анализ — нужен науке.
Когда двойной слепой метод не подходит — по этическим или другим причинам, корреляция остаётся лучшим доказательством.
Главное, тщательно исследовать все возможные причины. Тогда она поможет выявить существующие связи и будет полезным инструментом.