Если два параметра как-то связаны, это ещё не значит, что одно причина другого.

Перевод: Алексей Лоскутов
Редактура: Алексей Малов
Озвучка: Дмитрий Валуев
Монтаж видео: Джон Исмаилов
Обложка: Андрей Гавриков

Источник 

Разрешение на публикацию 

Скрытый текст
Как думаете, какая связь между тем, сколько людей ежегодно тонет в бассейнах и количеством фильмов с Николасом Кейджем, вышедшим в тот же год? Так вот, зависимость между этими цифрами – шестьдесят шесть и шесть процентов. 
А еще, более чем на девяносто девять процентов коррелируют количество разводов и объемы потребления маргарина в штате Мэн.
Дальше больше — девяносто девять и восемь процентов – такова зависимость между расходами на науку и числом самоубийств в результате удушения и повешения. 
То, что между двумя явлениями есть корреляция ещё не значит, что одно – причина другого. Это пример ложного заключения, и всё же мы верим заголовкам типа “Те, кто чаще занимаются сексом, больше зарабатывают”. 
К сожалению одно не всегда означает другое. Несмотря на статистику, потребление сыра вряд ли связано с тем, сколько людей погибает, запутавшись в простыне. Но есть менее очевидные примеры. 
Многие исследования показали, что у женщин, которые во время менопаузы проходят заместительную гормонотерапию, ниже риск заболеваний сердца. Врачи предположили, что такая терапия предотвращает сердечно-сосудистые заболевания, однако, рандомизированные испытания выявили обратное – на самом деле терапия повышает риск их появления.
Повторный анализ показал, что у принимавших гормоны — выше социально-экономический уровень, а значит они хорошо питались и следили за здоровьем, что и снижало риск сердечных заболеваний.
Когда-то предполагали, что использование ночника в детстве, повышает риск близорукости. Оказалось, что миопия может достаться ребенку от родителей, которые из-за своего слабого зрения чаще оставляют слабый свет в детской спальне. 
Так себя проявляет скрытая переменная, когда А — это не причина Бэ, но вместе они — следствие Цэ. 
Это всё равно что думать “Ага, у этих людей рак лёгких… и они носят в кармане зажигалку. Значит, зажигалки вызывают рак!” Здесь не учитывается скрытая переменная — курение.
Учёные стараются всячески избегать этой ошибки. Но СМИ усугубляют ситуацию тем, что эксплуатируют потенциально случайные корреляции. 
Провели даже исследование о пользе шоколада для похудения, специально, чтобы показать, как искажаются научные данные.
Один журналист со степенью в микробиологии провёл реальное клиническое исследование разделив испытуемых на три группы: с низкокалорийной диетой,  с низкокалорийной диетой плюс плитка шоколада и группу, которая питалась как обычно. 
К концу третьей недели у группы, которая ела шоколад, и правда снизился вес. Но дело в том, что журналист намеренно отобрал всего пятнадцать испытуемых и при этом включил в опыт большое число параметров: потерю веса, холестерин, качество сна, давление, благополучие и так далее. 
Но если измерять кучу всего в маленькой группе людей, скорее всего получишь статистически значимый результат (кстати, об этом есть классное видео на канале Веритасиум). 
Выводы вполне могли быть и другими — например, “шоколад понижает кровяное давление”.  Строго говоря, работа не выдерживала никакой критики. 
Но автор отправил статью в сомнительный журнал, заплатил шестьсот евро и указал в работе выдуманный институт: “Институт диетологии и здоровья”. После чего он разослал пресс-релиз в печатные и интернет издания — заголовки тут же запестрели сенсациями о пользе шоколада. 
Но несмотря на это, нельзя списывать корреляцию со счетов. Корреляционный анализ — нужен науке.
Когда двойной слепой метод не подходит — по этическим или другим причинам, корреляция остаётся лучшим доказательством. 
Главное, тщательно исследовать все возможные причины. Тогда она поможет выявить существующие связи и будет полезным инструментом.