Опровержение “Теоремы о конце света”

 

  В научных кругах встречается “теорема конце света” (Doomsday argument, DA) - довольно известное вероятностное рассуждение, вывод из которого можно сформулировать так (из Википедии): если принять, что 60 млрд людей родились вплоть до настоящего момента (оценка Лесли), то с 95 % уверенностью мы можем утверждать, что человеческая раса исчезнет в течение 9120 лет. В данной статье я пытаюсь доказать, что данное рассуждение на самом деле ошибочно.

 Рассуждение DA легко найти в интернете, например в Википедии, поэтому я оставляю его за пределами этой статьи:

 

https://ru.wikipedia.org/wiki/Теорема_о_конце_света

 

   DA одновременно и отвергается большинством учёных, и вызывает интерес у их части, вследствие чего по этой тематике можно найти довольно много публикаций. На мой взгляд, это объясняется тем, что рассуждение DA одновременно и внешне логично, и контр-интуитивно. Интуиция сразу подсказывает людям, прочитавшим DA, об его ошибочности, но доказать эту ошибочность логически довольно трудно.

  Прежде всего, DA нарушает принцип причинности. Если бы DA было верно, человечество бы могло сделать из него практические выводы; оно бы стало больше опасаться техногенных и прочих катастроф, т.е. попыталось бы “отменить” вероятную гибель человечества. Это означает воздействие будущего на прошлое, что предполагает даже возможность парадоксов нарушения причинно-следственной связи. Я считаю, что воздействие будущего на прошлое (перемещения во времени) в принципе действительно возможно, но такие явления относятся к категории паранормальных, а в данном случае всё гораздо проще.

  Один из ключевых моментов в рассуждении DA – возможность делать выводы о выборке по единственному объекту из выборки. В принципе, этот подход вполне справедлив. Приведём такую аналогию. В мешке лежат красные и зелёные шары; мы ничего не знаем о распределении шаров, и о том каких шаров больше – красных и зелёных. Предположим, мы вынули из мешка один шар, и он оказался зелёным. Из того факта, что шар оказался зелёным, мы можем делать какие-то выводы; можно утверждать, что с вероятностью 99.9% красных шаров в мешке не больше 99.9%. Если до вынимания шара мы знали, что вероятность того, что зелёных шаров больше чем красных, равна 50%, то после вынимания зелёного шара эта вероятность становится немного больше.

  Второй ключевой момент DA, который называют принципом Коперника (хотя в действительности он, видимо, не имеет к этому принципу отношения), заключается в том, что мы имеем равные шансы обнаружить себя в любом интервале временной шкалы, на которой существует человечество. Обозначим через N общее количество людей, которые родились в прошлом или когда-либо родятся в будущем. Для каждого человека можно назвать номер n, обозначающий его место в этой временной шкале (для условного Адама n=1, для людей нашего времени n, согласно оценке Лесли, находится в пределах 60 миллиардов, для последнего человека, который увидит гибель человечества, n будет равно N) В рассуждении DA предполагается, что поскольку для каждого человека номер n находится в интервале 1..N, распределение вероятностей для n равномерно, т.е. шансы родиться в начале временной шкалы (с относительно маленьким n) и в её конце (с n близким к N) одинаковы. Ниже будет показано, что в последнем предложении есть логическая ошибка, хотя её трудно сформулировать из-за нечёткой формулировки самого предложения.

  Приведу аналогию, которая на первый взгляд служит хорошим аргументом для DA. Вы просите человека загадать случайное число N, которое может быть совершенно любым (например сто, миллиард или “гугол”). Далее вы просите назвать случайное число n в интервале от 1 до N, причём распределение вероятностей для n должно быть равномерным (т.е. если загадано N, например, тысяча, то n может с вероятностью 10% оказаться от 1 до 100, ещё с вероятностью 10% от 101 до 200 и т.д.). Человек называет n=60; отсюда можно сделать вывод, что N вряд ли больше миллиарда.

  Эта задача сформулирована нечётко, поскольку не объясняется, что значит “загадать совершенно любое число”. Любое “загадывание” предполагает какое-то знание о распределении вероятностей. Поэтому для корректности задачу можно уточнить, например, так: вы просите человека загадать число N от одного до триллиона, и распределение вероятностей должно быть равномерным в логарифмической шкале, т.е. с вероятностью 25% он может загадать число от 1 до 1000, ещё с вероятностью 25% от 1001 до 1 000 000, еще с вероятностью 25% от 1 000 001 до миллиарда и т.д. Если после этого он называет число n=60, это, опять же, позволяет делать выводы о N: если изначально мы полагали, что вероятность того, что N не больше тысячи, равна 25 процентам, то после названного n=60 эта вероятность становится близка к 90 процентам.

  Перенося эту аналогию на нашу ситуацию, сторонники DA делают вывод, что поскольку для нас n приблизительно равно 60 миллиардов, это позволяет сделать вывод, что с вероятностью 95% N не больше триллиона. Отсюда и делается вывод о большой вероятности предстоящего “конца света”.

  Теория вероятностей изобилует парадоксами – истинами, которые очень трудно понять и в которые иногда даже трудно поверить, даже после того как ознакомишься с их доказательством. Часто парадоксы возникают при нечётких формулировках задачи. Как пример можно привести “парадокс мальчика и девочки”, разобранный в Википедии. Показательно, что известный математик Мартин Гарднер, разбиравший в своих книгах другие парадоксы теории вероятностей, изначально “сел в лужу” с этим парадоксом – написал ошибочный вывод, и только после критики признал свою ошибку.

  Формулировка парадокса мальчики и девочки такая:

1) У мистера Джонса двое детей. Старший ребёнок — мальчик. Какова вероятность того, что оба ребёнка мальчики?

2) У мистера Смита двое детей. Хотя бы один ребёнок — мальчик. Какова вероятность того, что оба ребёнка мальчики?

  Сам Гарднер изначально давал ответ 1/2 и 1/3 соответственно, но впоследствии понял, что ситуация во втором случае неоднозначна. Дело в том, что формулировка “хотя бы один ребёнок - мальчик” может быть интерпретирована по-разному. Возможны два варианта:

a) Из всех семей с двумя детьми, где хотя бы один мальчик, выбрана произвольная семья. В этом случае ответ 1/3.

b) Из всех семей с двумя детьми, один ребёнок выбирается случайным образом, и пол этого ребёнка оказывается мужским. В этом случае ответ 1/2.

  Проиллюстрирую это на двух примерах:

a) Мистер Смит отец двоих детей. Мы встретили его, прогуливающегося по улице с маленьким мальчиком, которого он с гордостью представил нам, как своего сына. Какова вероятность того, что второй ребёнок мистера Смита тоже мальчик?

b) Это же условие, но с дополнением: в культуре, где живёт мистер Смит, принято на прогулку из детей всегда брать мальчика.

  Можно показать, что в первом случае искомая вероятность равна 1/2, а во втором – 1/3. Проиллюстрируем это с помощью конкретных цифр. К слову, такой подход (выписывать конкретные числа), на мой взгляд, очень помогает избежать ошибок в теории вероятностей:

 

  В городе живёт тысяча семей с двумя детьми. Подсчитаем, какие возможны распределения между полами детей. Каждая семья может с вероятностью 25% иметь ММ (оба ребёнка мальчики), МД (старший ребёнок мальчик, младшая девочка), ДМ, ДД. Примем для простоты, что случайный фактор отсутствует, т.е. из тысячи семей имеем ровно 250 ММ , 250 МД, 250 ДМ и 250 ДД. Здесь уже виден ответ, который изначально давал Гарднер: если выбрать все семьи, у которых есть хотя бы один мальчик (это ММ, МД, ДМ), то этих семей наберётся 750, и из них 250 ММ – ответ 1/3.

  Далее предположим, что каждая семья дважды выходила прогуляться с одним ребёнком: в день A со старшим ребёнком, и в день B с младшим. Соответственно имеем две тысячи “выходов”: от семей ММ 500 выходов с мальчиком, от семей МД 250 выходов с мальчиком и 250 с девочкой, от семей ДМ то же самое, и от семей ДД 500 выходов с девочкой. В сумме мы имеем 1000 выходов с мальчиком, из них 500 от семей ММ, 250 от МД и 250 от МД. Таким образом, вероятность ММ получается равной 1/2.

  Теперь внесём в задачу озвученное условие – в этом городе принято гулять только с мальчиками, если нет другого выхода (когда в семье есть только девочки). Это значит, что мы заменяем “выходы” с девочкой для семей МД и ДМ на выходы с мальчиком, но ничего не меняем для семей ДД. Тогда всего мы имеем 1500 “выходов” с мальчиком, из них 500 от семей ММ – вероятность 1/3.

  Чтобы продемонстрировать важность чёткой формулировки условия, приведу пример, который ближе к DA. Предположим, в галактике есть две планеты, населённые разумными существами (в дальнейшем буду называть их “жители”). На первой планете живёт тысяча жителей, на второй миллион. Жители первой планеты имеют жёлтые глаза, а второй – зелёные глаза. С какой вероятностью случайно выбранный житель имеет жёлтые глаза?

  Ответ на этот вопрос зависит от того, каким способом мы будем выбирать случайного жителя. Рассмотрим два случая:

1) Сначала наугад выбираем планету, а затем на ней наугад выбираем жителя;

2) Выписываем всех жителей двух планет под номерами (от 1 до миллиона – вторая планета, от 1 000 001 до 1 001 000 – первая планета), и наугад выбираем номер из списка.

  Из этого примера видно, что распределение вероятностей выбираемых жителей различается в зависимости от того, каким способом выбирается житель: в первом случае вероятность выбрать желтоглазого жителя равна 50%, а во втором 1000/1001000=0.099%.

  Суть основной ошибки в рассуждении DA заключается в том, что не проводится различия между этими двумя способами случайной выборки: DA подразумевает, что распределение вероятностей родиться в какую-то эпоху соответствует первому способу, в то время как на самом деле более правильным является второй способ. Именно он соответствует определению "родиться в случайное время в случайном месте".

  Приведу ещё один пример, который на первый взгляд подтверждает DA. Этот пример показывает, что делать выводу по единственному элементу выборки в принципе можно:

 Предположим, всех жителей Земли можно условно разделить на тёмноволосых и светловолосых, причём первых большинство. Далее предположим, что каждый человек знает свой цвет волос, но не знает цвет волос остальных людей. Может ли он делать какие-то выводы о цвете волос у других по собственным? Очевидно, темноволосые люди придут к выводу, что большинство остальных людей тоже темноволосы, а светловолосые – что большинство светловолосы. А поскольку, как было обозначено, темноволосых людей на самом деле большинство, значит правильный ответ будет в среднем даваться чаще, чем неправильный, т.е. этот подход в принципе работает.

  В данной формулировке интуитивно чувствуется какой-то подвох, хотя трудно сформулировать, в чём именно он заключается. Чтобы задача стала более корректной, сформулируем её с помощью цифр:

 В галактике существует 1000 планет, населённых разумными существами (“жителями”), по миллиону на каждой планете. На 800 планетах (назовём их планетами A) большинство жителей являются тёмноволосыми (90% темноволосых и 10% светловолосых). На остальных 200 планетах (планеты B) 90% жителей светловолосы, а 10% темноволосы. Каждый житель планеты знает свой цвет волос и знает эти цифры, но не знает цвета волос остальных жителей своей планеты, т.е. он не знает, к какой категории относится его планета. Какие выводы о вероятностях он может делать по цвету своих волос?

  Рассчитаем общее количество темноволосых и светловолосых жителей в галактике. На 800 планетах A живёт в сумме 800 миллионов жителей, из них 800*0.9=720 миллионов темноволосых и 800*0.1=80 миллионов светловолосых. На 200 планетах B живёт 200 миллионов жителей, из них 200*0.1=20 миллионов темноволосых и 200*0.9=180 миллионов светловолосых. Итого имеем 720+20=740 миллионов темноволосых жителей и 80+180=260 миллионов светловолосых.

  Как должен рассуждать светловолосый житель, оценивая вероятность того, что его планета относится к категории B? По условиям задачи, изначально он знал, что эта вероятность равна 20%. Далее, тот факт, что у него светлые волосы, позволяет пересчитать вероятность: он знает, что является одним из 260 миллионов светловолосых жителей галактики, и тогда вероятность того, что он родился на планете B, равна 180/260=69.2%. Таким образом, знание того факта, что он светловолосый, увеличило для этого жителя вероятность того, что он родился на планете B, с 20% до 69.2%.

  Повторю основной вывод этого примера - по одной точке из выборки можно делать выводы о распределении вероятностей. В качестве иллюстрации этой идеи можно привести возможность существования углеродной и кремниевой жизни. Мы знаем, что возможна углеродная жизнь, и предполагаем что могут также существовать кремниевая и другие формы жизни. Если мы ничего не знаем о том, какова вероятность зарождения кремниевой жизни, факт того, что на нашей планете жизнь углеродная, корректирует эту вероятность: мы можем считать достаточно убедительной гипотезу, что углеродная жизнь является основной формой жизни во вселенной, либо единственной (поскольку ясно, что вероятность возникновения жизни на произвольной планете больше нуля, если вселенная достаточно велика, можно уверенно утверждать что где-то существуют другие формы жизни). Конечно, вероятность зарождения кремниевой жизни прежде всего определяется нашими научными данными о химии жизни – наука может дать достаточно чёткий ответ на вопрос, возможна ли неуглеродная жизнь. Другой пример: тот факт, что все высшие сухопутные животные на земле, включая нас, имеют четыре конечности, позволяют с достаточно высокой долей уверенности предполагать, что четыре конечности – самый распространённый или один из самых распространённых случаев для всех внеземных цивилизаций. Если бы у нас было шесть конечностей, мы бы с такой же долей уверенности предполагали, что самый типичный случай – это шестирукость. Опять же, следует помнить, что научные данные позволяют делать более уверенные выводы.

  Вероятность какого-то исхода или события всегда может быть оценена; не бывает такого, когда мы “не знаем, чему равна вероятность данного события”. В качестве примера приведу такую задачу: “в мешок случайным образом насыпаны красные и зелёные шары; какова вероятность того, что красных шаров больше?”. Напрашивающийся для неспециалиста ответ – “мы не знаем” – следует считать неправильным. Данные условия задачи подразумевают разные возможности распределения вероятностей, но все они “симметричны”, т.е. нет преимущества зелёных шаров перед красными или наоборот. Если, например, шары клали в мешок случайно (с вероятностью 50% клали зелёный шар и с вероятностью 50% - зелёный), то можно ожидать, что скорее всего тех и тех шаров примерно одинаковое количество, но не строго равное (вероятностью этого мы можем пренебречь). Вероятность того, что красных шаров больше чем зелёных, равна вероятности того, что больше зелёных шаров, и соответственно эти вероятности равны 50% (за вычетом небольшой вероятности, что шаров одинаковое количество). Далее, мы предполагаем что, возможно, есть какое-то преимущество красных шаров перед зелёными, или наоборот: может быть, когда клали шары, с большей вероятностью в мешок попадал красный шар, либо наоборот зелёный. Но из условий задачи ясно, что вероятность того, что красные шары имеют преимущество, равна вероятности того, что преимущество имеют зелёные шары; таким образом, если распределение цветов асимметричное (красный или зелёный цвет имеет преимущество), вероятность того, что преимущество изначально имели красные шары, равна вероятности того, что преимущество имели зелёные. Отсюда ясно, что эти вероятности равны, опять же, по 50%. Таким образом, правильный ответ в исходной задаче – 50%.

  Всегда имеется какое-то изначальное знание, изначальное распределение вероятностей. Приведу ещё один пример: я знаю, что через неделю либо будет дождь, либо не будет (эта статья написана летом). Чему равна вероятность предстоящего дождя, если принять что у меня нет никаких знаний, позволяющих делать предсказания? В действительности у меня есть определённые знания: по моим оценкам, вероятность дождя в течение следующей недели равна приблизительно 3% (этот вывод сделан на основании прошлого опыта, статистики частоты дождливых дней). Если у меня есть метеорологические данные, прогноз погоды, эта вероятность становится другой (либо довольно большой, либо очень малой). Если же у меня нет вообще никаких данных, мне остаётся только заключить “дождь либо будет, либо не будет”, и получается что его вероятность равна 50%. Конечно, это очень гипотетический пример, в реальности мы всегда владеем какой-то информацией. Повторю общее заключение: если мы знаем, что произойдёт либо событие A либо событие B, и не имеем никаких знаний о вероятности этих событий – значит вероятность события A для нас равна ровно 50%. Чем более достоверной информацией мы владеем, тем ближе эта вероятность либо к 0, либо к 100%.

  Разобранный выше пример с планетами позволяет вплотную подойти к какой-то простой математической модели, помогающий выяснить справедливость или ошибочность DA. Рассмотрим такую модель в виде простой задачи. Важно подчеркнуть, что упрощения этой задачи, позволяющие провести конкретные выкладки, ничего не меняют принципиально в логике DA.

  Предположим, до настоящего момента в галактике существовала тысяча цивилизаций на разных планетах. Из этих цивилизаций 80% просуществовали в течении ста миллионов лет, а оставшиеся 20% - в течении одного миллиона лет. Примем для простоты, что плотность населения в этих цивилизациях распределена равномерна во времени, и за каждый миллион лет на планете родилось по миллиарду жителей. Соответственно имеем, что на восьмистах планетах за всё время их существования родилось по ста миллиардам жителей (N=100 000 000 000), а на двухстах родилось по миллиарду жителей (N=1 000 000 000).

  Назовём планеты, на которых цивилизация просуществовала сто миллионов лет, “счастливыми”, а те где жители жили по миллиону лет – “несчастными”. Далее, назовём жителей планет, живших в первый миллион лет существования своей цивилизации, “пионерами”, а тех, кто жили в следующие 99 миллионов лет – “старожилами”. Таким образом получаем, что на “счастливых” планетах 1% жителей были “пионерами”, а оставшиеся 99% - “старожилами”; на “несчастных” же планетах все 100% жителей были пионерами.

  Посмотрим, как должен рассуждать житель-“пионер”, оценивая вероятность того, что его планета окажется “несчастной”. Изначально для него эта вероятность была равна 20%. Как она изменится от знания того факта, что он является “пионером”? Поскольку эта задача во многом аналогична предыдущей, на первый взгляд можно предположить, что эта вероятность увеличится; это и лежит в основе рассуждения DA.

  Проведём конкретные подсчёты. На восьмистах счастливых планетах за всё время родилось восемьдесят триллионов жителей, из них восемьсот миллиардов пионеров и 79.2 триллионов старожилов. На двухстах несчастных планетах родилось двести миллиардов пионеров. В сумме имеем триллион пионеров, из них 20% родились на несчастных планетах и 80% на счастливых. Таким образом, если я – пионер, для меня вероятность того, что моя планета несчастная, равна 20%. Эта вероятность была равна 20% изначально, т.е. она не изменилась от знания того факта, что я являюсь пионером.

  Если заменить приведённые цифры на какие-то другие, результат останется тем же: знание того факта, что мы находимся в предполагаемом начале существования нашей цивилизации, нисколько не меняет для нас вероятность того, что наша цивилизация преждевременно прекратит существование. Можно сколько угодно усложнять данную модель, и общий вывод от этого не измениться. Таким образом, мы пришли к пониманию, что рассуждение DA ошибочно.

  В то же время показательно, что в данной модели, если я – старожил, то для меня вероятности меняются: в этом случае с вероятностью 100% я являюсь жителем счастливой планеты. Можно сказать, в этом проявляется фундаментальный “философский” принцип: знание о настоящем позволяет получить довольно достоверную информацию о прошлом, но никакой достоверной информации о будущем. Реконструировать прошлое всегда легче, чем предсказывать будущее.

  Проводить расчёты, показывающие ошибочность рассуждения DA, можно на самых разных моделях, но легче просто отвергнуть это рассуждение, опираясь на фундаментальный принцип причинности: будущее не может воздействовать на настоящее. Если бы DA работало, это бы означало, что мы открыли какой-то принципиально новый способ предсказания будущего. На самом деле всё гораздо проще. По-видимому, именно из-за противоречия с принципом причинности DA отвергается большинством учёных, хотя они не всегда это осознают.

  Вернёмся с задаче с загадыванием случайных чисел N и n. Как уже было написано выше, эта задача кажется удачной аналогией, иллюстрирующей DA. В действительности же это неправильная аналогия, поскольку вероятность “оказаться родившимся” на какой-то планете не должна “подсчитываться” подобным образом – сначала случайно выбрать планету, а потом выбрать на ней случайного жителя. Чтобы это показать нагляднее, приведём два примера таких задач:

1) Попросить человека загадать случайное число N (с заданным распределением вероятностей), после чего загадать число n, равновероятное в интервале от 1 до N;

2) Попросить миллион человек загадать по случайному числу N, после чего каждый из них должен выписать все числа n от 1 до загаданного N; далее перемешать все полученные числа n и из них выбрать случайное.

  Довольно легко понять, что второй пример больше соответствует определению “вероятность оказаться родившимся в случайном месте и случайном времени”. Чтобы окончательно прояснить эту разницу, сведём данную задачу к простейшему случаю – N с равной вероятностью может быть выбрано равным либо единице, либо двум:

1) Мы предложили человеку выбрать случайное число N – от 1 до 2. После этого попросили tuj выбрать случайное число n от 1 до N. Имеем три расклада:

1) N=1, n=1 (вероятность 1/2)

2) N=2, n=1 (вероятность 1/4)

3) N=2, n=2 (вероятность 1/4)

Чтобы в дальнейшем легче было рассчитывать вероятности, примем что в данном случае мы имеем четыре равновероятных расклада:

1) N=1, n=1 (вероятность 1/4)

1) N=1, n=1 (вероятность 1/4)

2) N=2, n=1 (вероятность 1/4)

3) N=2, n=2 (вероятность 1/4)

 

 

2. Мы предложили одному человеку выбрать N1=1, второму N2=2; далее каждый из них должен выписать все числа от 1 до своего N. Выписанные числа мы перемешали и из них выбрали случайное n. Возможны следующие равновероятные расклады:

1) N1=1, n1=1 (вероятность 1/3)

2) N2=2, n2=1 (вероятность 1/3)

3) N2=2, n2=2 (вероятность 1/3)

 

 В первом варианте, если человек назвал n=1, то мы знаем, что с вероятностью 2/3 он загадал N=1, и только с вероятностью 1/3 N=2, т.е. прогноз для N понизился (чтобы получить эти цифры, мы разделили количество раскладов для каждого N на суммарное количество раскладов, при которых n=1). Это и есть DA (вероятность того, что N было загадано равным двум, снизилась с 1/2 соответственно до 1/3).

 Во втором случае, если нам выпало n=1, то мы знаем, что его загадал либо первый человек (N1=1), либо второй (N2=2), с вероятностью по 1/2 - значит прогноз для N не изменился (вероятность того, что N самое высокое, как была равна 1/2, так и осталась).

 Если провести такой подсчёт для более сложных случаев, то в целом получается, что небольшое значение n даёт информацию о минимально возможном N, но не позволяет оценить вероятность того, что N было загадано высоким. Это аналогично вышеназванному принципу причинности – можно реконструировать прошлое, но нельзя предсказывать будущее.

Теперь вернёмся к задаче с тысячей планет, из которых 20% “несчастные”. Рассмотрим ситуацию, при которой DA было бы верным. Предположим, вы – житель другой вселенной, которому Космический Коммутатор предложил вселить своё сознание в случайного жителя одной из этих планет (сделать его своим “аватаром”). Жителя планет коммутатор выбирает так – сначала выбирается случайная планета, а потом на ней выбирается случайный житель. После процедуры выбора аватара вы обнаруживаете себя на неизвестной планете в начале её существования, т.е. вы оказались “пионером”. Можете ли вы делать выводы, какова вероятность того, что вы попали на несчастную планету?

 Вероятно, читатель уже догадался, что в данной ситуации уже можно сделать предсказания насчёт судьбы планеты. Однако для наглядности проведём кое-какие подсчёты. Воспользуемся тем же приёмом, что и раньше – конкретные цифры количества жителей (или аватаров). Предположим, всего есть сто тысяч аватаров, по сто на каждую планету. Соответственно из каждых ста аватаров, попавших на несчастную планету (таких планет и соответственно сотен аватаров двести), все сто окажутся пионерами; из каждых же ста аватаров, попавших на счастливую планету (этих планет восемьсот), один окажется пионером и 99 – старожилами. Таким образом имеем всего 200*100+800*1=20800 аватаров-пионеров, из них 20000 “несчастных”. Для аватара-пионера вероятность обнаружить себя жителем несчастной планеты оказывается равна 20000/20800=96.2% - гораздо больше чем изначальные 20%. Это и есть рассуждение DA.

 

 

 

Наверх