Одна из проблем, с которой столкнулись молекулярные биологи при изучении последовательностей ДНК, была связана с дублированием заключенной в ней информации. В каждой клетке нашего организма то, что мы называем нашим геномом — то есть полная последовательность ДНК, кодирующая все белки нашего тела, а также большое количество другой ДНК, функция которой нам неизвестна, — действительно существует в двух копиях. ДНК упакована в аккуратную линейную структуру, называемую хромосомой — у нас их 23 пары. Хромосомы находятся в клеточной структуре под названием ядро. Одной из главных особенностей нашего генома является его поразительная упорядоченность — подобно тому, как одни компьютерные папки находятся внутри других папок, а те — в следующих и так далее. Человеческий геном состоит из 3 000 000 000 (трех миллиардов) строительных блоков, называемых нуклеотидами (их четыре вида — А, Ц, Г и Т), и нам необходимо каким-то образом получать заключенную в нем информацию в целости и сохранности. Вот почему мы имеем хромосомы, и вот почему они хранятся в ядре, отдельно от остальных частей клетки.
Причина, по которой мы имеем по две копии каждой хромосомы, более сложна, но сводится к вопросу пола. При оплодотворении сперматозоидом яйцеклетки суть происходящего в том, что часть отцовского и часть материнского геномов объединяются в пропорции 50:50, создавая геном ребенка. Говоря биологическим языком, одна из целей существования полов — создание новых геномов. Возникают новые комбинации, и не только в момент оплодотворения при смешивании отцовского и материнского геномов в соотношении 50:50, но даже раньше, когда формируются сами сперматозоиды и яйцеклетки. Это предшествующая оплодотворению перетасовка ДНК, называемая генетической рекомбинацией, возможна благодаря линейной природе хромосом — хромосомы относительно легко ломаются посередине и обмениваются частями со своей парой, формируя новые химерные хромосомы. Причина, по которой это происходит, как и в случае смешивания материнской и отцовской ДНК, заключается в том, что это, говоря эволюционным языком, хороший способ создать разнообразие в каждом поколении. Если изменится окружающая среда, следующие генерации ваших потомков будут готовы отреагировать на это.
«Но подождите, — скажете вы, — да разве эти сломанные и соединенные вновь хромосомы не такие, какими были прежние? Предполагалось, что они должны быть копиями!» Дело в том, что они не точные копии друг друга, а имеют отличия во многих местах по всей длине. Это копии копий, сделанные недобросовестным копировальным аппаратом, постоянно допускающим некоторое количество случайных ошибок при копировании хромосом. Эти ошибки и есть мутации, о которых мы уже упоминали ранее, а различия между парными хромосомами и есть полиморфизмы. Полиморфизмы обнаруживаются приблизительно через каждые 1000 нуклеотидов хромосомы. Таким образом, когда происходит рекомбинация, новые хромосомы отличаются от родительских.
Эволюционный смысл рекомбинации заключается в том, чтобы разрушить наборы полиморфизмов, соединенных друг с другом на одном участке ДНК. И хотя этот механизм, создающий разнообразие, в эволюционном плане отличная штука, он очень усложняет жизнь молекулярным биологам, желающим прочитать книгу об истории человеческого генома. Рекомбинация позволяет каждому полиморфизму на хромосоме вести себя независимо от других. Со временем полиморфизмы рекомбинируют много раз, и после сотен или тысяч поколений тип полиморфизмов, существовавший у общего предка, полностью утрачивается. Хромосомы потомков полностью перетасованы, и от первоначальной «колоды» не остается и следа. И это плохо для эволюционных исследований, так как, не имея возможности сказать что-либо о предке, мы не можем применять к полиморфизмам принцип «бритвы Оккама» и, следовательно, не представляем, сколько изменений претерпели в действительности перетасованные хромосомы. В настоящее время все наши расчеты молекулярных часов базируются на скорости появления новых полиморфизмов посредством мутаций. Из-за рекомбинации кажется, будто произошли мутации, в то время как их на самом деле не было, и из-за этого мы можем переоценить время, прошедшее с момента отделения от общего предка.
В начале 1980-х годов Уилсона и некоторых других генетиков посетила научная догадка, что если взглянуть на маленькие клеточные структуры, называемые митохондриями, то можно найти способ перехитрить перетасовку хромосом. Интересно, что митохондрия имеет свой собственный геном, и кроме ядра это единственная клеточная структура, у которой он есть. Дело в том, что по существу это эволюционный след, оставшийся с того времени, когда миллиарды лет назад образовались сложные клетки. Митохондрия — это то, что осталось от древней бактерии, проглоченной одним из наших одноклеточных предшественников. Позднее она оказалась пригодной для генерирования энергии в клетке, и теперь служит в качестве внутриклеточной силовой станции, хотя и начала свою жизнь как паразит. К счастью, митохондриальный геном существует всего в одной копии (как и бактериальный геном), а это означает, что он не может рекомбинировать. Кроме того, оказывается, что вместо одного полиморфизма приблизительно на 1000 нуклеотидов, он имеет один на 100. Чтобы провести эволюционное сравнение, мы хотели бы иметь в распоряжении столько полиморфизмов, сколько возможно, так как каждый полиморфизм увеличивает нашу способность различать индивидуумов. Вдумайтесь: если бы мы взяли только один полиморфизм с двумя различающимися формами А и Б, мы могли бы рассортировать всех на две группы — вариант А и вариант Б. С другой стороны, если взять 10 полиморфизмов, каждый из которых имеет два варианта, можно добиться лучшей разрешающей способности, так как вероятность того, что множество индивидуумов будет иметь одинаковый набор вариантов, намного меньше. Другими словами, чем больше полиморфизмов мы имеем, тем выше наши шансы сделать правильные выводы о родственных отношениях между исследуемыми людьми. Поскольку полиморфизмов митохондриальной ДНК (мтДНК) в десять раз больше, чем в остальной части нашего генома, к ней стоит приглядеться получше.
Ребекка Канн в рамках работы над своей диссертацией в лаборатории Уилсона начала исследование изменчивости мтДНК людей из разных уголков Земли. Команда ученых из Университета Беркли преодолевала огромные расстояния, чтобы собрать образцы человеческой плаценты (являющейся богатым источником мтДНК) в разных популяциях — европейской, новогвинейской, коренной американской и других. Их целью было оценить характер изменчивости всего человеческого вида, чтобы делать выводы о происхождении челочка. То, что они обнаружили, было поразительно.
Начальные исследования человеческого митохондриального разнообразия Канн с коллегами опубликовали в 1987 году. Это был первый случай, когда человеческий полиморфизм ДНК был проанализирован методами экономии для установления общего предка и датировки. В аннотации к статье они сформулировали основные результаты коротко и ясно: «Все исследованные митохондриальные ДНК восходят к одной женщине, жившей предположительно 200 000 лет назад в Африке». Это открытие стало большой новостью, а бульварные газеты назвали эту женщину митохондриальной Евой — нашей прародительницей. Однако самым неожиданным было то, что в райском саду она была не единственной Евой — лишь самой удачливой.
Анализ, проведенный Канн и ее коллегами, заключал в себе ответ на вопрос, как последовательности мтДНК были связаны между собой. В своей статье они исходили из предположения, что если последовательности двух мтДНК имеют одинаковую мутацию в полиморфном сайте (скажем, Ц в позиции, где может быть либо Ц либо Т), то они имеют общего предка. Построив схему из 147 последовательностей мтДНК, они смогли сделать вывод о степени связанности индивидуумов, у которых были взяты образцы мтДНК. Это был утомительный процесс, потребовавший много времени на компьютерный анализ данных. При этом наибольшая дивергенция последовательностей мтДНК (число различий) была обнаружена среди африканцев, а это показывает, что процесс дивергенции у них шел дольше. Другими словами, африканцы — самая древняя группа людей на Земле, и это означает, что наш вид возник в Африке.