Большинство линий одноклеточных эукариот, эволюционировавших в сторону больших Ne и эффективного очищающего отбора, пошли по первому пути; второй сценарий относится к животным и растениям, которые никогда не достигали больших эффективных размеров популяции и вынуждены были справляться с унаследованным неточным сплайсингом. Третьего пути, по-видимому, не существовало: либо разработать способ устранения аномальных транскриптов, либо использовать их, либо вымереть.
Сайты связывания факторов транскрипции у эукариот состоят из 8–10 нуклеотидов, так что стоимость добавления одного сайта составляет s ≈ 10u, или примерно 10–7, если взять характерное для позвоночных значение u (Lynch, 2007c). Таким образом, геномы сложных многоклеточных эукариот, по-видимому, могли практически «бесплатно» накапливать сайты связывания транскрипционных факторов, что позволило появиться сложным кассетам сайтов. У одноклеточных эукариот возможности для эволюции в этом направлении были ограничены; для прокариот этот путь к инновациям, судя по всему, был закрыт очищающим отбором.
Некодирующий РНом позвоночных — возможно, главнейшее проявление сложности генома. Белок-кодирующие экзоны составляют около 1,5 процента генома млекопитающих, в то время как экзоны, соответствующие некодирующим РНК, по различным оценкам, занимают более 4 процентов генома — около 80 процентов кодирующего потенциала генома используется для молекул РНК, не транслирующихся в белки (Eddy, 2002). Это коренным образом отличается от кодирующих репертуаров прокариот и даже одноклеточных эукариот, в которых некодирующие РНК составляют лишь небольшую часть. Что еще более поразительно, ряд недавних исследований показывает, что большая часть — вероятно, более 60 процентов — генома млекопитающих транскрибируется на заметном уровне (Lindberg and Lundeberg, 2010; Mendes Soares and Valcarcel, 2006). Природа этой «темной материи» далеко не ясна. Иногда считается, что экспрессия подразумевает функциональный смысл транскрибируемой области генома. Однако, учитывая отсутствие какой-либо заметной эволюционной консервации большинства из этих транскрибируемых последовательностей и относительной легкости возникновения ложных (слабых) сайтов инициации транскрипции в случайных последовательностях ДНК, можно сказать, что почти наверняка большая часть темной материи — это транскрипционный шум. Тем не менее эта случайно транскрибируемая часть генома и «мусорная» ДНК в целом представляют собой огромный резервуар для генерации новых микроРНК и других некодирующих, но выполняющих структурные и регуляторные функции РНК, многие из которых плохо сохраняются в процессе эволюции и эволюционируют высокими темпами. Открытие обширного РНома животных показывает, что сложные геномы многоклеточных организмов и простые геномы одноклеточных форм жизни качественно различаются. Это различие интерпретируется самым естественным образом в рамках неадаптивной популяционно-генетической теории эволюции генома. Согласно этой теории, эволюция форм жизни с низким Ne и последующим слабым очищающим отбором приводит к накоплению большого количества интронной и межгенной мусорной ДНК, некоторые сегменты которой время от времени задействуются для различных функций. Масштаб преобразования ландшафта экспрессии генома, вызванного, видимо, в первую очередь простыми факторами популяционной генетики, поражает воображение и представляется соразмерным с интуитивно очевидной разницей в сложности (и, очевиднее всего, в размере) между млекопитающим и простейшим. Вспомним обсуждение эволюции последовательностей в главах 3 и 4: широкий набор нефункциональных транскриптов составляет почти нейтральное пространство, открытое для эволюции сложности в многоклеточных организмах. Такое почти нейтральное пространство неизбежно возникает в ходе эволюции организмов с низкой Ne по чисто энтропийным причинам.
Хотя масштаб задействования мусора довольно мал по сравнению с общим количеством некодирующей ДНК, он огромен по отношению к суммарному размеру белок-кодирующих последовательностей. Учитывая популяционное «бутылочное горлышко», через которое, скорее всего, проходил эукариогенез (см. рис. 8-3), вполне вероятно, что значительное количество мусорной ДНК эволюционировало на очень раннем этапе истории эукариот и, возможно, уже присутствовало у LECA — как и интенсивная случайная транскрипция. Можно представить себе, что на следующем этапе эволюции произошло «нарушение симметрии», которое привело к бифуркации, описанной при обсуждении истории интронов: линии с большим Ne установили строгий контроль за геномом, устранив большинство мусорной ДНК. В противоположность им, линии, не достигшие больших Ne, занялись «компенсацией» в виде постепенного приспосабливания возрастающего количества частей (бывшего) мусора под функциональную РНК (см. рис. 8-4).
Продолжая в том же духе, неадаптивная теория предлагает простое объяснение для перехода от простого типа регуляции транскрипции по Жакобу — Моно к сложной стратегии регуляции, используемой эукариотами. Вместо того чтобы использовать лишь один сайт связывания для единственного регулятора оперона (или, в редких случаях, несколько сайтов), как у прокариот, транскрипция большинства эукариотических генов регулируется в так называемом комбинаторном режиме, при котором несколько факторов транскрипции взаимодействуют сразу с несколькими, а зачастую и с большим числом сайтов, расположенных перед геном (Ravasi et al., 2010). У прокариот сайты связывания фактора транскрипции содержат достаточно информации для точного распознавания уникального сайта (или нескольких сайтов) в относительно небольшой геномной последовательности. Напротив, у эукариот сайт обычно содержит слишком мало информации для обеспечения точного распознавания (другими словами, геном содержит много сайтов с равным или даже большим сродством к данному транскрипционному фактору; Wunderlich and Mimy, 2009). Эта неадекватность одиночных сайтов связывания у эукариот обусловлена слабостью очищающего отбора, неспособного поддерживать множество точно сохраненных сайтов в геноме (см. обсуждение эволюции интронов ранее в этой главе), а также не может предохранить геном от роста, что увеличивает пространство поиска для транскрипционных факторов. Таким образом, комбинаторная модель может быть единственным решением для проблемы эффективной регуляции. Эволюции такого режима регуляции способствует рост генома, в частности достаточно высокая частота коротких тандемных дупликаций. Эволюция сложной регуляции экспрессии генов, являющейся отличительной чертой эукариот и необходимым условием для эволюции сложных многоклеточных форм, по-видимому, является наиболее ярким примером превращения мусора в функциональные элементы в ходе эволюции при слабом очищающем отборе. Как и в случае других аспектов эволюции сложности, отбор направлен здесь на предотвращение энтропийного коллапса, а не на непосредственное «улучшение» регуляции.
Рис. 8-4. Пути эволюции генома: оптимизация и задействование «мусора».