Таблица 2-2
Измерение отбора путем анализа последовательностей белок-кодирующих генов (Hurst, 2002; Li, 1997)
Белок-кодирующие последовательности состоят из двух видов сайтов:
• синонимичные, в которых замены не влияют на последовательность кодируемых аминокислот;
• несинонимичные, в которых замены ведут к заменам аминокислот.
Отношение Ka/Ks (где Ka — частота несинонимичных замен, Ks — синонимичных; обе вычисляются с коррекцией на множественные замены) является количественной мерой отбора, действующего на уровне белковых последовательностей.
Ka/Ks = 1 — нейтральная эволюция белковой последовательности (кодируемый белок не подвергается отбору).
Для большинства белок-кодирующих генов Ka/Ks ≪ 1 — отсекающий отбор.
Для прокариот типично Ka/Ks < 0,1.
Для эукариот типично Ka/Ks ≈ 0,1–0,2.
Ka/Ks > 1 — положительный отбор; достаточно редко встречается для белок-кодирующих генов, но для некоторых категорий генов, несомненно, наличествует, например для генов, участвующих в антипаразитической защите или в сперматогенезе, а также в вирусных белках, таких как гемагглютинин вируса гриппа.
• Для измерения Ka/Ks для индивидуальных сайтов используют методы наибольшего правдоподобия; большинство белоккодирующих генов содержат несколько сайтов, подверженных положительному отбору.
• Использование Ka/Ks для измерения уровня отбора предполагает нейтральность синонимичных сайтов.
• Однако Ka и Ks положительно коррелируют между собой — таким образом, отбор затрагивает и синонимичные сайты.
• Некодирующие сайты, такие как интронные последовательности, могут использоваться как фон нейтральной эволюции при измерении отбора на синонимичных сайтах (Ks/Ki, где Ki — частота замен для интронных сайтов).
• Критерий Макдональда—Крейтмана (Aquadro, 1997; McDonald and Kreitman, 1991) широко используется для измерения отбора. Он сравнивает внутривидовые вариации (частота полиморфизма, P) с межвидовыми вариациями (дивергенция, D).
Dn/Ds = Pn/Ps — нейтральная эволюция белковой последовательности.
Dn/Ds < Pn/Ps — отсекающий отбор.
Dn/Ds > Pn/Ps — положительный отбор.
Появление таких количественных подходов к анализу отбора примечательно не только благодаря их технической применимости в изучении эволюции: они также являются признаком фундаментальных изменений в способах осмысления отбора биологами. Дарвиновская качественная идея, которая была выражена в абстрактной математической форме Фишером и впервые измерена с использованием генетических методов Добржанским и его учениками, теперь превратилась в прямо измеряемую статистическую характеристику ансамблей нуклеотидных сайтов. Такая трансформация концепции отбора сродни тому, как классическая термодинамика с ее абстрактными потоками превратилась в статистическую физику Больцмана и Гиббса (см. гл. 4).
Эгоистичные гены, мусорная ДНК и мобильные элементы
Хоть это и редко утверждается без обиняков, классическая генетика предполагает, что почти все части генома (все нуклеотиды, если употреблять более современные, молекулярные термины) имеют определенные функции. Это неявно выраженное утверждение также важно и с точки зрения СТЭ, с ее панадаптационистским подходом. Однако это понимание подверглось сомнению еще в 1960-х и 1970-х годах по мере накопления данных об отсутствии прямой связи между размером генома и фенотипической сложностью организма. Даже с использованием приблизительных методов, доступных в то время, становилось ясно, что организмы с примерно одинаковым уровнем фенотипической сложности зачастую имеют геномы, на порядок различающиеся по размеру (так называемый парадокс гаплоидной величины). Этот парадокс был концептуально разрешен с помощью двух связанных друг с другом фундаментальных идей: эгоистичных генов и мусорной ДНК
[21]. Концепция эгоистичных генов была предложена Ричардом Докинзом в одноименной книге, изданной в 1976 году (Dawkins, 2006). Резко отступив от организм-центричной парадигмы СТЭ, Докинз приходит к выводу, что естественный отбор может действовать не только на уровне организма в целом, но и на уровне индивидуального гена. Этот взгляд, поданный в умышленно провокационной манере, представляет геномы и организмы, по сути, средствами размножения генов.
Концепция эгоистичных генов породила множество важных выводов, и некоторые из них мы рассмотрим ниже в этой книге. Один из аспектов, имеющий непосредственное отношение к парадоксу гаплоидной величины, был всесторонне рассмотрен Фордом Дулиттлом и Кармен Сапиенцей (Doolittle and Sapienza, 1980), а также Лесли Оргелом и Фрэнсисом Криком (Orgel and Crick, 1980). Они предположили, что немалая или даже основная часть геномной ДНК (по крайней мере в сложных многоклеточных организмах) состоит из различных классов повторов, которые образуются в результате амплификации эгоистичных элементов — абсолютных паразитов, говоря хлестким языком Оргела и Крика. Другими словами, с точки зрения организма, большая часть геномной ДНК должна быть признана избыточной. Такой взгляд на геном в корне отличается от панселекционистской парадигмы, присущей СТЭ, в рамках которой большинство или даже все нуклеотиды в геноме подвержены влиянию отсекающего или положительного отбора, действующего на уровне организма.
Концептуально родственным важным открытием стало обнаружение транспозонов, или «прыгающих генов», сначала Барбарой Макклинток в 1940-х годах в растениях, а затем и в животных. Эти транспозоны стали затем известны как мобильные элементы (то есть генетические элементы, которые имеют тенденцию часто менять свое место в геноме; McClintock, 1984). Демонстрация вездесущности мобильных элементов привела к концепции высокодинамичных, постоянно меняющихся геномов задолго до рождения современной геномики
[22].