Рис. 12-1. Точность репликации и эволюция: а — цикл Дарвина – Эйгена; б — эволюция и край обрыва Эйгена.
Решающим в изучении происхождения жизни является вопрос о том, как начался цикл Дарвина – Эйгена, то есть как именно была достигнута наименьшая сложность, необходимая для приемлемой репликации. Даже в простейших современных системах, таких как РНК-вирусы, точность репликации в которых составляет всего 10-3 (то есть в среднем одна ошибка на 1000 нуклеотидов), и вироидах, реплицирующихся с наименьшей известной на сего дня среди всех репликонов точностью (около 10-2; Gago et al., 2009), репликация катализируется сложными белковыми полимеразами. Сами эти полимеразы (репликазы) синтезируются в результате трансляции соответствующих мРНК при посредстве чрезвычайно сложного рибосомного аппарата. Отсюда следует драматический парадокс происхождения жизни: для достижения минимальной начальной сложности, необходимой для того, чтобы биологическая система начала движение по Дарвину – Эйгену, эта система должна обладать гораздо большей начальной сложностью. В рамках обычного эволюционного мышления невозможно даже представить решения этой головоломки, поскольку это мышление относится исключительно к системам, уже находящимся на спирали. Таким образом, решение непременно окажется неординарным. В следующих разделах этой главы мы сначала рассмотрим потенциал подхода сверху вниз, то есть основанного на анализе современных генов, для получения указаний на возможное происхождение систем репликаторов. Затем мы обсудим подход снизу вверх.
Изучение эволюции белковых доменов дает аргументы в пользу сложного мира РНК: взгляд сверху вниз
Как уже упоминалось выше, система трансляции – единственный сложный ансамбль генов, сохранившийся во всех современных клеточных формах жизни. Современная трансляционная система, содержащая около 60 универсальных белок-кодирующих генов и 40 генов структурной РНК, представляет собой наилучшим образом сохранившийся остаток LUCA(S) и лучшее свидетельство того, что в какой-то форме LUCA(S) действительно существовал (см. гл. 11). В силу исключительной консервативности системы трансляции анализ ортологических последовательностей дает крайне мало для понимания ее происхождения, которое находится за горизонтом сравнения современных форм. Реконструкция генного состава LUCA(S) указывает на сложную трансляционную систему, включающую по меньшей мере 18 из 20 аминоацил-тРНК-синтетаз (АРСаз), несколько факторов трансляции, не менее 40 рибосомных белков и некоторое число ферментов, модифицирующих рРНК и тРНК. По-видимому, у LUCA(S) ядро системы трансляции было уже полностью сформировано (Anantharaman et al., 2002).
Однако сравнение последовательностей и структур белковых компонентов и РНК внутри самой системы трансляции оказывается информативным благодаря большому числу паралогов среди соответствующих генов. Когда в реконструированном генном наборе LUCA(S) обнаруживается пара паралогичных генов, давшая ей начало дупликация, естественно, относится к более ранней стадии эволюции, и, таким образом, реконструкция последовательности древнейших дупликаций позволяет взглянуть на очень ранние этапы эволюции. История паралогичных АРСаз особенно показательна. АРСазы образуют два класса по 10 специфичностей каждый (то есть каждый класс отвечает за распознавание и активацию 10 аминокислот), с неродственными каталитическими доменами и различными наборами вспомогательных доменов. Каталитические домены АРСаз классов I и II принадлежат, соответственно, к укладкам Россмана и биотин-синтазы[126]. Анализ эволюционной истории этих белковых укладок приводит к существенным выводам o ранней эволюции трансляционных систем, и не только об этом (Aravind et al., 2002). Каталитические домены АРСаз класса I образуют лишь небольшую ветвь эволюционного древа доменов укладки Россмана. Таким образом, появлению общего предка АРСаз предшествовало множество ветвлений эволюционного пути от примитивного древнего домена к состоянию с высоким разнообразием, соответствующему LUCA(S). Существенное разнообразие доменов укладки Россмана возникло еще до серии дупликаций, приведших к возникновению, еще до эпохи LUCA(S), АРСаз различных специфичностей (см. рис. 12-2а). Подобная эволюционная картина обнаруживается и при анализе домена биотин-синтазы, давшего начало АРСазам класса II. Даже при рассмотрении только этих двух укладок становится очевидно, что огромное структурное и функциональное разнообразие белковых доменов возникло еще до того, как появилась полноценная, состоящая из РНК и белков система трансляции современного типа.
Рис. 12-2а. Разнообразие белковых доменов, кристаллизация системы трансляции и LUCA(S): эволюция нуклеотид-связывающих доменов укладки Россмана. Указаны только достаточно хорошо изученные белки. USPA – универсальный фактор стресса А; ETFP – электронтранспортный флавопротеин; vWA – фактор фон Виллебранда А; Toprim – каталитический домен топоизомераз, праймаз и некоторых нуклеаз; ДГК – дегалогеназа галоидных кислот; Receiver – компонент двухкомпонентной сигнальной системы прокариот; TIR – широко распространенный домен белок-белкового взаимодействия в сигнальных системах прокариот и эукариот; Sir2—деацетилаза белков (в частности, гистонов). Подробное описание см. Aravind et al., 2002 и ссылки в этой статье.
Рис. 12-2б. Эволюция нуклеотид-связывающих доменов ГТФаз и родственных им АТФаз, по данным из Leipe et al., 2002. Указаны только хорошо изученные белки. Динеин, динамин, кинезин и миозин – моторные ГТФазы и АТФазы, ассоциированные с цитоскелетом; Ras/Rho – сигнальные ГТФа-зы, ассоциированные, в частности, с эндомембранной системой эукариот; G-белки – ассоциированные с мембраной ГТФазы, функционирующие совместно с G-белок-сопряженными рецепторами; PurA и PyrG – ферменты метаболизма нуклеотидов; ArgK, аргинин-киназа, – фермент метаболизма аминокислот; Mrp и MinD – АТФазы, участвующие в клеточном делении прокариот; SRP – частица узнавания сигналов.
Эволюционный анализ обширнейшего класса фосфат-связывающих доменов (известных также как P-петли) ГТФаз, в котором множество трансляционных факторов образует компактные семейства, приводит, в сущности, к тому же результату: в последовательности эволюционных бифуркаций (ветвлений эволюционного древа), представляющей историю ГТФазного домена, трансляционные факторы также возникли сравнительно поздно (см. рис. 12-2а; Leipe et al., 2002). ГТФазы образуют лишь одну из многих больших ветвей эволюционного древа укладки, содержащей Р-петлю, которая включает огромное разнообразие белковых доменов, связывающих НТФ (нуклеозидтрифосфаты – чаще всего субстратом является АТФ, гораздо реже ГТФ и изредка – другие НТФ) и расщепляющих β-γ-фосфодиэфирную связь (см. рис. 12-2б). Эта укладка является самым распространенным доменом во всех прокариотах (Wolf et al., 1999b), и во всех реконструкциях генетического разнообразия LUCA(S) выявляется несколько десятков содержащих Р-петлю белков. Таким образом, интенсивная эволюция домена, содержащего Р-петлю, предшествовала не только LUCA(S), но и, что еще более удивительно, современной системе трансляции. Сама Р-петля (известная также под названием мотива Уолкера A[127], рис. 12-3), богатая глицином петля, оборачивающая фосфатный конец НТФ-субстрата, является наиболее консервативным мотивом среди всех белковых последовательностей, несомненно зафиксированным на самых ранних стадиях белковой эволюции (Gorbalenya and Koonin, 1989; Trifonov et al., 2006).
Рис. 12-3. Р-петля, древнейший и самый распространенный в белковых последовательностях мотив. На рисунке изображено выравнивание Р-петель восьми древних НТФаз, каждая из которых, по данным эволюционных реконструкций, была представлена в LUCA(S) (Mirkin et al., 2003). Для каждой линии представлены три последовательности: бактерии (Escherichia coli, Ecoli), археи (Pyrococcus abyssi, Pabys) и эукариота (дрожжи Saccharomyces cerevisiae, Scere). Белыми буквами на черном фоне обозначены аминокислотные остатки, напрямую взаимодействующие с фосфатным концом НТФ, а серым фоном – характерная гидрофобная β-последовательность, предшествующая ФСП. SRP – частица узнавания сигналов.
Таким образом, из сравнительного анализа древних паралогических отношений между белковыми компонентами системы трансляции следует бесспорный, хоть и парадоксальный, вывод: за интересным исключением основных рибосомных белков, все белки, играющие главную роль в современной трансляции, возникли в результате долгой и сложной эволюции различных белковых доменов. Возникает замкнутый круг: для возникновения этих белков требуется точная и эффективная система трансляции. Древняя система трансляции могла быть и не столь совершенной, как современная, но несомненно, что она отличалась от нее не более чем на порядок по точности и скорости, иначе белковая эволюция не стала бы возможной. Однако из всего, что нам известно о современной системе трансляции, такой уровень точности невообразим без сложного и специализированного белкового аппарата.