На протяжении примерно 140 лет после Дарвина и Геккеля филогенетические деревья (изначально конструируемые на основании фенотипических признаков, но после фундаментальных работ Эмиля Цукеркандля и Лайнуса Полинга в начале 1960-х все чаще полагающиеся на сравнение молекулярных последовательностей) воспринимались как в целом точные отображения эволюции соответствующих организмов. Другими словами, древо, выстроенное для конкретного признака или гена, приравнивалось, по умолчанию, к «древу видов». Принятие 16S-рРНК, молекулы, универсальной для клеточных форм жизни, в качестве золотого стандарта генетической реконструкции привело к трехдоменному древу жизни Вёзе и коллег. Это была достойная кульминация героического периода филогенетики (Pace, 2006; Woese, 1987; Woese et al., 1990). В древе 16S РНК содержались части с великолепным разрешением ветвей, и, хотя многие другие части остались проработаны довольно слабо, в особенности в глубине древа, ожидалось, что дальнейшее усовершенствование методов филогенетики, вкупе с анализом нескольких дополнительных универсальных генов, позволит получить подробную и исчерпывающую топологию ДЖ в не столь отдаленном будущем (Pace, 1997).
Сложности у концепции ДЖ появились еще до появления геномики, поскольку стало ясно, что среди некоторых распространенных и необходимых генов прокариот наблюдаются множественные горизонтальные переносы генов (ГПГ). Петер Гогартен и коллеги предложили метафору «сеть жизни» в качестве потенциальной замены ДЖ (Hilario and Gogarten, 1993). Однако эти идеи не получили значительной поддержки в догеномную эру, и ГПГ рассматривался в основном как незначительный эволюционный процесс, важный в отдельных областях (таких как распространение устойчивости к антибиотикам), однако в общем эволюционном процессе играющий второстепенную роль – и являющийся несущественным осложнением в процессе построения всеобъемлющего ДЖ. В конце 1990-х сравнение геномов прокариот радикально изменило эту картину, показав, что распределение большинства среди геномов неоднородно (члены большинства КОГ разбросаны среди разнообразных организмов) и топологии филогенетических древ отдельных генов часто не соответствуют друг другу. Эти данные позволили предположить, что ГПГ очень широко распространен среди бактерий и архебактерий и также представлял определенную важность для эволюции эукариот, особенно в контексте эндосимбиоза (см. гл. 7). Таким образом, идеальное ДЖ оказалось химерой, поскольку широко распространенный ГПГ приводит к тому, что древо любого отдельного гена не является точным отображением эволюции целых геномов. Осознание того, что ГПГ среди прокариот является доминирующей формой эволюции, а не редким процессом, привело к идее «выкорчевывания» ДЖ – прежде всего в нескольких влиятельных обзорных статьях Форда Дулитла (Doolittle, 1999a, b, 2000). Заявленное падение ДЖ привлекло к себе много внимания не только в профессиональных публикациях, но и в научно-популярной литературе (Pennisi, 1999). Это событие часто воспринимается как сдвиг парадигмы эволюционной биологии, если не биологии вообще (O’Malley and Boucher, 2005; см. прил. I).
Взгляды эволюционных биологов на статус ДЖ в свете широкой распространенности ГПГ охватывают весь диапазон – от (i) упорного отрицания значения роли ГПГ в эволюции жизни до (ii) «умеренного» пересмотра концепции ДЖ и вплоть до (iii) полного «выкорчевывания» ДЖ, когда сама эта концепция объявляется лишенной смысла как представление эволюции организмов или геномов (O’Malley and Boucher, 2005). По мере накопления сравнительных геномных данных, установка на отрицание ГПГ быстро становится скорее некоей психологической странностью, нежели научной позицией, которую можно обосновать. Настоящие споры идут, похоже, между «ревизионистами» и «радикальным корчевателями» (ii и iii). Сторонники умеренного подхода придерживаются мнения, что, несмотря на все различия между древами отдельных генов, ДЖ по-прежнему имеет большое значение как главная тенденция, которая, хотя бы в принципе, может быть охарактеризована посредством всестороннего сравнения топологий филогенетических древ (Wolf et al., 2002). Приверженцы радикальных взглядов, напротив, считают, что массовые ГПГ уничтожают самые различия между вертикальными и горизонтальными путями передачи генетической информации, поэтому концепция ДЖ должна быть оставлена в пользу сетевой репрезентации эволюции (в широком ее понимании) (Doolittle and Bapteste, 2007; Gogarten et al., 2002).
Противоречивость концепции ДЖ особенно ярко проявилась в дебатах вокруг автоматически построенного «древа жизни в высоком разрешении», которое Пер Борк с коллегами получили путем объединения выровненных последовательностей тридцати одного высококонсервативного белка, в основном из участвующих в процессе трансляции (Ciccarelli et al., 2006). Очень скоро это предполагаемое ДЖ было отброшено как «древо 1 процента» (генов в любом произвольном геноме), которое в целом не отражает историю геномов. По крайней мере для меня эффектно сформулированный аргумент Тал Даган и Билла Мартина (Dagan and Martin, 2006) звучит неотразимо и достоин развернутой цитаты:
«Когда химики или физики обнаруживают, что некая нулевая гипотеза может объяснить только 1 процент полученных ими данных, они немедленно начинают искать другую, лучшую гипотезу. Но похоже, с микробной эволюцией дело обстоит иначе, что не может не беспокоить. Возможно ли, что многие биологи изо всех сил хотят отыскать древо жизни, невзирая даже на то, что говорят им факты?»
В настоящей главе я представляю полное разбиение эволюции прокариот на древовидные и сетевидные компоненты, которые, как мне кажется, вполне могут объективно определить роль и место древ в нашем понимании эволюции, а также в определенной степени разрешить полемику вокруг ДЖ. Однако, прежде чем приступить к этому количественному анализу, мы рассмотрим на концептуальном уровне корни «древесного мышления»[58].
Фундаментальные единицы эволюции и присущая им древовидная природа
Как было рассмотрено в главе 2, репликация генетического материала, процесс, по самой своей сути предрасположенный к ошибкам, является одновременно и условием, и прямой причиной эволюции. Критическим в определении статуса древа в биологии является то, что репликация и непременно следующая за ней эволюция суть по природе своей древовидные процессы (Koonin and Wolf, 2009a). И в самом деле, воспроизводящаяся молекула порождает две копии (в случае полуконсервативной репликации дцДНК, которая происходит во всех клеточных организмах и во многих вирусах) или множество копий (в случае консервативной репликации вирусов с геномами, представленными оцДНК или оцРНК) с ошибками, что приводит к древовидному процессу разветвления (см. рис. 6–1). В терминах теории графов – такой процесс может быть изоморфно представлен в виде особой формы направленного ациклического графа, известного как древовидное образование (arborescence) – то есть обобщенное дерево, в котором допустимы множественные разветвления, а все ребра направлены в противоположную от корня сторону (см. рис. 6–1). Хотя случайное вымирание одной или обеих молекул-потомков порождает вершины, не испускающие ребер, такой граф остается древовидным образованием; определение этого класса графов не требует, чтобы листья находились на одном уровне (см. рис. 6–1; здесь и далее вместо термина «древовидное образование» я буду использовать более распространенный термин «дерево»).
Рис. 6–1. Дерево (древовидное образование) как изоморфное представление предрасположенного к ошибкам процесса репликации генов. Схематическое изображение истории репликации генетического элемента, включающее как раздвоения, так и множественные разветвления (отмечены звездочкой). Зафиксированные мутации показаны штрихами. Адаптировано из Koonin and Wolf, 2009a.
Потенциально серьезным осложнением для древовидного характера эволюции является рекомбинация. Будучи широко распространенной, рекомбинация может превратить представление истории воспроизводящегося ряда поколений из дерева (см. рис. 6–1) в сеть (или, того хуже, в полную кашу). Возможно ли определить фундаментальный, «атомный» уровень генетической организации, на котором рекомбинацией можно пренебречь? Это представляется сомнительным в случае гомологичной рекомбинации, широко распространенной во время совместной репликации близкородственных последовательностей, в частности у эукариот, вовлеченных в обычные половые отношения, и у «квазиполовых» прокариот. Чаще всего единицей гомологичной рекомбинации является одиночная пара оснований. Однако гомологичная рекомбинация не может происходить между отдаленно родственными последовательностями, поэтому ГПГ между таксономически удаленными прокариотами подразумевает только негомологичную (незаконную) рекомбинацию, которой способствуют специфические механизмы, такие как распространение генов через бактериофаги и плазмиды (см. гл. 5). В отличие от гомологичной рекомбинации, следует ожидать, что эволюционная фиксация событий негомологичной рекомбинации вне генов или между частями генов будет гораздо предпочтительнее; сохранение целостности гена после негомологичной рекомбинации внутри генов крайне маловероятно. Распространенность внутригенной рекомбинации в ходе ГПГ между отдаленно связанными прокариотами не изучалась сколь-нибудь подробно. Тем не менее как минимум одно исследование показывает, что сегменты, кодирующие сравнительно небольшие белковые домены, в значительной степени избегаются рекомбинацией (Chan et al., 2009). Отсюда следует важный и правдоподобный, хотя и не подкрепленный пока что в достаточной мере данными, вывод: из-за гомологичной рекомбинации эволюционная история гена или домена представляет собой сетевую структуру на малых масштабах, но преимущественно древовидную на больших (см. рис. 6–2).