1. Альтернативный сплайсинг, который производит большую часть белкового разнообразия в данных организмах[75].
2. Комбинаторная регуляция транскрипции, при которой гены оснащены наборами сайтов связывания транскрипционных факторов. Различные комбинации факторов транскрипции связываются с этими сайтами, обеспечивая сложную регуляцию экспрессии (Venters and Pugh, 2009).
3. Гигантский некодирующий РНом, включающий в себя относительно хорошо изученные микроРНК, ряд других частично охарактеризованных малых РНК, более таинственные длинные некодирующие РНК[76] и огромное количество «темной материи» РНК (Amaral et al., 2008).
Рассмотрев эти замечательные явления более подробно, в каждом из них мы можем безошибочно различить следы неадаптивной эволюции, связанной с ослабленным очищающим отбором.
Как отмечалось в предыдущем разделе, богатые интронами геномы имеют «слабые» сигналы сплайсинга, скорее всего просто потому, что сила очищающего отбора в соответствующих популяциях недостаточна, чтобы жестко контролировать эти нуклеотидные последовательности. Иными словами, аномальные транскрипты, образующиеся с определенной частотой из-за ошибок сплайсинга в богатых интронами организмах, не являются достаточно вредными для того, чтобы быть устраненными очищающим отбором в условиях низкой Ne. Таким образом, неточность в вырезании интронов предоставляет нишу для альтернативного сплайсинга. Иными словами, неточный сплайсинг – это и есть альтернативный сплайсинг. Поскольку эволюционирующие небольшие популяции не могли избавиться от него, они «научились» использовать некоторые из альтернативных (первоначально аномальных) транскриптов в различных функциональных ролях. Эти роли часто основаны на том, что альтернативные белки являются модификациями «нормальных» белков и, соответственно, действуют как функциональные варианты исходного белка или же как доминантные отрицательные регуляторы. В соответствии с логикой эволюции, альтернативный сплайсинг аналогичен горизонтальному переносу генов у прокариот в том, что оба являются выгодными альтернативами дупликации генов, при которых модификация активности достигается за один шаг, а не за длительный период эволюции. С учетом реконструкции, приведенной на рис. 7–8, можно предположить, что у LECA ошибки сплайсинга происходили с высокой частотой, давая, соответственно, большое разнообразие транскриптов, но при этом функциональный альтернативный сплайсинг был весьма редок (если вообще происходил). Дальнейшая эволюция различных ветвей эукариот, по-видимому, происходила в соответствии с двумя противоположными сценариями: потеря большинства интронов и усиление сигналов сплайсинга на границах оставшихся интронов, снижающие продукцию аномальных транскриптов до незначительного уровня; сохранение частоты ошибок сплайсинга примерно на том же уровне, что и у LECA (при условии примерно такой же плотности интронов), сопровождаемое эволюцией функционального альтернативного сплайсинга, то есть задействование многих, но, конечно, не всех и, вероятно, даже не большинства аномальных транскриптов для продукции альтернативных функциональных форм белка.
Большинство линий одноклеточных эукариот, эволюционировавших в сторону больших Ne и эффективного очищающего отбора, пошли по первому пути; второй сценарий относится к животным и растениям, которые никогда не достигали больших эффективных размеров популяции и вынуждены были справляться с унаследованным неточным сплайсингом. Третьего пути, по-видимому, не существовало: либо разработать способ устранения аномальных транскриптов, либо использовать их, либо вымереть.
Сайты связывания факторов транскрипции у эукариот состоят из 8—10 нуклеотидов, так что стоимость добавления одного сайта составляет s ≈ 10u, или примерно 10–7, если взять характерное для позвоночных значение u (Lynch, 2007c). Таким образом, геномы сложных многоклеточных эукариот, по-видимому, могли практически «бесплатно» накапливать сайты связывания транскрипционных факторов, что позволило появиться сложным кассетам сайтов. У одноклеточных эукариот возможности для эволюции в этом направлении были ограничены; для прокариот этот путь к инновациям, судя по всему, был закрыт очищающим отбором.
Некодирующий РНом позвоночных – возможно, главнейшее проявление сложности генома. Белок-кодирующие экзоны составляют около 1,5 процента генома млекопитающих, в то время как экзоны, соответствующие некодирующим РНК, по различным оценкам, занимают более 4 процентов генома – около 80 процентов кодирующего потенциала генома используется для молекул РНК, не транслирующихся в белки (Eddy, 2002). Это коренным образом отличается от кодирующих репертуаров прокариот и даже одноклеточных эукариот, в которых некодирующие РНК составляют лишь небольшую часть. Что еще более поразительно, ряд недавних исследований показывает, что большая часть – вероятно, более 60 процентов – генома млекопитающих транскрибируется на заметном уровне (Lindberg and Lundeberg, 2010; Mendes Soares and Valcarcel, 2006). Природа этой «темной материи» далеко не ясна. Иногда считается, что экспрессия подразумевает функциональный смысл транскрибируемой области генома. Однако, учитывая отсутствие какой-либо заметной эволюционной консервации большинства из этих транскрибируемых последовательностей и относительной легкости возникновения ложных (слабых) сайтов инициации транскрипции в случайных последовательностях ДНК, можно сказать, что почти наверняка большая часть темной материи – это транскрипционный шум. Тем не менее эта случайно транскрибируемая часть генома и «мусорная» ДНК в целом представляют собой огромный резервуар для генерации новых микроРНК и других некодирующих, но выполняющих структурные и регуляторные функции РНК, многие из которых плохо сохраняются в процессе эволюции и эволюционируют высокими темпами. Открытие обширного РНома животных показывает, что сложные геномы многоклеточных организмов и простые геномы одноклеточных форм жизни качественно различаются. Это различие интерпретируется самым естественным образом в рамках неадаптивной популяционно-генетической теории эволюции генома. Согласно этой теории, эволюция форм жизни с низким Ne и последующим слабым очищающим отбором приводит к накоплению большого количества интронной и межгенной мусорной ДНК, некоторые сегменты которой время от времени задействуются для различных функций. Масштаб преобразования ландшафта экспрессии генома, вызванного, видимо, в первую очередь простыми факторами популяционной генетики, поражает воображение и представляется соразмерным с интуитивно очевидной разницей в сложности (и, очевиднее всего, в размере) между млекопитающим и простейшим. Вспомним обсуждение эволюции последовательностей в главах 3 и 4: широкий набор нефункциональных транскриптов составляет почти нейтральное пространство, открытое для эволюции сложности в многоклеточных организмах. Такое почти нейтральное пространство неизбежно возникает в ходе эволюции организмов с низкой Ne по чисто энтропийным причинам.
Хотя масштаб задействования мусора довольно мал по сравнению с общим количеством некодирующей ДНК, он огромен по отношению к суммарному размеру белок-кодирующих последовательностей. Учитывая популяционное «бутылочное горлышко», через которое, скорее всего, проходил эукариогенез (см. рис. 8–3), вполне вероятно, что значительное количество мусорной ДНК эволюционировало на очень раннем этапе истории эукариот и, возможно, уже присутствовало у LECA – как и интенсивная случайная транскрипция. Можно представить себе, что на следующем этапе эволюции произошло «нарушение симметрии», которое привело к бифуркации, описанной при обсуждении истории интронов: линии с большим Ne установили строгий контроль за геномом, устранив большинство мусорной ДНК. В противоположность им, линии, не достигшие больших Ne, занялись «компенсацией» в виде постепенного приспосабливания возрастающего количества частей (бывшего) мусора под функциональную РНК (см. рис. 8–4).
Продолжая в том же духе, неадаптивная теория предлагает простое объяснение для перехода от простого типа регуляции транскрипции по Жакобу – Моно к сложной стратегии регуляции, используемой эукариотами. Вместо того чтобы использовать лишь один сайт связывания для единственного регулятора оперона (или, в редких случаях, несколько сайтов), как у прокариот, транскрипция большинства эукариотических генов регулируется в так называемом комбинаторном режиме, при котором несколько факторов транскрипции взаимодействуют сразу с несколькими, а зачастую и с большим числом сайтов, расположенных перед геном (Ravasi et al., 2010). У прокариот сайты связывания фактора транскрипции содержат достаточно информации для точного распознавания уникального сайта (или нескольких сайтов) в относительно небольшой геномной последовательности. Напротив, у эукариот сайт обычно содержит слишком мало информации для обеспечения точного распознавания (другими словами, геном содержит много сайтов с равным или даже большим сродством к данному транскрипционному фактору; Wunderlich and Mimy, 2009). Эта неадекватность одиночных сайтов связывания у эукариот обусловлена слабостью очищающего отбора, неспособного поддерживать множество точно сохраненных сайтов в геноме (см. обсуждение эволюции интронов ранее в этой главе), а также не может предохранить геном от роста, что увеличивает пространство поиска для транскрипционных факторов. Таким образом, комбинаторная модель может быть единственным решением для проблемы эффективной регуляции. Эволюции такого режима регуляции способствует рост генома, в частности достаточно высокая частота коротких тандемных дупликаций. Эволюция сложной регуляции экспрессии генов, являющейся отличительной чертой эукариот и необходимым условием для эволюции сложных многоклеточных форм, по-видимому, является наиболее ярким примером превращения мусора в функциональные элементы в ходе эволюции при слабом очищающем отборе. Как и в случае других аспектов эволюции сложности, отбор направлен здесь на предотвращение энтропийного коллапса, а не на непосредственное «улучшение» регуляции.