Палиндромы могут возникнуть в ДНК двумя способами. Самые короткие ДНК-палиндромы, которые становятся причиной появления «шпилек», возникают случайно, когда А, Ц, Г и Т организуются симметрично. Более длинные палиндромы также перетряхивают наши хромосомы, и многие из них – особенно те, которые наносят серьезный ущерб маленькой Y-хромосоме – возможно, возникают в результате специфического двухступенчатого процесса. По различным причинам хромосомы иногда случайным образом дублируют отрезки ДНК, а потом вставляют вторую копию куда-нибудь вниз по линии. Также хромосомы могут (иногда после разрыва сразу двух нитей) разворачивать отрезок ДНК на 180 градусов и прикреплять их задом наперед. Действуя в тандеме, дупликация и инверсия создают палиндром.
Большинство хромосом, однако, препятствуют появлению длинных палиндромов или по крайней мере стараются не допускать инверсий, которые они создают. Инверсия может разрушить или «отключить» гены, оставив хромосому неэффективной. Также инверсии могут резко уменьшить шансы хромосомы на кроссинговер – а это огромная потеря. Кроссинговер (когда одинаковые хромосомы пересекаются и обмениваются сегментами) позволяет хромосоме поменять свой генетический материал, приобрести лучшие версии, или версии, которые лучше работают вместе и делают хромосому более жизнеспособной. Не менее важно то, что хромосомы пользуются преимуществами кроссинговера, чтобы выполнить проверку контроля качества: они могут выстроиться в две шеренги, «глаза в глаза» и заменить мутировавшие гены немутировавшими. Однако хромосома может пересекаться только с хромосомой, которая выглядит точно так же. Если же партнер выглядит подозрительно не похоже, хромосома опасается получить болезнетворную ДНК и отказывается от обмена. Инверсии на этом фоне выглядят чертовски подозрительно, поэтому в подобных обстоятельствах хромосомы с палиндромами просто игнорируются.
У Y-хромосомы нетерпимость к палиндромам проявилась с самого начала. Давным-давно, еще до того, как млекопитающие отделились от рептилий, Х и Y были парными хромосомами и пересекались часто. Затем, 300 миллионов лет назад, один из генов хромосомы Y мутировал и превратился в «главный выключатель», заставляющий яички развиваться. До этого, вероятно, пол животного зависел от температуры, при которой самка высиживает яйца – схожая не имеющая отношения к генетике система определяет пол черепах и крокодилов. Благодаря этому изменению Y стала «мужской» хромосомой и, пройдя через разнообразные процессы, сконцентрировала другие мужские гены, преимущественно связанные с производством сперматозоидов. Как следствие, Х и Y стали выглядеть по-разному и, соответственно, уклоняться от кроссинговера. Хромосома Y не захотела рисковать своими генами, которые могла переписать злобная Х-хромосома, в то время как Х не хочет приобретать грубые гены хромосомы-мужлана, которые могут повредить женским ХХ-организмам.
После того как кроссинговер замедлился, Y-хромосома стала более терпимой к инверсиям, как коротким, так и длинным. Фактически она в своей истории претерпела четыре крупные инверсии, реально глобальные перестройки ДНК. Каждая из них создала много замечательных палиндромов – один из них сразу на три миллиона символов, но каждая вместе с тем приводила к тому, что кроссинговер с Х-хромосомой становился все тяжелее. В этом бы не было особого значения, если не учитывать, что кроссинговер позволяет хромосомам заменять злокачественные мутации. Х-хромосомы могут делать это в женских организмах с парой ХХ, но когда Y-хромосома потеряла своего партнера, злокачественные мутации начали накапливаться. И с появлением каждой новой мутации у клеток не было иного выбора, кроме как избавляться от Y-хромосомы и удалять мутировавшую ДНК. Результаты оказались неутешительны. Y-хромосома, когда-то имевшая внушительные размеры, потеряла почти все свои гены: из 1400 осталось чуть больше 20. При таком раскладе биологи поспешили записать «игреков» в доходяги. Похоже, что этим хромосомам суждено продолжать накапливать неблагополучные мутации и становиться короче и короче, пока эволюция не покончит с Y-хромосомами – и, возможно, в придачу и с мужчинами – совсем.
Палиндромы, однако, могут помиловать Y-хромосому. Шпильки в цепи ДНК – это плохо, но если Y-хромосома загнется в гигантскую шпильку, это может привести к тому, что два ее палиндрома – с тем же набором генов, но идущим в противоположном порядке – вступят в контакт. Это позволит Y-хромосоме проверяться на наличие мутаций и заменять проблемные участки. Это все равно что написать: «А роза упала на лапу Азора» на листе бумаги, сложить бумагу чтобы буквы двух половин совпали, а потом буква за буквой исправлять все расхождения. Нечто подобное около 600 раз повторяется при рождении каждого мальчика. «Складывание» также позволяет «игрекам» компенсировать недостаток половой хромосомы-партнера и «рекомбинировать» с самими собой, заменяя гены на протяженности одного участка генами из другой точки.
Это палиндромное исправление совершенно гениально. Даже можно сказать, слишком гениально. Система, которую Y-хромосома использует для того, чтобы сравнивать палиндромы, к сожалению, не «знает», какой из палиндромов мутировал, а какой – нет; она только может определить, что они не совпадают. Поэтому нередко Y-хромосома заменяет хороший ген плохим. Авторекомбинация также (внимание!) приводит к тому, что ДНК между палиндромами случайным образом удаляется. Такие ошибки редко приводят к смерти человека, но могут сделать его семя бесплодным. В общем, Y-хромосома может исчезнуть, если не сможет корректировать мутации наподобие этой; но то, что нужно для такой корректировки – палиндромы, может, так сказать, кастрировать хромосому.
* * *
И лингвистические, и математические свойства ДНК способствуют ее конечной цели: управлению данными. Клетки накапливают информацию и обмениваются ею друг с другом с помощью ДНК и РНК, и ученые уже привыкли говорить о программировании и обработке информации нуклеиновыми кислотами, будто бы генетика является отраслью криптографии или информатики.
И действительно, современная криптография в какой-то мере происходит из генетики. В 1915 году молодой генетик по имени Уильям Фридман окончил Корнелльский университет и присоединился к эксцентричному научному обществу, базировавшемуся в одной из деревень Иллинойса. Это общество могло похвастаться голландской ветряной мельницей, ручным медведем по имени Гамлет и маяком – последнее особенно забавно ввиду того, что дело происходило в доброй тысяче километров от побережья. Первым делом босс Фридмана поручил ему исследовать, как лунный свет влияет на гены пшеницы. Но благодаря полученным в университете знаниям по статистике молодой ученый вскоре оказался вовлечен в другой сумасбродный проект своего начальства[23]. Целью проекта было доказать то, что Фрэнсис Бэкон не только написал пьесы Шекспира, но и оставил на страницах Первого фолио[24] подсказки, свидетельствующие о своем авторстве. Подсказки включали в себя изменение формы отдельных букв.
Фридман воодушевился этим заданием – он полюбил работать с шифрами с тех самых пор, как в детве прочел «Золотого жука» Эдгара По – и доказал, что предполагавшиеся отсылки на Бэкона – это полная чушь. Он писал, что по тем же схемам дешифровки можно «доказать» что угодно: например, что «Юлия Цезаря» написал Теодор Рузвельт. Тем не менее Фридман заинтересовался генетикой как биологическим инструментом расшифровки кодов и после успешных попыток реальной дешифровки стал криптографом, работающим на правительство США. Основываясь на статистических знаниях, накопленных из генетики, Фридман вскоре сумел прочитать секретные телеграммы, которые в 1923 году спровоцировали так называемый скандал «Крышка заварника», связанный с получением взяток представителям власти. В начале 1940-х годов он приступил к расшифровке японских дипломатических кодов, включая десяток скандально известных депеш, отправленных из Японии в японское посольство в Вашингтоне и перехваченных 6 декабря 1941 года: в этих депешах говорилось о том, что война неминуема.
Фридман бросил генетику, потому что в первой четверти ХХ века (по крайней мере на фермах) генетикам приходилось слишком много времени просто сидеть вокруг и ждать, пока глупые звери начнут размножаться: это было больше похоже на животноводство, чем на научный анализ данных. Если бы Фридман родился поколением-двумя позже, он бы смог взглянуть на те же вещи совершенно иначе. К 1950-м годам биологи уже регулярно ссылаются на пары оснований А-Ц-Г-Т как на биологические «биты» и на генетику в целом как на код, который нужно взломать. Генетика окончательно превратилась в анализ данных и продолжала развиваться в этом направлении – в том числе благодаря работе более молодого последователя Уильяма Фридмена – инженера Клода Шеннона. Его работы охватывают как криптографию, так и генетику.