Новые гены могут возникать и быстрее — путем перетасовки частей имеющихся генов. Один такой случай зарегистрирован у человека. Ген SIGLEC-11 дуплицировался примерно 15 млн лет назад, еще до расхождения линий человека и шимпанзе. Его вторая копия в какой-то момент выключилась, перестала работать, и в ней накопились мутации. У шимпанзе эта отключенная копия так и осталась невостребованной, а у человека ее фрагмент заместил собой часть исходного гена SIGLEC-11. В результате получился почти совсем новый, чисто человеческий ген. Он кодирует рецепторный белок, относящийся к надсемейству иммуноглобулинов и присутствующий на мембранах лимфоцитов и некоторых клеток мозга. По-видимому, он выполняет нейропротекторную функцию — защищает нервные клетки от каких-то токсинов.
Рассмотрим один хорошо изученный пример появления нового гена путем дупликации и смены функции. Правда, на этот раз речь пойдет о гене, который появился не в гоминидной линии, а раньше — у общего предка человекообразных обезьян. Этот случай детально исследован бельгийскими и швейцарскими биологами в 2008 году (Rosso et al., 2008).
Для начала необходимо напомнить, что существует два основных механизма удвоения генов: «обычная» дупликация фрагментов ДНК и ретродупликация. Последнее означает дупликацию в результате деятельности ферментов — обратных транскриптаз. Гены обратных транскриптаз входят в состав мобильных генетических элементов — ретротранспозонов, которых в геноме любого млекопитающего насчитываются тысячи. Ретротранспозоны размножаются так: сначала клетка осуществляет транскрипцию (прямую, а не обратную) ретротранспозона, то есть синтезирует на матрице ДНК молекулу РНК. Затем эта РНК используется для синтеза закодированного в ней белка — обратной транскриптазы. Последняя в свою очередь может синтезировать на матрице РНК комплементарный ей фрагмент ДНК и встроить его в хозяйскую хромосому (подробнее об этом рассказано в книге «Рождение сложности»).
Время от времени обратные транскриптазы переписывают в ДНК хозяина информацию не только со «своих» молекул РНК, создавая новые копии ретротранспозонов, но и с «хозяйских» РНК, создавая тем самым «лишние» копии хозяйских генов. Отличить такие ретродуплицированные гены от обычных можно по отсутствию в них некодирующих вставок — интронов. Дело в том, что после транскрипции интроны из молекулы РНК вырезаются (это называется сплайсингом). В результате получаются «зрелые матричные РНК», которые используются, с одной стороны, клеткой для синтеза белка, с другой — обратными транкриптазами для создания ретрокопий. В зависимости от того, в какой генетический контекст попадет ретрокопия, она может оказаться либо работающей (тогда ее называют ретрогеном), либо, чаще, она работать не будет, и тогда ее называют ретропсевдогеном.
В эволюции приматов, в том числе человекообразных, ретрогены появлялись довольно часто. Ген CDC14Bretro появился 18–25 млн лет назад у общих предков человекообразных обезьян (гиббонов, орангутанов, горилл, шимпанзе и людей) в результате ретродупликации. Его «родителем» был очень древний ген CDC14B, первые варианты которого появились еще у одноклеточных. Функция этого гена (точнее, кодируемого им белка) состоит в регуляции некоторых стадий клеточного деления. Ген весьма консервативен, то есть мало меняется в ходе эволюции, что говорит о важности выполняемой им функции. Варианты CDC14B настолько похожи у разных организмов, что если у дрожжей удалить этот жизненно необходимый ген и вместо него вставить человеческий аналог, то дрожжевые клетки совершенно нормально живут и делятся.
Как же сложилась судьба ретрокопии этого гена, которая появилась у древних человекообразных?
Здесь необходимо еще одно пояснение. Исходный ген CDC14B у приматов подвергается альтернативному сплайсингу, то есть из незрелой матричной РНК, считанной с этого гена, может быть «нарезана» не одна, а несколько — в данном случае четыре — разных зрелых матричных РНК (которые используются затем для синтеза четырех различающихся вариантов белка). Подробнее о явлении альтернативного сплайсинга рассказано в книге «Рождение сложности». Предком CDC14Bretro является один из четырех сплайс-вариантов, который исследователи обозначили как CDC14Bpar (от parent — «родитель»). Остальные варианты получили названия CDC14B1, CDC14B2 и CDC14B3.
Затем авторы проверили, в каких тканях производятся соответствующие молекулы РНК. Картина получилась любопытная. Оказалось, что все четыре сплайс-варианта исходного гена CDC14B производятся во всех тканях человеческого организма, однако его ретрокопия CDC14Bretro работает (экспрессируется) только в мозге и семенниках. Особенно интересно, что ретроген активно работает во время раннего эмбрионального развития в переднем мозге эмбриона, в той области, из которой впоследствии развивается кора больших полушарий.
Похоже на то, что пока «родительский» ген продолжал заниматься своей старинной работой — регуляцией клеточных делений во всех тканях, — его ретрокопия занялась чем-то более специфическим в мозге и в семенниках. Эта смена тканевой локализации, по-видимому, произошла еще до отделения предков гиббонов от предков остальных человекообразных, то есть вскоре после дупликации, 18–25 млн лет назад. Это подтверждается тем, что у гиббонов, шимпанзе и людей ретроген экспрессируется в одних и тех же тканях — в семенниках и в мозге (горилл и орангутанов пока не проверяли).
Интересные результаты дал также анализ изменений нуклеотидной последовательности ретрогена в ходе эволюции. Сопоставив последовательности гена CDC14Bretro разных человекообразных обезьян с эволюционным деревом этой группы, авторы реконструировали «ископаемые» варианты этого гена, которые имелись у вымерших предков, а также установили, какие нуклеотидные замены и в каком количестве произошли в каждой отдельной веточке. Как известно, нуклеотидные замены делятся на синонимичные, не ведущие к изменению структуры кодируемого белка, и несинонимичные, или значимые. Первые находятся вне сферы внимания естественного отбора и могут накапливаться свободно. Вторые влияют на фенотип и поэтому либо отсеиваются отбором (если они вредны), либо, наоборот, распространяются в популяции и в конце концов фиксируются (если они полезны). Поэтому по соотношению синонимичных и значимых замен можно судить о том, находился ли данный ген под действием одного из двух вариантов отбора. Если синонимичных замен много, а значимых мало, то ген находился под действием отрицательного (очищающего) отбора, который отбраковывал большинство значимых замен. Если доля значимых замен повышена, то ген находился под действием положительного отбора, который способствовал фиксации полезных изменений.
Так вот, оказалось, что ген CDC14Bretro в ходе эволюции гоминоидов почти всегда находился под действием очищающего отбора, и только однажды он подвергся кратковременному, но сильному действию положительного отбора. Этот период соответствует веточке дерева, которая соединяет общего предка орангутанов и африканских человекообразных обезьян (= горилла + шимпанзе + человек) с общим предком последних. Движущий отбор действовал на данный ген только в промежутке от 14 до 7 млн лет назад и только в одной эволюционной линии, которая соответствует общим предкам африканских человекообразных обезьян (после отделения от этой линии предков орангутанов и до разделения ее на линии, ведущие к горилле и к предку шимпанзе и человека). За этот период в гене зафиксировалось 12 значимых замен и ни одной синонимичной.
Большинство значимых замен, зафиксировавшихся у предков африканских человекообразных, расположены в концевых участках гена, от которых зависит, в какие части клетки будет доставляться белок. Поэтому авторы решили проверить, в каких частях клетки работают белки, кодируемые четырьмя сплайс-вариантами CDC14B и ретрогеном CDC14Bretro. Оказалось, что два из четырех сплайс-вариантов скапливаются в клеточном ядре, а два другие, в том числе «предковый» вариант CDC14Bpar, локализуются в цитоплазме и прикрепляются к микротрубочкам — особым внутриклеточным структурам, играющим важную роль в клеточном делении.
Белки, кодируемые ретрогеном CDC14Bretro, у гиббона и орангутана ведут себя так же, как их молекулярный предок — сплайс-вариант CDC14Bpar, то есть прикрепляются к микротрубочкам. Однако белки, кодируемые тем же ретрогеном у гориллы, шимпанзе и человека, ведут себя иначе: они игнорируют микротрубочки и вместо этого прикрепляются к мембранам эндоплазматической сети (системы внутриклеточных каналов, служащей для синтеза и транспорта различных веществ).