Транскрипция умеренно-повторяющихся последовательностей была продемонстрирована у зародышей морских ежей. Шеллер и др. (Scheller et al.) использовали ряд клонов отдельных членов нескольких семейств повторяющихся последовательностей для того, чтобы сравнить экспрессию транскриптов этих семейств в ядрах клеток зародыша на стадии гаструлы и клеток кишечника взрослого животного. Число копий в изученных семействах повторяющихся последовательностей колебалось от 20 до 1000 на геном; члены одних семейств были очень консервативны, т. е. их последовательности оставались в процессе эволюции неизменными, тогда как у членов других семейств они сильно дивергировали. В ядрах тех и других клеток были обнаружены транскрипты всех последовательностей, однако они четко различались в отличие от транскриптов уникальных последовательностей, которые очень сходны в ядрах как клеток гаструлы, так и клеток кишечника. Подобным же образом Константини и др. (Constantini et al.) обнаружили, что члены по крайней мере 80% семейств повторяющихся последовательностей из генома морского ежа представлены в РНК яиц. Самое интригующее наблюдение этих авторов состоит в том, что (в отличие от структурных генов) транскрипты обеих цепей повторяющихся последовательностей присутствуют в ядрах в виде копий РНК. В цитоплазме яиц обнаружены также транскрипты повторяющихся последовательностей, связанные с РНК, подобными матричным. Хотя присутствие транскриптов обеих цепей повторяющихся последовательностей и неожиданно, оно совместимо с гипотезой регуляции, при которой регуляторный транскрипт должен связаться с комплементарной ему, состоящей из повторяющихся последовательностей частью транскрипта, подлежащего процессингу. Следует помнить, однако, что совместимость - это еще не доказательство: может оказаться, что повторяющиеся последовательности несут совершенно иные функции. Например, Джелинек и др. (Jelinek et al.) изучали главное семейство коротких повторов в геноме человека - семейство Alu, присутствующее в геноме в нескольких сотнях тысяч сайтов. Эти последовательности транскрибируются с образованием ядерной РНК; неясно, однако, выполняют ли они какую-то функцию, существенную для ядерной РНК, или же эта их транскрипция - случайное следствие их функции или локализации в ДНК. Существует еще один класс повторяющихся последовательностей, который, как может оказаться, играет значительную роль в регуляции генной экспрессии в процессе развития, а также в эволюционных изменениях генной организации. Это подвижные элементы, представляющие собой длинные последовательности с короткими прямыми повторами на каждом конце. Эти последовательности, которые включены в молекулу ДНК в ряде сайтов, могут вырезаться и переноситься на другое место в пределах данного генома. Такие элементы впервые обнаружила генетическими методами Мак-Клинток (McClintock) в 50-х годах у кукурузы, но их молекулярная природа была выявлена лишь недавно. Функция этих элементов неясна, однако, включаясь рядом с 5'-концом структурных генов, они могут действовать как регуляторные элементы, активируя эти гены. Как показали Эрреде и др. (Errede et al.) и Уильямсон и, др. (Williamson et al.), один из таких элементов - последовательность Ty1 дрожжей-действует именно подобным образом. Работа Эрреде и др. представляет особый интерес, потому что гены, активируемые в результате включения примыкающего к ним элемента Ty1, приобретают способность реагировать на контролирующее воздействие аллелей, которые, определяя тип скрещивания, регулируют конъюгацию и споруляцию у дрожжей. Возможно, что эти подвижные элементы обеспечивают механизм, контролирующий генную экспрессию в процессе развития при помощи регулируемой модификации генома, однако такую их функцию еще следует продемонстрировать. Быть может, гораздо более важную роль подвижные элементы играют в эволюции, потому что они обладают способностью перемещать контролирующие элементы на новые места, тем самым добавляя гены к определенным контролирующим сетям или удаляя их из таких сетей. Сходные элементы были обнаружены у дрозофилы и у мыши.
В отличие от гипотез, основанных на допущении определенной функции для повторяющихся последовательностей, Дулиттл и Сапиенца (Doolittle, Sapienza), а также Орджел и Крик (Orgel, Crick) высказали предположение, что эти элементы представляют собой «эгоистичную» ДНК, т. е. что существуют, возможно, последовательности ДНК, способные включаться в геном и избегать элиминации. Эгоистичные последовательности предположительно способны реплицироваться так же хорошо или даже лучше, чем вся масса генома, не нанося вреда своему «хозяину». В заключение своих рассуждений Дулиттл и Сапиенца отмечают: «Если можно показать, что у данной ДНК или у целого класса ДНК, фенотипические функции которых не установлены, в процессе эволюции возникла некая стратегия (такая, как транспозиция), обеспечивающая ее выживание в геноме, то никаких других обоснований ее существования уже и не требуется». Надо сказать, что это малоутешительное соображение.
Разорванные гены и непредвиденные последствия
В начальный период развития молекулярной биологии все ее внимание было в основном сосредоточено на ряде открытий, сделанных в результате очень подробных исследований бактериофага и бактериальных генов. Этими исследованиями было установлено, что конечные молекулярные продукты генов - белки - представляют собой линейные полимеры, состоящие из аминокислот, непосредственно транслируемых с мРНК. которые построены из линейной последовательности нуклеотидов, комплементарных генетическому коду, заключенному в колинеарной цепи ДНК. Казалось, что так же обстоит дело и у эукариот, поскольку можно было показать, что их гены занимают в хромосомах дискретные участки и что их мРНК, подобно мРНК прокариот, непосредственно кодируют линейные последовательности аминокислот. Однако, когда успехи методов клонирования позволили выделять у эукариот отдельные гены и подробно изучать их структуру, эти привлекательные своей простотой взгляды на гены эукариот пришлось оставить. Большинство генов оказалось разорванными (split) на несколько кодирующих участков (экзонов), разделенных находящимися между ними некодирующими последовательностями - нитронами; это схематически показано на рис. 11-4 для генов нескольких эукариот. Число нитронов достигает иногда поразительно высоких значений, если учесть точность процессинга, необходимого для продуцирования функциональной мРНК: 33 интрона для гена вителлогенина A (Wahli et al.) и даже 50 нитронов для коллагенового гена (de Crombrugghe et al.)
В результате процесса транскрипции создается копия целого гена, содержащего как интронные, так и кодирующие последовательности в виде одной крупной молекулы ядерной РНК. При процессинге этого транскрипта, приводящем к образованию мРНК, интронные последовательности очень аккуратно вырезаются из предшественника мРНК, а затем кодирующие последовательности сращиваются (сплайсируются). Ряд событий, происходящих при экспрессии разорванного гена, схематически представлен на рис. 11 -5.
Существование нитронов в значительной степени устраняет недоумения, порождаемые парадоксом значений С. Интроны содержат как повторяющиеся, так и уникальные последовательности. Общая длина нитронов в данном гене нередко превосходит длину кодирующих последовательностей в 10 раз. Образование мРНК из гораздо более длинных транскриптов находится в соответствии с существованием очень длинных транскрипционных единиц, подобных обнаруженным у дрозофилы. В геномах Metazoa половина или более ДНК нередко бывает представлена повторяющимися последовательностями, и вследствие большой протяженности нитронов лишь часть остальной уникальной ДНК может кодировать синтез мРНК.
Причины существования у эукариот разорванных генов все еще неясны. Гены гистонов и некоторые другие гены эукариот не содержат нитронов; следовательно, интроны не могут быть условием, выполнение которого абсолютно необходимо для генной экспрессии. Можно представить себе, что интроны - это эгоистичные последовательности, включающиеся в жизненноважные гены и благодаря этому укрывающиеся от процессов, которые могут их элиминировать. Возможно, что подобные последовательности действительно существуют, однако именно преобладание нитронов у всех изученных эукариот заставляет считать, что разорванные гены составляют часть генома эукариот со времени их возникновения и часто существование этих генов связано с какими-то определенными причинами.
Рис. 11-4. Некодирующие последовательности (интроны) в структурных генах некоторых эукариот. Кодирующие последовательности, которые в конечном итоге и дают мРНК, показаны черным, а интроны - белым. (Lewin, 1980).
Рис. 11-5. Процессинг транскрипта разорванного гена, приводящий к образованию мРНК. Кодирующие последовательности показаны черным, единственный интрон - белым, а нетранслируемые 5'- и З'-последовательности покрыты пунктиром. При процессинге к 5'-концу транскрипта добавляется кэп GpppG, а к его З'-концу - полиадениловый фрагмент. Фермент, осуществляющий процессинг, очень точно проводит разрезы на границах между нитроном и кодирующими последовательностями и сращивает эти две последовательности, в результате чего получается полная кодирующая последовательность для мРНК.