Эра ДНКовых последовательностей
Изобретение Сэнгером в середине 1970-х годов метода секвенирования ДНК оказалось важнейшей вехой на пути создания базы данных о последовательностях ДНК всевозможных организмов. Но как раз в отношении создания таких баз данных это изобретение опередило свое время. Ведь тогда еще не был доступен Интернет, а без Интернета создание и использование базы данных о последовательностях ДНК практически немыслимо. Так что первые десять лет накопление знаний о различных геномах шло медленно, хотя и были сделаны важнейшие открытия, о которых мы говорили выше в этой главе и еще будем говорить в главе 6. Кроме Интернета, важнейшим изобретением, резко ускорившим и упростившим создание геномных баз данных, был метод полимеразной цепной реакции (ПЦР), который позволил амплифицировать, т. е. многократно приумножать любые выбранные участки генома. Но метод ПЦР заслуживает особого разговора, собственно, с него началась биотехнологическая революция, и мы о нем подробно поговорим в главе 10.
Метод Сэнгера позволяет секвенировать куски ДНК, содержащие около 1000 нуклеотидов, но они, конечно, гораздо короче геномной ДНК. Как же секвенировать целый геном, содержащий, в случае человеческого генома, 3 миллиарда нуклеотидов? Понятно, что геномную ДНК надо нарезать на короткие куски. Слава богу, у нас есть такой сверхточный инструмент: рестиктазы (см. главу 4). Итак, используя какую-нибудь рестриктазу или смесь двух рестриктаз, если хотим, чтобы куски были покороче, нарезаем ДНК на куски (рис. 19). Прекрасно, теперь можно прочесть каждый кусок методом Сэнгера. Но постойте, для метода Сэнгера нужен праймер. Откуда же нам знать, какой праймер использовать, ведь мы еще ничего не знаем о последовательности кусков? Как же быть? А очень просто. Ведь после действия рестриктазы у фрагментов, как правило, образуются «липкие концы». Например, после разрезания ДНК рестриктазой EcoRI образуются два взаимно комплементарных конца:
Но эти концы одинаковые, так что если мы сделаем на ДНК-синтезаторе такую искусственную молекулу:
то она прилипнет к обоим концам, образовавшимся под действием рестриктазы. Правда, в обоих случаях между нашей синтетической молекулой, которая называются адаптером, и куском неизвестной пока ДНК имеются два однонитевых разрыва, но это не беда: они легко залечиваются ферментом ДНК-лигазой. Теперь все наши фрагменты, полученные после нарезания геномной ДНК, оказываются снабженными по концам прекрасно известной нам последовательностью, ведь мы ее сами выдумали, когда делали дизайн адаптеров: все 20 нуклеотидов слева от концевого Г в верхней цепи адаптера я выдумал сам, совершенно произвольно. Так что теперь нет никакой проблемы с дизайном праймеров для чтения последовательностей кусков геномной ДНК методом Сэнгера. Снабженные адаптером фрагменты разделяются с помощью гель-электрофореза или каким-нибудь другим способом (рис. 19), а затем секвенируются.
Рис. 19. Секвенирование генома. Вся геномная ДНК подвергается разрезанию на фрагменты рестриктазой (то же самое повторяется с использованием другой рестриктазы, чтобы в дальнейшем на последней стадии провести сборку всей последовательности по перекрывающимся участкам фрагментов, полученных при разрезании разными рестриктазами). Рестрикционные фрагменты соединяются с синтетическими адаптерами, как объяснено в тексте, с использованием «липких» концов, создаваемых рестриктазой. Затем фрагменты разделяются, и каждый фрагмент отдельно секвенируется, после чего следует сборка всего генома
Итак, мы секвенировали все куски, на которые была порезана геномная ДНК рестриктазой EcoRI. Дело в шляпе? Не тут-то было! Мы же не знаем, в каком порядке расположены куски вдоль генома. Как их теперь правильно собрать? К сожалению, нет другого способа, как повторить все сначала, используя другую рестриктазу. Тогда мы получим другое разрезание и по перекрывающимся участкам сможем узнать, какой кусок, полученный с помощью первой рестриктазы, следует за куском, полученным с помощью второй рестриктазы (рис. 19). Конечно, такая сборка полной последовательности делается компьютером. Но повторное секвенирование так и так надо делать, чтобы избежать случайных ошибок, ведь, как бы ни была хороша ДНК-полимераза, она редко, но ошибается. В реальности, чтобы получить последовательность генома с очень малым количеством ошибок, всю процедуру повторяют 10 раз.
В общем, трудоемкое дело. Недаром прочтение первого человеческого генома, которое было осуществлено в рамках проекта «Геном человека» к 2000 году, обошлось американским налогоплательщикам в кругленькую сумму – в $3 млрд, по баксу за нуклеотид! Если бы такие цены сохранились, то эра ДНКовых последовательностей всерьез так бы и не наступила.
Поразительно, какие плоды приносит здоровая конкуренция при условии щедрого финансирования! Вскоре после завершения проекта «Геном человека» Национальный институт здравоохранения США объявил новый конкурс грантов под названием «Геном за $1000». Честно говоря, это звучало как насмешка: удешевить секвенирование в три миллиона раз! Это вы серьезно? Хотите верьте, хотите нет, но спустя 15 лет конкурс был остановлен, так как он выполнил свою задачу. За прошедшие годы какие только подходы ни напридумывали! Большинство идей не выдержало конкуренции, но несколько идей оказались суперуспешными. И даже те, что были оставлены, сыграли свою роль, заставляя совершенствоваться тем подходам, которые выжили, иначе им бы не удалось избежать печальной участи. Это была жесточайшая гонка! Как же теперь, после того, как ситуация более или менее устаканилась, выглядит «пейзаж после битвы»?
Лидирующее положение занимают методы, основанные на идее Сэнгера использования ДНК-полимеразы, они коллективно называются методами «секвенирования посредством синтеза». Самый успешный из них, который лежит в основе секвенатора, выпускаемого компанией «Иллюмина», даже использует идею Сэнгера по терминации синтеза. Но секвенатор «Иллюмины» примерно так же напоминает примитивный аппарат Сэнгера, как беспилотный электромобиль – ручную тачку. Все этапы в секвенаторе компании «Иллюмина» полностью роботизированы, это подлинный триумф инженерной мысли.
Остальные подходы в рамках «секвенирования посредством синтеза» не используют терминирования синтеза. В подходе, называемом пиросеквенирование, используется тот факт, что при присоединении ДНК-полимеразой очередного нуклеотида высвобождается дифосфатная группа, называемая пирофосфатом. Регистрация этого события, появление пирофосфата, лежит в основе метода пиросеквенирования. Метод был доведен до прибора, но он не выдержал конкуренции, и соответствующая компания обанкротилась. Более успешной оказалась сходная идея, основанная на том, что, кроме пирофосфата, при присоединении нуклеотида высвобождается еще один протон, т. е. ион Н+, что приводит к микроскопическому изменению pH в микролунке, сделанной в чувствительном к pH полупроводниковом материале, где идет ДНК-полимеразная реакция. В этом методе полупроводникового секвенирования изменение pH удается детектировать электроникой, так что в данном подходе последовательность читается непосредственно компьютером, а не путем превращения оптического сигнала в электрический, как это делается и в методе Сэнгера, и в машине «Иллюмины», и в случае пиросеквенирования. Это большое преимущество метода полупроводникового секвенирования, и соответствующая компания успешно конкурирует с компанией «Иллюмина».
Особняком стоит метод секвенирования индивидуальной молекулы ДНК, основанный на использовании нанопор. Вот уж воистину нанотехнология par excellence! Этот метод не принадлежит к разряду «секвенирования посредством синтеза». Если секвенаторы компании «Иллюмина» представляют собой громоздкие приборы, а приборы для полупроводникового секвенирования хоть и компактнее, но все же достаточно крупные, то устройство для секвенирования при помощи нанопор, MinION, выпускаемое компанией Oxford Nanopore, и прибором не назовешь, это устройство чуть больше обычной флешки, которое имеет USB-интерфейс. Подобно флешке, MinION вставляется в USB-порт компьютера, на него наносится капля, содержащая ДНК, и через короткое время в памяти компьютера оказывается записанной последовательность нуклеотидов этой ДНК. Как же работает это чудо-устройство?
Рис. 20. Прохождение ДНК через нанопору. В мембране, разделяющей ячейку на две половины, проделано отверстие диаметром около 4 нм. Это и есть нанопора. В обеих половинах ячейки находится солевой раствор (диссоциированные ионы соли обозначены точками), но молекулы ДНК первоначально находятся только в той половине, к которой приложено отрицательное напряжение. Ток в ячейке измеряется амперметром (А)