Другим объектом исследования было расстройство, вызванное мышечной атрофией, – миотоническая дистрофия. С учеными, исследующими это заболевание под руководством Тони Каррано, моим соперником в борьбе за злополучный грант на исследование Х-хромосомы, мне повезло больше. После подписания соглашения, согласно которому я обязался делиться с ним полученными данными и взять его в соавторы, мы получили 3 клона из хромосомы 19, содержащие 100 тысяч пар оснований на участке, наиболее вероятно включавшем искомый ген. Постдок из Испании Антония Мартин-Гальярдо возглавила команду исследователей хромосомы 19, которую я финансировал из своего внутриинститутского бюджета. Я полагал и тогда, и сегодня, что успех – лучший способ в борьбе с критиками. Хорошие результаты всегда побеждают.
С применением метода дробовика секвенирование пошло быстро. Клоны в виде космид ДНК длиной около 35 тысяч пар оснований были упакованы в фаги и внедрены в E. coli. Вначале мы использовали акустические волны, чтобы раздробить множество копий ДНК на мелкие фрагменты размером около полутора тысяч пар оснований. Случайным образом отобрав 1000 фрагментов и секвенируя от 300 до 400 пар оснований генетического кода в каждом, мы теоретически должны были охватить все пары оснований ДНК в космиде минимум десять раз (350 × 1000 = 350 000).
Но и тут нас ждали трудности. Программное обеспечение тогда не предназначалось для обработки более нескольких сотен последовательностей, поэтому было невозможно справиться с тысячами, и нам пришлось прибегнуть к утомительному ручному методу. Для сколько-нибудь существенного прогресса требовались гораздо более мощные компьютеры, чем наши, и программное обеспечение значительно более высокого качества (несмотря на противоположное мнение наших коллег). И я стал нанимать на работу специалистов по информационным технологиям.
Одним из них был Марк Адамс из Мичиганского университета, вылитый Маколей Калкин (из кинофильма «Один дома»), имевший вид «нет-ничего-невозможного», исполнительный и энергичный парень в больших очках, с которым я провел собеседование в конце 1989 года. Меня поразило тогда, что этот худой молодой человек создал компанию по разработке программного обеспечения, еще учась в аспирантуре. Марк увлекался геномикой и был готов приступить к работе. Мы приобрели мощные компьютеры компании Sun, а я разыскал программистов для разработки новых способов интерпретации генетического кода, данные о котором у нас уже начали накапливаться. Благодаря незрячему программисту Марку Дабнику, который пользовался клавиатурой особой системы, «разговаривавшей» с ним в таком быстром темпе, что никто другой не мог ничего разобрать, мы стали по-новому смотреть на ДНК. Мы даже попытались использовать ее для прочтения генетического кода, проигрывая его в виде музыкальной фразы и надеясь обнаружить изменения в генетической структуре.
Но что бы мы ни делали, правильная интерпретация генетического кода оказалась практически невозможной даже после составления длинных отрезков хромосом. Программное обеспечение, с помощью которого можно идентифицировать последовательности бактерий, не работает в случае более сложного человеческого генома. В нем гены разбиты на небольшие сегменты (экзоны) бессмысленными участками ДНК (интронами), подобно тому, как бессмысленная реклама прерывает телефильм. Поэтому ген часто состоит из частичек и кусочков огромного генетического кода, от сотен тысяч до миллионов пар оснований. Мы использовали самые совершенные программы, чтобы найти эти участки, но компьютер не мог отличить реальные гены от шума, генерируемого случайным сочетанием четырех букв замучившего нас генетического кода.
И тогда я придумал новый способ определить прогнозируемый ген, отыскав его аналог в матричной РНК. Всякий раз, когда в геноме человека обнаруживается реально действующий ген, мы находим и соответствующую молекулу матричной РНК, сокращенный вариант гена, который содержит только пары оснований генетического кода для создания белка. Превращая эту «летучую» РНК в кДНК для последующего секвенирования, мы обрели способ подтвердить наличие прогнозируемых генов.
Мы начали тестирование библиотек кДНК разных тканей человека, главным образом мозга и плаценты. Наши зонды состояли из последовательностей генов, прогнозируемых на основе компьютерного анализа ДНК из хромосом 4 и 19. Если бы удалось доказать, что клон кДНК является прогнозируемым геном в генетическом коде, его существование стало бы доказательством подлинности гена, а не артефактом. Несмотря на бесспорную логичность этого метода, потребовались месяцы напряженной работы, чтобы подтвердить наличие всего лишь нескольких истинных генов в изучаемой последовательности. Неудивительно, что в начале дискуссии о проекте генома методы анализа кДНК, которые были предложены (в частности, Сидни Бреннером и Полом Бергом) в качестве альтернативы секвенирования генома, сразу же были отвергнуты.
Однако я чувствовал, что нахожусь на правильном пути. Моя уверенность окрепла в 1990 году, когда меня пригласили на симпозиум в Японии, организованный производителем секвенаторов компанией ABI. Тогда я и узнал, что мои методы исследования генома считаются наиболее перспективными. Целый ряд японских ученых решили сосредоточить свои усилия на выделении и секвенировании клонов кДНК. Японцы пришли в восторг от моих результатов, поскольку они подтверждали их собственную методику. Два японских ученых произвели на меня особенно сильное впечатление и серьезно помогли усовершенствовать мою теорию. Одним из них был Хирото Окаяма из Осакского университета, который вместе с Полом Бергом разработал замечательный метод получения клонов кДНК и теперь хотел найти подтверждение, что они покрывают всю последовательность генов – так называемых полноразмерных кДНК.
Это имело определенное отношение к важнейшей проблеме при изучении кДНК – нестабильности мРНК при выделении ее из тканей. Эта молекула имеет тенденцию распадаться на более мелкие фрагменты, прежде чем ее удается полностью скопировать. Другие проблемы связаны с ферментом, называемым обратная транскриптаза, который используется для преобразования нестабильных мРНК в более стабильные кДНК. Фермент отсоединялся от мРНК, прежде чем заканчивал свою работу. Я был хорошо знаком с этим явлением: при использовании кДНК для изучения рецепторов адреналина я потерял так часть гена с одного из концевых участков клона.
Другим источником моего вдохновения был Кэнъити Мацубара, директор Института молекулярной и клеточной биологии Осакского университета, руководитель японской программы расшифровки генома человека и советник Монбусё (Министерства образования, науки и культуры Японии). Оба ученых были убеждены, что секвенирование полноразмерных клонов кДНК станет основной частью, а возможно, даже альтернативой всей работы по секвенированию генома, несмотря на то, что данный вариант был категорически отклонен американскими и британскими экспертами. И тут возникли еще и иного рода осложнения. Уотсон, считая, что богатая Япония паразитирует на исследованиях генома, финансируемых другими странами, в раздражении написал Мацубаре письмо с угрозой прекратить делиться с ним результатами исследований, причем в таких выражениях, что в прессе заговорили о «войне генов человека»{23}. «Если начнется война, я буду с ним воевать, – заявил Уотсон. – Слюнтяям никогда ничего не добиться в жизни».
Во время полета домой я только и думал, что о развиваемой в Японии методике секвенирования полноразмерной кДНК. А также о том, как легко было бы изучать геном человека, будь все клоны кДНК выделены и секвенированы. А ведь мне понадобилось долгих десять лет, чтобы обнаружить один-единственный ген, только один клон кДНК. Думал я и о том, каким неэффективным оказался метод дробовика для прочтения кода всего лишь тысячи или около того геномных последовательностей, и всё – чтобы найти всего один ген, или даже лишь его часть. А еще – о том, как трудно найти соответствующий клон кДНК, чтобы доказать существование этого гена.
И вдруг, на высоте 11,5 тысяч метров над Тихим океаном, меня осенило: я использовал правильную методику секвенирования, но не той ДНК! Что, если применить быстрый метод случайного секвенирования (метод дробовика) к клонам кДНК? Что произойдет, если просто случайно выбрать клон кДНК и секвенировать его за один проход? Мои секвенаторы одновременно прочитывали около 400 пар оснований генетического кода – более чем достаточно, чтобы найти соответствие в геномной базе данных. Это было подобно открытию алфавитного указателя к каталогу генов человека.