14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13 12 7 12 12
7 14 17 17 11 25 8 8 12 8 8 1113 11 12 10 8 13 8 13 14 10 11 9 20 17 15
36 9 13 14 39 33 36 9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11
11 11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8 16 10 9 33
27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8
27 7 5 13 7 15 28 25 60 42 12 31 22 20 12 3 4
Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.
Вопрос 44: Что такое аллель в ДНК-генеалогии?
АЛЛЕЛЬ, число тандемных повторов определенных блоков нуклеотидов в маркерах. Обычно в биологии понятие аллели относят к разным формам генов, расположенных в одинаковых маркерах хромосом одного типа, то есть гомологичных хромосом, и которые (аллели) при кодировании приводят к появлению различных вариантов одного и того же признака. В ДНК-генеалогии аллели задают разное число тандемных повторов в одном и том же маркере. Выше был приведен пример, когда в маркере DYS19 число повторов квадруплета ТАГА (TAGA) может быть от 11 до 19 раз. Числа аллелей в маркерах – важнейшая характеристика в ДНК-генеалогии, поскольку статистическое отклонение числа аллелей от предкового в каждом маркере гаплотипа позволяет рассчитывать, когда жили общие предки популяций, и эти расчеты работают на временах от сотен лет до нескольких миллионов лет.
Вопрос 45: Что такое гаплотип в ДНК-генеалогии?
ГАПЛОТИП – это совокупность аллелей, то есть наборов повторов в маркерах. Гаплотип записывается в виде набора чисел, которые отражают число аллелей в каждом маркере. Например, предковый гаплотип славян гаплогруппы R1a Русской равнины: в 12-маркерном формате (формате FTDNA)
13 25 16 11 11 14 12 12 10 13 11 30
в 25-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16
(здесь поставлено тире между первой и второй панелью маркеров, точнее – аллелей, потому что в длинных последовательностях чисел легко потеряться, а тире представляют собой метки, на которые можно ориентироваться),
в 37-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 11 19 23 16 16 18 19 35 38 14 11
в 67-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 11 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11
10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13
в 111-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 12 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11
10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13–32 15
9 15 12 26 27 19 12 12 12 12 10 9 12 11 10 11 11 30 12 13 24 13 9 10
19 15 20 11 23 15 12 15 24 12 23 19 10 15 17 9 11 11
Вопрос 46: Что такое «стандартная запись гаплотипов в формате FTDNA»?
ФОРМАТ FTDNA – форма записи гаплотипов, принятая компанией Family Tree DNA (США), основной компанией в мире по тестированию ДНК, и далее принятая в ДНК-генеалогии. В статьях по популяционной генетике такая запись практически не используется, и по простой причине – протяженные гаплотипы там не используются. Порядок записи гаплотипов в попгенетике другой, и часто нестандартный, меняющийся у разных авторов. Но поскольку гаплотипы в попгенетике используются редко, то им такой разнобой не мешает.
Порядок маркеров в 12-, 25-, 37-, 67- и 111-маркерных гаплотипах следующий (в верхней строке – порядковый номер маркера, в нижней – индекс маркера DYS):
Вопрос 47: Что такое дерево гаплотипов, и какую программу для их построений можно использовать?
ДЕРЕВО ГАПЛОТИПОВ, серия гаплотипов, рассортированная с помощью специальной компьютерной программы и представленная в виде круговой, спиральной или линейной диаграммы (см. ниже). Эта диаграмма группирует гаплотипы по динамике их мутаций во всех маркерах, и таким образом представляет дерево в виде совокупности ветвей гаплотипов, соответствующих их наиболее вероятным ДНК-генеалогическим линиям. Например, среди гаплотипов гаплогруппы R1a встречаются гаплотипы с «типовой» мутацией, в которой маркер DYS388=12 заменён на DYS388=10. Это отдельная (и древняя) ДНК-генеалогическая линия, потому что и многие остальные мутации более присущи этой линии «10», по сравнению с мутациями для линии «12». Действительно, на дереве гаплотипов линия «10» выделяется в отдельную ветвь, которую следует анализировать отдельно. В настоящей книге деревья гаплотипов строились с помощью программы PHYLIP[53].
В качестве примера приведем дерево гаплотипов гаплогруппы I1 из 800 гаплотипов в 111-маркерном формате в нескольких видах графического представления (последние три дерева – фрагмент) (рис. 8.).
Вопрос 48: Что такое гаплогруппа в ДНК-генеалогии?
ГАПЛОГРУППА, совокупность гаплотипов, объединённая «групповой» необратимой мутацией, присущей определённому человеческому роду, то есть потомкам одного «патриарха», как правило, тысячелетия назад. Эквивалентна понятию «род» в ДНК-генеалогии. Эти мутации («снипы») выбирают по определённым критериям. Гаплогруппой также называют сам род в таких выражениях, как «гаплогруппа мигрировала шесть тысяч лет назад на восток», понимая, естественно, что мигрировали носители данной гаплогруппы. В настоящее время классификация включает 20 основных гаплогрупп (плюс A0 и A00), от А до Т в алфавитном порядке, и тысячи «нисходящих» гаплогрупп и субкладов. Индекс гаплогруппы с надстрочным * (например, I*) показывает, что «нисходящих» мутаций у их носителей в классификации пока не обнаружено. Все тестированные носители – прямые потомки данной гаплогруппы или субклада.
Рис. 8. Дерево гаплотипов гаплогруппы I1 из 800 гаплотипов в 111-маркерном формате в нескольких видах графического представления (последние три дерева – фрагмент)
Вопрос 49: Что такое «бинарная гаплогруппа»?
БИНАРНАЯ ГАПЛОГРУППА, устаревшее название гаплогруппы, приводится здесь, потому, что всё ещё иногда встречается в публикациях. То же, что и «биаллельная гаплогруппа», потому что у мутации, её определяющей (снип, SNP, см. ниже) есть всего два состояния – либо мутация есть, либо её нет. То есть в соответствующем участке ДНК есть две аллели – исходная и мутированная. В отличие от них, тандемные мутации, или тандемные повторы (см. выше) являются, как правило, множественными и имеются в популяции в виде различных аллелей, то есть «полиаллельными».
Вопрос 50: Что такое субклад в ДНК-генеалогии?
СУБКЛАД, подчинённая, «нижестоящая» гаплогруппа, ДНК-генеалогическая ветвь в пределах той же гаплогруппы, все члены которой имеют не только мутацию основной гаплогруппы, но и дополнительную мутацию, общую только для данной ветви/ субклада. Например, гаплогруппа R имеет «подчинённые», или «дочерние» гаплогруппы R1 и R2; R1, в свою очередь, имеет R1a и R1b и так далее. R1a в настоящее время имеет 66 субкладов, утвержденных Международным обществом генетической генеалогии, R1b в настоящее время имеет 443 «официальных» субкладов.
Вопрос 51: Что такое мутация в ДНК-генеалогии?
МУТАЦИЯ, в ДНК-генеалогии биологическая ошибка при копировании последовательности Y-хромосомной ДНК, в результате которой (ошибки) или меняется число аллелей в определённом локусе (STR мутации, от Short Tandem Repeats), или происходит модификация гаплогруппы (SNP мутации, от Single Nucleotide Polymorphism). В отличие от мутации в генах, вызванной, например, радиоактивным излученияем, и при которой нуклеотид «ломается», то есть мутация там деструктивная, мутация в гаплотипах происходит обычно путем ошибочного копирования достаточно длинных фрагментов ДНК, при котором (копировании) происходит или удлинение, или укорачивание копируемого фрагмента ДНК. Это – не деструкция, а модификация. Но поскольку происходит отклонение от исходной «матрицы», то есть происходит ошибка копирования, то это тоже называют мутацией.
Вопрос 52: Что такое тандемная мутация в ДНК-генеалогии?
ТАНДЕМНАЯ МУТАЦИЯ в гаплотипе – это изменение числа аллелей в маркере. Происходит в среднем в маркере примерно раз в 500 поколений, хотя для каждого маркера своя скорость мутаций, которая для первых 37 маркеров варьируется от одного раза в 11100 поколений (DYS426, раз примерно в 280 тысяч лет) до одного раза в 140 поколений (CDYb, раз примерно в 3500 лет). Среди 67 маркеров есть такие, в которых мутация происходит раз в 125 тысяч поколений, то есть раз в 3.1 миллионов лет. По скоростям мутаций это сопоставимо со снипами. В популяции обычно наблюдается множественность аллелей в одних и тех же маркерах, то есть вариации аллелей. Совокупность этих вариаций позволяет рассчитывать время, когда жил один или несколько наиболее отдаленных предков популяции. Разные маркеры имеют разные скорости мутации в маркере, поэтому диапазоны вариации аллелей в разных маркерах разные.
Например, DYS426 – очень «медленный» маркер, всё человечество имеет всего четыре варианта аллелей – 10, 11, 12 и 13. Действительно, этот маркер имеет малую скорость мутации, она по оценкам равна 0.00009 мутаций на маркер на условное поколение. Это значит, что через пять тысяч лет среди тысячи наших современников всего у пятнадцати произойдет мутация в этом маркере – за 5 тысяч лет! Это несложно проверить, используя логарифмическую формулу, описанную выше: [ln(1000/985)]/0.00009 = 168 → 202 условных поколения, то есть 5050 лет.