Рис. 9. Значения индивидуальных констант скоростей мутаций для 111 маркеров
Вопрос 66: Почему датировки по мутациям в гаплотипах и по снипам часто не совпадают?
Строго говоря, это разные датировки. Расчеты по мутациям в гаплотипах наших современников дают временное расстояние до общего предка выборки. Если выборка малая, нерепрезентативная, то она может дать заниженное или завышенное расстояние до общего предка. С увеличением размера выборки, или числа выборок по изучаемой территории (вплоть до всего континента или всей планеты) датировка постепенно стабилизируется, приходя к значению, которое можно принять за наиболее особно-ванное. По аналогии, если бросать монету всего немного раз, то усредненное значение «вероятности» выпадения орла или решки может быть завышенным или заниженным по сравнению с известной вероятностью 0.5, но при увеличении числа бросков это усредненное значение стабилизируется, приближаясь к 0.5.
Важно, что время жизни общего предка выборки современников из определенной и выбранной гаплогруппы вовсе не обязательно покажет датировку образования данной гаплогруппы. Популяция данной гаплогруппы могла пройти «бутылочное горлышко», при котором могли выжить только некоторые, и потомство могло выжить и дожить до наших дней только от одного человека, пережившего бутылочное горлышко. Тогда, разумеется, датировка общего предка будет более недавней, чем датировка образования рассматриваемой гаплогруппы.
В отличие от этого, датировка по снипам не ограничена вымираниями древних популяций, если остался хотя бы один мужчина, прямое потомство от которого дожило до наших дней. Тогда цепочка снипов проходит в его Y-хромосоме до общего предка с шимпанзе и древнее. В этом причина, почему «датировка общего предка выборки» или «датировка общего предка региона», даже обширного, часто не совпадают друг с другом.
Пример – субклад V13 гаплогруппы E1b. Датировка образования субклада по снипам (компания YFull) – примерно 7600 лет назад, с учетом погрешности, приведенной YFull – 7600±1300 лет назад. С этим согласуется археологическая датировка ископаемого субклада E1b-V13, обнаруженный на севере Испании – примерно 7000 лет назад. Для вычисления датировки общего предка выборки современных гаплотипов собрали 193 гаплотипа в 67-маркерном формате по всей Европе, и их дерево гаплотипов оказалось почти идеально симметричным:
Рис. 10. Дерево 193 гаплотипов в 67-маркерном формате субклада E1b-V13
Все 193 гаплотипа содержат 2857 мутаций, что дает 2857/193/0.12 = 123 → 141 условных поколений до общего предка, то есть общий предок всей выборки жил 3525±360 лет назад[64]’ [65]. Мы столь подробно на этом останавливаемся, чтобы показать разрыв во времени между датировкой ископаемого гаплотипа группы E1b-V13, и датировкой общего предка современных носителей той же группы. Разрыв – почти четыре тысячи лет. На самом деле, разрыв, скорее всего, начался примерно 4500 лет назад, в ходе заселения континентальной Европы эрбинами, носителями гаплогруппы R1b, и продолжался тысячу лет. Это было время выживания ДНК-генеалогической линии E1b-V13, пока выживание не состоялось окончательно, то есть критический размер популяции был преодолен.
Теперь проверим, как ископаемый гаплотип соотносится с современными гаплотипами субкладаVl3. Ископаемый имеет вид
13 24 13 10 16 19 11 13 11 31 16 14 20 10 22
(ископаемый E1b-V13, Испания)
Предковый гаплотип, к которому сходится дерево, показанное выше, в 67-маркерном формате имеет вид
13 24 13 10 16 18 11 12 12 13 11 30–15 9 9 11 11 26 14 20 32 14 16
17 17 – 9 11 19 21 17 12 17 20 31 34 11 10–10 8 15 15 8 11 10 8 12 10
0 23 24 18 11 12 12 17 7 12 22 18 12 13 12 14 11 11 11 11
(предковый гаплотип E1b-V13, 3525 лет назад)
В маркерах, показанных для ископаемого гаплотипа, он редуцируется до следующего:
13 24 13 10 16 18 12 13 11 30 15 14 20 10 22
(предковый E1b-V13, 3525 лет назад)
Четыре мутации между гаплотипами (отмечены) разводят их на 2625 лет, и помещают их общего предка на (2625+3525+7000V2 = 6575±700 лет назад, что и соответствует датировке ископаемого гаплотипа в пределах погрешности расчетов. Таким образом, выжил, пройдя бутылочное горлышко популяции, прямой потомок «испанского» гаплотипа, и он принял эстафету рода, образовавшего сейчас дерево гаплотипов, показанное выше.
Напротив, для множества субкладов датировка для их образования по снипам и мутациям в гаплотипах, практически совпадают. Приведем всего несколько примеров – для субкладов I2a-S17250, l2a-Y4460 и I2a-Z17855, основных для носителей гаплогруппы I2a Восточной Европы, и снипы, и мутации в гаплотипах дали датировку 2300 лет назад. Для субклада R1a-Z280, который имеют половина этнических русских (наряду с субкладом R1a-M458), датировка по снипам и мутациям в гаплотипах дала 4900 лет назад, для субклада R1b-L23, основного субклада древнеямной культуры на территории современной России, потом переместившегося на Кавказ и в Месопотамию, датировка по снипам и мутациям в гаплотипах дала 6400±900 и 6000±600 лет, соответственно, и так далее.
Вопрос 67: В примере выше вы приводили значения констант скоростей мутаций и для отдельных маркеров, как DYS393 и DYS390, так и для всего гаплотипа, от 6- до 111-маркерного, и даже до 409-маркерного. Как же все-таки нужно считать, по отдельным маркерам или по целым гаплотипам?
Это – хороший вопрос, он часто служит предметом путаницы. Считать можно и по отдельным маркерам, и по целым гаплотипам, и это определяется целесообразностью в каждом конкретном случае, удобством, экономией времени.
Приведем пример – серию из 27 гаплотипов в 12-маркерном формате. Это – реальная серия гаплотипов из одного из проектов (киргизского) FTDNA.
13 24 16 10 11 14 12 12 10 13 11 18
13 24 16 11 11 14 12 12 10 13 11 18
13 24 16 11 11 14 12 12 10 14 11 17
13 24 16 11 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 19
13 25 16 10 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 14 11 17
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 15 11 17
13 25 17 11 11 14 12 12 10 14 11 18
13 26 16 11 11 11 12 12 10 14 11 17
Девять из них идентичны друг другу, это – базовые, или предковые гаплотипы. Они не успели мутировать за время, прошедшее от их общего предка. На все 27 гаплотипов приходится 27 мутаций (отмечены жирным шрифтом). Иначе говоря, за время, прошедшее от их общего предка, девять 12-маркерных гаплотипов полностью сохранились, 18 гаплотипов приобрели мутации. Популяционный генетик рассчитал бы «коэффициент разнообразия» гаплотипов, который никому и никогда не нужен, и на этом бы свою работу закончил соответствующей публикацией, а рецензент в журнале, тоже, естественно, попгенетик, статью бы без вопросов пропустил в печать. То, что это фактически мусор, ему бы и в голову не пришло, там «наука» такая. На самом деле эта серия гаплотипов позволяет расчитать, когда жил общий предок этих гаплотипов, и далее, прослеживая подобные гаплотипы по территориям, и каждый раз рассчитывая времена жизни общих предков, можно понять, в какую сторону направлялись древние миграции, и сопоставляя полученные данные с археологическими и лингвистическими показателями, можно получать более содержательные картины прошлого.
Рис. 11. Расчет времени до общего предка для 27 гаплотипов в 12-маркерном формате из Киргизского проекта FTDNA. Поскольку гаплотипы 12-маркерные, то же расстояние до общего предка (TMRCA), 1304±283 лет, повторено в колонке для 225-, 37-, 67- и 111-маркерных гаплотипов. Колонка для 6-маркерных гаплотипов показывает 1425±453 лет до общего предка, что является тем же самым в пределах погрешности расчетов. Остальными колонками следует пренебречь.
Так вот, рассчитать время жизни общего предка можно разными способами. Можно – используя все 12 индивидуальных констант (k) скоростей мутаций, и считать по каждому маркеру, раздельно. Их величины приведены выше, в ответах на вопрос 65. Тогда результатом расчета будет набор из 12 «времен жизни до общего предка», который следует усреднить Это – очень непродуктивный метод расчета, и так вручную никто не считает (тем более всего для 27 гаплотипов, с крайне бедной статистикой). Но это – основа для машинных (компьютерных) расчетов, особенно для сотен и тысяч гаплотипов, и итоговое усреднение проводится по всему полю данных. Именно так работает калькулятор Килина-Клёсова[66], в который заложены значения констант скоростей для 111 маркеров, и расчет проводится по массиву данных до 10 тысяч гаплотипов практически в любом формате. Время расчета даже для 10 тысяч 111-маркерных гаплотипов занимает всего несколько секунд. В данном случае у шести маркеров из 12 мутаций нет, так что для них формальное «время до общего предка» равно нулю, но оно усредняется с результатами по шести оставшимся маркерам, и суммарно оно оказывается равно 1304±283 лет до общего предка (без округлений). Скриншот калькулятора с экрана компьютера приведен на рис 11.