7 – 1 (то есть аллель 7 встречается в 3466 маркерах DYS472 всего один раз)
8 – 3461 раз
9 – 4 раза
Таким образом, мы наблюдаем всего пять мутаций на 3466 маркеров DYS472 за 152 условных поколений (расчеты см. выше), прошедших со времени жизни общего предка этих гаплотипов. Это дает константу скорости мутации, равную примерно 5/3466/152 = 0.95 × 10-5 мутаций на условное поколение. Если давать более строгую формулировку, то при пяти мутациях надо написать (0.95±0.43) × 10-5 мутаций на условное поколение, или, что более правильно, (1.0±0.4) × 10-5 мутаций на условное поколение. Погрешности здесь рассчитываются по обычным правилам статистики, как квадрат обратной величины квадратного корня из числа мутаций. Здесь мы пренебрегли поправкой на возвратные мутации, потому что она в данном случае практически ничего не меняет, поправка составит менее одной сотой доли процента.
Но этот расчет проведен только на одной серии гаплотипов. В серии из 976 гаплотипов гаплогруппы R1a в маркере DYS472 прошла всего одна мутация, что при 154 условных поколениях до общего предка дает константу скорости мутации 1/976/154 = 0.67 × 10-5 на условное поколение. В целом, при подобном рассмотрении серий гаплотипов из 24 разных субкладов средняя величина для константы скорости мутации для DYS472 оказалась равной 0.8 × 10-5 мутаций на условное поколение.
Заметим, что это – самая «медленная скорость мутации из всех 111 маркеров. Для остальных задача решается еще проще, там мутаций больше.
Приведем еще несколько примеров «медленных» маркеров, расчеты по которым самые сложные. По парам отец-сын они вообще не определяются. Например, маркер DYS455. В серии из 3466 аллелей этого маркера наблюдаем следующее распределение:
9 – 6 (то есть аллель 9 встречается в 3466 маркерах DYS455 всего 6 раз)
10 – 28
11 – 3409
12 – 23
Считая, что все мутации одношаговые, получаем 63 мутации на 3466 аллелей DYS455 за те же 152 условных поколения, прошедших со времени жизни общего предка этих гаплотипов. Это дает константу скорости мутации, равную 63/3466/152 = 0.00012±0.00002 мутаций на маркер DYS455 за условное поколение. Поправка на возвратные мутации здесь составляет менее одного процента, поэтому вводить ее бессмысленно. В таблице выше дана константа скорости 0.00010, усредненная из многих расчетов по разным гаплогруппам.
Маркер DYS594:
7 – 1
8 – 2
9 – 4
10 – 3401
11 – 58
В сумме это дает 69 мутации на 3466 аллелей DYS594 за 152 условных поколения до общего предка. Это дает константу скорости мутации, равную 69/3466/152 = 0.00013±0.00002 мутаций на маркер DYS594 за условное поколение. Поправка здесь тоже составляет менее одного процента, поэтому вводить ее не будем. В таблице выше дана константа скорости 0.00017, усредненная из многих расчетов по разным гаплогруппам.
Маркер DYS490:
11 – 4
12 – 3437
13 – 18
14 – 7
В сумме это дает 36 одношаговых мутаций на 3466 аллелей DYS490 за 152 условных поколения до общего предка. Это дает константу скорости мутации, равную 36/3466/152 = 0.00007±0.00001 мутаций на маркер DYS594 за условное поколение. Поправка здесь тоже составляет менее одного процента, поэтому вводить ее не будем. В таблице выше дана константа скорости 0.00007, усредненная из многих расчетов по разным гаплогруппам, то есть точно такая же, как рассчитанная выше.
Маркер DYS492:
11 – 44
12 – 3398
13 – 22
14 – 2
В сумме это дает 70 одношаговых мутаций на 3466 аллелей DYS492 за 152 условных поколения до общего предка. Это дает константу скорости мутации, равную 70/3466/152 = 0.00013±0.00002 мутаций на маркер DYS492 за условное поколение. Поправка здесь тоже составляет менее одного процента. В таблице выше дана константа скорости 0.00015, усредненная из многих расчетов по разным гаплогруппам, то есть в пределах погрешности такая же, как рассчитанная выше.
А теперь приведем несколько примеров того, к чему приводят «быстрые» константы скоростей мутаций. Рассмотрим самую «быструю» – DYS 710, которая входит в 111-маркерную панель. Этот маркер не изучался в экспериментах на примерно 1700 парах отец-сын[73], как и многие другие маркеры. Точнее, там вообще не изучались 24 маркера, в 17 маркеров мутаций не было, в 15 маркерах прошла всего одна мутация, то есть 56 маркеров из 111 оказались непригодными для количественного определения скоростей мутаций. А поскольку еще в 11 маркерах прошли всего две мутации, то почти две трети всех маркеров оказались непригодными для определения констант скоростей мутаций.
Даже при одной сигма (доверительный интервал плюс-минус 68 %) погрешность в определении скоростей мутаций (точнее, констант скоростей мутаций) составляет ±100 % при одной мутации, и ±71 % при двух мутациях. А попгенетики их используют, в том числе и те маркеры, в которых мутаций вообще не было, при этом умудряясь рассчитать «скорости мутаций» для тех маркеров! В результате, разумеется, опять мусор в академических публикациях. Пример такой работы – исследование 2013 года[74], в авторах которого Chris Tyler-Smith, один из ведущих популяционных генетиков мира, и журнал один из ведущих. Я немедленно написал критическую статью в тот же журнал, и началась типичная для попгенетиков ситуация. Полгода ответа от журнала вообще не было. Я написал напоминание. После этого пришла одна рецензия, совершенно уклончивая, суть которой состояла в том, что несправедливо критиковать исследование, в котором используются мутации, определенные по парам отец-сын, поскольку многие их применяют. Поэтому моя статья быть принята не может. Я написал ответ, выразив возмущение сроками рецензии – более полугода, а также тем, что рецензент всего один, и само замечание неквалифицированное.
Через месяц пришла еще одна рецензия, в которой опять предлагалось снять критику за использование «скоростей мутаций» по парам отец-сын, снять таблицу, в которой показано, что значительная часть маркеров, используемых в работе Tyler-Smith, основывается всего на нескольких мутациях в парах отец сын. Так, по разным цитируемым авторами данным, в маркере DYS643 мутаций вообще не было, в DYS448, и DYS549 прошло всего по одной мутации (в 1213 и 555 парах отец-сын, соответственно), маркерах DYS533 и DYS 438 по две мутации (в 555 и 4565 парах отец-сын, соответственно), и это уже шесть маркеров из 21, используемых в работе, более четверти. Помимо того, в работе использовались печально известные «популяционные скорости Животовского», которые вообще завышали датировки в три раза. Я ответил, что ничего снимать не буду. После этого получил письмо уже от главного редактора с приложением еще одной рецензии. Суть ее была в том, что несправедливо критиковать именно эту статью, и особенно несправедливо по отношению к Tyler-Smith, поскольку то, о чем я пишу, характерно по отношению почти ко всем статьям популяционных генетиков, и почему начинать именно с Tyler-Smith? Поэтому мне предлагалось вообще снять всю критику данной статьи, и написать общую статью по скоростям мутаций в гаплотипах. Я отказался, написав, что сначала пусть они публикуют эту критическую статью, а потом обсудим более общую статью. После этого в течение года редактор мне регулярно напоминал, что они ждут общую статью, но о критической статье не упоминал. Но мне статьи не очень нужны, у меня их более пятисот, и более двадцати книг, поэтому я и не отвечал. Такое отношение к авторам мне не подходит. И после этого попгенетики еще мне высказывают претензии, что я не публикуюсь в журналах по популяционной генетике. Нет уж, меня ангажированные издания не устраивают.
Возвращаемся к «быстрым» скоростям мутаций. В маркере DYS710 в рассмотренном выше списке из 3466 гаплотипов (и, соответственно, аллелях данного маркера) наблюдается следующая картина распределений:
29 – 1 (то есть аллель 29 встречается в 3466 маркерах DYS710 всего один раз)
30 – 21 раз
31 – 49 раз
32 – 93
33 – 427
34 – 808
35 – 1058
36 – 759
37 – 182
38 – 50
39 – 17
40 – 1 раз
Видно, что картина мутаций значительно более «размазанная» по сравнению с медленными константами скоростей. Считая, что все мутации одношаговые, получаем 3594 мутации на 3466 аллелей DYS710 за те же 152 условных поколения, прошедших со времени жизни общего предка этих гаплотипов. Мы видим, как высокие скорости мутаций «размазывают» распределение мутированных аллелей в широком диапазоне. Если при минимальной скорости мутаций в DYS472 сохранились неизменными 3461 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации 0.000008 на условное поколение), и в DYS617 сохранились неизменными 2921 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации на в 63 раза выше, 0.0005 на условное поколение), то в случае самого «быстрого» маркера сохранились всего 1058 предковые (базовые) аллели, и число мутаций равно 3594 вместо 5 в DYS472, то есть в 700 с лишним раз больше. Константа скорости мутации была бы равна 3594/3466/152 (без учета поправки на возвратные мутации), то есть была бы равна примерно 0.0068 мутаций на условное поколение. Но из-за высокой скорости мутаций настолько много, что отношение числа мутированных аллелей к общему числу аллелей превышает единицу (3594/3466 = 1.037), и поправки на возвратные мутации «захлебываются», дают заниженные показатели, и в целом перестают работать. Формальный расчет по формуле, приведенной выше, показывает, что число возвратных мутаций здесь практически равно числу «прямых» мутаций, и полученную величину 0.0055 нужно удвоить. В действительности усредненная контанта скорости мутации этого маркера по разным гаплогруппам равна 0.0073 на условное поколение (25 лет), и она приведена в таблице выше.