Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

На сайте mybooks.club вы можете бесплатно читать книги онлайн без регистрации, включая Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1). Жанр: История издательство -,. Доступна полная версия книги с кратким содержанием для предварительного ознакомления, аннотацией (предисловием), рецензиями от других читателей и их экспертным мнением.
Кроме того, на сайте mybooks.club вы найдете множество новинок, которые стоит прочитать.

Название:

Методы статистического анализа исторических текстов (часть 1)

Автор

Анатолий Фоменко

Жанр

Книги / Научные и научно-популярные книги / История

Издательство:

ISBN:

Год:

Дата добавления:

2 февраль 2019

Количество просмотров:

126

Читать онлайн

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки mybooks.club

Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) читать онлайн бесплатно

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко

Назад 1 ... 86 87 88 89 90 ... 145 Вперед

Если потоки анкет-кодов двух династий «МАЛО» ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА, то они изображают ОДНУ И ТУ ЖЕ РЕАЛЬНУЮ ДИНАСТИЮ. Если же два потока анкет-кодов изображают РАЗНЫЕ ДИНАСТИИ, то эти потоки анкет-кодов «ДАЛЕКИ» ДРУГ ОТ ДРУГА.

Как можно сравнивать потоки анкет-кодов двух династий и отвечать на вопрос: «похожи» они или нет? А если «похожи», то в какой степени? Пусть АК и АК' — анкет-коды двух правителей из разных династий, имеющих один и тот же порядковый номер в своей династии. Сравним эти два анкет-кода в каждом их пункте. Расхождение между пунктами будем оценивать в баллах. Для разных пунктов эти баллы следует установить различными, в зависимости от их важности и степени инвариантности сравниваемых «биографических фактов» относительно субъективных оценок летописцев. В результате экспериментирования с конкретными «летописными биографиями», мы выработали следующую систему оптимальную баллов, позволяющую быстрее обнаруживать возможные зависимости.

Для пунктов 1-10, за исключением пункта 3 (то есть длительности правления), будем использовать баллы 0,+1,-1.

Для пунктов 11–21 будем использовать баллы 0, +1/2, -1/2.

Для пунктов 22–33 — баллы 0, +1/3, -1/3.

При сравнении пунктов анкет-кодов возможны три случая. Проиллюстрируем их на примере пунктов с номером 5, то есть АК-5: «обстоятельства смерти правителя».

а) Сравниваемые сведения СОВПАДАЮТ. Например, и в АК, и в АК' сказано, что оба сравниваемых царя умерли естественной смертью. В этом случае этой паре пунктов мы придадим балл +1 (совпадение). Будем условно записывать это так: Е5=+1.

б) Сравниваемые сведения ЯВНО НЕ СОВПАДАЮТ, противоречат друг другу. Например, в АК сказано, что царь умер естественной смертью, а в АК' сообщено, что сравниваемый с ним царь убит в результате заговора. В этой ситуации мы дадим балл -1 (противоречие). Запишем: Е5=-1.

в) Сравниваемые сведения НЕЙТРАЛЬНЫ, то есть не совпадают, но и не противоречат друг другу. Например, в АК сказано, что «царь умер», а в АК' сообщено, что «царь был убит». Здесь дадим балл 0 (нейтральная ситуация), то есть напишем: Е5=0.

Итак, для каждой пары пунктов с номером i (сравниваемых анкет-кодов) мы получаем некоторое число Ei. Следовательно, для пары анкет-кодов АК и АК' двух сравниваемых царей можно подсчитать сумму всех получившихся чисел Ei:

f(AK,AK') = Е1 + E2 + E4 + E5 +… + E33.

Напомним, что коэффициент E3 мы здесь не рассматриваем, поскольку для сравнения длительностей правлений у нас разработана другая методика, изложенная выше.

Эксперименты с конкретными историческими анкет-кодами показали, что во многих случаях значение коэффициента Ei приходится полагать равным нулю, так как довольно часто сравниваемые сведения о двух царях и не совпадают, и не противоречат друг другу. Тем самым возрастает роль +1 и -1, когда они появляются. Далее, оказалось, что в подавляющем большинстве случаев приходится полагать E34 = 0. Дело в том, что обычно при сравнении «остатков биографий» двух царей обнаруживается, что сравниваемые второстепенные, не очень важные сведения настолько разнохарактерны, что их вообще трудно сопоставить. Например, про одного царя в «остатке биографии» АК-34 говорится, что он любил искусство и даже пел, а про другого царя сказано, что он у него были черные волосы. Эти сведения можно, конечно, принять к сведению, но сравнивать их бессмысленно. В таких случаях естественно приходилось полагать балл Е34 равным нулю.

Пусть теперь нам даны две летописные династии a и b, каждая из которых состоит из k последовательных царей. «Заполняя на каждого из них анкету», то есть составляя на каждого царя его анкет-код, мы получаем последовательность, поток анкет-кодов

АК1, АК2, АК3…, АКk для династии a, и другую последовательность, поток анкет-кодов

АК'1, АК'2, АК'3…, АК'k для династии b.

Последовательность анкет-кодов царей

(АК1, АК2, АК3…, АКk)

естественно назвать ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ a. Обозначим его через AK(a). Аналогично, последовательность «анкет царей»

(АК'1, АК'2, АК'3…, АК'k)

назовем ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ b и обозначим его через AK(b). Другими словами, поток анкет-код династии — это просто последовательность анкет-кодов составляющих ее царей, фактических правителей.

Теперь мы хотим сравнить между собой потоки анкет-кодов AK(a) и AK(b) двух династий a и b. Для каждой пары сравниваемых анкет-кодов царей мы вычисляем коэффициент f(AKi,AK'i). Наконец, можно определить число

f(AK1,AK'1) + f(AK2,AK'2) +… + f(AKk,AK'k) e(a,b) = —,

то есть попросту среднее арифметическое всех коэффициентов f(AKi,AK'i). Другими словами, шаг за шагом, мы сравниваем каждую пару последовательных царей двух сопоставляемых династий, подсчитываем для каждой такой пары «меру близости» f(AKi,AK'i), после чего берем среднее арифметическое по всем царям династии.

Таким образом, близость или удаленность друг от друга потоков анкет-кодов двух династий a и b можно оценивать парой чисел

(c(a,b), e(a,b)),

где коэффициент c(a,b)=ВССД описан выше.

Мы опускаем здесь описание численных экспериментов со сравнением потоков анкет-кодов летописных династий. Сообщим только результат: оказалось, что описанная выше методика позволяет довольно уверенно отделять «зависимые анкет-коды» от «независимых». Детали см. в [416], [438], [375]. Экспериментальная проверка подтвердила верность принципа малых искажений и в этом случае: оказалось, что потоки анкет-кодов, изображающие одну и ту же династию, отличаются друг от друга существенно меньше, чем потоки анкет-кодов разных реальных династий. Ясно, что это позволяет датировать потоки анкет-кодов династий, следуя схеме, описанной выше.

Ниже мы приведем конкретные примеры зависимых потоков анкет-кодов некоторых пар династий-дубликатов. Этот сравнительный материал очень полезен, так как показывает — насколько иногда ярко проявляется то обстоятельство, что перед нами два дубликата, попросту два разных летописных описания одной и той же реальной династии.

В заключении остановимся на одном важном обстоятельстве. Изложенная выше методика сравнения анкет-кодов является не просто «данью статистической моде», а чрезвычайно полезным орудием исследования. Важно, что методика нацелена на сравнение не просто какой-то пары отдельных летописных биографий, а на сравнение ДВУХ ДЛИННЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ТАКИХ БИОГРАФИЙ. Например, мы будем сравнивать двадцать последовательных биографий царей из одной династии с двадцатью последовательными биографиями царей из другой династии. Такие примеры см. ниже. Вывод о зависимости двух династий можно делать только на основе сравнения двух «длинных потоков биографий».

Напротив, близость, «похожесть» двух ОТДЕЛЬНЫХ ИЗОЛИРОВАННЫХ биографий каких-то персонажей ни о каком хронологическом дублировании может не говорить. Ведь не составляет особого труда подобрать пару «похожих биографий» двух разных исторических деятелей из современной нам эпохи, выдергивая из их жизни близкие, иногда поразительно похожие факты. Причем, таких «похожих фактов» можно иногда набрать довольно много. В то же время совершенно ясно, что делать отсюда какие-то «хронологические выводы» не следует. Все эти совпадения могут оказаться просто игрой случая. Но совсем другое дело, когда мы обнаруживаем две близкие ДЛИННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ, два ДЛИННЫХ «ПОТОКА» удивительно похожих биографий. Когда формальная статистическая методика «вылавливает» в огромном наборе древних документов пару «ПОХОЖИХ ДЛИННЫХ ПОТОКОВ БИОГРАФИЙ», — причем «похожесть» эта устанавливается не «на глазок», а формальным образом, становится ясно, что мы обнаружили нечто весьма серьезное. Тем более, что наши методы позволяют (хотя и грубо) оценивать вероятность того, насколько такая «близость» случайна. Если оказывается, что вероятность случайного совпадения мала, это усиливает подозрения, что мы действительно натолкнулись на «размножение» одной и той же реальной династии в разных летописях.

Подчеркнем далее, что во всех примерах пар зависимых династий a и b, которые мы вскоре продемонстрируем, однозначно прослеживается следующее обстоятельство. Пусть, например, a — это римская династия, b германская династия. Оказывается, что:

• Биография первого римского царя «похожа» на биографию первого германского царя.

• Биография второго римского царя «похожа» на биографию второго германского царя.

• Биография третьего римского царя «похожа» на биографию третьего германского царя.

И так далее, вплоть до конца всей династии, в которой пятнадцать или двадцать царей.

Назад 1 ... 86 87 88 89 90 ... 145 Вперед

Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки mybooks.club.

Похожие книги на "Методы статистического анализа исторических текстов (часть 1)", Анатолий Фоменко

Анатолий Фоменко читать все книги автора по порядку

Методы статистического анализа исторических текстов (часть 1) отзывы