MyBooks.club
Все категории

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

На сайте mybooks.club вы можете бесплатно читать книги онлайн без регистрации, включая Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1). Жанр: История издательство -,. Доступна полная версия книги с кратким содержанием для предварительного ознакомления, аннотацией (предисловием), рецензиями от других читателей и их экспертным мнением.
Кроме того, на сайте mybooks.club вы найдете множество новинок, которые стоит прочитать.

Название:
Методы статистического анализа исторических текстов (часть 1)
Издательство:
-
ISBN:
-
Год:
-
Дата добавления:
2 февраль 2019
Количество просмотров:
125
Читать онлайн
Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1)

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) краткое содержание

Анатолий Фоменко - Методы статистического анализа исторических текстов (часть 1) - описание и краткое содержание, автор Анатолий Фоменко, читайте бесплатно онлайн на сайте электронной библиотеки mybooks.club
Книга посвящена новому направлению в современной прикладной статистике. Предлагаются эмпирико-статистические методы распознавания зависимых и независимых текстов, в том числе исторических, т. е. текстов повествовательного характера, например хроник, летописей Эти методы позволяют во многих случаях датировать древние тексты, описанные в них события и могут применяться для анализа текстов самой разной природы, в теории распознавания образов, при анализе генетических кодов, для уточнения дат древней хронологии. Представлен богатый научный материал — результаты статистической обработки хроник, древних астрономических сообщений, летописей. Книга стала уникальным явлением в мировой научной литературе по прикладной статистике.Для специалистов в области математической статистики и распознавания образов, лингвистики, филологии, хронологии, истории, а также широкого круга читателей.

Методы статистического анализа исторических текстов (часть 1) читать онлайн бесплатно

Методы статистического анализа исторических текстов (часть 1) - читать книгу онлайн бесплатно, автор Анатолий Фоменко

Внутри БОГАТЫХ ЗОН ситуация меняется. Здесь летописец сталкивается с необходимостью ОТБОРА нужной ему информации из большого, и даже избыточного, резервуара сведений. Но чем больше объем уцелевшей информации, тем меньше летописец ценит отдельные ее фрагменты. Что часто приводит, как показали наши статистические эксперименты, к искажению амплитуд графиков объема уцелевшего фонда внутри богатых зон. Здесь хронист может также дать волю своим личным пристрастиям — отбирать одни сведения и намеренно «не замечать» другие.


1.6.5. Принцип амплитудной корреляции графиков объема в бедных зонах летописей

Извлечем следствия из принципа уважения к информации.

Пусть два летописца X и Y описывают одни и те же события на одном и том же интервале времени (А,В). Каждый из них достаточно хорошо «копирует» график объема БЕДНЫХ ЗОН фонда уцелевшей информации о событиях эпохи (А,В). Следовательно, ГРАФИКИ ОБЪЕМА ЛЕТОПИСИ X И ОБЪЕМА ЛЕТОПИСИ Y БУДУТ ПОХОЖИ ВНУТРИ БЕДНЫХ ЗОН. Теперь мы можем сформулировать модель — ПРИНЦИП АМПЛИТУДНОЙ КОРРЕЛЯЦИИ В БЕДНЫХ ЗОНАХ.

а) Если летописи X и Y ЗАВИСИМЫ, то есть описывают примерно одни и те же события, восходят к общему первоисточнику, то графики их объемов vol X(t) и vol Y(t) должны хорошо коррелировать внутри их бедных зон. В то же время, внутри их богатых зон амплитудной корреляции (при наложении графиков) может не быть.

б) Если летописи X и Y НЕЗАВИСИМЫ, то графики их объемов внутри их бедных зон должны быть также независимыми, то есть амплитудная корреляция (при наложении графиков) должна отсутствовать.

То есть, в случае зависимых летописей должны коррелировать не только точки всплесков сравниваемых графиков, но и ИХ АМПЛИТУДЫ.


1.6.6. Описание статистической модели и формализация

Рассмотрим интервал времени (А,В), введем на нем координату x, изменяющуюся от 0 до В-А, где В-А — это длина интересующего нас временного промежутка. Ясно, что x=t-A. Пусть f(x)=vol X(x) функция объема летописи X. Через G(x) обозначим функцию

G(x)=f(0)+f(1)+…+f(x),

то есть «интеграл» функции f от 0 до x. Назовем эту функцию НАКОПЛЕННОЙ СУММОЙ летописи X. Рассмотрим нормированную накопленную сумму

F(x) = G(x)/vol X,

где vol X — полный объем летописи X. Нормированная накопленная сумма изображается неубывающим графиком, значения которого нарастают от 0 до 1. Для разных летописей характер этого нарастания — разный.

Рассмотрим новую функцию g(x)=1-F(x).

См. рис. 3.21. Ее график не возрастает. Опуская математические подробности, сформулируем следующую модель.

ФУНКЦИЯ g(x)=1-F(x) ДОЛЖНА ВЕСТИ СЕБЯ В БЕДНОЙ, НАЧАЛЬНОЙ ЗОНЕ ЛЕТОПИСИ КАК ФУНКЦИЯ exp(-(λ) xα).

В математической статистике распределения такого вида называются распределениями Вейбулла-Гнеденко.

Следовательно, мы располагаем двумя степенями свободы параметром λ и параметром α, меняя которые, можем пытаться аппроксимировать функцию 1-F(x). Если это удастся сделать для конкретных летописей, мы подтвердим нашу теоретическую модель.

Проведенный нами статистический эксперимент с реальными летописями показал, что действительно, затухание графика 1-F(x) хорошо аппроксимируется функцией exp(-(λ) xα) при подходящем выборе значений λ и α.

В результате, мы можем теперь сопоставить каждой летописи, а точнее — начальной, бедной зоне этой летописи, два числа λ и α, отражающие характер поведения функции объема летописи. Назовем λ — параметром ОБЪЕМА летописи, а α — параметром ФОРМЫ летописи.

Оказывается, для нас наиболее важен параметр α. Именно он, как показали статистические эксперименты, наиболее хорошо чувствует характер распределения отдельных редких всплесков графика объема внутри бедной зоны летописи. Именно параметр α будет в первую очередь указывать нам — зависимы или независимы летописи. Параметр λ отвечает скорее за объем летописи, он чувствует — насколько летопись богата или бедна.

Итак, нашу гипотезу, статистическую модель можно переформулировать так.

а) Если летописи X и Y ЗАВИСИМЫ, то отвечающие им пары параметров (αX, λX) и (αY, λY) должны быть БЛИЗКИ, при условии, что они вычислены для бедных зон летописей.

б) Если же летописи X и Y НЕЗАВИСИМЫ, то отвечающие им пары параметров (αX, λX) и (αY, λY) «далеки друг от друга».

Удобно изображать пару чисел (α,λ) точкой на обычной плоскости с декартовыми координатами α и λ. См. рис. 3.22.


1.6.7. Гипотеза о возрастании параметра «формы» летописи с течением времени

Рассмотрим две разные исторические эпохи — с бедным начальным фондом информации, и с богатым начальным фондом. Во втором, богатом случае предположим, что объем этого фонда более или менее постоянен для каждого года. Тогда можно показать, математические детали мы здесь опускаем, — что значение α в первом, бедном случае должно быть МЕНЬШЕ, чем значение α во втором, богатом случае [410], [424]. Другими словами: БЕДНЫЕ ПЕРВИЧНЫЕ ФОНДЫ характеризуются МАЛЫМИ значениями α, а БОГАТЫЕ ПЕРВИЧНЫЕ ФОНДЫ ИНФОРМАЦИИ характеризуются БОЛЬШИМИ значениями α.

Но чем ближе историческая эпоха (А,В) к нашему времени, тем лучше сохраняются первичные фонды информации. Сегодня, например, письменная информация в среднем хранится куда лучше, чем в далеком прошлом. Следовательно, значение параметра α должно «в среднем» ВОЗРАСТАТЬ, когда мы перемещаем исследуемый нами отрезок времени (А,В) слева направо по оси времени, то есть ближе к нам.


1.6.8. Список и характеристики исследованных нами русских летописей

1) ПОВЕСТЬ ВРЕМЕННЫХ ЛЕТ. См. Памятники литературы Древней Руси. Начало русской литературы. М., 1978.

Эта знаменитая летопись охватывает события истории Руси в интервале якобы от IX до XII веков н. э. Основная часть летописи описывает эпоху якобы 850-1110 годы н. э., в принятой сегодня датировке. Летопись начинается с бедной зоны длительностью примерно в сто лет. Эта зона тянется якобы от 850 года и кончается якобы 940 годом н. э. Следующая часть летописи, за 1050–1110 годами н. э. уже достаточно богата.

2) НИКИФОРОВСКАЯ ЛЕТОПИСЬ, из группы Белорусско-Литовских летописей. См. Полное Собрание Русских Летописей (сокращенно ПСРЛ), том 35, М., 1980. Для анализа был взят период длиной в 650 лет якобы от 850 до 1450 годов н. э.

3) СУПРАСЛЬСКАЯ ЛЕТОПИСЬ, из группы Белорусско-Литовских летописей. См. ПСРЛ, том 35, М., 1980. Здесь период, снабженный в летописи датами, приходится якобы на 850-1450 годы н. э. Эта летопись, как и Никифоровская, может быть отнесена скорее к БЕДНЫМ текстам, по сравнению с более богатой Повестью временных лет.

4) АКАДЕМИЧЕСКАЯ ЛЕТОПИСЬ. См. ПСРЛ, том 35, М., 1980. Мы исследовали период 1338–1378 годы н. э. Эта летопись занимает промежуточное положение между бедными и богатыми текстами.

5) ХОЛМОГОРСКАЯ ЛЕТОПИСЬ. См. ПСРЛ, том 33, Л., 1977. Она охватывает период якобы 850-1560 годы н. э. Эта летопись содержит как богатые, так и бедные зоны.

6) ДВИНСКОЙ ЛЕТОПИСЕЦ. Краткая редакция и полная редакция. См. ПСРЛ, том 33, Л., 1977. Охватывает период 1390–1750 годы н. э. Летопись включает как богатые, так и бедные зоны.

Все эти летописи начинаются с БЕДНЫХ ЗОН, что и неудивительно. Функции объемов были подсчитаны А.Т. Фоменко. См. Приложение 4.1. Среди перечисленных летописей есть ЗАВЕДОМО ЗАВИСИМЫЕ и ЗАВЕДОМО НЕЗАВИСИМЫЕ. Например, ЗАВЕДОМО ЗАВИСИМЫ следующие летописи:

а) Никифоровская и Супрасльская,

б) Повесть временных лет и Никифоровская летопись, а следовательно, и Супрасльская летопись,

в) полная и краткая версии Двинского летописца.

ЗАВЕДОМО НЕЗАВИСИМЫ, например, следующие тексты:

а) часть Двинского летописца, охватывающая XIV век н. э., и его следующая часть, охватывающая XV век н. э.

Факт зависимости или независимости перечисленных хроник был подтвержден в [375], [388] статистически, на основе принципа корреляции максимумов. См. также выше.


1.6.9. Итоговая таблица численного эксперимента

Перечисленные летописи были разбиты на куски, охватывающие приблизительно по сто лет. Каждый из них был обработан по указанной выше методике. В результате были вычислены параметры αX и λX, а также коэффициент корреляции r, показывающий насколько хорошо соответствующий график exp(-(λ) xα) аппроксимирует затухающий график 1-F(x).

ТАБЛИЦА 1

Обозначение / Летопись / Эпоха (гг.н. э.) / α / λ / r

П-1 Повесть временных лет… 854–950… 1,847… 3,9×10… 0,953

П-2 Повесть временных лет… 918-1018… 3,003… 1,6×10… 0,955

П-3 Повесть временных лет… 960-1060… 2,497… 4×10… 0,956

П-4 Повесть временных лет… 998-1098… 2,378… 1,3×10… 0,954

Н-1 Никифоровская… 854–960… 1,511… 9,3×10… 0,966


Анатолий Фоменко читать все книги автора по порядку

Анатолий Фоменко - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки mybooks.club.


Методы статистического анализа исторических текстов (часть 1) отзывы

Отзывы читателей о книге Методы статистического анализа исторических текстов (часть 1), автор: Анатолий Фоменко. Читайте комментарии и мнения людей о произведении.

Прокомментировать
Подтвердите что вы не робот:*
Подтвердите что вы не робот:*
Все материалы на сайте размещаются его пользователями.
Администратор сайта не несёт ответственности за действия пользователей сайта..
Вы можете направить вашу жалобу на почту librarybook.ru@gmail.com или заполнить форму обратной связи.