Действительно, сравнивая на нашей графике главный предложный спектр Пушкина с таким же спектром «Малиновой воды» Тургенева (в последней колонке рис. 29), мы видим, что они очень сходны, и потому для отличия Тургенева от Пушкина главный предложный спектр негоден и надо искать других.
Да и вообще нельзя решать вопроса об авторстве по какому-либо одному небольшому спектру, в роде взятого нами и состоящего лишь из трёх членов. Необходимо составить очень длинный многочленный спектр, или несколько коротких, но разнородных по своему содержанию спектров, и это тем более необходимо, что не всякий член спектра абсолютно постоянен у данного автора по частоте своего употребления. Здесь в полной мере господствует закон случайных отклонений от средней нормы, дающей вместо средней частоты употребления вариационную с размахом АВ, который, однако, тем более суживается, чем больше тысяч слов отсчитано нами в исследуемом отрывке, т. е. если при числе N слов (рис. 30) вариационный криволинейный треугольник будет иметь вид АВС, то при числе 2N слов он получит вид A1В1C1, а при большем числе слов его основание ещё больше сузится за счёт вырастающей высоты, так как площадь его всегда одна и та же, если перечислена на промилли (пли на проценты).
Рис. 30. Широкая или узкая вариационная дуга вероятных отступлений многократно повторяющихся фактов от средней нормы, при малом или большом количестве их подсчитанных повторений.
Но и при меньшем числе слов неправильное определение по причине значительной величины вероятной ошибки возможно лишь тогда, когда мы исследуем только три-четыре распорядительные частицы, а при десятке их всегда обнаружится общий характер лингвистического спектра для данного писателя.
Особенно обязательно это для старых авторов рукописного периода, которые не могли десятки раз «исправлять свой слог в корректурах», заменяя другими как раз те распорядительные частицы, которые для них слишком привычны.
Очень интересно отметить, например, что те самые члены главного предложного спектра (в, на, с), которые обнаружили постоянство у Пушкина и у Гоголя, совсем не обнаруживают этого у Толстого, и главный предложный спектр у него является в двух вариациях. Первая (например, в «Смерти Ивана Ильича» и в «Корнее Васильеве») напоминает спектр Пушкина, хотя и с несравненно меньшим числом частицы в (рис. 29), а вторая вариация (например, в «Трёх смертях» и «Трёх старцах») напоминает Гоголя, но с несравненно меньшим числом предлога с.
Здесь является вопрос: отчего зависит это расчленение главного лингвистического спектра Толстого на два типа? Оттого ли, что он сильно корректировал свои произведения и этим сделал свой главный предложный спектр неопределённым, пли те перевороты, которые он переживал в своём мировоззрении и направлении своего творчества, отзывались и на слоге его речи? Конечно, у каждого автора, писавшего более полувека, лингвистический спектр не может оставаться всё время совершенно неизменным. Он должен подвергаться медленной эволюции, как и световые спектры физических тел, изменяющиеся по мере повышения температуры. Однако, у Толстого обе вариации так резко различились на приведённых мною графиках, что наводят на мысль о специальной корректурной обработке автором их частоты, и исследование в этом отношении всех других его произведений является в высшей степени желательным.
Перейдём теперь к другим спектрам тех же писателей в тех же их произведениях. Рассмотрим, например, один из многих возможных союзных спектров (рис. 31). Я взял для его составления, как видно по таблице, сначала союз а, затем союз и, когда он употребляется в выражениях в роде «был и он», «я и знал», т. е. служит не обозначением конца перечня, а чисто слоговой приставкой, вследствие чего я и поставил его в кавычках («и»). Затем я взял тот же союз и в начале фраз, когда он пишется с большой буквы. В спектре Библии этот член дал бы преобладание над предыдущими, а у взятых мною писателей он всегда в минимуме, как видно по его графике. Этот спектр тоже оказался различен у них всех. У Гоголя и Пушкина здесь преобладает слоговое «и», у Толстого же «а»; кроме того, Пушкин отличается от Гоголя почти полным отсутствием библейского предфразного И (как оно употребляется во фразах в роде: «И был вечер, и было утро», «И пошёл Иисус» и т. д.).
Рис. 31. Один из союзных спектров.
Спектр пз наиболее часто встречающихся местоимений: этот, свой, тот оказался уже несоставимым у современных писателей при подсчёте только одной тысячи слов, так как этих местоимений у них оказалось лишь по нескольку на тысячу, а малое количество повторений какого-либо случайного фактора, как известно из статистики, не даёт возможности для вывода в нём закономерностей, благодаря уже отмеченному мною закону случайных отклонений от средней нормы тем более широких, чем меньше взято слов для подсчёта. Для того, чтобы местоименные и другие спектры дали достаточно типичные графики, нужно подсчитать их число по крайней мере среди пяти тысяч слов (а потом разделить полученную цифру на пять, с целыо приведения их к однородности с вышеприведёнными спектрами).
Но, даже и при значительной частоте повторения некоторых служебных частиц речи, могут обнаруживаться, как мы уже видели у Толстого, значительные колебания их числа в различных произведениях того же самого автора, если мы будем брать всего лишь тысячу слов. Образчиком такого неопределённого спектра является, между прочим, и приводимый мною на рис. 32, где я сопоставил отрицательную частицу не с союзом и, в его двух вариациях: первая (и') соединяет между собою существительные или прилагательные имена, вторая (и") – глаголы или пелые фразы. Мы видим, что колебания их числа в различных произведениях у того же самого автора настолько же резки, как и у двух различных писателей. Однако и тут могут найтись авторы, у которых этот спектр обнаружит явное постоянство во всех произведениях.
Рис. 32. Спектр и"-не-и'.
Все лингвистические спектры, где, как у предыдущих, лишь высчитывается прямое среднее число той или другой служебной частицы на тысячу слов, можно назвать естественными. Они не всегда удобны для наглядного выражения слоговой физиономии автора и, кроме того, с ними надо уметь обращаться при их подборе для спектра. Составьте, например, спектр из каких-либо двух часто употребляемых служебных частиц и из одной мало употребительной. Поставив её на графике в середине между двумя первыми, вы получите всегда фигуру в роде V, в которой сольются все индивидуальные особенности слога различных авторов. Но особенности каждого из них станут ясно определёнными, когда мы расположим все такие частицы не в случайном порядке, а по мере уменьшения или по мере увеличения их средней употребимости у писателей данной эпохи. Так я и сделал в предыдущих таблицах, иначе мои графики обнаружили бы лишь ложное сходство.
Чтобы избежать подобных фикций, при дальнейшем развитии предлагаемого мною метода следует все естественные спектры обращать в приведённые. Для этого надо только соблюдать следующее правило.
Среднее число повторений каждой служебной частицы на тысячу слов данного произведения нужно разделить на среднюю повторяемость той же частицы, вычисленную по многим авторам данной эпохи. Тогда вместо предыдущих абсолютных цифр получатся Коэффициенты индивидуальности авторов, величиною своею то более, то менее единицы. Изобразив для их представления на графике единицу высоты горизонтальной линией (рис. 33) и обозначив выше её избыток исследуемой частицы в десятых долях единицы, а ниже недочёт (в таких же долях), мы и получим приведённые спектры. Образчик их я дал здесь на рис. 33 для спектра из предлогов в, на и с, который в естественном виде был показан уже ранее, на рис. 29.
Составил я его так. Определив среднюю повторяемость этих трёх предлогов на тысячу слов по приведённым в примечании десяти произведениям Пушкина[7], Гоголя и Толстого, я получил знаменатели однородности для этих предлогов. Именно:
для В ………. 26
для НА ……… 20
для С ………. 11
Здесь предлоги в, на и с написаны надстрочными буквами в знак того, что они не относятся к какому-либо отдельному автору, а представляют собой обобщённые величины. Разделив на них число повторений тех же самых предлогов (найденных среди тысячи же слов) в отдельных произведениях Гоголя, Пушкина и Толстого, мы получаем результаты, приведённые на таблице XIII.