программе Excel пакетом «Анализ данных», который поможет нам решить линейное уравнение регрессии, используя данные по 190 территориальным избирательным округам.
В результате у нас получится следующая статистическая зависимость:
Y расч. = 33,903+ 0,213X (2)
Все коэффициенты этого уравнения линейной регрессии (2) получились статистически значимыми с 99% уровнем надежности. При этом коэффициент детерминации у данного уравнения оказался равен 0,6511, то есть можно сказать, что оно на 65,11% объясняет итоги голосования за Петра Порошенко в избирательных округах, в то время как остальные 34,89% объясняются воздействием других факторов, не включенных в это уравнение. В целом расчетные значения Y, найденные по этому уравнению регрессии, отклоняются от фактических Y (данных ЦИК по доле проголосовавших за г-на Порошенко в округах) в среднем на 10,9 % по модулю.
Интерпретация уравнения (2) следующая: увеличение на одну единицу индекса вброса бюллетеней в среднем приводило к росту на 0,213 процента голосов, отданных (а вернее сказать, сфальсифицированных путем вброса бюллетеней) в данном округе за Петра Порошенко. При этом цифра 33,903 называется константой или свободным членом уравнения, показывающим долю голосов (в %), отданных за будущего президента вне зависимости от роста индекса вброса.
Мы уже говорили, что по итогам опросов, проведенных с 8 по 13 мая 2014 г., Центр социальных и маркетинговых исследований СОЦИС, социологическая группа «Рейтинг» и Киевский Международный институт социологии КМИС заявляли, что за Петра Порошенко в первом туре в целом по стране готовы были проголосовать лишь 33,9 – 34,1% опрошенных избирателей. Таким образом константа, полученная в результате решения уравнения регрессии (2), практически совпадает с данными соцопросов, проведенных накануне президентских выборов.
Построив уравнение регрессии на базе данных по 190 избирательным округам, нам в результате удалось существенно снизить разброс в оценке его параметров. Так, согласно полученному в Excel уравнению (2) точечная оценка его коэффициента регрессии = 0,213 и с 95% уровнем надежности находится в интервале от 0,191 до 0,235, а с 99,9% уровнем надежности – в интервале от 0,175 до 0,251.
В то время как точечная оценка константы уравнения = 33,90% и с 95% уровнем надежности находится в интервале от 31,76% до 36,05%, а с 99,9% уровнем надежности – в интервале от 30,26% до 37,54%. Чем более высоким задан уровень надежности, тем более широким оказывается разброс в интервальных оценках параметров уравнения регрессии. Но даже при 99,9% уровни надежности этот разброс у уравнения (2), построенного на основе статистики по 190 округам, оказался гораздо меньше, чем у уравнения (1), построенного на основе статистики по 25 регионам. Дополнительные математические подробности по уравнению регрессии (2) можно посмотреть в конце книги – в приложении.
Напомним, что константа (или свободный член) в уравнении регрессии (2) показывает долю голосов (в %), отданных за будущего президента Украины вне зависимости от роста индекса вброса бюллетеней. Как мы уже говорили, для того, чтобы не допустить второго тура г-ну Порошенко нужно было набрать более 50% голосов, а так как даже при самой оптимистической оценке величина константы в уравнении (2) не превышает 37,54%, то можно с 99,9% уровнем надежности утверждать, что при отсутствии вброса бюллетеней ему бы пришлось идти на второй тур.
Уравнение регрессии (2) в графическом виде представлено ниже – см. рис. 3. На этом графике точками представлены официальные данные ЦИК по доле проголосовавших за г-на Порошенко в 190 избирательных округах, а пунктирной линией изображена линия регрессии их расчетных значений, найденных по формуле (2). Линия регрессии построена таким образом, чтобы минимизировать сумму квадратов отклонений расчетных значений зависимой переменной Y от ее фактических значений. На рис. 3 хорошо видно, что пунктирная линия, характеризующая линию регрессии, вдоль которой локализуются расчетные значения, найденные по формуле (2), имеет наклон вправо, что свидетельствует о довольно тесной положительной регрессионной связи между ростом индекса вброса бюллетеней и повышением доли проголосовавших в избирательных округах за Петра Порошенко.
Источник: расчеты автора по данным ЦИК Украины
Рис. 3
Далее по формуле (2) рассчитаем, как индекс вброса бюллетеней повлиял на масштаб фальсификации президентских выборов в различных избирательных округах Украины. Так, в избирательном округе №91 Киевской области индекс вброса, рассчитанный на основе данных ЦИК по доле в этом округе недействительных бюллетеней, оказался равен 127,0. Подставим эту цифру в уравнение (2) вместо независимой переменной X, в результате чего найдем расчетное значение Y, в котором будет содержаться оценка уровня фальсификации выборов в этом округе:
Y расч. = 33,903+ 0,213X = 33,903+ 0,213*127,0= 33,90+ 27,05= 60,95%
Таким образом, согласно полученным расчетам, за П. А. Порошенко в избирательном округе №91 Киевской области должны были проголосовать 60,95% (результат мы округлили до сотых процента) всех участвовавших в голосовании избирателей. Из них 33,90% приходится на голоса, отданные за этого кандидата вне зависимости от индекса вброса бюллетеней. А вот остальные 27,05%, тесно коррелируют с ростом индекса вброса бюллетеней, то есть таким, по оценке уравнения регрессии (2), был уровень фальсификации волеизъявления избирателей в округе №91.
По официальным данным ЦИК, в целом в этом округе за будущего президента проголосовали в общей сложности 57,81% участвовавших в голосовании жителей. Поэтому, если из 57,81%, то есть из доли голосов, полученных г-ном Порошенко по версии ЦИК, вычесть их расчетное значение (60,95%), то полученная отрицательная разница -3,14% представляет собой остаток или случайную ошибку, связанную с воздействием на предпочтения избирателей прочих факторов, не включенных в уравнение (2).
Таким образом в общей сложности по округу №91 Киевской области доля реально проголосовавших за Петра Порошенко (без учета фальсификации) находится путем суммирования доли голосов, отданных за этого кандидата, согласно уравнению регрессии (2) вне зависимости от индекса вброса бюллетеней (то есть константы), с долей (остатком или случайной ошибкой), полученной за счет воздействия на предпочтения избирателей прочих факторов, не включенных в уравнение (2):
33,90 % + (-3,14%) = 30,76%
Аналогичные расчеты сделаны нами и по остальным территориальным избирательным округам (включая ЗВО – заграничный избирательный округ) – см. рис. 4 и табл. 5. На рис. 4 дана диаграмма, наглядно показывающая уровень фальсификации выборов в различных избирательных округах в пользу Петра Порошенко. На ней округа расположены слева направо по мере снижения доли бюллетеней, которые, согласно нашим расчетам, были вброшены в пользу ныне действующего президента.
Источник: расчеты автора по данным ЦИК Украины
Рис. 4
При этом наибольшим рост доли проголосовавших за Петра Порошенко за счет индекса вброса бюллетеней оказался в следующих округах: №86 Ивано-Франковской