Выборы в Думу (2016 г.)

#1
Ну что, в России через пару недель намечается цЫрк под названием "голосуй, не голосуй, все равно получишь...мало".

Мне лично интересны две вещи:
(1) Какой будет явка по сравнению с 2011 и 2012. Вангую, что даже по официальным цифрам она будет ниже процентов на пять-десять (в 2011 было 60%)
(2) Сколько будет фальсификаций. Увидим ли мы опять пресловутую "пилу Чурова", насколько будет вытянут вправо "хвост" ЕР на гистограмме распределения голосов, и тыды.
 
#2
Ну и, до кучи. Я накропал небольшой псто в ЖЖ о мат. методах которыми можно выявить статистические аномалии являющиеся признаком фальсификации результатов голосования. Копипаста:

Метод первый. Распределение голосов на избирательных участках.

Взгляньте на график внизу, это результаты выборов в Думу в 2011 году. По оси абсцисс отложена явка в процентах. По оси ординат -- процентная доля избирателей, проголосовавших за данную кандидатуру, от общего числа зарегистрированных избирателей на избирательных участках с такой явкой. Малый график слева-сверху это спектр Фурье.



Во-первых сразу же бросаются в глаза пики на значениях явки 65, 70, 75, 80, 85, 90, 95, 100%. Вероятность случайного возникновения таких регулярных пиков астрономически мала, и при том появление их очень просто объяснить человеческой психологией и стремлением показать "красивые" цифры в отчете. В 2011 под этими пиками находилось около миллиона дополнительных голосов за ЕР, что их итоговый результат меняет не очень сильно (примерно на 1 %). Но зато никаких сомнений в рукотворном происхождении пиков быть не может.

Во-вторых, налицо крайне необычная форма распределения. Помимо основного максимума в районе 55%, распределение имеет «плечо» со стороны больших явок и резкий пик вблизи 100%, причем при высоких явках доли голосов за все кандидатуры, кроме кандидатуры власти, начинают падать, а все потерянные ими голоса вкупе с дополнительными голосами от роста явки отходят к кандидатуре власти. Распределение голосов на честных выборах необязательно должно быть нормальным (например в Израиле или Германии на выборах видна четкая корреляция между явкой и результатами разных партий) -- но подобной кластеризации вы там не найдете.

Такой же график для президентских выборов в 2012 году, имеются те же статистические аномалии что и в 2011, пусть и чуть менее ярко выраженные:



Вот более наглядная иллюстрация. По оси абсцисс отложена явка в процентах, а по оси ординат процентная доля избирателей, проголосовавших за выигравшую выборы партию/кандидатуру. Кроме российских выборов в 2011 и 2012 году также приведены результаты выборов в иных странах, в т.ч. и выборы в Уганде на которых партия власти обвинялась в масштабных фальсификациях результатов голосований. Обратите внимание на кластеры участков с высоким процентов явки и высоким же процентом голосов за партию власти (обведены красным):



Причем в самой России в недавнем прошлом гистограмма явки не имела этого ярко выраженного кластера на высоких значениях явки. На графике ниже (источник) показано распределение явки на общероссийских выборах в период с 1995 по 2003 год (не включены национальные республики, с ними уже и тогда были проблемы):



Ну и еще одна визуализация. Совокупное количество голосов за партию власти как процент от явки. Обычно эта кривая выглядит как сигмоида, но в случае с российскими выборами в 2011/2012 и с выборами в Уганде вместо плато на правой части кривой мы имеем весьма высокий прирост.



Больше информации, с конкретными мат. методами которые помогут дать вероятность того или иного распределения голосов:
P. Klimek, Y. Yegorov, R. Hanel, and S. Thurner. Statistical detection of systematic election irregularities (2012).
Kobak D, Shpilkin S, Pshenichnikov MS Statistical anomalies in 2011–2012 Russian elections revealed by 2D correlation analysis (2012)

Метод второй. Анализ последней и первой цифры.

Начнем с анализа последней цифры. Для этого надо взять абсолютную явку и абсолютное количество голосов на всех участках, и записать последную цифру (или последние две цифры, при должном размере участков). Т.е., к примеру, если явка на участке X была 1034 человек -- мы записываем в табличку цифру 4, или цифру 34. Последние цифры явки со всех участков компилируются в один набор данных, и затем мы анализируем их распределение.

В честных выборах распределение этих цифр должно быть более-менее равномерным, ибо последняя цифра абсолютной явки является по сути случайной. Но если результаты "рисуются", то снова проявляется человеческая психология: когда людям надо выдумать некую случайную цифру, они тяготеют к определенным числам (например "красивый" ноль в качестве последней цифры); также не любят повторяющиеся цифры (напр. 22), но в то же время часто выдают последовательные цифры (напр. 12).

В качестве примера, вот анализ выборов в Нигерии по последней цифре явки. Налицо статистическая аномалия, которая может быть объяснена фальсификацией результатов на изберательных участках:



Более подробно тут: Bernd Beber and Alexandra Scacco. What the Numbers Say: A Digit-Based Test for Election Fraud (2012).

Теперь о первой цифре (или первых двух цифрах) абсолютной явки на избирательных участках. Сам метод в принципе очень похож на метод "последней цифры", вот только ожидаемое распределение берется не равномерное, а соответствующее т.н. закону Бедфорда, который описывает вероятность появления определённой первой значащей цифры в распределениях величин, взятых из реальной жизни:



Подробнее тут: Walter R. Mebane. Election Forensics: Vote Counts and Benford’s Law (2006)

Заключение

Оба вышеуказанных метода требуют доступа к данным индивидуальных избирательных участков, так что надеюсь, что в этом году все результаты по УИКам будут также выложены Центрбизберкомом в интернет. Скажем, в случае с крымским референдумом в 2014 году в открытый доступ эти данные так и не попали (впрочем там все равно были крайне странные цифры общей явки в Севастополе, лично я думаю, что рисовавшие этот результат люди попросту не озаботились проконсультироваться с кем-то знающим статистику и тервер).

Гистограмму распределения голосов на этих думских выборах и без меня найдется кому сделать (вангую посты о "пиле Чурова" в топе ЖЖ). А вот анализа первых/последних цифры я в 2011/2012 году не помню, так что буду не прочь буду запилить анализ и глянуть что там и как. Если результаты будут интересными -- выложу тут.

Ну и необходимый дисклеймер, ибо некоторые, возможно, захотят прикопаться к технической стороне вопроса. Статистические методы никогда не смогут доказать наличие фальсификаций. Они лишь могут отвергнуть нулевую гипотезу (которой в данном случае является тезис "выборы были честными") с некоторым уровнем статистической значимости, и с учетом неких вводных предположений (например центральной предельной теоремы).
 
Последнее редактирование:
#3
Ну, с почином, хе-хе :) Снова пики на пятикратных значениях явки, снова весьма интересный хвост на высоких значениях оной. То что заштриховано -- это статистически аномальные голоса, если предположить что голоса за ЕР должны быть распределены нормально. Т.е. есть немало оснований предполагать, что треть голосов за ЕР фальшивые.



Тут больший размер графика: http://ic.pics.livejournal.com/podmoskovnik/11997705/75579/75579_original.png

via
 
#6
Что то "Единая Россия» – колыбель российской демократии" (с) маловато на мой взгляд набрала. Подтасовали в пользу Зюганова и Жириновского?. А вообще хочу поздравить россиян с правильным выбором.
Надеюсь в Думе найдутся светлые головы, которые предложат перенести выборы президента РФ в Думу для экономии средств в кризисное время
 
#7
Что то "Единая Россия» – колыбель российской демократии" (с) маловато на мой взгляд набрала. Подтасовали в пользу Зюганова и Жириновского?. А вообще хочу поздравить россиян с правильным выбором
Ты не трынди, а в графиках разбирайся...
 
#9
Зачем мне какие то сомнительные графики когда есть предварительные результаты официальных органов . Выбор сделан и выбор верен
Мужчина старался, формулы выводил, а ты "сомнительные".
Видишь, у него явка 95%. Путину и не снилось.
 
#13
"Желание партии власти победить любой ценой оказалось сильнее страха перед президентом"
Это шедеврально
 
#16
Судя по СМИ еще остались, процентов пять
А что вас смущает в выборе россиян? ЕР получила конституционное большинство, это же значительно улучшит и политический климат в РФ и жизнь простых россиян