GSAC Analytics

Утекшие списки?

Утекшие списки?

Публикуемое исследование о списках избирателей изначально готовилось для нового проекта, который мы делаем к выборам 2020. Мы создаем веб-портал, на котором будет выложена масса архивных данных и исследований, которые я делал “в стол” в 2014-2016 годах и в штабе оппозиции в 2018 году. Также, там будет анализ текущей ситуации. Кстати, в связи с ожиданием джеримендеринга, у меня наконец дошли руки до освоения GIS-анализа, который я тоже буду выкладывать на сайт. Материалы будут на английском. Ближе к лету запускаемся.Я бы не стал форсировать события и публиковать сейчас материал, который у меня идет под порядковым номером 0, если бы не вчерашняя утечка списков, о которой сейчас довольно много разговоров. На этот счет у меня есть своя теория, которую я хочу поведать узкому кругу своих читателей. Тут будут немного сырые графики, для сайта я готовлю интерактивные и кликабельные.Когда я работал в штабе на президентских выборах, как и положено электоральному аналитику, я имел доступ к спискам избирателей. Надо сказать, что все партии и некоторые НКО получают списки на руки и это прописано в правилах игры. Юридически, эти списки имеют условно открытый статус. То есть их нельзя публиковать, но их можно исследовать. Публиковать можно только статистическую информацию, чем я сейчас и займусь.Исследование относится к списку, составленному ко второму туру президентских выборов в 2018 году (это самый свежий из розданных партиям на данный момент). В списках есть имена, адреса и даты рождения избирателей. Никаких телефонов, как в утекших списках там нет. Для начала давайте посмотрим на демографический профиль:

Для разгадки источников утечки списка этот график информации не несет, но во первых демографические гистограммы всегда интересно рассматривать, а во вторых, если у меня хватит рук и мозгов, я планирую закодить SEIR модель эпидемии для Грузии, в которой возрастное распределение играет важную роль (приглашаю к совместной работе).А вот следующий график непосредственно ведет к разгадке вопроса об утекших источниках. Расскажу о нем подробнее. Всего, в списке избирателей, который я исследую 3,528,658 записей. Я сгруппировал из этих записей 15 самых распространенных фамилий и построил гистограмму. Затем, я зашел на сайт Public Relation Service (PRS) на котором нашел форму для запроса количества носителей той или иной фамилии (время от времени эти данные публикуют и некоторые информагентства). На представленной гистограмме я так же отметил разницу в количестве человек в списках CESKO и PRS (красные столбики). Получилось, что в среднем, в списке PRS на 35% больше записей, чем в списке CESKO. Эта пропорция сохраняется и при большей выборке (реально я сделал это для 70 первых фамилий (16% списка) и для многих других на случайный выбор). Таким образом, мы приходим к выводу, что в списке дома юстиций приблизительно 3.5+35% млн. записей, т.е. где-то 4.8 млн. (нижняя граница), что удивительным образом совпадает с количеством записей в утекших данных.Число людей с 15 самыми распространенными фамилиями в Грузии.Для нашего аналитического портала я готовил эту информацию, чтобы показать сколько реальных избирателей живет в Грузии. Подсчет довольно простой. Как мы поняли, в реестре числится около 4.8 млн. человек, из них 3.5 млн. избирательного возраста и 1.3 млн. подростков (это согласуется со статистикой рождаемости за последние 18 лет). Отмечу, что списки избирателей, очевидно, формируются по спискам реестра. По переписи населения, которой я склонен верить с точки зрения методологии и честности проведения, в Грузии живет 3.8 млн. человек. Таким образом, около 1 млн. эмигрировали. Я склоняюсь к тому, что в этот миллион входят не только люди реально покинувшие страну, но и переехавшие в крупный город Грузии и не участвующие в переписи (и в выборах, ввиду отсутствия в Грузии практики открепления от участка).В итоге, как можно понять из моего рисунка (надеюсь), беря грубый расчет, что люди уезжают с мест прописки в равномерной возрастной пропорции (что конечно грубо), в Грузии в выборах участвует около 2.6 млн. человек. Для более точной аллокации необходимо больше данных с мест и привязка к urban/rural округам.

А теперь, наконец, перейду к причине того, почему я начал заранее постить материалы исследований. У меня есть предчувствие, что утекшие списки настоящие и они из реестра дома юстиции. Пойду немного дальше в своих догадках и предположу, что “утекли” из реестра они сильно раньше, чем вчера. Я, кажется, уже так далеко зашел, что начал находить ответы на вопросы, которые меня беспокоили в 2018. Например, откуда у власти телефоны, чтобы обзванивать граждан, тогда, как в отличие от оппозиции, они не проводили уличной агитации и не набирали базу сторонников? Тут я, пожалуй, и остановлюсь в своих догадках.В отрыве от этой истории скажу, что дата-инженеры, которые подготавливают пайплайны для работы с данными, иногда, подзарабатывают на их продаже в даркнете. А я так хвалил бэкофис мечты…Все это еще раз наталкивает на мысль о том, что “Грузинская мечта” никуда не собирается и сейчас максимальное внимание уделяет подготовке к выборам. Надо сказать, что комендантский час явно входит в предвыборную агитацию. Слышал множество восторженных откликов на нее.

Тамаз Хунджуа, руководитель проекта выборы 2020 Грузинского центра стратегического анализа GSAC