Аварийные знаки. Исследование о том, как статистика автомобильных аварий доказывает слабость российской власти
Автор: Андрей Дорожный
Дата-история: «Аварийные знаки. Исследование о том, как статистика автомобильных аварий доказывает слабость российской власти»
Материал опубликован изданием «Проект» 19 декабря 2018 года
Инструменты: API, Tableau Public, d3.js, Google Sheets, Adobe Illustrator
Источники данных: открытые данные сайта stat.gibdd.ru
В конце 2018 года на сайте издания «Проект» вышел материал, основанный на анализе данных ДТП за три года, под названием «Аварийные знаки. Исследование о том, как статистика автомобильных аварий доказывает слабость российской власти»
ДТП — это важная общественная проблема. Многих смертей от аварий можно избежать, но для этого важно понимать причины и обстоятельства этих происшествий. Мы решили изучить их с помощью анализа данных.
Статистика о дорожно-транспортных происшествиях, где есть хоть один пострадавший или погибший, публикуется в открытом доступе с 2015 года на сайте stat.gibdd.ru. Мы скачали данные через API. Сейчас создан сайт «Карта ДТП», где можно скачать данные по интересующему вас городу совершенно бесплатно.
Данные о ДТП представляют из себя json-файл (иерархичный формат хранения данных), но нам необходимо было перевести данные в табличный формат. Данные содержат то, что заполняют сотрудники ГИБДД на месте аварии. Есть информация о месте ДТП, числе пострадавших и погибших, погодных условиях и других обстоятельствах произошедшего.
Поиск истории
Сложной задачей было найти, за что зацепиться в этих данных. Гипотез было много, из них можно было сделать десятки дата-материалов. Можно было сделать простой анализ того, в каких регионах больше пострадавших, в каких регионах больше погибших. Сделать подробные карты. Можно было попробовать посмотреть число ДТП на федеральных трассах. Большая их часть происходит именно там.
В итоге мы остановились на следующих гипотезах:
-
Много участников скрывается с места ДТП. Есть регионы, где доля таких водителей гораздо больше, чем в других. Много водителей, скрывшихся с места ДТП, так и не находят.
-
Не у всех участников ДТП есть обязательная страховка ОСАГО.
-
В республиках Северного Кавказа, особенно в Чечне, очень высокое количество погибших на 1000 ДТП. Мы выдвинули гипотезу, что не все ДТП там не попадают в статистику.
Все эти гипотезы сходились в одну большую: государство не контролирует исполнение законов и правил дорожного движения.
Анализ данных
Для того, чтобы найти закономерности, мы визуализировали данные в сервисе Tableau. Из них в итоге выбрали те, по которым сформулировали гипотезы. Вот некоторые черновые визуализации.
Самое большое число пьяных водителей приходится на 1 января.
Значительная доля водителей скрывается с места ДТП.
Многих из них не находят.
Не у всех участников ДТП есть полис обязательного страхования ОСАГО.
История
Данные помогают нам найти историю, но читатели не любят смотреть на цифры. Людям интересно читать про людей. Я начал искать человеческие истории, которые иллюстрировали бы то, что мы нашли в данных.
Подобные вещи удобно искать в социальных сетях — там пишут о том, о чем местные СМИ могут по разным причинам промолчать. Для первой гипотезы нашелся подходящий случай в поселке Лиски Воронежской области. Там человек, похожий на местного районного судью, был замечен в ДТП и скрылся. Я почитал местные СМИ и связался с редакторами, чтобы лучше разобраться в ситуации.
Вторую историю про то, что сбежавших водителей не находят, я нашел в селе Щекино Тульской области. Там у Татьяны Выборновой сбили тестя и водитель скрылся в ночи. Его, разумеется, так и не нашли.
В третьем разделе об институте ОСАГО нашлось много фактов по теме. Все эксперты в один голос заявляли, что смысла оформлять ОСАГО нет — выплаты маленькие, а взносы большие. Все это показывало несостоятельность реформы.
Четвертая часть была посвящена истории с Северным Кавказом: там скрывают очень много ДТП. Непросто было найти СМИ, которые об этом писали. Но такие кейсы тоже были собраны и вошли в историю.
Визуализация
Долго решали, как сделать лучше – визуализировать данные на карте или столбиками. Столбики мне кажутся более наглядными, потому что размеры регионов не всегда отражают размер показателя. В итоге с помощью библиотеки d3.js мы сделали и рейтинг, и карту. Аналогичные вещи можно сделать в сервисах по визуализации данных Datawrapper или Flourish.
Несколько мелких графиков мы сделали прямо в Google Sheets и позже редактировали в Adobe Illustrator. Если жалко денег на подписку, можно сделать это в сервисе Figma.
https://www.proekt.media/wp-content/uploads/2018/12/Osago_percent-2.png
https://www.proekt.media/wp-content/uploads/2018/12/Osago_vs_auto-3.png
https://www.proekt.media/wp-content/uploads/2018/12/kavkaz-5.png
Редактура
Редактура дата-материала делится на две части: фактчек текста и фактчек данных. С данными все сложнее: нужно, чтобы редактор разбирался в теме. Цифры проверяли в режиме реального времени по датасету, текст — классической проверкой фактов.
Дополнительно пришлось брать комментарии по методике сбора данных. Выяснилось, например, что если человек умер в больнице в течении двух недель после ДТП, эти смерти тоже учитываются. Сложнее со смертями, которые произошли не на дорогах. Учитываются они или нет, разобраться не удалось. Ну и конечно нельзя упускать то, что часть ДТП осталась за кадром, так как о них не сообщили сами участники.
Отклик
Материал был опубликован и стал первым подобным масштабным исследованием проблемы ДТП в России. История не собрала миллионов просмотров, как мне кажется, потому, что у читателей есть ощущение, что смерти от ДТП естественны и предотвратить их нельзя. Тем не менее, она относится к разряду «вечнозеленого контента», который не потерял актуальности и по сей день.