«Капремонт в Перми». Анализируем открытые данные
Преподаватель журналистики со студентами работали с открытыми данными и выяснили много интересного про капитальный ремонт в Перми. Их опыт можно применить в любом регионе.
- Иван Печищев
- магистры интернет-журналистики ПГНИУ
- собственные средства и время авторов
В рамках дисциплины «Мастерская инфографики» мы постоянно что-то делаем с магистрами интернет-журналистики нашего университета. Как-то рассматривали статистику ГИБДД. Сейчас анализировали данные с сайта Фонда капитального ремонта домов Пермского края. Это главное — чтобы данные были открыты.
Это тот случай, когда данные рассказывают истории. Журналист получит информацию, о которой никто не рассказывает и которую не увидишь, пока не заглянешь в таблицы и не проанализируешь данные. После анализа мы узнали:
- самые старые дома в Перми, подлежащие капитальному ремонту в 2018-202 годах, 1913 года постройки;
- самый «молодой» дом — 2012 года постройки,
- в 2018 и 2019 года запланировано к ремонту не более 200 домов, зато в 2020 — сразу 934!
- есть дома, где стоимость ремонта в расчёте на жителя достигает 1,3 млн. Интересно, какими взносами можно накопить на такой ремонт? Получается, что взносы распределяются неравномерно?
Подобный анализ открытых данных может стать отправной точкой для журналистского расследования. Вопросов осталось много, и на них нужно искать ответы, делать запросы.
Как работали с таблицами
Над данными работали 8 студентов. Мы скачали таблицу с сайта Фонда капремонта, затем определили, какая информация нужна. Смотрели только Пермь. Создали файл Excel, куда заносили выбранные данные. Например, сортировали дома по годам ремонта, указывали стоимость ремонта и год постройки. Составление такой таблицы в Excel — чисто техническая работа. У нас вышло около 1200 строк.
Как не запутаться при работе с таким большим объемом данных? Дата-журналист Анастасия Валеева советует каждый шаг записывать в отдельно созданном документе. Например: отсортировали такие-то данные, выделили и скопировали такой-то столбец и так далее. Это позволяет увидеть все этапы работы.
Еще один способ — создавать промежуточные копии таблицы. Мы не работали в той таблице, которую скачали с сайта Фонда, а сделали ее копию и создавали их для каждого изменения, отдельно для карты и отдельно для инфографики. Это позволяет вернуться к исходнику и проверить данные.
Как визуализировали данные
У нас было несколько идей, как визуализировать полученные данные. Обсуждали, как лучше сделать. Решили использовать старый добрый Infogram и Google Карты. То, что получилось, — самый удачный вариант анализа и визуализации.
Учились с магистрами в пару кликов вносить на карту тысячу адресов. Когда они увидели, как просто это сделать, был вау-эффект. Google Карты позволяют не только одномоментно загрузить на карту тысячу точек, но и изменить вид маркера по конкретному критерию. Предлагались варианты выделить дома по стоимости ремонта, но карта выходила очень пестрой. Поэтому остановились на варианте выделить цветом год проведения капитального ремонта.
Долго обсуждали, какие виды чартов использовать в инфографике. Данные по году постройки дома и стоимости ремонта решили показать пузырьковой диаграммой. Из-за большого количества адресов, многие точки смешались, но зато четко видны экстремальные случаи: очень дорогой ремонт, «старый» или «молодой» дом. Здесь мы не загружали таблицу, а просто копировали данные из Excel и вставляли их в редакторе Infogram.
Студентам было интересно работать над проектом — выполняли не придуманное кем-то задание с выдуманными данными, а с реальными. И подобную работу мы с студентами будем проводить и в будущем.
Тема капитального ремонта — актуальная, она касается всех, потому что мы все платим взносы. И наш опыт по изучению открытых данных Фонда можно повторить в любом регионе.