«Капремонт в Перми». Анализируем открытые данные

Преподаватель журналистики со студентами работали с открытыми данными и выяснили много интересного про капитальный ремонт в Перми. Их опыт можно применить в любом регионе.

2
сервиса
4,5
часа
8
студентов
АВТОРЫ ПРОЕКТА
  • Иван Печищев
  • магистры интернет-журналистики ПГНИУ
ФИНАНСИРОВАНИЕ
  • собственные средства и время авторов
Иван Печищев
Иван Печищев,
доцент кафедры журналистики и массовых коммуникаций Пермского университета (ПГНИУ)

Тема капитального ремонта — актуальная, она касается всех, потому что мы все платим взносы. И наш опыт по изучению открытых данных Фонда можно повторить в любом регионе.

В рамках дисциплины «Мастерская инфографики» мы постоянно что-то делаем с магистрами интернет-журналистики нашего университета. Как-то рассматривали статистику ГИБДД. Сейчас анализировали данные с сайта Фонда капитального ремонта домов Пермского края. Это главное — чтобы данные были открыты.

Это тот случай, когда данные рассказывают истории. Журналист получит информацию, о которой никто не рассказывает и которую не увидишь, пока не заглянешь в таблицы и не проанализируешь данные. После анализа мы узнали:

  • самые старые дома в Перми, подлежащие капитальному ремонту в 2018-202 годах, 1913 года постройки;
  • самый «молодой» дом — 2012 года постройки,
  • в 2018 и 2019 года запланировано к ремонту не более 200 домов, зато в 2020 — сразу 934!
  • есть дома, где стоимость ремонта в расчёте на жителя достигает 1,3 млн. Интересно, какими взносами можно накопить на такой ремонт? Получается, что взносы распределяются неравномерно?
Александра Черноокая, магистрант интернет-журналистики ПГНИУ, презентует свой эскиз инфографики о капитальном ремонте в Перми.

Подобный анализ открытых данных может стать отправной точкой для журналистского расследования. Вопросов осталось много, и на них нужно искать ответы, делать запросы.

Как работали с таблицами

Над данными работали 8 студентов. Мы скачали таблицу с сайта Фонда капремонта, затем определили, какая информация нужна. Смотрели только Пермь. Создали файл Excel, куда заносили выбранные данные. Например, сортировали дома по годам ремонта, указывали стоимость ремонта и год постройки. Составление такой таблицы в Excel — чисто техническая работа. У нас вышло около 1200 строк.

Как не запутаться при работе с таким большим объемом данных? Дата-журналист Анастасия Валеева советует каждый шаг записывать в отдельно созданном документе. Например: отсортировали такие-то данные, выделили и скопировали такой-то столбец и так далее. Это позволяет увидеть все этапы работы.

Еще один способ — создавать промежуточные копии таблицы. Мы не работали в той таблице, которую скачали с сайта Фонда, а сделали ее копию и создавали их для каждого изменения, отдельно для карты и отдельно для инфографики. Это позволяет вернуться к исходнику и проверить данные.

Пузырьковая диаграмма показывает данные по году постройки дома и стоимости ремонта. Многие точки смешались, но четко видны экстремальные случаи.

Как визуализировали данные

У нас было несколько идей, как визуализировать полученные данные. Обсуждали, как лучше сделать. Решили использовать старый добрый Infogram и Google Карты. То, что получилось, — самый удачный вариант анализа и визуализации.

Учились с магистрами в пару кликов вносить на карту тысячу адресов. Когда они увидели, как просто это сделать, был вау-эффект. Google Карты позволяют не только одномоментно загрузить на карту тысячу точек, но и изменить вид маркера по конкретному критерию. Предлагались варианты выделить дома по стоимости ремонта, но карта выходила очень пестрой. Поэтому остановились на варианте выделить цветом год проведения капитального ремонта.

Долго обсуждали, какие виды чартов использовать в инфографике. Данные по году постройки дома и стоимости ремонта решили показать пузырьковой диаграммой. Из-за большого количества адресов, многие точки смешались, но зато четко видны экстремальные случаи: очень дорогой ремонт, «старый» или «молодой» дом. Здесь мы не загружали таблицу, а просто копировали данные из Excel и вставляли их в редакторе Infogram.

На карте более тысячи домов, которые капитально отремонтируют в Перми с 2018 по 2020 год. Эти точки студенты внесли на карту несколькими кликами.

Студентам было интересно работать над проектом — выполняли не придуманное кем-то задание с выдуманными данными, а с реальными. И подобную работу мы с студентами будем проводить и в будущем.

Над материалом работали:
Ольга Бердецкая
Иллюстрации:
фото из архива Ивана Печищева, скриншоты проекта

Подводя итоги:

1
Анализируйте реальные проблемы
2
Ищите истории
3
Тренируйтесь на реальных данных