«Самые популярные имена в России». Инфографика по данным за 120 лет

Журналист—инфографер Тинькофф Журнала Артём Иволгин изучил статистику личных имён за 120 лет и выяснил, как меняется мода на имена, и какие из них самые популярные. Объёмную аналитику автор представил в виде инфографик — получился большой проект с понятной и интересной визуализацией.

15
графиков в проекте
7
человек в команде
56
часов на исследование
АВТОРЫ ПРОЕКТА
  • Артём Иволгин
  • Сергей Антонов
  • Рахман Исаев
  • Лена Кузиленкова
ФИНАНСИРОВАНИЕ
  • средства компании

Редакция «Статистика» в Тинькофф Журнале занимается дата-журналистикой и ежемесячно выпускает по 15 материалов на основе различных статистических, социологических и других цифровых данных. Один из таких материалов посвящён популярным именам для мальчиков и девочек в разных регионах за последние 120 лет.

Сергей Антонов,
шеф-редактор редакции «Статистика» в Тинькофф Журнале 

Когда-то у нас был материал про фамилии и его хорошо читали: он набрал около 200 тысяч просмотров. Тогда мы поняли, что тема, когда человек читает про себя, — классная, и подумали, что неплохо бы сделать такой вот большой материал про имена. В интернете были подобные, но они были сделаны по отрывочным данным и очень старые.

Как считали

Источником данных послужили единый цифровой загс, куда стекается информация от загсов со всей страны, правительство Москвы и база данных студии «Меркатор», которая десять лет назад опубликовала инфографику об именах людей, которые жили в Москве и Московской области в 2007 году и родились в период с 1890 по 2007 год.

— С данными пришлось немного повозиться. Мы собирали их из нескольких источников, и основной проблемой было то, что эти данные довольно разрозненные. Обычно дата-материалы строятся так: есть какой-либо вопрос, есть таблица, которая полностью описывает какое-то явление. Например, уровень безработицы в каждом регионе. А здесь пришлось собирать по кусочкам, — рассказывает автор материала Артём Иволгин.

Поскольку перечни имён обновляются с разной периодичностью (одни — ежемесячно, другие — по годам) и имеют разный объём (например, топ-100), пришлось провести некоторые расчеты. Для понимания все они описаны в начале материала.

В процессе исследования Артём собирал все данные в Excel.
Артем Иволгин
Артём Иволгин,
автор, заместитель шеф-редактора редакции «Статистика» 

В процессе исследования я спрашивал у друзей и знакомых, какие тренды они замечают. Это помогло структурировать материал и понять, что людям интереснее всего именно изменения. Часто, когда анализируют статистику, то берут только верхний топ. Но самое интересное — в середине.

Как рисовали графики

За визуализацию данных в Т—Ж отвечает дизайнер инфографики, но основу для него готовит автор материала.

— В случае с исследованиями, основанными на данных, очень важно, как эти самые данные выглядят. Бывает, что картинка идёт перед текстом: то есть сначала я рисую данные, и только потом понимаю, что на них видно и как их нужно комментировать в тексте. Поэтому, конечно, картинки в виде эскизов делаются на этапе исследования, — отмечает Артём.

При этом черновой график — не догма. Дизайнер может предложить другой тип графика или другую подачу (например, таблицу вместо диаграммы), если считает это более удачным вариантом.

— Последнее слово здесь всё-таки за дизайнером инфографики, потому что ему виднее. Он может вообще заморочиться и что-то красивое придумать. Но в 90% случаев мы не используем какое-то «Вау!», у нас стандартные столбчатые, линейные, гантельные диаграммы и карты, — добавляет шеф-редактор Сергей Антонов.

В Google-документе, кроме текста, автор, расставляет графики: эскиз графика, ссылку на данные, чтобы дизайнер мог сам построить график при желании, и иногда векторное изображение для отрисовки. Ниже — то, как визуализирует данные журналист, и готовый график от дизайнера.

Что касается цветового решения инфографики, то оно всегда привязано к цветовой гамме обложки.

Сергей Антонов,
шеф-редактор редакции «Статистика» в Тинькофф Журнале 

Мы подсчитали недавно, что на исследование у Артёма уходит 56 часов чистого времени. А вообще когда мы говорим о любом из этапов, мы имеем ввиду, что у автора-исследователя, у корректоров, верстальщиков есть и другие задачи, и они занимается не только этим исследованием.

— Иллюстратор, который делает обложку, может быть, ещё обложку не нарисовал, но дизайнеру говорит: «цветовая гамма будет вот такой». А все стилистические графики существуют в дизайн-коде Т—Ж. Все они отрисовываются в Figma с соблюдением стиля, — отмечает Сергей.

Над одним материалом работают, как минимум, семь человек: автор, редактор, корректор, дизайнер инфографики, иллюстратор, который делает обложку, верстальщик и выпускающий редактор. Через руки всех этих специалистов материал проходит примерно за четыре недели: две — на исследование и работу с документами и таблицами, одна — на подготовку текста и картинок и ещё она — на вычитку, верстку и публикацию.

Как продвигали и что получили

Некоторые из материалов редакции Т—Ж — большие исследования, подобно популярным именам — продвигаются через крупные федеральные издания совместно с пиар-отделом.

— Мы заранее планируем, готовим пресс-релиз, отдельно рисуем под него графики и отдаём под эмбарго какому-нибудь крупному медиа: допустим, «Газете.ру» или «Известиям». Они выпускают его ночью, мы — чуть позже, ближе к утру. И после выпуска нашего материала пресс-релиз автоматически уходит во все СМИ по базе. Получается, что классный текст генерирует нам не столько трафик, сколько упоминаемость. А посещаемость приносят поисковики, — рассказывает Сергей Антонов.

Материал «Самые популярные имена для мальчиков и девочек в разных регионах» первой опубликовала «Газета.ру», затем было около 80 перепубликаций: в «Известиях», РБК, «Комсомолке», на сайте «Говорит Москва», на региональных порталах, а также в крупных телеграм-каналах.

— Материал собрал 196 тысяч просмотров, 164 комментария. Это много. Люди, как правило, обсуждают не материал, а тему, которую он затронул. Материал выстрелил, в топы попал, медиа взяли. Это то, ради чего мы и работаем, — резюмирует Сергей.

С какими сложностями столкнулись

Главной проблемой Артём и Сергей называют отсутствие комплексной статистики и ретроспективных данных. Так, у загсов нет единой информационной базы — единый цифровой загс ведёт Федеральная налоговая служба, и он содержит данные только за три последних года. Чтобы провести всестороннее исследование, журналисту нужно написать в каждый региональный загс и запросить все данные самостоятельно.

Ещё одна сложность — выбрать только часть из огромного количества данных и структурировать материал.

Разобраться с этим автору помогает шеф-редактор: в первой версии материала они удаляют или меняют местами некоторые смысловые части. Что-то выносят в отдельные материалы. Так, например, появился материал про необычные имена в России.

— Была проблема с тем, что из-за высокой рождаемости на Кавказе в последние годы начала превалировать доля кавказских имен. И эти данные надо было представить так, чтобы они не забивали все остальные. То есть придумать такую визуализацию, чтобы не оказалось, что все популярные имена — кавказские. Мы решили эту проблему с помощью таблицы, где показали смещение популярности имен по годам, — добавляет Артём.

Артем Иволгин
Артём Иволгин,
автор, заместитель шеф-редактора редакции «Статистика» 

Тема имён довольно бесконечная, потому что сколько людей, столько и имён. Отсюда много аспектов: выстроить из этого какую-то более-менее логичную историю, понять, что больше всего людям будет интересно и с какой стороны на это смотреть.

— Обработка данных — это ходьба по граблям, — признаётся Артём. — Ты постоянно что-то делаешь, а оно не работает. Например, я собрал данные загса, не обратив внимание на дату обновления. А через месяц увидел на сайте, что там уже абсолютно другой топ имен. Пришлось пересобирать. Соответственно, это повлекло другие переделки.

Над материалом работали:
Валерия Шаньгина
Иллюстрации:
скриншоты Тинькофф Журнал

Подводя итоги:

1
Внимательно относитесь к цифрам
2
Не бойтесь таблиц
3
Занимайтесь тем, что интересно узнать вам самим