«Самые популярные имена в России». Инфографика по данным за 120 лет
Журналист—инфографер Тинькофф Журнала Артём Иволгин изучил статистику личных имён за 120 лет и выяснил, как меняется мода на имена, и какие из них самые популярные. Объёмную аналитику автор представил в виде инфографик — получился большой проект с понятной и интересной визуализацией.
- Ссылки на проект отсутствуют
И ПОДСКАЗКИ
- Артём Иволгин
- Сергей Антонов
- Рахман Исаев
- Лена Кузиленкова
- средства компании
Редакция «Статистика» в Тинькофф Журнале занимается дата-журналистикой и ежемесячно выпускает по 15 материалов на основе различных статистических, социологических и других цифровых данных. Один из таких материалов посвящён популярным именам для мальчиков и девочек в разных регионах за последние 120 лет.
Как считали
Источником данных послужили единый цифровой загс, куда стекается информация от загсов со всей страны, правительство Москвы и база данных студии «Меркатор», которая десять лет назад опубликовала инфографику об именах людей, которые жили в Москве и Московской области в 2007 году и родились в период с 1890 по 2007 год.
— С данными пришлось немного повозиться. Мы собирали их из нескольких источников, и основной проблемой было то, что эти данные довольно разрозненные. Обычно дата-материалы строятся так: есть какой-либо вопрос, есть таблица, которая полностью описывает какое-то явление. Например, уровень безработицы в каждом регионе. А здесь пришлось собирать по кусочкам, — рассказывает автор материала Артём Иволгин.
Поскольку перечни имён обновляются с разной периодичностью (одни — ежемесячно, другие — по годам) и имеют разный объём (например, топ-100), пришлось провести некоторые расчеты. Для понимания все они описаны в начале материала.


автор, заместитель шеф-редактора редакции «Статистика»
В процессе исследования я спрашивал у друзей и знакомых, какие тренды они замечают. Это помогло структурировать материал и понять, что людям интереснее всего именно изменения. Часто, когда анализируют статистику, то берут только верхний топ. Но самое интересное — в середине.
Как рисовали графики
За визуализацию данных в Т—Ж отвечает дизайнер инфографики, но основу для него готовит автор материала.
— В случае с исследованиями, основанными на данных, очень важно, как эти самые данные выглядят. Бывает, что картинка идёт перед текстом: то есть сначала я рисую данные, и только потом понимаю, что на них видно и как их нужно комментировать в тексте. Поэтому, конечно, картинки в виде эскизов делаются на этапе исследования, — отмечает Артём.
При этом черновой график — не догма. Дизайнер может предложить другой тип графика или другую подачу (например, таблицу вместо диаграммы), если считает это более удачным вариантом.
— Последнее слово здесь всё-таки за дизайнером инфографики, потому что ему виднее. Он может вообще заморочиться и что-то красивое придумать. Но в 90% случаев мы не используем какое-то «Вау!», у нас стандартные столбчатые, линейные, гантельные диаграммы и карты, — добавляет шеф-редактор Сергей Антонов.
В Google-документе, кроме текста, автор, расставляет графики: эскиз графика, ссылку на данные, чтобы дизайнер мог сам построить график при желании, и иногда векторное изображение для отрисовки. Ниже — то, как визуализирует данные журналист, и готовый график от дизайнера.
Что касается цветового решения инфографики, то оно всегда привязано к цветовой гамме обложки.

шеф-редактор редакции «Статистика» в Тинькофф Журнале
Мы подсчитали недавно, что на исследование у Артёма уходит 56 часов чистого времени. А вообще когда мы говорим о любом из этапов, мы имеем ввиду, что у автора-исследователя, у корректоров, верстальщиков есть и другие задачи, и они занимается не только этим исследованием.
— Иллюстратор, который делает обложку, может быть, ещё обложку не нарисовал, но дизайнеру говорит: «цветовая гамма будет вот такой». А все стилистические графики существуют в дизайн-коде Т—Ж. Все они отрисовываются в Figma с соблюдением стиля, — отмечает Сергей.
Над одним материалом работают, как минимум, семь человек: автор, редактор, корректор, дизайнер инфографики, иллюстратор, который делает обложку, верстальщик и выпускающий редактор. Через руки всех этих специалистов материал проходит примерно за четыре недели: две — на исследование и работу с документами и таблицами, одна — на подготовку текста и картинок и ещё она — на вычитку, верстку и публикацию.
Как продвигали и что получили
Некоторые из материалов редакции Т—Ж — большие исследования, подобно популярным именам — продвигаются через крупные федеральные издания совместно с пиар-отделом.
— Мы заранее планируем, готовим пресс-релиз, отдельно рисуем под него графики и отдаём под эмбарго какому-нибудь крупному медиа: допустим, «Газете.ру» или «Известиям». Они выпускают его ночью, мы — чуть позже, ближе к утру. И после выпуска нашего материала пресс-релиз автоматически уходит во все СМИ по базе. Получается, что классный текст генерирует нам не столько трафик, сколько упоминаемость. А посещаемость приносят поисковики, — рассказывает Сергей Антонов.
Материал «Самые популярные имена для мальчиков и девочек в разных регионах» первой опубликовала «Газета.ру», затем было около 80 перепубликаций: в «Известиях», РБК, «Комсомолке», на сайте «Говорит Москва», на региональных порталах, а также в крупных телеграм-каналах.
— Материал собрал 196 тысяч просмотров, 164 комментария. Это много. Люди, как правило, обсуждают не материал, а тему, которую он затронул. Материал выстрелил, в топы попал, медиа взяли. Это то, ради чего мы и работаем, — резюмирует Сергей.
С какими сложностями столкнулись
Главной проблемой Артём и Сергей называют отсутствие комплексной статистики и ретроспективных данных. Так, у загсов нет единой информационной базы — единый цифровой загс ведёт Федеральная налоговая служба, и он содержит данные только за три последних года. Чтобы провести всестороннее исследование, журналисту нужно написать в каждый региональный загс и запросить все данные самостоятельно.
Ещё одна сложность — выбрать только часть из огромного количества данных и структурировать материал.
Разобраться с этим автору помогает шеф-редактор: в первой версии материала они удаляют или меняют местами некоторые смысловые части. Что-то выносят в отдельные материалы. Так, например, появился материал про необычные имена в России.
— Была проблема с тем, что из-за высокой рождаемости на Кавказе в последние годы начала превалировать доля кавказских имен. И эти данные надо было представить так, чтобы они не забивали все остальные. То есть придумать такую визуализацию, чтобы не оказалось, что все популярные имена — кавказские. Мы решили эту проблему с помощью таблицы, где показали смещение популярности имен по годам, — добавляет Артём.

автор, заместитель шеф-редактора редакции «Статистика»
Тема имён довольно бесконечная, потому что сколько людей, столько и имён. Отсюда много аспектов: выстроить из этого какую-то более-менее логичную историю, понять, что больше всего людям будет интересно и с какой стороны на это смотреть.
— Обработка данных — это ходьба по граблям, — признаётся Артём. — Ты постоянно что-то делаешь, а оно не работает. Например, я собрал данные загса, не обратив внимание на дату обновления. А через месяц увидел на сайте, что там уже абсолютно другой топ имен. Пришлось пересобирать. Соответственно, это повлекло другие переделки.
шеф-редактор редакции «Статистика» в Тинькофф Журнале
Когда-то у нас был материал про фамилии и его хорошо читали: он набрал около 200 тысяч просмотров. Тогда мы поняли, что тема, когда человек читает про себя, — классная, и подумали, что неплохо бы сделать такой вот большой материал про имена. В интернете были подобные, но они были сделаны по отрывочным данным и очень старые.