Сайт Numbeo — как из личного запроса вырос крупный международный проект

ссылка на проект

авторы

Младен Адамович
Numbeo — крупнейшая в мире база данных о стоимости и о качестве жизни. Основатель ресурса Младен Адамович в интервью Оксане Силантьевой рассказал, как создавал ресурс, как собирается и проверяется информация.

человек в команде

тысяч уникальных пользователей

тысяч евро — доход сайта

— Как был создан сайт Numbeo, какие вопросы вам надо было решить с помощью этого проекта?

Младен Адамович

Младен Адамович

основатель проекта Numbeo

— Больше десяти лет назад я работал на одну крупную международную компанию. После некоторого периода работы ко мне обратился глава компании и сказал: «У тебя не очень-то хорошие показатели, но мы понимаем, что ты очень умный, ты нам нравишься, и мы хотим дать тебе второй шанс. Мы видим, что есть проблема, но не знаем, что служит её причиной.

Если проблема в городе, выбери другой, где у нас есть инженерный отдел, и мы тебя туда переведём. Если считаешь, что проблема в проекте — выбери другой проект, и мы переведём тебя на этот проект. Не торопись, подумай и реши».

Я тогда мог прикинуть, какова будет моя зарплата в этой компании в определённом городе, если я перееду. А сколько составили бы мои расходы на жизнь в месяц, если бы я переехал, скажем, в Нью-Йорк? И я стал искать город в Google, чтобы это узнать, также забивал много поисковых запросов: «стоимость жизни в Нью-Йорке», «стоимость жизни в Токио», «стоимость жизни в Лондоне». И вскоре понял, что такая информация не систематизирована, и мне надо каким-то образом её структурировать, чтобы подготовиться к ответу. Стал думать — а почему до сих пор никто не сделал такую «Википедию», где можно было бы сравнить расходы на жизнь в разных городах мира?

Когда я покинул ту большую компанию и переехал в Белград, чтобы создать свой сайт Numbeo. Через пару лет он вырос в вебсайт номер один по сравнению уровня жизни. Это самый популярный ресурс такого рода в мире, и, согласно оценкам специалистов, его трафик сравним с трафиком крупной мультинациональной консалтинговой компании McKinsey и немного уступает трафику журнала «Экономист». Есть и другие компании, которые примерно в то же самое время сделали что-то похожее на Numbeo, но у них примерно в три раза меньше трафика. Так что сайт Numbeo весьма известен по всему миру.

Информация о стоимости жизни в крупных городах дается в кратком виде

— Это пример того, как ваш личный запрос запустил большой международный проект. Так?

— Да, и многие успешные бизнес-проекты начались с удовлетворения каких-то личных потребностей. Когда кто-то чем-то страстно увлечен, у такого дела больше шансов стать успешным.

— Это отличная мысль, потому что одна из целей этого интервью — вдохновить людей сделать что-то, чего они действительно хотят. Итак, появилась идея, как сравнить расходы на жизнь в разных городах. А как вы собираете информацию, кто отвечает за эти данные и их верификацию? Почему я могу доверять вашим цифрам?

— У Numbeo есть — и были до пандемии COVID-19 — около 2,4 миллиона людей, которые посещают вебсайт и добавляют информацию. За годы работы мы создали около 20 алгоритмов, которые обеспечивают качество этих данных. Один из самых первых алгоритмов, который мы начали применять, отсекает 20% самых нижних и 20% самых высоких цен для каждого города. Есть алгоритмы, которые сражаются со спамом, — используя IP-адрес и анализируя поведение пользователя, мы можем выявлять спамеров.

Зеленые метки на карте показывают карты с невысокой стоимостью жизни. Красные метки свидетельствуют о высокой стоимости

— Вы используете государственные источники информации? Или только данные пользователей?

— Мы используем некоторые официальные источники, но обычно это не правительственные источники. Например, в Турции есть «Фольксваген», который устанавливает одинаковые цены по всей стране, так что кто-то раз в год идёт на их вебсайт, берёт там цены на автомобили, проверяем их и вводит как цены на автомобили в городах Турции. Это важно, потому что это можно проверить. А когда обычные люди вводят цены на автомобили, они больше ошибаются, чем, скажем, в ценах на одну поездку в общественном транспорте. То есть люди обычно знают, сколько стоит поездка в общественном транспорте, но часто ошибаются в ценах на автомобили. Мы на платформе Numbeo собираем цены на модели Тойота Королла и Фольксваген Гольф.

— А если мы говорим о загрязнении окружающей среды, например?

— Во-первых, раздел «стоимость жизни» на Numbeo дает в настоящее время 70% трафика, я имею в виду, столько было до COVID-19. Сейчас трафик упал, и в теперешней ситуации это около 40%. А для страниц, относящихся к здравоохранению, трафик возрос на 380%, то есть теперешняя ситуация — не обычная ситуация, она очень отличается от того, что мы видим обычно.

Мы также проводим опросы относительно качества жизни, преступности, загрязненности, пробок, вопросов здравоохранения, которые я уже упомянул. И когда мы проводим опрос, мы задаем повторяющиеся вопросы, чтобы можно было определить, насколько честно отвечает пользователь. И мы также отслеживаем поведение пользователей на сайте.

Также мы можем определить, насколько ответы респондентов ближе или дальше от средних значений, а нас как раз интересуют средние значения.

О верификации и медиаграмотности

— Вы общаетесь с пользователями, которые предоставляют информацию, или вы просто собираете их ответы и анализируете их при помощи формул и алгоритмов?

— Иногда да, но весьма редко. Я вообще-то не получаю достаточно обратной связи о нашей работе, мне бы хотелось узнавать больше, как и что можно улучшить на сайте.

— Какого рода цифровые навыки, на ваш взгляд, будут полезны современным людям? Они должны знать, как иметь дело с данными, как верифицировать информацию?

— Почему вы думаете, что обычные люди должны верифицировать все данные? Какого рода данные они должны верифицировать?

— Например, люди должны понимать на хороший вебсайт они зашли или это фальшивый ресурс. Из-за отсутствия медиаграмотности, у нас нет алгоритма, способа понять, что фейк, а что заслуживает доверия.

— Если я читаю что-то у Би-би-си, я считаю, что это факт, и скорее всего, оно так и есть. Если я хочу проверить что-то, я обычно гуглю этот факт, проверяю другие источники. Если кто-то хочет что-то проверить, он должен проверить — пойти в Google, или Yandex, или Baidu — в поисковик — и посмотреть, какие еще данные есть на эту тему.

Скажем, Numbeo проводит опросы, которые иногда дают, возможно, не самые объективные результаты. Например, мы проводим опросы по теме здравоохранения, а простые люди в некоторых странах склонны недооценивать качество здравоохранения в своей стране и переоценивать качество здравоохранения в других странах. В этом проблема опросов.

Но у нас есть 2,4 миллиона людей, читающих данные, и они могут вносить свой вклад и опровергать то, что считают неправильным. У нас есть сервисы, которые довольно хорошо справляются с верификацией официальных источников данных. Люди не очень доверяют официальным источникам данных, потому что бывали случаи, когда официальные источники подвергались правительственной манипуляции — и как раз в таком случае Numbeo может быть полезен.

О законах и манипуляции с данными

— Сейчас довольно легко манипулировать данными. И не так уж много тех, кто может провести их верификацию. Как вы думаете, сейчас — лучшее время для журналистики данных? Или это просто какой-то беспорядок, хаос с цифрами без какого-либо толкового пути, как понимать и анализировать их?

— Сложно дать определение «беспорядку». Я не думаю, что это беспорядок. Это хаотично? Возможно. По моему мнению, есть много данных в интернете, которые считаются фактами, но на самом деле таковыми не являются.

Если вы посмотрите на историю Википедии на протяжении последних 20 лет, некоторые события, я считаю, в реальности отличаются от того, как про них там написано. Я думаю, на журналистику оказывают большое влияние не только данные, но также и правительства, поскольку правительства по всему миру часто финансируют медиакомпании.

— Крупные компании владеют нашими данными: где мы путешествуем, что мы публикуем онлайн, и эти данные могут быть оружием. И правительства всегда запрашивают или требуют эти данные для своих собственных целей. Вас это настораживает? Или вам кажется, что развитие технологий — это нормально и это просто период эволюции?

— Не все данные собираются. Если кто-то расплачивается, например, картой Visa, я думаю, там существуют строгие правила, как эта информация может быть обработана. И Visa не знает, что конкретно вы купили в супермаркете.

Но есть компании, которые обрабатывают ваши данные. Я не думаю, что настоящая причина — в том, чтобы продавать это правительству, скорее, чтобы продавать другим компаниям, например, для целевой рекламы. Это наиболее частая причина, зачем компании обрабатывают персональные данные.

Как работать с открытыми данными?

Истории прячутся и в цифрах. Они помогают увидеть картину целиком, подтверждают или опровергают обещания и гипотезы. Данные способны рассказать то, о чем никто не расскажет.

— Как вы думаете, нам нужны какие-то дополнительные законы, правила, как жить в этом цифровом мире данных?

— Я не сторонник увеличения количества законов и правил, уже есть GDPR (General Data Protection Regulation — Общий регламент по защите данных) в Европе, есть еще один акт в Калифорнии (California Privacy Act — Калифорнийский акт о приватности). Для маленьких интернет-компаний, как Numbeo, это очень болезненно, следовать всем этим правилам и требованиям, которые в каждой стране свои.

Например, Numbeo не смог бы выполнить требования российского законодательства — хранить информацию о пользователях из России на серверах в России. Мы работаем в Сербии, у нас есть клиенты в России, но мы не можем соблюдать российские законы, мы соблюдаем местные законы. Аналогичная ситуация не только в России, то же самое и в США, и в Соединённом Королевстве. Например, нас не очень заботит Калифорнийский акт о приватности (California (Consumer) Privacy Act, калифорнийский закон о защите прав потребителей). У меня нет времени и ресурсов изучать этот акт, мы соблюдаем GDPR, и если калифорнийский закон отличается от GDPR, я не знаю, почему это должно быть моей проблемой, у меня есть документ о соблюдении GDPR.

— Если мы говорим о журналистах, работающих с данными, думаете ли вы, что это хорошая профессия на ближайшие 10 лет? Вы бы посоветовали молодым людям приобретать эту специализацию и эти навыки? Приносит ли это деньги?

— Сейчас растёт тенденция, что медиа поддерживаются правительствами или какими-то организациями, политическими партиями, чтобы презентовать их взгляды, и я думаю, этот тренд будет усиливаться в ближайшем будущем. Ведь в последние 10-20 лет, по-моему, он только усиливался.

Вы спросили про прибыль и деньги. Есть профессии, в которых платят больше, есть профессии, в которых платят меньше. Что касается будущего, я не уверен на 100 процентов, какая профессия будет «выгодной». Мне кажется, важно, чтобы люди занимались тем, что они любят, что им нравится, а не думали в первую очередь о деньгах.

Люди в Западной Европе скорее будут заниматься тем, что они любят, потому что они чувствуют безопасность общественных систем, а в Восточной Европе в некоторых странах люди бегут за деньгами, потому что они думают, что, может быть, иначе будут бедными и т.п. По моему мнению, люди должны делать то, что любят.

Когда люди думают о каких-то популярных вебсайтах, им кажется, что это очень выгодный бизнес.

Как организованы процессы в Numbeo

— Как монетизируется ваш сайт?

— Доход у Numbeo в прошлом году был 220 тысяч евро — и в сравнении с миллионами долларов дохода у Google или Facebook это, конечно, на порядки меньше. Реклама хорошо работает у больших компаний, а для маленьких медиакомпаний это может не быть столь эффективным, как некоторые думают.

Numbeo зарабатывает через API — в прошлом году это составило 25% дохода, а в целом доход был 220 тысяч. С таким доходом мы не можем себе позволить крутой офис или нанимать много людей.

— Младен, сколько людей работают в Numbeo?

— Numbeo очень маленькая компания. Это такой «театр одного актера» — это я. Количество сотрудников варьирует — иногда я принимаю на работу временных сотрудников, которые работают удаленно, скажем, в течение года.

— Сейчас из-за вируса многие люди просто вынуждены работать из дома…

— Да, и для многих это серьезная проблема. Например здесь, в Сербии, я знаю многих, для кого это проблема, потому что они живут в маленьких квартирах, и у них нет отдельной комнаты для работы. Дети тоже дома, и если у тебя двое детей, и ты должен работать дома, это довольно проблематично. Некоторые начальники понимают ситуацию.

— У вас есть какие-то лайфхаки по работе на удаленке?

— Я советую людям не работать за два часа до того, как они собираются пойти спать. Потому что это может негативно повлиять на сон. Это мой совет, который вы, наверное, больше нигде не прочтёте. У меня нет каких-то других особых предложений, которые вы не нашли бы, погуглив вопрос, как работать на удалёнке.

Над материалом работали
Оксана Силантьева, перевод Ольга Кравцова

Иллюстрации:
скриншот сайта Numbeo

Делали похожие проекты? Расскажите о своем опыте, нам интересно!

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Больше медиаполезностей

Больше медиаполезностей

Еженедельная рассылка по средам для мультимедийных авторов

You have Successfully Subscribed!

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: