«Эли». Чат-бот для подростков

Инновационный просветительский проект на основе машинного обучения

«Эли» отвечает на вопросы о физиологии и психологии взросления, любви, отношениях и сексуальном здоровье, профилактике и лечении ВИЧ. Чат-бот — часть экосистемы, которую создает ЮНЕСКО. Проект реализован совместно с социальной сетью ВКонтакте.

1
год работы
24
тысячи пользователей
325
тысяч обращений
АВТОРЫ ПРОЕКТА
  • Мария Медведчикова
  • Илья Стечкин
  • Иван Журавлев
  • Максим Корнев
  • Илья Рапопорт
  • Дима Некрасов
  • Вика Бубнова
  • Ольга Бубнова
  • Юрий Тимофеев
  • Юлия Смушкина
  • Леонид Слиосберг
  • Кирилл Койро
ФИНАНСИРОВАНИЕ
  • ИИТО ЮНЕСКО
  • партнеры проекта
Мария Медведчикова
Мария Медведчикова,
координатор проекта

В состав Института информационных технологий в образовании (ИИТО) ЮНЕСКО входит отдел ИКТ в образовании, в котором я работаю. Мы занимаемся цифровыми технологиями в образовании в области здоровья. В российских школах нет уроков здоровья, и мы восполняем этот пробел, запуская различные онлайн-проекты.

В нашей экосистеме несколько молодежных ресурсов, объединенных миссией — обеспечивать для пользователей безопасное пространство, надежные и доступные ресурсы, где можно узнать о теле, взрослении, начале сексуальной жизни… В экосистему входят такие проекты ИИТО ЮНЕСКО, как мобильное приложение «LoveLogs: Дневник отношений», молодежное медиа ДВОР, сеть сообществ Teenslive.

Чат-бот «Эли», запущенный в октябре 2020-го, стал важной частью этой экосистемы.

Первоначально задумывали линейную историю — создание интерактивной базы знаний. Но когда начали эту идею с коллегами обсуждать, поняли, что можно создать умного чат-бота.

О рождении чат-бота

Илья Стечкин
Илья Стечкин,
консультант проекта

Думали, как подступиться к задаче и в кратчайшие сроки за сравнительно небольшой бюджет реализовать проект. Нужно отметить смелость Ивана Журавлева и его команды, которые взялись за это дело.

Когда мы заговорили о чат-боте, то рассматривали его не как самостоятельный проект, а как интерфейс для «LoveLogs». Было понятно — 2020 год пройдет под технологическим знаменем чат-ботов разной степени сложности.

Первоначально задумывали линейную историю — создание интерактивной базы знаний. Но когда начали эту идею с коллегами обсуждать в рамках экосистемы, то поняли, что можно создать умного чат-бота. Хотелось, чтобы наш пользователь мог произвольно задавать вопрос системе и получать релевантный ответ.

В выборе программной платформы, которая определяет структуру системы, остановились на Rasa. Лицензия в этой области дорогая, но платформа сейчас в тройке лучших фреймворков для создания сложных чат-ботов. Компания развивается, и маркетинг у них обширный, есть видеокурсы, совершенствуются внутренние алгоритмы нейронных сетей.

Сейчас у нас около 320 цепочек, в каждой по 4-5 вопросов, у каждого вопроса по 3-4 варианта. В этом массиве, если перевести его в страницы, то их уже тысячи.

Мы хотели сделать высокоуровневого интерактивного чат-бота, чтобы лучше имитировать собеседника и пользователь мог не только получить информацию, но и поддержку.

Как собиралась команда и работала над чат-ботом

Было сформировано несколько рабочих групп: авторы, эксперты, контрибьюторы и представители партнерских организаций. В процессе работы над проектом акценты менялись и соответственно количество людей в каждой группе тоже менялось.

Иван Журавлев
Иван Журавлев,
руководитель команды разработки

У этой платформы многоуровневая нейросеть, состоящая из нескольких алгоритмов классификаторов. Сеть преобразовывает, раскладывает тексты на разные алгоритмы и по ним оценивает точность того, что спрашивает пользователь.

Команда целиком ни разу не собиралась. Мы работали на удаленке, когда это еще не было мейнстримом. Команда распределена в двух странах — Израиле и России. При этом, в России не в одном городе. Штаб-квартира в Москве, часть сотрудников в Петербурге, часть в Екатеринбурге. Для созвонов учитывали часовые пояса.

У самой большой — авторской группы — была самая сложная задача: для обучения нейросети за два месяца собрать массив не менее чем из 100 единиц. Правда, сначала мы не очень понимали, что считать единицами. Первоначально фигурировала связка «вопрос-ответ», но потом пришли к выводу, что единицей является история (по нашей терминологии — цепочка). Это логическая последовательность вопросов и ответов. Обычно в цепочке пять пар «вопрос-ответ», плюс вариантность вопросов, чтобы система училась давать правильный совет на любое сообщение пользователя.

Наша база знаний на самом деле суперценна. Собирали ее у разных авторов, блогеров, журналистов, на сайтах, в телеграм-каналах и социальных сетях, которые либо посвящены похожим темам, либо периодически пишут в этом направлении. Гигантскую работу проделала авторско-редакторская группа, которая изучила и составила короткие, но при этом емкие ответы на основные вопросы.

Отвечаем подростку в любое время суток и даем полезные ссылки на заданную тему. Информация проверена экспертами, упакована и пользователь может не искать ее по крупицам в других источниках, рискуя натолкнуться на недобросовестный контент.

Редакционной группой на момент подготовки массива руководил Макс Корнев — известный медиаисследователь, практикующий редактор. Макс собрал команду авторов, которая оперативно смогла этот массив аккумулировать. Точное количество авторов не скажу, знаю, что это порядка 10 человек.

Эксперты (сейчас у нас их 6) — это отдельные агенты, которые нам помогали сделать проект достоверным, научно обоснованным, не пропустить ошибки, не позволить себе неправильный совет. Экспертам мы очень благодарны.

Контрибьюторы-волонтеры проходили жесткий отбор. Это — психологи, врачи, журналисты, блогеры. Команда тоже интернациональная. Эти люди ничего не получили за работу, кроме нашей благодарности.

Группой продвижения, в которую вошли 3 человека, руководила известный специалист по SMM Вика Бубнова. У Ивана Журавлева из «Highload.Zone» в команде разработки тоже было 3 человека.

Внутри этого проекта реализованы не только редакционные, но и лучшие технические практики. В частности, архитектура чат-бота позволяла выдерживать в момент релиза до 92 обращений в секунду на распределенную нейронную сеть.

Много сделал для проекта веб-разработчик Юрий Тимофеев. Благодаря ему у «Эли» появился законченный визуальный язык, его команда делала лендинг.

Над проектом трудились год. По разным причинам все оказалось сложнее, чем мы ожидали: бюрократические задержки, пандемия… Но зато отточили мелочи, базу данных привели в очень классный вид, который позволяет задавать больше вопросов. Включили тему коронавируса. Например, варианты вопросов «Передается ли ковид половым путем?».

Как выбирали имя для чат-бота и создавали стикерпак

Илья Стечкин
Илья Стечкин,
консультант проекта

В команде самым частым оказалось имя Илья в той или иной производной. На иврите полная версия этого имени звучит как Элияху, но в обиходе употребляется Эли. Так и назвали нашего чат-бота, хотя партнеры из ВК называют Элли, как девочку из детской сказки «Волшебник изумрудного города». Но у бота нет пола. Он гендерно нейтральный. Правда, временами мужская сущность проскальзывает, но это не в имени, а в типе продукта, поскольку он чат-бот.

Что касается визуализации, то иллюстратор Дима Некрасов в процессе работы предложил несколько эскизов. Для тестирования проекта один из рисунков сделали аватаркой для ВК. В какой-то момент Мария приходит на еженедельный созвон и говорит: «Мы к нему привыкли, она нам нравится, давайте оставим». Таким образом появилась визуализация, которую потом, доработали. Аватарка стала объемнее, разнообразнее в позах, ситуациях. Сейчас у нас достаточно большой стикерпак.

Изначально мы нацеливались не гендерно нейтральный образ, потому что хотелось попасть и в женскую, и в мужскую аудитории. Правда, ситуация с сексуальным образованием девочек проще. Многие коммерческие бренды рекламируют гигиенические продукты, которые используются при менструациях, поэтому мамам приходится объяснять дочкам о половом созревании. А вот юноши в этом плане остаются за бортом.

Очень хочется этот дисбаланс выровнять и делать просветительские ресурсы, в том числе и для молодых людей. Ведь если просвещаем одну половину молодежи, то вторая вырастет сама по себе и гармоничного результата добиться сложно. Поэтому мы и делаем ставку на чат-бот «Эли». Это достаточно интересный игровой продукт, который может привлечь мужскую аудиторию.

Как отслеживаем поведение «Эли»

Еженедельно анализируем взаимодействия чат-бота с пользователями. Смотрим, какие вопросы задаются, как «Эли» отвечает. Имена людей, их пол, возраст мы не видим. Одна из важных функций, реализованных в рамках проекта, — обезличивание сообщений, которая делает коммуникацию анонимной даже для создателей.

Диалоги происходят только в сообщениях группы «Эли: бот-консультант» социальной сети ВКонтакте. Соцсеть знает информацию о пользователе, но, когда бот общается, он общается по API, через отдельный протокол, и те данные, которые нам присылает ВК о пользователе — ID страницы и другую информацию — мы не сохраняем на уровне обработки этого запроса. У нас создается на сообщение уникальный номер диалога. У нас огромный список диалогов под номерами и понять, это диалоги одного пользователя или разных невозможно.

Да, мы можем читать анонимные диалоги. Анализируем, смотрим правильно или неправильно бот отвечает, а также выявляем вопросы, на которые «Эли» не знает ответа. И дальше по ним уже контент-группа составляет варианты ответов для дальнейшего обучения.

Мы, моделируя аудиторное поведение, сформулировали гипотезу, что у нас будет небольшая группа в ВК, предполагали, что люди не захотят демонстрировать свой интерес к соответствующей тематике. Получилось наоборот.

Мы специально много времени потратили на то, чтобы вопросы анонимности были в приоритете. Меньше всего нам нужно, чтобы пришли люди и сказали, например: «Ну, а теперь, ребята, расскажите, кто чем интересуется». Мы им можем честно, глядя в глаза, ответить, что не знаем.

Анонимность в работе с чувствительной информацией, и тем более с подростками, — это архиважно. В фокус-группах всегда всплывал вопрос: «А кто узнает?». И этот вопрос мы просто не могли проигнорировать. Но это не значит, что разработчики не знают аудиторию. Мы анализируем нашу группы ВКонтакте, можем посмотреть пол, возраст, географию, интересы владельцев аккаунтов. Это те люди, которые решили показать, что пользуются чат-ботом и хотят знать больше.

Илья Стечкин
Илья Стечкин,
консультант проекта

Лаборатория технических коммуникаций «TechComLab», которую я представляю, занимается не только менеджментом проекта, реализацией, редакционной активностью, но и ведет аналитическую работу. Она потом превращается в научные доклады. У нас уже было несколько выступлений на конференциях. Две публикации готовятся к выходу. Одна в рамках конференции «Журналистика 2020», вторая в рамках конференции «НАММИ».

У нас есть такая работа «Динамика аудитории интерактивного медиа проекта на примере трех недель работы чат-бота «Эли» в социальной сети ВКонтакте». И в рамках этого исследования мы смотрели что происходит.

Еженедельно готовится отчет нашими аналитиками, ведет эту работу Юлия Смушкина.

Мы, моделируя аудиторное поведение, сформулировали гипотезу, что у нас будет небольшая группа в ВК, предполагали, что люди не захотят демонстрировать свой интерес к соответствующей тематике. Получилось наоборот, сейчас у нас почти 13 тысяч подписчиков. Группа нам очень помогает, потому что группа — это та выборка, которой мы имеем право пользоваться.

Если говорить о посещаемости, то доля женской аудитории выше (60%), чем мужской (40%), но цифры потихонечку сравниваются. Для секс-просветного проекта это очень хорошие показатели.

Первоначально разрыв между количеством пользователей самого чат-бота и количеством пользователей группы был очень большим, но постепенно пришел к балансу примерно один к двум.

Как чат-бот «Эли» приобретает известность

Проект продвигаем разными способами на разных площадках. И наши партнеры из ВК оказали нам колоссальную поддержку.

Когда только запустились, был большой интерес со стороны СМИ. О нас писали от ТАСС до Forbes. Мы зашли в очень разные сферы медиа. Были и крупные федеральные агентства, и развлекательные, и образовательные, и технические. Вышло более 80 публикаций, нас упомянули Известия, TJournal, РосКомСвобода, Рен ТВ, Wonderzine, Журналист, 5 Канал, Мел, МамКомпания

По данным Медиалогии, потенциальный охват инфоповода составил 9,4 млн человек. И это привело к нам много пользователей.

Каждый день делаем посты в ВК. Недавно провели конкурс тестировщиков. Это хороший пример того, как подписчики превращаются в комьюнити, с которыми можно вместе решать исследовательскую задачу. Мне кажется, будет здорово, если у нас по итогу получится вовлечь еще больше людей.

Недавно мы поддержали проект Mail.ru Group #неткибербуллингу — социальная инициатива по борьбе с онлайн-травлей. За две недели провели полноценную интеграцию. Думаю, что «Эли» уже можно рассматривать как самостоятельный редакционный продукт.

Почему ВКонтакте и куда еще придет «Эли»

Продукт у нас специфический и не на каждой площадке приживется. Например, Инстаграм* не работает с ботами. А Фейсбук*, казалось бы, всем хорошая платформа, но ей практически не пользуются подростки. Да и Фейсбук* — это аудитория, которая концентрируется в больших городах. А мы хотим, чтобы ботом интересовалась вся русскоязычная молодежь. ВК — это как раз та площадка, которая в равной мере популярна среди подростков в нашей стране.

В 2021 году планируем похожие боты запустить в Казахстане и Кыргызстане. Они будут двуязычными. Правда, русскоязычная версия для каждой страны будет уникальна. Дело в том, что в чат-боте мы даем не только текст, но и контакты сервисов, которые могут помочь в сложной жизненной ситуации — «горячие линии», «телефоны доверия», списки правозащитных организаций и медицинских учреждений. Это специфично для каждой страны, и информацию нужно собирать.

Надеюсь, что все пройдет хорошо и это будет самый первый в мире опыт такого масштабирования.

Региональные версии сделаем в Телеграм, поскольку ВКонтакте — российская соцсеть. В соседних странах она не очень популярна. Если все получится там, то рассмотрим эмиграцию «Эли» в Телеграм для России.

Что говорят о чат-боте

По опыту работы с этой тематикой знаю, что люди, которым нравится продукт, они пользуются, а те, кому нет, спешат рассказать об этом всему миру.

Некоторым чат-бот показался крамольным. Мол, мы развращаем подростков и рассказываем про то, что они не должны знать. И такие высказывания были от людей разного возраста.

На это у нас есть несколько аргументов. Например, бот доступен ребятам с 14 лет. В этом возрасте к человеку уже нельзя относиться как к ребенку, думать, что он живет и ничего не видит, не слышит, не заглядывает в интернет. И те ячейки мозга, которые не заполнятся нормальными систематизированными знаниями, заполняются другим (неверной, неполной, предвзятой информацией), а это может иметь для человека серьезные негативные последствия в будущем.

Мы понимаем, что работаем в информационном поле, где есть определенные возрастные ограничения. Консультировались с юристами, экспертами на этот счет. Информации, которая может ребят подросткового возраста травмировать, в чат-боте нет. Мы не рассказываем о механизмах секса, не описываем и не показываем его. Наш проект — о здоровье и рисках. Вреда он нанести не может, но я вижу, как может навредить отсутствие знаний, которые он предлагает.

Было и много позитивных отзывов. Например, люди оценили конфиденциальность.

Над материалом работали:
Дмитрий Артюх
Иллюстрации:
скриншоты лендинга чат-бота «Эли»

Подводя итоги:

1
2
3
* Деятельность Meta (включая деятельность Facebook и Instagram) признана экстремистской и запрещена на территории России.