Цифровые следопыты

Ночь музеев в зеркале больших данных

11:37, 26 июля 2018
ФОТО:  Иллюстрация: Елена Авинова
Социолог, специалист в сфере Social Network Analysis Алексей Горгадзе рассказал на примере исследований Ночи музеев, как анализ цифровых следов в интернете позволяет изучать поведение людей.

— Расскажите, как вы пришли к идее изучать цифровые следы?

— Наверное, ограничусь тем, что 8 лет назад я поступил на факультет социологии Высшей школы экономики, сейчас это факультет социологии и социальной информатики. Там я начал заниматься темой, связанной с виртуальными этническими группами в социальных сетях. Я продолжил эту работу в магистратуре, изучал там феномен панкавказскости, то есть кавказские группы в контексте более локальных этнических сообществ. С помощью опросов и интервью сложно было получить нужные данные, а в виртуальной среде можно было посмотреть, насколько этнические группы проникают друг в друга, где между ними существуют разрывы, где они, наоборот, переплетены. Несколько лет назад я со своим коллегой Александром Лукояновым увлекся более практическими задачами, и в 2016 году мы запустили проект «Сетевые исследования», пытаясь с помощью тех навыков анализа данных, которые мы получили на факультете социологии, делать прикладные исследования.

— Ваше исследование Ночи музеев тоже к ним относится?

— Наше внутреннее название для таких работ – «социальные исследования». Дело в том, что у нас очень часто были заказы от конкретных организаций по конкретным проблемам, и результаты таких работ мы публиковать не могли. Поэтому мы решили проводить небольшие некоммерческие исследования, в рамках которых было бы интересно посмотреть на те или иные явления. В прошлом году появилась идея проанализировать цифровые следы Ночи музеев, и мы сделали небольшой research.

— Что вы понимаете под «цифровым следом»?

— Под следами я подразумеваю всё, что мы оставляем в социальных сетях. Это не только очевидная информация типа возраста, пола – это также информация латентная. Например, в каких группах состоит пользователь, или с кем он дружит. Такого рода информация позволяет выявлять и описывать сложные социальные явления.

В исследовании Ночи музеев в прошлом году мы изучали публикации пользователей в Instagram с хештэгами #ночьмузеев и #artnight, анализировали время активности и геолокацию. Мы также хотели посмотреть Вконтакте, но Instagram – более подходящий сервис для того, чтобы люди выкладывали маленькие кусочки информации, и при этом анализировать такие посты удобнее с технической точки зрения. Разумеется, все данные мы анонимизировали и агрегировали, нас интересовало скопление людей в определенных местах, маршруты и динамика.

— И к каким выводам вы пришли?
Мы говорим про «ночь» музеев, но пик активности публикаций приходиться на 7–8 часов вечера. Поэтому реально у нас получается, скорее, «вечер», а не «ночь». Правда, там есть еще один пик, около 6 часов утра, но это, вероятно, вызвано тем, что в это время люди уже после посещения всех мест начинают выкладывать фотографии.
Второй интересный вывод: мы обнаружили, что активность людей в Петербурге даже в абсолютных значениях была выше, чем в Москве. Хотя по количеству музеев и, возможно, по финансированию Петербург был не на первом месте. Получается, наше исследование показало эффективность управленческой составляющей при организации мероприятия. Мы поняли, что с помощью подобных методик можно в будущем выявлять и корректировать какие-то проблемные зоны. Например, можно изучить, обеспечена ли транспортная связь между наиболее востребованными площадками.
Изображение

Иллюстрация: Елена Авинова

Конечно, этому исследованию не хватало качественного анализа. Я очень надеюсь, что в исследовании Ночи музеев, которое мы в этом году проводим совместно с Лабораторией экономики и культуры НИУ ВШЭ в Санкт-Петербурге, удастся заполнить эти пробелы.

— Этот проект тоже посвящен цифровым следам?

— Коллеги из Вышки уже давно изучают Ночь музеев, но в этом году их заинтересовали бывшие заводы и фабрики, которые сейчас заняты креативными площадками. За ними закрепилась репутация мрачных, неприятных мест, но через определенную событийность можно было бы изменить это отношение. Ночь музеев как раз может служить для этого одним из инструментов. Мы проводили опросы на четырех ревитализированных площадках: Порт Севкабель, Музей логистики на Василевском острове, «Скороход» и ДК «Громов». Эти места имеют схожую историю, и нас интересует, каким образом можно повысить лояльность посетителей к этому месту, как привлечь сюда новую аудиторию. Это ключевая тема, но цифровые следы помогут дать более полную картину. В эту Ночь музеев была возможность посетить площадки по единому билету – и по данным сканирования штрихкодов можно будет восстановить реальные маршруты людей. Организаторы открыты к сотрудничеству, так что у нас в планах сравнить такие маршруты с цифровыми следами. Это будет методологическая работа, мы узнаем, насколько цифровые следы подходят для анализа подобных явлений.

— Проект будет включать еще и качественный анализ?

— Да, на этих площадках мы проводили опрос, просили людей дать нам контакты, если они готовы поговорить. И к моему удивлению, около 70% людей давали свои телефоны, мейлы или ссылки на соцсети. Мы планируем брать полуструктурированные интервью по телефону или даже при личных встречах. Нас будут интересовать глубинные смыслы, которые люди вкладывают в отношения к этому месту. Мы попросим рассказать, что их впечатлило и заинтересовало, какие перемены они хотели бы видеть на площадках. Важный момент: мне лично и моим коллегам интересно посмотреть, как аудитория таких мест отличается от посетителей более «классических» музеев. С помощью цифровых следов мы поймем, существует ли между ними «сегрегация».

— Вы говорите о популярности площадок среди населения в целом, но по цифровым следам изучаете поведение активной аудитории Instagram. Разве по этим данным можно судить об «истинной» популярности музеев?  

— Это одна из задач, которую мы хотели бы решить, сравнивая цифровые следы с реальными маршрутами людей. Я надеюсь, что мое предположение подтвердится, и цифровые следы окажутся хорошим индикатором.
Есть еще одна амбициозная гипотеза, которая пользуется популярностью в определенных кругах. Она утверждает, что работая с большими данными – а это сотни тысяч наблюдений, – мы в любом случае улавливаем некоторые паттерны поведения, и большие числа могут минимизировать ошибки. Мне эта гипотеза нравится, так как более надежного инструмента с такими минимальными издержками я пока не нашёл.
Изображение

Иллюстрация: Елена Авинова

— Как думаете, может ли анализ больших данных вытеснить или хотя бы потеснить более традиционные социологические методы? 
 
— В некоторых областях, я уверен, большие данные очень популярны. Например, банковская сфера в России полностью переходит на анализ больших данных, об этом много говорят. Но в социологии вряд ли сейчас получится отойти от традиционных методов, особенно если мы говорим про изучение локальных явлений. Например, Лаборатория социологии образования и науки в Вышке ежегодно проводит полевую практику: ребята ходят по маленьким городам, узнают про их образ жизни, проводят сравнения социального порядка. В данном случае, когда мы хотим выявить определенные смыслы, нельзя рассчитывать только на цифровые следы.

Но в других областях – например, при исследовании туризма – big data могут активно использоваться. Сейчас в зарубежных журналах как раз выходит много статей про анализ туристических порталов. И для чего проводить масштабный опрос, терроризировать людей, если они и так оставляют отзывы на разных платформах? Мои коллеги, студенты Вышки, написали даже статью, где показали, что при выборе высокозвёздочных отелей люди больше интересуются их расположением в центре, удобствами внутри; при выборе низкозвёздочных – транспортными узлами, близостью к метро. И для этого им не понадобилось прибегать к опросам.

— А вы сами пользуетесь Instagram? Была возможность запостить что-то в Ночь музеев?

— Пользуюсь, кончено, но в этом году я курировал исследование на двух площадках, так что просто не успел. У куратора много дел. Он должен организовать поле, принести всем анкеты, раздать ручки, вручить планшеты, чтобы, грубо говоря, обеспечить все удобства. Не можем же мы просто отправить интервьюеров, дать анкеты и сказать: «Опрашивайте». Всю работу в поле мы подготавливали заранее, продумывали и следили, чтобы люди не мерзли, не голодали. В некоторых местах у нас было по две смены, чтобы студенты физически не уставали. Ведь максимум, который можно выстоять, – это 3–4 часа. И это очень важно, так как интервьюер, мотивированный и заинтересованный в какой-либо информации, получает гораздо меньше отказов.