Ледовая Я. А., Тихонов Р. В., Иванов В. Ю., Яминов Б. Р., Боголюбова О. Н. Организационно-методические вопросы сбора данных в онлайн-исследовании поведения пользователей социальной сети «Фейсбук» из России и США

Л

Введение

Как было указано в предыдущей статье исследовательского коллектива [1], за последние 10–15 лет изменился образ жизни более чем половины населения мира: имея возможность регулярной коммуникации посредством социальных сетей, современные жители развитых стран не менее двух часов в день проводят за общением и получением информации через социальные сети («Фейсбук», «Инстаграм», «Твиттер», «ВКонтакте», «Одноклассники» и др.) [2; 3]. 

Молодые люди тратят на эти формы коммуникации еще больше времени [4], ведь для них они стали доступны в раннем возрасте, а значит, естественным образом встроились в образ жизни и каждодневный опыт. У этого нового когнитивного социально-психологического феномена есть важная техническая составляющая: история поведения пользователя, его «цифровые следы» (“digital footprints”). При наличии технических возможностей (и иногда в силу различных ограничений, введенных руководством различных социальных сетей) эти следы можно исследовать. 

Такой подход к сбору данных и в целом к созданию и проведению психологических и междисциплинарных исследований набирает популярность [1; 5; 6]. Эту информацию в своих интересах используют маркетинговые компании и службы разведки и контрразведки разных стран [7]. Но и исследователи, представители социальных наук и лингвисты, а также математики, программисты и специалисты по работе с данными начали изучать поведение людей в социальных сетях в попытках найти и проанализировать внешне наблюдаемые и зафиксированные следы пользовательской истории. 

Для осуществления подобных проектов не нужны затраты на помещения, оборудование, договоренности с испытуемыми: важно наличие компьютеров, сервера, хостинга для хранения данных и доступ в Интернет. Кроме того, для привлечения респондентов в социальной сети необходимо оплачивать рекламу объявления, содержащего ссылку на приложение, позволяющее принять участие в исследовании, но эти затраты в целом невелики. Пожалуй, самый важный ресурс — это наличие в коллективе проекта специалистов из разных областей знания и коммуникация между ними.

В статье будут описаны особенности процесса сбора данных в социальной сети «Фейсбук» на основе опыта реализации проекта, проводящегося в СПбГУ. В этом проекте исследуются психологическое благополучие и ряд личностных особенностей пользователей из России и США в связи с их поведением и публичными текстами в социальной сети. 

Подобные онлайн-исследования становятся все более актуальными, так как одной из угроз психическому здоровью и психологическому благополучию пользователей социальных сетей является нежелательная агрессия, которой они могут подвергнуться в социальных сетях. Анонимность, возможность мгновенного обмена сообщениями, доступность коммуникации практически с любыми пользователями создают как возможности, так и угрозы. 

Россия занимает пятое место из 25 стран по показателям онлайн-буллинга, и 49 % российских детей и подростков от 8 до 17 лет сообщают об опыте жертвы кибербуллинга (тогда как в среднем этот показатель составляет 37 %), а 33 % признают, что выступали в роли агрессора (по сравнению со средней долей 24 % среди 25 стран) [8].

В литературе появилось понятие «кибербуллинг», или «троллинг», обозначающее целенаправленное (чаще вербальное) воздействие некоторых пользователей на эмоциональное состояние других партнеров по онлайн-коммуникации с целью вызвать негативные эмоции, тревогу, страх, огорчение [9]. И именно изучение возможных причин такого опасного для психического здоровья обычных пользователей поведения, а также задача поиска языковых коррелятов поведения как социально-сетевых агрессоров, так и тех, кто мог пострадать от их нападений, послужило мотивами для организации проекта.

Описываемое исследование, по нашим данным, является первым в своем роде в академической среде в России. В его основе — использование еще не применявшихся в отечественной психологической практике методов и методик. 

Поэтому основная цель статьи — описать этот достаточно новый исследовательский подход, упомянуть возможные сложности, которые могут встретиться на пути коллег, заинтересовавшихся подобным методом сбора данных в социальных сетях, а также зафиксировать пути их решения, предложенные в ходе работы участниками нашего научного проекта.

В рамках проекта данные собирались дважды: осенью 2015 г. в России и осенью-зимой 2016 г. в России и США. Организационно-методические вопросы сбора данных будут описаны в хронологическом порядке.

Используемые методики и вопросы

Основной новацией описываемого исследования можно назвать метод сбора данных в социальной сети «Фейсбук» при помощи специально созданной программы-приложения (она будет описана ниже). В 2015 г. в СПбГУ стартовал междисциплинарный проект, в рамках которого впервые на российской выборке с использованием метода сбора данных пользователей социальной сети «Фейсбук» через приложение исследовались «цифровые следы» респондентов (в частности, характеристики их публичных текстов, постов). Затем эти результаты соотносились с данными психологических опросников, собранными с помощью этого же приложения.

На следующем этапе англоязычные оригиналы указанных опросников использовались для аналогичного сбора данных среди пользователей сети «Фейсбук» из США, и в дальнейшем проводилось сопоставление результатов, полученных в двух странах. 

Для сокращения времени заполнения опросников респондентами и для большей вероятности получить максимальное возможное количество завершенных сессий работы с приложением мы подбирали максимально короткие опросники. 

В исследование были заложены гипотезы о возможном влиянии ряда негативно окрашенных личностных особенностей («Темная триада», отчуждение моральной ответственности), а также присутствия в жизненном опыте травматичных событий и их последствий на агрессивное поведение в социальной сети. Для этого несколько еще не использовавшихся в России опросников прошли процедуру двойного перевода, первичного и повторного тестирования офлайн-респондентов и проверки внутренней согласованности их структуры.

Психологическое благополучие оценивалось с помощью шкалы субъективного благополучия ВОЗ-5 [10], переведенной ее разработчиками на русский язык [11]. При сборе данных в 2016 г. использовалась также шкала удовлетворенности жизнью Э. Динера [12] в переводе и адаптации коллектива исследования [13].

Для измерения «темных» личностных черт использовалось две методики: опросник «Темная Триада личностных черт» (нарциссизм, макиавеллизм, неклиническая психопатия) Джонса и Полхуса [14] в адаптации М. С. Егоровой и коллег [15]1; 2) опросник выраженности отчуждения моральной ответственности (совокупности когнитивных механизмов, избирательно активирующих моральные запреты субъекта по отношению к себе при совершении социально осуждаемых, вредоносных поступков [16]) авторства С. Мур [17] в переводе и адаптации коллектива проекта и их коллег [18].

Нами использовалась короткая шкала для скрининга посттравматических симптомов Primary Care PTSD Screen [19] в переводе и адаптации коллектива исследования [13]. В шкале четыре вопроса о возможных последствиях травматичных событий, произошедших в жизни. Например: «В течение жизни переживали ли Вы какое-то событие, которое было настолько пугающим, ужасным или расстраивающим, что за последние 30 дней у Вас были ночные кошмары, связанные с этим событием, или оно всплывало в памяти против вашей воли?» (с вариантами ответов «да» или «нет»).

Помимо стандартизированных опросников, использовались также отдельные вопросы о демографических характеристиках респондентов:

  • вопрос о трудоустройстве с вариантами ответов («работаю как наемный работник», «работаю на себя», «домохозяйка», «студент», «пенсионер», «не работаю по другой причине»);
  • вопрос об уровне образования с вариантами ответов (неполное среднее, среднее, среднее профессиональное, неполное высшее, высшее, ученая степень).

Также использовались вопросы для самооценки поведения пользователей:

  • вопрос о частоте использования социальной сети (с вариантами «обычно не бываю в Фейсбуке», «бываю раз в месяц», «бываю раз в неделю», «бываю раз в день», «захожу несколько раз в день», «нахожусь в нем постоянно»);
  • вопросы об опыте столкновения с интернет-агрессией в роли агрессора (3 вопроса), жертвы (3 вопроса) и свидетеля (1 вопрос), заданные косвенным образом, например: «Случалось ли так, что вы писали комментарии, содержащие насмешки, оскорбительные высказывания, угрозы к заметкам, фотографиям и другому контенту других людей в Фейсбуке?» с пятью вариантами ответа от «никогда» до «часто»;
  • три вопроса о возможном опыте насилия (физическое нападение, домашнее насилие, сексуальное насилие), также с пятью вариантами ответа от «никогда» до «часто».

С согласия пользователей мы также получили со страницы профиля в социальной сети их возраст, пол, город (регион) проживания, подписки на публичные страницы (собирались в 2016 г.; не более 50 с каждого пользователя), публично открытые записи (посты) и скопированные записи (репосты).

Организация процедуры сбора данных

Для респондента взаимодействие с онлайн-приложением выглядело следующим образом (см. в Приложении скриншоты интерфейса опроса, иллюстрирующие приведенные ниже пункты 1, 3, 5).

  1. Респондент видит в ленте новостей рекламное объявление, приглашающее принять участие в психологическом исследовании (ниже оно будет описано подробнее), кликает на него.
  2. Приложение запрашивает доступ к ленте публикаций пользователя, дате рождения, месту жительства, его идентификатору.
  3. Пользователю показывается стартовая страница приложения, на которой коротко объяснены цели исследования, приведена короткая версия информированного согласия (есть ссылка на отдельную страницу с его полным текстом), приведено обещание по окончании участия в опросе предоставить «персональный психологический портрет и индивидуальные рекомендации», дан адрес специально созданного почтового ящика проекта, на которой можно присылать вопросы (и, действительно, на несколько десятков вопросов респондентов впоследствии сотрудники проекта отвечали). Перейти дальше, к вопросам, можно только после принятия условий, поставив галочку в поле «Я принимаю условия соглашения».
  4. Все данные, к которым пользователь дал доступ, отправляются на сервер приложения.
  5. Пользователь начинает отвечать на вопросы приложения (это занимало примерно 10–15 минут, вопросов было 61 в 2015 г. и 66 в 2016 г.). По окончании выводилась страница с благодарностью за участие и обратной связью («психологическим портретом»). Формулировки и дизайн обратной связи были разными в 2015 и 2016 гг., об этом будет написано ниже.

Подготовка и три процедуры сбора данных (один в России в 2015 г., второй в России в 2016 г. и третий в 2016 г. в США) заняли примерно два года. Последовательность этапов реализации проекта представлена в таблице 1.

Таблица 1. Основные этапы работы над подготовкой и сбором данных (февраль 2015 — сентябрь 2017)

Таблица 1. Основные этапы работы над подготовкой и сбором данных

Опишем эти этапы и их содержание более подробно.

Подготовительный этап был связан с отбором и русифицированием психологических методик, получением разрешения от Этического комитета, а также с созданием программы-приложения и регистрацией ее в качестве приложения, одобренного юристами и техническими специалистами сети «Фейсбук»2.

К этапу первого сбора данных, после создания и отладки приложения со встроенными опросниками и автоматической краткой обратной связью, можно отнести запуск приложения и рекламной кампании в социальной сети «Фейсбук» (с 8 по 20 ноября 2015 г.). 

Он включал в себя несколько шагов, связанных с: а) созданием специальной страницы приложения в социальной сети, на которой коротко описывались цели исследования и присутствовало рекламное объявление, призывающее принять участие в исследовании, а также ссылка на собирающее данные приложение; б) проектированием дизайна и короткого слогана рекламного объявления (см. прил. 1); в) регистрацией аккаунта «рекламодателя» в сети «Фейсбук»; г) настройкой и таргетированием показов этого объявления определенным аудиториям (в исследовании 2015 г. — жители России старше 18 лет, в 2016 г. таргетирование было более специализированным); д) подключением банковской карты с достаточной суммой на счете к аккаунту («Фейсбук» принимает оплату только через банковскую карту, причем деньги перечисляются в Ирландию, необходима банковская карта с такой возможностью) и контролем оплаты показов (в 2015 г. было потрачено на рекламу 76 000 руб.); е) отслеживанием эффективности набора респондентов (см. табл. 2).

Таблица 2. Показатели эффективности трех рекламных кампаний, использованных для сбора данных в сети «Фейсбук»

Таблица 2. Показатели эффективности трех рекламных кампаний, использованных для сбора данных в сети «Фейсбук»
В 2015 г. участники с социально желательными или некачественными ответами не исключались из анализа, так как вопрос-ловушка и шкала социальной желательности были добавлены позднее.

На этапе обработки и описания полученных данных мы увидели возможность улучшить процедуру сбора данных и качество выборки. Дело в том, что распределение по полу оказалось неравномерным — 77,9 % выборки составили участники женского пола, а средний возраст выборки составил 45 лет (± 11,58). Данные текстов постов по ряду технических причин были получены только от 1972 участников (в среднем у этих пользователей было скачано по 7,67 постов). После этого мы начали работать над оптимизацией процедуры сбора данных.

В процессе оптимизации приложения были удалены несколько вопросов о негативных переживаниях и их последствиях (чтобы пользователи были более мотивированы отвечать на вопросы и заполнить опросник до конца), добавлены три вопроса, отслеживающих социальную желательность, один вопрос-ловушка, отсекающий тех, кто вообще не читает вопросы и отвечает наобум. 

Кроме того, получив некоторое количество комментариев участников под рекламным объявлением о том, что обратная связь по двум методикам (опросник «Темная триада» и шкала субъективного благополучия ВОЗ-5, для обратной связи брались результаты только по ним) иногда содержала противоречивые утверждения, мы изменили форму подачи обратной связи.

Также в процессе оптимизации приложения для подготовки сбора данных во второй раз была создана более яркая и упрощенная форма обратной связи. Сделано это было в том числе для того, чтобы не усложнять восприятие информации на темы, связанные с «темными» чертами самих пользователей, а также для того, чтобы после нескольких десятков вопросов на достаточно чувствительные темы они получили описание, не усугубляющее возможный дистресс. 

Среди трех субшкал опросника «Темная триада» программой выбиралась шкала, по которой респондент набрал больше всего баллов (с поправкой в виде числового коэффициента на то, что в российской выборке 2015 г. показатели шкалы макиавеллизма в среднем были самыми высокими, а по шкале психопатии — самыми низкими), и тогда респонденту выводился на экран «портрет» одного из трех типажей с достаточно шутливым описанием. 

Были найдены аналоги носителей трех ярко выраженных «темных черт» — персонажи древнегреческих мифов. Кроме того, для мужчин и женщин были подобраны боги и герои разных полов, а в Интернете были найдены черно-белые изображения этих персонажей. Таким образом, для женщин обратная связь могла быть о том, что «по своим личностным чертам Вы больше всего похожи на Афродиту (Геру, Медузу Горгону)…», а для мужчин — о том, что «по своим личностным чертам Вы больше всего похожи на Нарцисса (Одиссея, Минотавра)». 

Далее следовал абзац, описывающий типичное поведение людей с достаточно яркой выраженностью нарциссизма (макиавеллизма, неклинической психопатии), причем акцент делался на сильных, положительных сторонах их поведения. 

Также в новой версии содержалась возможность поделиться своими результатами с друзьями в социальной сети, и эта опция помогла нам привлечь довольно большое число участников исследования бесплатно (примерно треть от общего количества). Упрощение и сведение результатов к описанию типа были выбраны осознанно. 

Отсылка к мифологическим персонажам вызывает положительные эмоции из-за факта узнавания уже известного, а яркий типаж упрощает запоминание типичных паттернов приписанного нами им поведения. (Иногда когнитивные искажения работают во благо.)

Во время второго сбора данных в России (месяц, с 8 октября по 9 ноября 2016 г.) было уделено внимание таргетированию показа объявлений на пользователей мужского пола, а также на более молодых пользователей. 

Изначально при одинаковом таргетинге на всех пользователей из России старше 18 лет женщины и люди старше 40–45 лет переходили в приложение по объявлению чаще. В связи с этим через некоторое время рекламная кампания была перезапущена с таргетингом только на мужчин и на людей до 45 лет (это позволяют возможности аккаунта рекламодателя в сети «Фейсбук»).

Кроме того, таргетинг на некоторое время направлялся на крупные города (Москва, Санкт-Петербург, города-миллионники), откуда, по данным панели рекламного аккаунта, не было респондентов. Мы объяснили это тем, что коммерческие рекламодатели таргетируют свою рекламу на эти города, и их жители в большей степени загружены разнообразными рекламными объявлениями в ленте новостей сети «Фейсбук», а реклама приложений автоматически направляется на максимально доступную и экономически выгодную аудиторию.

Охват пользователей оказался менее масштабным, чем в 2015 г. (см. табл. 2), однако эффективность рекламы повысилась примерно на 26 %. Кроме того, возможность поделиться результатами исследования с друзьями увеличила охват пользователей без дополнительных затрат. 

Качество полученных данных также удалось повысить за счет того, что в результирующую выборку попали только пользователи, которые прошли предварительный отбор (учитывалась социальная желательность, скорость ответов и внимательность чтения формулировок вопросов). Затраты на рекламу составили примерно 28 000 руб., почти в три раза меньше, чем при первом сборе данных.

При сборе данных среди пользователей из США с 6 по 16 декабря 2016 г. (для этого были переведены тексты начальной страницы с кратким информированным согласием и тексты вариантов обратной связи, а все опросники изначально были англоязычными) была затрачена существенная сумма, но при этом получены более количественно скромные результаты, чем при сборе данных в российском сегменте сети «Фейсбук» (см. табл. 2). 

На показы рекламных объявлений было потрачено 97 500 руб., а средняя стоимость данных, полученных в США, составила 155 руб. за каждого участника (или 2,5 долл. США) (что в целом не очень дорого по сравнению с вариантами стоимости сбора аналогичных данных, описанными в статье Косински и соавторов (от 1,5 до 33 долл., в среднем — 13,75 долл.) [5]). Но это почти в 20 раз выше стоимости сбора данных в российском сегменте сети «Фейсбук». Возможно, это произошло из-за более высокой активности рекламодателей в США, чем в России. Кроме того, упоминание российских психологов как организаторов исследования могло снизить привлекательность рекламы.

Для того чтобы выборка была более уравновешенной по полу и возрасту, необходимо было таргетировать показ объявления на аудиторию 25–34 лет и на женщин (тогда как в России пользователей-женщин, наоборот, было больше).

Описав последовательность сбора данных, осуществляемую и контролируемую психологами проекта, выделим и опишем два важных, на наш взгляд, технически значимых этапа в работе: этап подготовки приложения в начале (осуществляется веб-программистом в постоянной коммуникации с психологами и лингвистами) и этап препроцессинга данных перед проверкой гипотез по итогам их сбора (осуществляется психологом, специализирующимся на обработке данных).

Краткое описание особенностей программы-приложения для сбора данных

Перейдем к обобщенному описанию специального приложения, которое осуществляло онлайн-тестирование, выдавало пользователям краткую обратную связь о них и с их разрешения собирало тексты их открытых постов, а также минимальную демографическую информацию из профиля и «лайки страниц» — подписки на публичные страницы компаний, организаций, медиа-персон в сети «Фейсбук».

Приложение, с помощью которого собирались данные, в нашем случае было создано для веб-версии «Фейсбук» (т. е. для тестирования на компьютере или ноутбуке, а не через браузеры смартфонов или планшетов). Социальная сеть через свой API-интерфейс (программный интерфейс социальной сети) дает возможность приложению запросить доступ к ленте публикаций пользователя, его месту жительства, информации об интересных ему страницах, личной информации — дате рождения, семейном положении и т. д. 

«Фейсбук» очень серьезно подходит к вопросам безопасности личных данных пользователя, поэтому для получения этих данных с помощью приложения нужно двойное подтверждение — вначале, на этапе регистрации приложения в сети, для каждого конкретного пункта собираемых через профиль данных требуется разрешение самой социальной сети (ее программистов и юристов), причем необходимо обосновать причину, по которой эти данные нужны разработчику, и причину полезности именно для пользователя факта передачи этой информации нам (обоснования, написанные на английском языке, отправляются из аккаунта программиста-разработчика в специальном разделе социальной сети, и в нашем случае пришлось сделать несколько итераций, прежде чем было получено разрешение). 

Вторым этапом является разрешение на скачивание этих данных от самого пользователя в момент первого перехода в приложение. Кроме того, в сети «Фейсбук» некоторые данные так и остались за пределами API и не могут быть получены никаким официальным образом — это список друзей пользователя (можно получить лишь список друзей, которые также переходили в это приложение), его личные сообщения, информация о его действиях в «Фейсбук».

Еще одна составляющая безопасности приложения по требованиям сети «Фейсбук» — это наличие и ежегодное продление SSL-сертификата для передачи зашифрованных данных по протоколу HTTPS. О его покупке и ежегодном обновлении нужно тоже помнить. Кроме того, необходим хостинг и сервер, где будут храниться данные. Под данные нашего проекта (мы собирали данные дважды в России и один раз в США) зарезервировано 4 Гб.

В качестве системы управления базами данных используется MySQL, для которой у использованного в проекте языка PHP есть много встроенных функций. MySQL является основным хранилищем как для ответов пользователей, так и для данных, полученных через API Facebook.

Важно отметить, что подобные исследования со стационарных компьютеров через веб-интерфейс постепенно будет все сложнее проводить. Пользователи все чаще переходят на использование смартфонов, а заполнять опросник около 15– 20 минут и не отвлекаться от мобильного устройства — паттерн, противоречащий самой идее мобильности. 

В связи с этим для проведения интернет-исследований мы рекомендуем максимально сокращать количество вопросов, программировать возможность прервать процедуру и вернуться к ней, а также по возможности геймифицировать взаимодействие с приложением, чтобы удержать внимание пользователей (как минимум добавить строку прогресса). А разрабатывая вебприложения, быть готовыми к тому, что относительно просто будет собрать лишь данные пользователей старшего поколения, которые чаще пользуются стационарными компьютерами.

Препроцессинг полученных данных

В качестве примера приведем применяемую нами процедуру предобработки данных, полученных в 2016 г. среди пользователей русскоязычного сегмента сети «Фейсбук». Она включала в себя следующие этапы:

  1. исключение неполных ответов;
  2. исключение ответов невнимательных респондентов с помощью вопроса-ловушки;
  3. исключение ответов пользователей с высокой социальной желательностью;
  4. исключение пользователей, которые отвечали на вопросы быстрее обычного. Из 9683 человек, согласившихся принять участие в исследовании в 2016 г., только 4240 человек (44 %) смогли завершить опрос, ответив на все 66 вопросов. Интересно, что более половины из всех отказавшихся (61 %) не стали отвечать даже на первый вопрос, а еще около трети из всех отказов (34 %) произошли при ответе на первые 20 вопросов. И только 5 % из всех отказавшихся прекратили участие начиная с 21-го и заканчивая 65-м вопросом.

Участники достаточно внимательно подходили к чтению формулировок вопросов. Только 2,5 % участников, завершивших опрос, неверно ответили на вопрос-ловушку, в котором требовалось выбрать обозначенный в формулировке вопроса вариант ответа («В этом вопросе выберите вариант “часто”»). Ответы этих респондентов были исключены из дальнейшего анализа.

Шкала социальной желательности включала три вопроса из опросника КроунаМарлоу [25] в адаптации Ю. Л. Ханина (использовалась пятибалльная шкала Лайкерта вместо оригинальной шкалы «да»/«нет»). Средний балл по модифицированной шкале оказался равен 8,2 (±2,4). Мы исключили ответы участников с высокой социальной желательностью, т. е. тех, кто набрал 14 и 15 баллов из 15 возможных.

Мы также фиксировали время от момента загрузки каждого вопроса до выбора варианта ответа. Участников с большим количеством быстрых ответов (менее 5 сек.) мы исключили из анализа. В качестве критерия отсева мы использовали количество быстрых ответов, превышающее три стандартных отклонения от среднего по выборке.

Выводы

Мы описали последовательность подготовки и сбора психологических (а также частично текстовых) данных при помощи специального приложения для социальной сети «Фейсбук». Ниже приведем список ограничений процедур, которые мы провели, а также сформулируем полезные советы для тех исследователей, которые захотели бы воспользоваться нашим опытом и начать исследования, собирая «цифровые следы» пользователей социальных сетей.

Ряд ограничений, которые присутствовали в описанном исследовании.

Собирая данные в первый год, не имея подобного опыта, а также доступа к описанным кем-то пошаговым инструкциям о проведении такого рода проектов, наша группа неизбежно столкнулась с рядом технических недочетов, сказавшихся на качестве собранных в первый год исследования данных. Это небольшое количество текстов постов, которые получилось собрать, неравновесная по полу выборка без специального таргетирования рекламы, противоречия в обратной связи, вызвавшие вопросы респондентов.

В социальной сети «Фейсбук» в России достаточно сложно собрать данные молодых пользователей, потому что они чаще пользуются социальной сетью «ВКонтакте», и это сказалось на том, что средний возраст участников этого исследования — 45–46 лет.

Поскольку сеть «Фейсбук» на третьем месте по популярности в России (ею пользуются более 14 млн человек [26]), собранные в ней данные нельзя считать репрезентативно отражающими особенности всей популяции (но этот недостаток есть почти у каждой социальной сети).

Судя по загруженным в базу данных историям публикаций респондентов, участники исследования — это люди, регулярно откликающиеся на рекламу принять участие в различных онлайн-тестированиях (как правило, несерьезных, когда по особенностям профиля, текстов или частоте переписки с кем-то из друзей возвращается обратная связь о том, «какой ты герой сериала “Игра престолов”» и т. п.). Эта особенность данных также свидетельствует об их недостаточной репрезентативности и специфичности выборки (хотя позволяет проводить лингвистический анализ и сопоставление лингвистических и психологических данных).

Нам не удалось собрать достаточное количество данных пользователей из США для прямого сопоставления их с данными пользователей из России. Для этого необходимо либо тратить слишком существенные средства, либо менять рекламное объявление (при этом важно, чтобы оно сохраняло преемственность с тем, которое сработало на российской выборке).

Опираясь на свой опыт, мы бы хотели заострить внимание на некоторых нюансах проведения исследований в социальной сети.

Обратную связь (желательно в достаточно шутливой форме, потому что к этому привыкли пользователи социальных сетей) необходимо продумывать заранее и уделить ей время. Несложно сформулированная, необязательно исчерпывающая и в целом отражающая вопросы опросников обратная связь («психологический портрет») минимизирует неискренность в ответах и может стать стимулом для добровольного распространения респондентами ссылки на опрос.

Список вопросов должен быть недлинным, в пределах примерно 60–70, чтобы пользователи не уставали и не отказывались отвечать на них.

Для привлечения аудитории к серьезному академическому исследованию может сработать достаточно скромное рекламное объявление.

Важно иметь в виду, что все больше пользователей выходят в социальные сети через смартфоны, а это значит, что сессии ответов на вопросы должны быть как можно короче, желательно запрограммировать возможность прервать сессию и вернуться к ней позже. Также не лишними будут элементы геймификации в приложении, как минимум строка, отображающая количество отвеченных и оставшихся вопросов.

Важны вопросы на социальную желательность, автоматические ответы и фиксация времени ответа на один вопрос. Они помогут отсеять нежелательные результаты.

Также важно делать предварительную обработку и отсев данных с учетом описанных нами параметров.

Необходимо не забывать о затратах на создание и обновление SSL-сертификата для протокола HTTPS и хостинг.

В конце статьи важно написать о том, какие (судя по анализу литературных источников и отчасти с опорой на наш опыт работы в проекте) существуют ограничения и преимущества в подходе к описываемому варианту сбора данных в социальных сетях.

Ограничения процедуры сбора данных в социальных сетях.

  1. Не все социальные сети (в частности, «Фейсбук») позволяют скачивать и анализировать связи между пользователями («дружбы»), а это важный и потенциально продуктивный элемент исследований такого характера.
  2. Технически достаточно сложно проводить подобные исследования в сети «Фейсбук» из-за длительных согласований с администрацией сети и особенностей работы с API (технически проще работать с API в «Твиттере» и «ВКонтакте», но в России «Твиттер» нерепрезентативен, у него немного пользователей, а «ВКонтакте» недостаточно представлены люди старше 40 лет).
  3. Чаще всего в таком исследовательском контексте доступны корреляционные модели исследований, без каузальных объяснений.
  4. Собирать данные за границей (по нашему единичному опыту) довольно дорого по сравнению со стоимостью данных из России.
  5. Не всегда в загруженных текстах (не репостах) пользователей представлены именно их тексты (они могут цитировать писателей, политиков и т. д.).

В заключение исходя из своего опыта работы опишем достоинства сбора данных в социальной сети.

Как показал наш опыт, собрать психологические, поведенческие (относительно поведения в социальной сети) и языковые данные на выборках, исчисляемых тысячами человек, в социальной сети «Фейсбук» — достаточно недорого и достаточно быстро. Это требует определенной длительной и аккуратной подготовки, но затем приносит свои продуктивные плоды. 

Вознаграждение респондентов, которые участвуют в исследованиях, проводимых отечественными психологами офлайн, составляет, по нашим сведениям, от 100 до 1000 руб. А собирая данные через рекламирование ссылки на приложение в сети «Фейсбук», мы потратили около 10 руб. на одного российского респондента и 155 руб. на одного респондента из США.

Для сбора данных, а потом для их обработки необходимо участие представителей других наук и специальностей — программистов, лингвистов, аналитиков данных. Такие проекты заведомо междисциплинарны. Но основные задачи в них ставят психологи.

Такой формат работы достаточно удобен (оперативен и относительно недорог) для сбора данных в нескольких странах, несмотря на то что попытка собрать данные в США в описываемом нами случае не увенчалась однозначным успехом.

Увеличивается количество пользователей русскоязычного сегмента сети «Фейсбук». Возможно, со временем выборки пользователей этой сети будут достаточно репрезентативными.

Как показывают данные наших и не только наших публикаций, тексты постов пользователей социальных сетей действительно отражают их самые разные личностные особенности (от факторов «Большой пятерки» до черт «Темной триады» и уровня психологического благополучия). Поэтому подобные исследования имеют немалую теоретическую и прикладную ценность.

На основе получаемых данных можно строить предсказательные модели, установив корреляции лексических, морфологических, синтаксических характеристик текстов постов с психологическими чертами их авторов. И такие прикладные модели могут стать основой для моделей теоретических в дальнейшем.

Собранные таким образом за одну-две рекламные кампании в социальной сети данные позволяют достаточно долго и продуктивно их обрабатывать и описывать силами специалистов из нескольких областей науки. Можно сказать, что материал для проверки немалого количества гипотез в течение еще нескольких лет в базах данных нашего проекта имеется.

В заключение хотим выразить признательность нашим коллегам — участникам проекта, помогавшим на разных этапах его реализации и оказавшим помощь при подготовке текста статьи: П. В. Паничевой, А. К. Москвичеву, А. Г. Чуриловой, М. А. Недошивиной, М. В. Салитовой, А. Б. Спектру.

Литература

  1. Ледовая Я. А., Тихонов Р. В., Боголюбова О. Н. Социальные сети как новая среда для междисциплинарных исследований поведения человека // Вестн. С.-Петерб. ун-та. Психология и педагогика. 2017. Т. 7, № 3. С. 193–200.
  2. Исследовательский холдинг Ромир. Социально-сетевая жизнь. 2015. 
  3. Mander J. Daily time spent on social networks rises to over 2 hours // GlobalWebIndex. 2017. 
  4. Mander J., McGrath F. GWI Social Summary: GlobalWebIndex’s quarterly report on the latest trends in social networking [Flagship Report Q1 2017]. 
  5. Kosinski M., Matz S., Gosling S., Popov V., Stillwell D. Facebook as a research tool for the social sciences: Opportunities, challenges, ethical considerations, and practical guidelines // Am. Psychol. 2015. Vol. 70. No. 6. P. 543–556.
  6. Guntuku S. C., Yaden D. B., Kern M. L., Ungar L. H., Eichstaedt J. C. Detecting depression and mental illness on social media: an integrative review // Curr. Opin. Behav. Sci. 2017. Vol. 18. P. 43–49.
  7. Хачуян A. Можно ли определить террориста по его цифровому следу [видеозапись лекции] // YouTube. 2 июня. 2017. 
  8. Online Bullying Among Youth 8–17 Years Old — Russia [Report Q2-CY2012] / Cross-Tab Marketing Services & Telecommunications Research Group for Microsoft Corporation. 2012.
  9. Ybarra M. L., Mitchell K. J., Wolak J., Finkelhor D. Examining Characteristics and Associated Distress Related to Internet Harassment: Findings From the Second Youth Internet Safety Survey // Pediatrics. 2006. Vol. 118, N 4. P. e1169–e1177.
  10. Bech P. Health-related quality of life measurements in the assessment of pain clinic results // Acta Anaesthesiol. Scand. 1999. Vol. 43, N 9. P. 893–896.
  11. Индекс общего (хорошего) самочувствия ВОЗ / Psychiatric Research Unit. WHO Collaborating Center for Mental Health, Frederiksborg General Hospital. 1999. 
  12. Diener E., Emmons R. A., Larsen R. J., Griffin S. The Satisfaction With Life Scale // J. Pers. Assess. Lawrence Erlbaum Associates, Inc. 1985. Vol. 49, N 1. P. 71–75.
  13. Ледовая Я. А., Боголюбова О. Н., Тихонов Р. В. Стресс, благополучие и Темная триада // Психологические исследования. 2015. Т. 8, № 43. С. 5. 
  14. Jones D. N., Paulhus D. L. Introducing the Short Dark Triad (SD3) // Assessment. 2014. Vol. 21, N 1. P. 28–41.
  15. Егорова М. С., Ситникова М. А., Паршикова О. В. Адаптация короткого опросника «Темной триады» // Психологические исследования. 2015. Т. 8, № 43. С. 1. 
  16. Bandura A. Social foundations of thought and action: A social cognitive theory. Englewood Cliffs, NJ: Prentice-Hall Inc, 1985. 544 p.
  17. Moore C., Detert J. R., Klebe Treviño L., Baker V. L., Mayer D. M. Why employees do bad things: Moral disengagement and unethical organizational behavior // Pers. Psychol. 2012. Vol. 65, N 1. P. 1–48.
  18. Ледовая Я. А., Тихонов Р. В., Боголюбова О. Н., Казенная Е. В., Сорокина Ю. Л. Отчуждение моральной ответственности: психологический конструкт и методы его измерения // Вестн. С.-Петерб. ун-та. Сер. 16. Психология. Педагогика. 2016. № 4. С. 23–39.
  19. Prins A., Ouimette P., Kimerling R., Camerond R. P., Hugelshofer D. S., Shaw-Hegwer J., Sheikh J. I. The primary care PTSD screen (PCPTSD): development and operating characteristics // Prim. Care Psychiatry. 2004. Vol. 9, N 1. P. 9–14.
  20. Bogolyubova O., Tikhonov R., Ivanov V., Panicheva P., Ledovaya Ya. Violence Exposure, Posttraumatic Stress, and Subjective Well-Being in a Sample of Russian Adults // J. Interpers. Violence. 2017. P. 1–16.
  21. Bogolyubova O., Panicheva P., Tikhonov R., Ivanov V., Ledovaya Ya. Dark Personalities on Facebook: Harmful Online Behaviors and Language // Comput. Human Behav. Elsevier Ltd, 2018. Vol. 78. P. 151–159.
  22. Panicheva P., Ledovaya Ya., Bogolyubova O. Lexical, Morphological and Semantic Correlates of the Dark Triad Personality Traits in Russian Facebook Texts // Proc. Artif. Intell. Nat. Lang. Conf. (AINL 2016). 2016. P. 1–8.
  23. Panicheva P., Mirzagitova A., Ledovaya Y. Semantic Feature Aggregation for Gender Identification in Russian Facebook // AINL 2017: Artificial Intelligence and Natural Language / eds A. Filchenkov, L. Pivovarova, J. Žižka. Communications in Computer and Information Science, vol 789. Springer, Cham. 2018. Р. 3–15. URL: https://link.springer.com/chapter/10.1007/978-3-319-71746-3_1 (дата обращения: 01.12.2017).
  24. Moskvichev A., Dubova M., Menshov S., Filchenkov A. Using Linguistic Activity in Social Networks to Predict and Interpret Dark Psychological Traits // AINL 2017: Artificial Intelligence and Natural Language / eds A. Filchenkov, L. Pivovarova, J. Žižka. Communications in Computer and Information Science. Vol. 789. Springer, Cham. 2018. P. 16–26. URL: https://link.springer.com/chapter/10.1007/978-3-319-71746-3_2 (дата обращения: 01.12.2017).
  25. Crowne D. P., Marlowe D. A new scale of social desirability independent of psychopathology // J. Consult. Psychol. 1960. Vol. 24, N 4. P. 349–354.
  26. Количество активных пользователей Facebook в России составляет 14,4 млн человек // Rambler News Service. 2016. 
  27. Guðmundsdóttir H., Ólason D., Guðmundsdóttir D., Sigurðsson J. F. A psychometric evaluation of the Icelandic version of the WHO-5 // Scand. J. Psychol. 2014. Vol. 55, N 6. P. 567–572.

Приложение

Рис. 1. Пример отображения рекламного объявления в ленте новостей социальной сети «Фейсбук»
Рис. 1. Пример отображения рекламного объявления в ленте новостей социальной сети «Фейсбук»
Рис. 2. Пример начальной страницы приложения с краткой формой информированного согласия
Рис. 2. Пример начальной страницы приложения с краткой формой информированного согласия
Рис. 3. Пример отображения вопросов и вариантов ответа для участников
Рис. 3. Пример отображения вопросов и вариантов ответа для участников
Рис. 4. Обратная связь для женщины-участницы, набравшей по шкале «нарциссизм» больше баллов, чем по двум другим шкалам «Темной триады»
Рис. 4. Обратная связь для женщины-участницы, набравшей по шкале «нарциссизм» больше баллов, чем по двум другим шкалам «Темной триады»

Работа выполнена при поддержке гранта СПбГУ 8.38.351.2015 «Стресс, здоровье и психологическое благополучие в социальных сетях: кросскультурное исследование».

Источник: Вестник СПбГУ. Психология и педагогика. 2017. Т. 7. Вып. 4. С. 308–327. https://doi.org/10.21638/11701/spbu16.2017.402

Об авторах

  • Янина Александровна Ледовая — Санкт-Петербургский государственный университет, Российская Федерация, Санкт-Петербург.
  • Роман Вадимович Тихонов — аспирант, Санкт-Петербургский государственный университет, Российская Федерация, Санкт-Петербург.
  • Виктор Юрьевич Иванов — Интернет-компания «Мэйл.ру», Российская Федерация, Москва.
  • Булат Равилевич Яминов — XebiaLabs, Нидерланды, 1213VB, Хилверсум.
  • Ольга Николаевна Боголюбова — кандидат психологических наук, Университет Кларксон, США, штат Нью-Йорк, Потсдам.

Смотрите также:

ПРИМЕЧАНИЕ

  1. В используемой нами версии мы оставили вопрос из оригинальной шкалы Джонса и Полхуса «Мне нравится секс с едва знакомыми людьми» вместо варианта русскоязычной версии М. С. Егоровой и коллег «Мне нравится подкалывать неудачников».
  2. Отдельно остановимся на подготовке формулировок обратной связи. Пользователям возвращалось короткое описание их самочувствия по результатам шкалы ВОЗ-5 (с характеристиками отличного, умеренно-положительного и неблагополучного характера). Для отнесения результатов респондентов к одному из трех описанных уровней программой высчитывалась сумма по всем вопросам шкалы, которая сопоставлялась с найденными в литературе данными по достаточно большой выборке жителей стран Скандинавии [27]. Также пользователи получали обратную связь по итогам выраженности трех субшкал шкалы «Темная триада»: в первый год были взяты средние данные из статьи М. С. Егоровой и коллег о сборе данных на российской офлайн-выборке, во второй год были изменены дизайн и расчет обратной связи по этой шкале.

Категории

Метки

Публикации

ОБЩЕНИЕ

CYBERPSY — первое место, куда вы отправляетесь за информацией о киберпсихологии. Подписывайтесь и читайте нас в социальных сетях.

vkpinterest