Ледовая Я.А., Тихонов Р.В., Боголюбова О.Н. Социальные сети как новая среда для междисциплинарных исследований поведения человека

Л

Преимущества и перспективы нового подхода к сбору индивидуальных данных о поведении личности через социальные сети

В 1990-х годах нача­лось повсе­мест­ное рас­про­стра­не­ние воз­мож­но­сти выхо­да в Интер­нет, что повлек­ло за собой почти неогра­ни­чен­ный доступ поль­зо­ва­те­лей к инфор­ма­ции и ком­му­ни­ка­ции друг с дру­гом. Начи­ная с 2004 г., когда появи­лась соци­аль­ная сеть «Фейс­бук», соци­аль­ный и соци­аль­но-пси­хо­ло­ги­че­ский опыт боль­шой части наших совре­мен­ни­ков суще­ствен­но расширился. 

Доступ к сети Интер­нет име­ет 51 % жите­лей Зем­ли [1], от при­мер­но 30 % в Афри­ке до 88 % в Север­ной Аме­ри­ке, а это в сум­ме более 3,8 млрд чело­век. В Рос­сии уро­вень про­ник­но­ве­ния Интер­не­та оце­нен в 73 % [2]. Не менее двух мил­ли­ар­дов чело­век еже­ме­сяч­но поль­зу­ют­ся воз­мож­но­стя­ми «Фейс­бук» [3], и это чис­ло удво­и­лось за послед­ние пять лет [4]. Поми­мо «Фейс­бук», есть и дру­гие соци­аль­ные сети, кото­рые полу­чи­ли широ­кое рас­про­стра­не­ние (табл. 1), одна­ко ни одна из них не достиг­ла мас­шта­бов «Фейс­бук» по охва­ту пользователей. 

Мы сосре­до­то­чим свое вни­ма­ние на доль­ше все­го суще­ству­ю­щей и доми­ни­ру­ю­щей по охва­ту и про­ник­но­ве­нию меж­ду­на­род­ной сети «Фейс­бук». Боль­шая часть инте­ре­су­ю­щих нас иссле­до­ва­ний дела­лась на осно­ве дан­ных из нее. 

Кро­ме того, сре­ди меж­ду­на­род­ных соци­аль­ных сетей имен­но «Фейс­бук» поз­во­ля­ет полу­чить доступ к мак­си­маль­но подроб­ной и пер­со­на­ли­зи­ро­ван­ной инфор­ма­ции о поль­зо­ва­те­ле через его акка­унт, и имен­но эти дан­ные наи­бо­лее инте­рес­ны и важ­ны для психологов-исследователей.

Итак, изме­нил­ся соци­аль­ный ланд­шафт, и воз­ник­ли новые соци­аль­ные прак­ти­ки (в част­но­сти, это рас­ши­ре­ние кру­га зна­ко­мых и воз­мож­ность опе­ра­тив­ной ком­му­ни­ка­ции в еди­ном интер­фей­се, кол­лек­тив­ные обсуж­де­ния и про­сто­та пуб­лич­ной ком­му­ни­ка­ции от пер­во­го лица с боль­шой ауди­то­ри­ей, рас­про­стра­не­ние инфор­ма­ции через дру­зей и раз­лич­ные вир­ту­аль­ные сооб­ще­ства, воз­мож­ность наблю­дать за собы­ти­я­ми из жиз­ни дру­зей и зна­ко­мых, кото­ры­ми они делят­ся, ана­ло­гич­ная воз­мож­ность делить­ся зна­чи­мы­ми соб­ствен­ны­ми пере­жи­ва­ни­я­ми в виде тек­стов, фото­гра­фий и видео — спи­сок мож­но продолжать). 

Еже­днев­но в соци­аль­ных сетях люди про­во­дят все боль­ше вре­ме­ни: не менее двух часов в сред­нем в мире [11] и почти два с поло­ви­ной часа — в Рос­сии (дан­ные 2015 г. [12]). Пред­ста­ви­те­ли моло­до­го поко­ле­ния в сред­нем уде­ля­ют вни­ма­ние обще­нию в соци­аль­ных сетях и мес­сен­дже­рах еще боль­ше вре­ме­ни, до 160 минут в день [2].

Два часа и более — это боль­шая часть сво­бод­но­го вре­ме­ни, это суще­ствен­ная часть дня. Люди, осо­бен­но пред­ста­ви­те­ли моло­до­го и сред­не­го поко­ле­ния, дей­стви­тель­но вовле­че­ны в эту дея­тель­ность очень активно. 

При этом, по нашим дан­ным, и пред­ста­ви­те­ли стар­ших поко­ле­ний актив­но про­во­дят вре­мя в соци­аль­ных сетях: в выбор­ке из 8396 участ­ни­ков от 18 до 80 лет из Рос­сии сред­ний воз­раст соста­вил 45 лет [13; 14].

Таблица 1. Количество активных пользователей социальных сетей в разных странах

Таблица 1. Количество активных пользователей социальных сетей в разных странах

С нача­ла 2000-х годов пред­ста­ви­те­лям соци­аль­ных наук ста­ло невоз­мож­но игно­ри­ро­вать эти пере­ме­ны в обра­зе жиз­ни совре­мен­ных людей. Неко­то­рые иссле­до­ва­те­ли изу­ча­ют новые (или зано­во обна­ру­жи­ва­ют при­выч­ные) фор­мы ком­му­ни­ка­ции в соци­аль­ных сетях [15–17], кто-то иссле­ду­ет поло­жи­тель­ные и отри­ца­тель­ные послед­ствия новых воз­мож­но­стей обще­ния и полу­че­ния инфор­ма­ции, при этом неред­ко утвер­жда­ет­ся, что соци­аль­ные сети при­во­дят к нега­тив­ным послед­стви­ям для пси­хи­че­ско­го здо­ро­вья, вво­дит­ся даже алар­мист­ское поня­тие «Фейс­бук-аддик­ции» [18–21].

Но есть кате­го­рия уче­ных, кото­рые, сме­нив пара­диг­му отно­ше­ния к соци­аль­ным сетям и рас­смат­ри­вая их не как пред­мет иссле­до­ва­ния, а как инстру­мент, нача­ли исполь­зо­вать соци­аль­ные сети как плат­фор­му для сбо­ра ново­го типа­дан­ных — сле­дов, кото­рые остав­ля­ют поль­зо­ва­те­ли в есте­ствен­ных для себя усло­ви­ях. Это усло­вия, кото­рые ста­ли для мно­гих при­выч­ны­ми и удоб­ны­ми, а зна­чит, пове­де­ние в них ста­ло менее контролируемым. 

Появи­лось назва­ние для таких дан­ных — “digital footprints” — «циф­ро­вые отпе­чат­ки». Воз­ник­ли раз­но­об­раз­ные авто­ма­ти­зи­ро­ван­ные фор­мы для их мас­штаб­но­го сбо­ра — это могут быть про­грам­мы-крау­ле­ры [22] (их назва­ние про­изо­шло от англий­ско­го сло­ва “crawling” — пол­за­ние, они после­до­ва­тель­но соби­ра­ют откры­тые дан­ные из любых источ­ни­ков в Интер­не­те, в том чис­ле из соци­аль­ных сетей) или спе­ци­аль­ные про­грам­мы-при­ло­же­ния, под­клю­ча­ю­щи­е­ся через про­грамм­ный интер­фейс соци­аль­ной сети (так назы­ва­е­мый API — Application Programming Interface) и рабо­та­ю­щие внут­ри ее интер­фей­са, напри­мер как авто­ма­ти­че­ские опрос­ни­ки раз­вле­ка­тель­но­го харак­те­ра, воз­вра­ща­ю­щие поль­зо­ва­те­лям обрат­ную связь по резуль­та­там тести­ро­ва­ния [23].

Иссле­до­ва­тель­ским под­раз­де­ле­ни­ям ком­па­ний-вла­дель­цев соци­аль­ных сетей доступ­ны вооб­ще все дан­ные, кото­рые остав­ля­ют поль­зо­ва­те­ли, вклю­чая «закры­тые» от посто­рон­них запи­си (ста­ту­сы, посты) и фото­аль­бо­мы, и даже тек­сты лич­ных сооб­ще­ний. Поэто­му они могут зани­мать­ся еще более слож­ны­ми, хотя и эти­че­ски неод­но­знач­ны­ми вида­ми ана­ли­за таких данных.

Резуль­та­ты, собран­ные таким новым спо­со­бом, лише­ны ряда мето­до­ло­ги­че­ских недо­стат­ков, доста­точ­но извест­ных в пси­хо­ло­гии и соци­аль­ных нау­ках, и при этом сохра­ня­ют поло­жи­тель­ные сто­ро­ны при­выч­ных офлайн-иссле­до­ва­ний [24–26].

Во-пер­вых, на про­тя­же­нии ХХ в. стра­да­ла внеш­няя валид­ность боль­шей части иссле­до­ва­ний. Их резуль­та­ты нель­зя было лег­ко рас­про­стра­нять на всех пред­ста­ви­те­лей гене­раль­ной сово­куп­но­сти из-за того, что типич­ны­ми испы­ту­е­мы­ми во мно­гих пси­хо­ло­ги­че­ских иссле­до­ва­ни­ях были так назы­ва­е­мые “WEIRD people” (от “weird” — «стран­ный, неадек­ват­ный»): выбор­ки неред­ко фор­ми­ро­ва­лись и сей­час фор­ми­ру­ют­ся по прин­ци­пу доступ­но­сти, а доступ­ны­ми для иссле­до­ва­тель­ских про­ек­тов уни­вер­си­тет­ских уче­ных из раз­ви­тых стран запад­но­го мира были сту­ден­ты — пред­ста­ви­те­ли White, Educated, Industrialized, Rich, Democratic сооб­ществ [27].

Таким обра­зом, пред­ста­ви­те­ли при­мер­но 12 % миро­вой попу­ля­ции были испы­ту­е­мы­ми в 80 % пуб­ли­ку­е­мых науч­ных иссле­до­ва­ний, резуль­та­ты кото­рых обыч­но рас­про­стра­ня­ли на услов­но­го «сред­не­ста­ти­сти­че­ско­го испы­ту­е­мо­го», т. е. абсо­лют­но любо­го чело­ве­ка на планете. 

Исполь­зуя же дан­ные из соци­аль­ных сетей, иссле­до­ва­те­ли авто­ма­ти­че­ски полу­ча­ют доступ к гораз­до более широ­ко­му кру­гу испы­ту­е­мых, и их огра­ни­чи­ва­ет теперь в основ­ном лишь сте­пень рас­про­стра­нен­но­сти Интер­не­та и нали­чие финан­си­ро­ва­ния для про­ве­де­ния реклам­ной кам­па­нии, при­вле­ка­ю­щей потен­ци­аль­ных участ­ни­ков [28].

Во-вто­рых, имея воз­мож­ность соби­рать при помо­щи спе­ци­аль­ных про­грамм и затем ана­ли­зи­ро­вать «циф­ро­вые отпе­чат­ки» и реаль­ные про­дук­ты дея­тель­но­сти поль­зо­ва­те­лей соци­аль­ных сетей (тек­сты постов, фото­гра­фии, мет­ки место­по­ло­же­ния — гео­те­ги, мет­ки тема­ти­че­ских ассо­ци­а­ций — хеш­те­ги, спис­ки сооб­ществ, на ново­сти кото­рых под­пи­са­ны поль­зо­ва­те­ли, спис­ки «дру­зей» и т. д.), иссле­до­ва­те­ли полу­ча­ют доступ к менее под­вер­жен­ным эффек­ту соци­аль­ной жела­тель­но­сти и более эко­ло­ги­че­ски валид­ным данным. 

Сто­ит отме­тить, что полу­че­ние спис­ка дру­зей воз­мож­но не во всех соци­аль­ных сетях. Сего­дня это доста­точ­но неслож­но делать для соци­аль­ных сетей «Твит­тер» и «ВКон­так­те». В сетях «Фейс­бук» и «Инста­грам» спи­сок дру­зей полу­чить затруднительно.

В-тре­тьих, мно­го­крат­но воз­рос­ли раз­ме­ры выбо­рок иссле­до­ва­ний, а так­же сокра­ти­лась по вре­ме­ни и уде­ше­ви­лась про­це­ду­ра сбо­ра дан­ных. Так, в соби­ра­е­мых в США через сеть «Фейс­бук» дан­ных (когда поль­зо­ва­тель запол­ня­ет, как пра­ви­ло, внут­ри интер­фей­са соци­аль­ной сети ряд пси­хо­ло­ги­че­ских опрос­ни­ков, а с его согла­сия иссле­до­ва­те­ли загру­жа­ют при этом пуб­лич­но доступ­ную инфор­ма­цию, напри­мер упо­ми­нав­ши­е­ся уже тек­сты ста­ту­сов, воз­раст и пол, место­на­хож­де­ние и инфор­ма­цию о под­пис­ках на пуб­лич­ные стра­ни­цы — “page likes”) сто­и­мость спе­ци­аль­но настра­и­ва­е­мой рекла­мы таких опро­сов (рекла­му мож­но тар­ге­ти­ро­вать на демо­гра­фи­че­ски и гео­гра­фи­че­ски раз­ные груп­пы в осо­бом раз­де­ле сети «Фейс­бук» для рекла­мо­да­те­лей) колеб­лет­ся в пере­сче­те на одно­го респон­ден­та от 1,51 до 33 дол­ла­ров, в сред­нем — 13,75 дол­ла­ра [24; 29; 30]. По наше­му опы­ту сбор дан­ных сре­ди рос­сий­ских поль­зо­ва­те­лей гораз­до менее затратен.

В-чет­вер­тых, для того что­бы полу­чить дан­ные поль­зо­ва­те­лей из прак­ти­че­ски любой стра­ны, нет необ­хо­ди­мо­сти орга­ни­зо­вы­вать поезд­ку и искать воз­мож­ность кон­так­тов с пред­ста­ви­те­ля­ми дру­го­го язы­ка и дру­гой куль­ту­ры. Доста­точ­но иметь доступ к вер­си­ям опрос­ни­ков на нуж­ном язы­ке и сотруд­ни­чать с линг­ви­стом, зна­ю­щим этот язык, — для после­ду­ю­щей обра­бот­ки язы­ко­вых дан­ных. Так­же более реа­ли­стич­ны­ми ста­но­вят­ся зада­чи полу­че­ния дан­ных от мало­мо­биль­ных групп людей (нахо­дя­щих­ся чаще дома или в учреждениях).

Нако­нец, в-пятых, на дан­ных тако­го мас­шта­ба мож­но стро­ить и про­ве­рять пред­ска­за­тель­ные моде­ли о лич­ност­ных осо­бен­но­стях и пове­де­нии людей, напри­мер по тек­стам пуб­лич­ных постов поль­зо­ва­те­ля или по тема­ти­ке сооб­ществ, на кото­рые он (она) подписан(а) (это так назы­ва­е­мые «деше­вые», как пра­ви­ло, доступ­ные для сбо­ра при помо­щи про­грам­мы-крау­ле­ра дан­ные), мож­но пред­ска­зы­вать его (ее) лич­ност­ные осо­бен­но­сти, если до это­го было собра­но доста­точ­но «доро­гих» дан­ных боль­шо­го коли­че­ства дру­гих поль­зо­ва­те­лей (т. е. таких дан­ных, в кото­рых есть отве­ты этих поль­зо­ва­те­лей на вопро­сы пси­хо­ло­ги­че­ских опрос­ни­ков, кото­рые мож­но было сопо­став­лять для постро­е­ния моде­лей с так­же собран­ны­ми крау­ле­ром или при помо­щи при­ло­же­ния дан­ны­ми о пове­де­нии в соци­аль­ной сети — о текстах, под­пис­ках на пуб­лич­ные стра­ни­цы и т. п.) [31–33].

Мы так­же реко­мен­ду­ем посмот­реть видео­за­пись выступ­ле­ния Миха­ла Косин­ски в Рос­сии, в цен­траль­ном офи­се ком­па­нии «Сбер­банк». В нем он рас­ска­зы­ва­ет о сво­их иссле­до­ва­ни­ях и прин­ци­пе созда­ния и рабо­ты пред­ска­за­тель­ных моде­лей, кото­рые стро­ят­ся на осно­ве боль­ших данных.

Отме­тим, что в целом каче­ство дан­ных, полу­чен­ных с исполь­зо­ва­ни­ем соци­аль­ных сетей и дру­гих интер­нет-тех­но­ло­гий, сопо­ста­ви­мо с офлайн-мето­да­ми сбо­ра дан­ных, что неод­но­крат­но отме­ча­лось раз­ны­ми авто­ра­ми [34–36].

Опи­сы­ва­е­мый под­ход к сбо­ру дан­ных име­ет и свои ограничения.

Во-пер­вых, невоз­мож­ность кон­тро­ли­ро­вать фак­то­ры окру­жа­ю­щей сре­ды, в кото­рой про­ис­хо­дит запол­не­ние опро­са, а так­же сте­пень вовле­чен­но­сти и вни­ма­тель­но­сти респон­ден­та. Вполне воз­мож­но, что в момент запол­не­ния опро­са кто­то шумит или под­ска­зы­ва­ет «пра­виль­ные» вари­ан­ты отве­тов, созда­вая не самую ком­форт­ную атмо­сфе­ру для запол­не­ния пси­хо­мет­ри­че­ских тестов и опросников.

Во-вто­рых, доста­точ­но рас­про­стра­не­но наме­рен­ное иска­же­ние поль­зо­ва­те­ля­ми инфор­ма­ции о сво­ем воз­расте и поло­вой при­над­леж­но­сти: респон­ден­ты могут захо­дить в соци­аль­ные сети через фаль­ши­вый про­филь, выда­вая себя за дру­го­го человека.

В-тре­тьих, про­бле­ма­тич­ность запол­не­ния слиш­ком длин­ных опрос­ни­ков при сокра­ще­нии вре­ме­ни типич­ной онлайн-сес­сии [24].

И, в-чет­вер­тых, исполь­зо­ва­ние дан­ных из соци­аль­ных сетей под­ни­ма­ет новые вопро­сы иссле­до­ва­тель­ской эти­ки в онлайн-сре­де. Какую инфор­ма­цию мож­но соби­рать и ана­ли­зи­ро­вать без ведо­ма поль­зо­ва­те­лей? Мож­но ли счи­тать, что участ­ни­ки дали инфор­ми­ро­ван­ное согла­сие на сбор и обра­бот­ку их пер­со­наль­ных дан­ных, если они не гля­дя нажа­ли на кноп­ку «Я согла­сен», что­бы побыст­рее перей­ти к опро­су (см. подроб­нее: [37])? Как повы­сить осве­дом­лен­ность поль­зо­ва­те­лей о том, какие дан­ные будут доступ­ны иссле­до­ва­те­лям? К сожа­ле­нию, про­це­ду­ры рас­смот­ре­ния интер­нет-иссле­до­ва­ний эти­че­ски­ми коми­те­та­ми все еще не до кон­ца отрегулированы. 

Напри­мер, в кодек­се APA, обнов­лен­ном с янва­ря 2017 года, нет упо­ми­на­ний сбо­ра дан­ных в соци­аль­ных сетях. А один из самых цити­ру­е­мых иссле­до­ва­те­лей, во мно­гом пио­нер это­го направ­ле­ния Михал Косин­ски гово­рит в сво­их выступ­ле­ни­ях о том, что необ­хо­ди­мо с осто­рож­но­стью отно­сить­ся к открыв­шим­ся воз­мож­но­стям рабо­ты с боль­ши­ми дан­ны­ми на осно­ве «циф­ро­вых сле­дов», пото­му что пред­ска­за­ния осо­бен­но­стей лич­но­сти и даже поступ­ков чело­ве­ка, кото­рые ста­но­вят­ся все более точ­ны­ми, могут лишить нас при­ват­но­сти и в какой-то мере даже лич­ной безопасности.

Мно­гие из этих огра­ни­че­ний пре­одо­ли­мы за счет каче­ствен­ной пре­до­б­ра­бот­ки пер­вич­ных дан­ных: вклю­че­ние в опрос­ник вопро­сов, оце­ни­ва­ю­щих соци­аль­ную жела­тель­ность респон­ден­та, исполь­зо­ва­ние «вопро­сов-лову­шек», направ­лен­ных на отсе­и­ва­ние невни­ма­тель­ных участ­ни­ков, кон­троль вре­ме­ни, выде­ля­е­мо­го на вопрос, и исклю­че­ние слиш­ком быст­рых отве­тов, отсле­жи­ва­ние длин­ных цепо­чек оди­на­ко­вых и про­ти­во­ре­чи­вых отве­тов на сход­ные по смыс­лу вопросы.

Необ­хо­ди­мо отме­тить, что у рас­смат­ри­ва­е­мо­го под­хо­да есть не толь­ко науч­ные пер­спек­ти­вы, свя­зан­ные с уточ­не­ни­ем тео­ре­ти­че­ских моде­лей лич­ност­ных черт при помо­щи новых пове­ден­че­ских дан­ных или с созда­ни­ем новых тео­рий, опи­сы­ва­ю­щих лич­ность через ее язык. 

С опо­рой на пове­де­ние людей в соци­аль­ных сетях и, в част­но­сти, на откры­тые тек­сты поль­зо­ва­те­лей воз­мож­ны вари­ан­ты прак­ти­че­ско­го при­ме­не­ния под­хо­да: напри­мер, поль­зо­ва­те­лям, в чьих текстах при ска­ни­ро­ва­нии про­грам­ма­ми-крау­ле­ра­ми будут обна­ру­жи­вать­ся лек­се­мы, темы (кла­сте­ры семан­ти­че­ски близ­ких слов), эмо­ци­о­наль­ные валент­но­сти, кото­рые до это­го были свя­за­ны в иссле­до­ва­ни­ях с потен­ци­аль­ным сни­же­ни­ем уров­ня пси­хо­ло­ги­че­ско­го бла­го­по­лу­чия и угро­зой депрес­сии, суи­ци­даль­ны­ми наклон­но­стя­ми и т. п., мож­но авто­ма­ти­че­ски (при дого­во­рен­но­сти с адми­ни­стра­ци­ей соци­аль­ной сети) предъ­яв­лять в лен­те ново­стей рекла­му служб пси­хо­ло­ги­че­ской помо­щи или объ­яв­ле­ния, под­дер­жи­ва­ю­щие их и разъ­яс­ня­ю­щие при­ро­ду их пло­хо­го самочувствия. 

С такой прак­ти­кой столк­ну­лись авто­ры ста­тьи и их кол­ле­ги, когда ана­ли­зи­ро­ва­ли слу­чай­ные изоб­ра­же­ния из сети «Инста­грам», снаб­жен­ные под­пи­ся­ми-хеш­те­га­ми (так назы­ва­ют­ся мет­ки тема­ти­че­ских ассо­ци­а­ций, кото­рые про­из­воль­но ста­вят сами пользователи). 

Ана­ли­зи­ро­ва­лись и коди­ро­ва­лись изоб­ра­же­ния, сопро­вож­дав­ши­е­ся хеш­те­га­ми, опи­сы­ва­ю­щи­ми нега­тив­ные эмо­ции и пере­жи­ва­ния, — #depression, #anxiety, #fear, #stress, #worry (депрес­сия, тре­во­га, страх, стресс, бес­по­кой­ство) — на англий­ском и рус­ском язы­ках соответственно. 

До поло­ви­ны изоб­ра­же­ний, сопро­вож­дав­ших­ся мет­кой “#depression” вме­сто соб­ствен­но изоб­ра­же­ний, фото­гра­фий, содер­жа­ли «моти­ва­то­ры» — кар­тин­ки со сло­ва­ми под­держ­ки, объ­яс­не­ни­ем при­чин и симп­то­мов депрес­сии и номе­ра­ми теле­фо­нов или адре­са­ми сай­тов орга­ни­за­ций, ока­зы­ва­ю­щих пси­хо­ло­ги­че­скую помощь (зача­стую бес­плат­ную). При этом изоб­ра­же­ния, сопро­вож­дав­ши­е­ся ана­ло­гич­ным хеш­те­гом на рус­ском язы­ке, не содер­жа­ли подоб­ных тек­стов, кото­рые мог­ли бы выпол­нять функ­ции пси­хо­ло­ги­че­ской помощи. 

Ана­ли­зи­руя этот факт, мы пред­по­ло­жи­ли, что куль­ту­ра ока­за­ния пси­хо­ло­ги­че­ской помо­щи тем, кто может сооб­щать через свои пуб­ли­ка­ции в соци­аль­ной сети об ухуд­ше­нии пси­хи­че­ско­го здо­ро­вья или искать имен­но в соци­аль­ной сети под­держ­ку, еще недо­ста­точ­но хоро­шо раз­ви­та в рус­ско­языч­ном мире по срав­не­нию с англо­языч­ным [38].

Воз­мож­ность досту­па к запи­сям поль­зо­ва­те­лей за все вре­мя, начи­ная с момен­та реги­стра­ции в соци­аль­ной сети, поз­во­ля­ет иссле­до­ва­те­лям из обла­сти обще­ствен­но­го здо­ро­вья ретро­спек­тив­но про­во­дить лон­ги­тюд­ный ана­лиз и вос­ста­нав­ли­вать осо­бен­но­сти обра­за жиз­ни поль­зо­ва­те­лей, делать уточ­не­ния для поста­нов­ки диа­гно­зов [26].

Гово­ря о при­клад­ном при­ме­не­нии дан­ных из соци­аль­ных сетей, мож­но так­же упо­мя­нуть иссле­до­ва­ние, в кото­ром до 70 % паци­ен­тов, ожи­да­ю­щих меди­цин­ской помо­щи в при­ем­ном покое боль­ни­цы, име­ю­щих акка­унт в соци­аль­ной сети и согла­сив­ших­ся участ­во­вать в уст­ном опро­се, дают раз­ре­ше­ние поль­зо­вать­ся авто­ма­ти­че­ски под­клю­ча­е­мы­ми к их меди­цин­ским кар­там дан­ны­ми из их соци­аль­но-сете­вых акка­ун­тов — для уточ­не­ния диа­гно­за и про­ве­де­ния науч­ных иссле­до­ва­ний [39].

MyPersonality.org” (Кембриджский университет), “World Well-Being Project” (Университет Пенсильвании) и исследования на основе данных пользователей социальных сетей «Фейсбук» и «Твиттер»

Перей­дем к тому, как имен­но иссле­до­ва­те­ли соби­ра­ют одно­вре­мен­но пси­хо­ло­ги­че­ские и язы­ко­вые дан­ные, а так­же дан­ные о пове­де­нии в соци­аль­ной сети, напря­мую обра­ща­ясь к поль­зо­ва­те­лям соци­аль­ных сетей, как ана­ли­зи­ру­ют их и какие резуль­та­ты получают. 

Насколь­ко нам извест­но, сего­дня в мире суще­ству­ет лишь один круп­ный науч­ный про­ект, в кото­ром пси­хо­ло­ги, линг­ви­сты, про­грам­ми­сты и спе­ци­а­ли­сты по обра­бот­ке дан­ных исполь­зу­ют воз­мож­но­сти сбо­ра инфор­ма­ции в соци­аль­ных сетях для оцен­ки пси­хо­ло­ги­че­ско­го бла­го­по­лу­чия и физи­че­ско­го здо­ро­вья с опо­рой на ана­лиз язы­ка соци­аль­ных медиа. Это про­ект Цен­тра пози­тив­ной пси­хо­ло­гии Уни­вер­си­те­та Пен­силь­ва­нии “World Well-Being Project” [40], стар­то­вав­ший в 2011 г. [25].

В нем исполь­зу­ют­ся дан­ные из уни­каль­ной базы поль­зо­ва­те­лей соци­аль­ной сети «Фейс­бук», собран­ные бла­го­да­ря идее и уси­ли­ям науч­ных сотруд­ни­ков в тот момент Кем­бридж­ско­го уни­вер­си­те­та Дэви­да Сти­л­вел­ла и Миха­ла Косин­ски (сей­час Михал Косин­ски рабо­та­ет в Стэн­форд­ском уни­вер­си­те­те). Они созда­ли про­грам­му, кото­рая рабо­та­ла на их сай­те с 2007 по 2012 г. и поз­во­ля­ла раз­лич­ным (англо­языч­ным) людям участ­во­вать в запол­не­нии любо­го коли­че­ства из при­мер­но двух десят­ков рас­про­стра­нен­ных пси­хо­ло­ги­че­ских опрос­ни­ков, воз­вра­щав­ших им обрат­ную связь с резуль­та­та­ми. Кро­ме того, с согла­сия этих поль­зо­ва­те­лей про­грам­ма загру­жа­ла демо­гра­фи­че­скую инфор­ма­цию из их про­фи­ля и пуб­лич­но доступ­ные тек­сты их ста­ту­сов из сети «Фейс­бук», а так­же «лай­ки» страниц. 

У про­ек­та есть сайт на кото­ром неко­то­рые дан­ные доступ­ны для ана­ли­за заре­ги­стри­ро­ван­ным сто­рон­ним иссле­до­ва­те­лям. Более 7,5 млн уни­каль­ных поль­зо­ва­те­лей «Фейс­бук» участ­во­ва­ли в тести­ро­ва­нии на сай­те и оста­ви­ли дан­ные сво­их профилей. 

Сти­л­велл и Косин­ски часто явля­ют­ся соав­то­ра­ми работ упо­мя­ну­той лабо­ра­то­рии Уни­вер­си­те­та Пен­силь­ва­нии, кото­рой руко­во­дит Мар­тин Селиг­ман. Все­го в коман­де про­ек­та “World Well-Being Project” око­ло 20 посто­ян­ных участ­ни­ков и око­ло 15 кол­ла­бо­ра­то­ров со все­го мира. Рабо­та­ют они во мно­гом бла­го­да­ря спон­сор­ской помо­щи фон­да “Templeton Religion Trust” (на зна­чи­мость про­ек­та ука­зы­ва­ет то, что с 2013 г. этот фонд под­дер­жал про­ек­ты Мар­ти­на Селиг­ма­на на сум­му, пре­вы­ша­ю­щую 9 млн дол­ла­ров [41]).

Они рабо­та­ют с дан­ны­ми, соби­ра­е­мы­ми так­же и в соци­аль­ной сети «Твит­тер». Эти дан­ные, в отли­чие от дан­ных, соби­ра­е­мых с помо­щью при­ло­же­ний для сети «Фейс­бук», гораз­до более доступ­ны: руко­вод­ство сети «Твит­тер» откры­то к кол­ла­бо­ра­ци­ям и дает воз­мож­ность ска­чи­вать их через API и даже про­да­ет мас­си­вы дан­ных для иссле­до­ва­ний [42].

Но соци­аль­но-демо­гра­фи­че­ской инфор­ма­ции в про­фи­лях этой сети гораз­до мень­ше, тек­сты суще­ствен­но коро­че, в ней мно­го ботов (искус­ствен­ных акка­ун­тов, кото­рые не ведут люди), и рабо­та с дан­ны­ми «Твит­тер» ско­рее будет пред­став­лять инте­рес для линг­ви­стов и спе­ци­а­ли­стов, отсле­жи­ва­ю­щих кана­лы рас­про­стра­не­ния инфор­ма­ции и свя­зи меж­ду участ­ни­ка­ми сети, — социо­ло­гов, поли­то­ло­гов (иссле­до­вать соци­аль­ные свя­зи поль­зо­ва­те­лей, напри­мер, полу­чив спи­сок их «дру­зей», в насто­я­щее вре­мя затруд­ни­тель­но через API «Фейс­бук»).

Надо отме­тить, что на сай­те пен­силь­ван­ско­го про­ек­та и на лич­ном сай­те Миха­ла Косин­ски выло­же­ны в откры­том досту­пе десят­ки пуб­ли­ка­ций, сде­лан­ных на осно­ве рабо­ты авто­ров с дан­ны­ми из соци­аль­ных сетей.

Основ­ные резуль­та­ты про­ек­та “World Well-Being Project” свя­за­ны с тем, какие язы­ко­вые про­яв­ле­ния (сло­ва, эмо­ци­о­наль­ная валент­ность) свой­ствен­ны людям с раз­лич­ны­ми пси­хо­ло­ги­че­ски­ми чер­та­ми или демо­гра­фи­че­ски­ми харак­те­ри­сти­ка­ми. Нахо­дя спер­ва кор­ре­ля­ции меж­ду пси­хо­ло­ги­че­ски­ми, демо­гра­фи­че­ски­ми и язы­ко­вы­ми дан­ны­ми, а так­же осо­бен­но­стя­ми пове­де­ния в соци­аль­ной сети (фото­гра­фи­я­ми про­фи­ля, сте­пе­нью актив­но­сти и т. д.), иссле­до­ва­те­ли затем стро­ят пред­ска­за­тель­ные модели. 

При­ве­дем несколь­ко при­ме­ров. В одной из пуб­ли­ка­ций опи­сы­ва­ет­ся, как по смыс­ло­вым харак­те­ри­сти­кам пуб­ли­ку­е­мых в сети «Твит­тер» постов и фото­гра­фий про­фи­ля поль­зо­ва­те­ля пред­ска­зать нар­цис­сизм и пси­хо­па­тию: по полу­чен­ным дан­ным, люди с более высо­ким нар­цис­сиз­мом пуб­ли­ку­ют пози­тив­ную инфор­ма­цию, а на фото­гра­фии про­фи­ля будут, ско­рее все­го, они сами, при­чем улы­ба­ясь, в то вре­мя как люди с более высо­ким уров­нем пси­хо­па­тии исполь­зу­ют в текстах широ­кий спектр нега­тив­ных эмо­ций, свя­зан­ных с сооб­ще­ни­я­ми о раз­ных видах наси­лия [43].

На осно­ва­нии ана­ли­за тек­стов ста­ту­сов (так в сети «Фейс­бук» назы­ва­ют сооб­ще­ния, пуб­ли­ку­е­мые поль­зо­ва­те­ля­ми на сво­их «сте­нах» для дру­зей или все­об­ще­го досту­па) иссле­до­ва­те­ли из это­го кол­лек­ти­ва смог­ли, в част­но­сти, опи­сать отли­чия «жен­ско­го» язы­ка от «муж­ско­го» по несколь­ким пара­мет­рам: жен­щи­ны (если судить по полу, при­пи­сан­но­му сами­ми поль­зо­ва­те­ля­ми в акка­ун­тах) чаще пишут о семье, дру­зьях и раз­лич­ных собы­ти­ях соци­аль­ной жиз­ни (ана­ли­зи­ро­ва­лись тема­ти­че­ские кла­сте­ры семан­ти­че­ски свя­зан­ных слов (“topics”), исполь­зу­е­мых в ста­ту­сах), а муж­чи­ны в текстах руга­ют­ся, выра­жа­ют гнев, участ­ву­ют в дис­кус­си­ях о поли­ти­ке, спор­те, музы­ке и видео­иг­рах и реже рас­суж­да­ют о людях [44].

В ста­тье, опи­сы­ва­ю­щей воз­мож­но­сти пред­ска­зы­вать уро­вень бла­го­по­лу­чия (удо­вле­тво­рен­но­сти жиз­нью) с опо­рой на язык соци­аль­ных сетей, ана­ли­зи­ро­ва­лись дан­ные более 2000 чело­век, доб­ро­воль­но участ­во­вав­ших в их сбо­ре через сайт Д. Сти­л­вел­ла и М. Косин­ски, запол­нив­ших опрос­ник удо­вле­тво­рен­но­сти жиз­нью Э. Дине­ра [45] и дав­ших доступ к пара­мет­рам сво­е­го акка­ун­та (в том чис­ле к тек­стам ста­ту­сов в сети «Фейс­бук» [46].

Иссле­до­ва­те­ли, тра­ди­ци­он­но для тако­го рода работ, раз­де­ли­ли выбор­ку, 80 % дан­ных кото­рой участ­во­ва­ли в созда­нии и обу­че­нии несколь­ких ком­пью­тер­но-линг­ви­сти­че­ских моде­лей, пред­ска­зы­вав­ших уро­вень удо­вле­тво­рен­но­сти жиз­нью с опо­рой на тек­сты, а 20 % были тесто­вы­ми, на кото­рых эти моде­ли про­ве­ря­лись («метод кросс-вали­да­ции с пятью разбиениями»). 

Авто­рам уда­лось достичь эффек­тив­но­сти пред­ска­за­ния уров­ня удо­вле­тво­рен­но­сти жиз­нью на отмет­ке 0,566 (в модель вошли н-грам­мы, тема­ти­че­ские кла­сте­ры слов (“topics”) и отдель­ные лек­се­мы). Более все­го кор­ре­ли­ро­ва­ли с резуль­та­та­ми опрос­ни­ка SWLS тема­ти­че­ские кла­сте­ры. Сре­ди наи­бо­лее кор­ре­ли­ру­ю­щих были четы­ре поло­жи­тель­но с ним свя­зан­ных («Эмо­ци­о­наль­ная вовле­чен­ность» — «потря­са­ю­ще», «супер», «зав­тра»; «Соци­аль­но-граж­дан­ская вовле­чен­ность» — «встре­ча», «кон­фе­рен­ция», «пер­со­нал», «посе­щать»; «Про­фес­си­о­наль­ные цен­но­сти» — «управ­ле­ние», «навы­ки», «уче­ба», «биз­нес»; «Теп­лые отно­ше­ния» — «семья», «дру­зья», «бла­го­да­рен», «с любо­вью») и два отри­ца­тель­но свя­зан­ных («Отчуж­де­ние» как анти­под «Вовле­чен­но­сти» — «скуч­но», «ску­ка», «текст» и кла­стер, состо­я­щий из обсцен­ных слов и выра­же­ний — яркий при­мер пре­дик­то­ра низ­ко­го уров­ня удо­вле­тво­рен­но­сти жиз­нью — пре­дик­тор со зна­ком минус)1.

Иссле­до­ва­те­ли сопо­став­ля­ют обоб­щен­ные и осмыс­лен­ные зна­че­ния этих кла­сте­ров с име­ю­щи­ми­ся в пси­хо­ло­ги­че­ской лите­ра­ту­ре кор­ре­ля­та­ми удо­вле­тво­рен­но­сти жиз­нью, тра­ди­ци­он­но опре­де­ля­е­мы­ми через пси­хо­ло­ги­че­ские опрос­ни­ки или наблю­да­е­мое пове­де­ние людей, и при­хо­дят к выво­ду о том, что соче­та­ние линг­ви­сти­че­ских и пси­хо­ло­ги­че­ских дан­ных может стать не толь­ко мате­ри­а­лом для сугу­бо при­клад­ной зада­чи пред­ска­зы­вать одно через дру­гое (тра­ди­ци­он­ной для ком­пью­тер­ной линг­ви­сти­ки), но и для более глу­бо­ко­го тео­ре­ти­че­ско­го осмыс­ле­ния само­го поня­тия «удо­вле­тво­рен­ность жиз­нью», его при­чин, форм про­яв­ле­ния и последствий.

Самая цити­ру­е­мая рабо­та Миха­ла Косин­ски и его соав­то­ров (Дэви­да Сти­л­вел­ла из Кем­бридж­ско­го уни­вер­си­те­та и сотруд­ни­ка ком­па­нии «Май­к­ро­софт» Тора Грей­пе­ла), упо­мя­ну­тая с апре­ля 2013 г. уже в 226 ста­тьях, назы­ва­ет­ся “Private traits and attributes are predictable from digital records of human behavior” («Инди­ви­ду­аль­ные чер­ты и харак­те­ри­сти­ки мож­но пред­ска­зы­вать на осно­ве циф­ро­вых дан­ных о пове­де­нии чело­ве­ка») [47].

В ней был пред­став­лен по-сво­е­му рево­лю­ци­он­ный под­ход к рабо­те с дан­ны­ми о пове­де­нии людей в сети Интер­нет, в част­но­сти в соци­аль­ной сети «Фейс­бук». Жела­ю­щие прой­ти пси­хо­ло­ги­че­ское тести­ро­ва­ние с обрат­ной свя­зью на сай­те про­ек­та “Mypersonality.org” в 40 % слу­ча­ев дава­ли раз­ре­ше­ние иссле­до­ва­те­лям полу­чить ряд харак­те­ри­стик их акка­ун­та в сети «Фейс­бук» (пол и воз­раст, семей­ное поло­же­ние и сек­су­аль­ная ори­ен­та­ция (в про­фи­ле сети «Фейс­бук» мож­но обо­зна­чить, что поль­зо­ва­тель «заин­те­ре­со­ван встре­чать­ся с… (муж­чи­на­ми или жен­щи­на­ми)»), поли­ти­че­ские и рели­ги­оз­ные взгля­ды, спи­сок пуб­лич­ных стра­ниц (сооб­ществ), на кото­рые был под­пи­сан поль­зо­ва­тель (это и были пре­сло­ву­тые “Facebook likes”, исхо­дя из кото­рых мож­но с доста­точ­но высо­кой веро­ят­но­стью пред­ска­зы­вать скры­тые пси­хо­ло­ги­че­ские и демо­гра­фи­че­ские харак­те­ри­сти­ки поль­зо­ва­те­лей), а так­же на тот момент было воз­мож­но полу­чить спи­сок дру­зей). Кро­ме того, несколь­ко вопро­сов зада­ва­лось им допол­ни­тель­но (о куре­нии, упо­треб­ле­нии алко­го­ля и нар­ко­ти­ков и о том, раз­ве­лись ли их роди­те­ли до дости­же­ния ими 21 года).

Из 25 доступ­ных пси­хо­ло­ги­че­ских опрос­ни­ков для рас­смат­ри­ва­е­мой ста­тьи были взя­ты резуль­та­ты трех — одной из вер­сий «Боль­шой пятер­ки лич­ност­ных свойств», теста Дж. Раве­на и опрос­ни­ка удо­вле­тво­рен­но­сти жиз­нью Э. Дине­ра SWLS. Дан­ные раз­но­го коли­че­ства респон­ден­тов, от 766 (вопрос о раз­во­де роди­те­лей) до 54 373 (оцен­ки по тесту «Боль­шой пятер­ки»), попа­ли в выбор­ку. 17 601 респон­дент дал доступ к про­фи­лю в сети «Фейс­бук».

По несколь­ким тыся­чам слу­чай­но выбран­ных фото­гра­фий из про­фи­лей, про­смот­рен­ных «вруч­ную», делал­ся вывод об этни­че­ской при­над­леж­но­сти респон­ден­та (евро­пей­ской или афри­кан­ской). Сред­нее коли­че­ство «лай­ков» в выбор­ке рав­ня­лось 170 (еще раз под­черк­нем, что этот пара­метр отра­жа­ет устой­чи­вые инте­ре­сы поль­зо­ва­те­лей, от этих пуб­лич­ных стра­ниц (сооб­ществ) они регу­ляр­но полу­ча­ют ново­сти, и это не разо­вое выра­же­ние сим­па­тии к новой фото­гра­фии дру­га или обнов­ле­нию его статуса).

Далее все мно­же­ство поль­зо­ва­те­лей и все воз­мож­ные пуб­лич­ные стра­ни­цы («лай­ки») были поме­ще­ны в мат­ри­цу, раз­мер­ность кото­рой была мно­го­крат­но умень­ше­на при помо­щи про­це­ду­ры син­гу­ляр­но­го раз­ло­же­ния (“singular-value decomposition, SVD”): мож­но ска­зать, что почти 56 000 раз­ных пуб­лич­ных стра­ниц, на кото­рые были под­пи­са­ны 17 600 респон­ден­тов, были све­де­ны к 100 «ком­по­нен­там» — стра­ни­цам («лайк­ну­тым» стра­ни­цам), наи­бо­лее часто встре­ча­ю­щим­ся в выбор­ке и наи­бо­лее точ­но в ито­ге пред­ска­зы­ва­ю­щим важ­ные пси­хо­ло­ги­че­ские и демо­гра­фи­че­ские пара­мет­ры. Затем для пред­ска­за­ния коли­че­ствен­ных пере­мен­ных (таких, как интел­лект или удо­вле­тво­рен­ность жиз­нью) исполь­зо­ва­лась линей­ная регрес­си­он­ная модель, а для бинар­ных (пол, сек­су­аль­ная ори­ен­та­ция) — логи­сти­че­ская регрессия. 

Моде­ли были обу­че­ны доста­точ­но типич­ным в машин­ном обу­че­нии мето­дом кросс-вали­да­ции с деся­тью раз­би­е­ни­я­ми (10-fold cross-validation). Он поз­во­ля­ет оце­нить пове­де­ние ана­ли­ти­че­ской моде­ли на неза­ви­си­мых дан­ных. Пред­ска­зан­ные вели­чи­ны пара­мет­ров затем сопо­став­ля­лись с реальными.

Точ­ность пред­ска­за­ния бинар­ных пере­мен­ных с опо­рой на «лай­ки» стра­ниц была порою очень высо­кой. Так, веро­ят­ность точ­но­го опре­де­ле­ния расы — 0,95, пола — 0,93, поли­ти­че­ских пред­по­чте­ний (демо­кра­ти­че­ских или рес­пуб­ли­кан­ских) — 0,85, веро­ис­по­ве­да­ния (хри­сти­ан­ство или ислам) — 0,82. Гомо­сек­су­аль­ность муж­чин — 0,88, жен­щин — 0,75. От 0,65 до 0,7 — веро­ят­ность точ­но­го опре­де­ле­ния семей­но­го ста­ту­са, при­стра­стий к куре­нию, алко­го­лю, нар­ко­ти­кам. Раз­вод роди­те­лей до дости­же­ния совер­шен­но­ле­тия опре­де­лял­ся хуже все­го — с веро­ят­но­стью 0,6, но здесь было мень­ше все­го респон­ден­тов и их данных.

Точ­ность пред­ска­за­ния коли­че­ствен­ных пара­мет­ров (выра­жен­ная как коэф­фи­ци­ент кор­ре­ля­ции меж­ду пред­ска­зан­ным и реаль­ным пара­мет­ра­ми) была в целом ниже, чем бинар­ных. Воз­раст был пред­ска­зан точ­нее все­го — с веро­ят­но­стью 0,75. При­бли­зи­тель­но меж­ду 0,4 и 0,5 полу­чи­лись веро­ят­но­сти пред­ска­за­ния интел­лек­та, экс­тра­вер­сии, откры­то­сти ново­му опы­ту, коли­че­ства дру­зей. С коэф­фи­ци­ен­та­ми от 0,2 до 0,3 кор­ре­ли­ро­ва­ли реаль­ные и пред­ска­зан­ные эмо­ци­о­наль­ная ста­биль­ность, доб­ро­же­ла­тель­ность и созна­тель­ность. А пред­ска­зать уро­вень удо­вле­тво­рен­но­сти жиз­нью по шка­ле Э. Дине­ра при помо­щи моде­лей, постро­ен­ных на дан­ных о под­пис­ках на стра­ни­цы сооб­ществ, мож­но ска­зать, не уда­лось: точ­ность пред­ска­за­ния удо­вле­тво­рен­но­сти жиз­нью соста­ви­ла 0,17.

Иссле­до­ва­те­ли рас­суж­да­ют, что при­чи­ной может быть тот факт, что «лай­ки» стра­ниц отра­жа­ют слиш­ком устой­чи­вые инте­ре­сы, а в шка­лу удо­вле­тво­рен­но­сти жиз­нью зало­же­ны в том чис­ле вопро­сы о доста­точ­но неста­биль­ных сме­нах настро­е­ния. Ниже пред­став­лен спи­сок пуб­лич­ных стра­ниц, под­пис­ки на кото­рые тес­нее все­го свя­за­ны с тем или иным полю­сом бинар­ных шкал, а так­же с высо­ки­ми и низ­ки­ми зна­че­ни­я­ми по коли­че­ствен­ным шка­лам. Посколь­ку все участ­ни­ки иссле­до­ва­ния — жите­ли США, этот спи­сок куль­тур­но спе­ци­фи­чен. При­ве­дем несколь­ко при­ме­ров (табл. 2).

Таблица 2. Примеры некоторых публичных страниц, наиболее точно предсказывающих психологические, демографические и поведенческие характеристики пользователей сети «Фейсбук» (данные статьи М. Косински и соавторов) [47]

Таблица 2. Примеры некоторых публичных страниц, наиболее точно предсказывающих психологические, демографические и поведенческие характеристики пользователей сети «Фейсбук»

Корот­ко про­ком­мен­ти­ру­ем резуль­та­ты двух послед­них иссле­до­ва­ний. Мы видим, что такие пока­за­те­ли, как кла­сте­ры слов и «лай­ки» пуб­лич­ных стра­ниц, полу­чен­ные сила­ми спе­ци­а­ли­стов по ком­пью­тер­ной линг­ви­сти­ке и ана­ли­зу дан­ных, могут дать пси­хо­ло­гам нема­ло новых идей о том, как в реаль­ной жиз­ни, в соб­ствен­ной речи или через приз­му ста­биль­но­го инте­ре­са к соци­аль­но-сете­вым сооб­ще­ствам люди пере­жи­ва­ют, осмыс­ля­ют и «озву­чи­ва­ют» соб­ствен­ные пси­хо­ло­ги­че­ские чер­ты. Таки­ми при­ме­ра­ми мож­но по-ново­му напол­нить содер­жа­ние поня­тий, при­выч­ных для пси­хо­ло­гов и неред­ко опи­сы­ва­е­мых в доста­точ­но абстракт­ных категориях.

Так­же мож­но отме­тить, что для пред­ска­за­ния уров­ня удо­вле­тво­рен­но­сти жиз­нью, по дан­ным этих двух иссле­до­ва­ний, более эффек­тив­ны­ми пре­дик­то­ра­ми явля­ют­ся тек­сты поль­зо­ва­те­лей, а не их под­пис­ки на пуб­лич­ные страницы. 

Мож­но пред­по­ло­жить, что удо­вле­тво­рен­ность жиз­нью — доста­точ­но интим­но пере­жи­ва­е­мая сущ­ность, тес­но свя­зан­ная с «я», поэто­му пря­мая речь субъ­ек­та может быть более точ­ным пре­дик­то­ром, чем выра­жа­ю­щие ско­рее соци­аль­но обу­слов­лен­ные инте­ре­сы лич­но­сти под­пис­ки на пуб­лич­ные стра­ни­цы в соци­аль­ной сети.

Заключение

Рас­про­стра­не­ние соци­аль­ных сетей в мире нарас­та­ет, а это зна­чит, что все боль­шее коли­че­ство людей будет доступ­но для уча­стия в иссле­до­ва­ни­ях через соци­аль­ные сети. Мы обо­зна­чи­ли изме­не­ния в соци­аль­но-ком­му­ни­ка­тив­ных прак­ти­ках и обра­зе жиз­ни боль­шой части совре­мен­ных людей, появив­ши­е­ся в свя­зи с рас­про­стра­не­ни­ем соци­аль­ных сетей. 

Так­же мы затро­ну­ли вопро­сы пер­спек­тив и огра­ни­че­ний суще­ству­ю­щих мето­до­ло­ги­че­ских и мето­ди­че­ских под­хо­дов к иссле­до­ва­ни­ям «циф­ро­вых сле­дов», кото­рые остав­ля­ют поль­зо­ва­те­ли соци­аль­ных сетей. Прак­ти­че­ски все иссле­до­ва­ния тако­го рода свя­за­ны с исполь­зо­ва­ни­ем воз­мож­но­стей сетей «Фейс­бук» и «Твит­тер». При этом в Рос­сии, судя по резуль­та­там поис­ка в науч­ной базе РИНЦ, прак­ти­че­ски не про­во­дят­ся тако­го рода пси­хо­ло­ги­че­ские иссле­до­ва­ния с исполь­зо­ва­ни­ем API соци­аль­ных сетей и воз­мож­но­стя­ми боль­ших выборок.

Тех­но­ло­гии машин­но­го обу­че­ния, стре­ми­тель­но раз­ви­ва­ю­щи­е­ся послед­ние 2–4 года, дают новые и очень мас­штаб­ные воз­мож­но­сти. Напри­мер, они поз­во­ля­ют пред­ска­зы­вать (с опре­де­лен­ной веро­ят­но­стью) на осно­ве полу­ча­е­мых мас­си­вов пове­ден­че­ских дан­ных нали­чие опре­де­лен­ных черт лич­но­сти исхо­дя из тек­стов поль­зо­ва­те­лей и их под­пи­сок на пуб­лич­ные страницы. 

Это новый для пси­хо­ло­гии под­ход, и он дает воз­мож­но­сти как для при­клад­но­го при­ме­не­ния таких моде­лей, так и для фун­да­мен­таль­ных тео­ре­ти­че­ских инсай­тов отно­си­тель­но нали­чия устой­чи­вых свя­зей меж­ду скры­ты­ми пси­хо­ло­ги­че­ски­ми чер­та­ми и внешне наблю­да­е­мы­ми про­дук­та­ми дея­тель­но­сти в пуб­лич­ном соци­аль­но-сете­вом пространстве.

Исполь­зо­ва­ние раз­лич­ных аспек­тов язы­ко­вых (линг­ви­сти­че­ских) кор­ре­ля­тов пси­хо­ло­ги­че­ских осо­бен­но­стей людей (от часто­ты напи­са­ния постов и богат­ства сло­ва­ря до спе­ци­фи­че­ских лек­сем, эмо­ци­о­наль­ной валент­но­сти и тема­ти­че­ских кла­сте­ров слов) откры­ва­ет инте­рес­ные пер­спек­ти­вы для при­клад­ных и фун­да­мен­таль­ных меж­дис­ци­пли­нар­ных работ, в кото­рых пси­хо­ло­ги могут ста­вить зада­чи, а ком­пью­тер­ные линг­ви­сты и спе­ци­а­ли­сты по рабо­те с дан­ны­ми и машин­но­му обу­че­нию — зани­мать­ся раз­ра­бот­кой алго­рит­мов и мет­рик для их решения.

Мы хотим еще раз под­черк­нуть важ­ность меж­дис­ци­пли­нар­но­го сотруд­ни­че­ства в рам­ках тако­го рода иссле­до­ва­ний: в науч­ных про­ек­тах, соби­ра­ю­щих и ана­ли­зи­ру­ю­щих инди­ви­ду­аль­ные дан­ные поль­зо­ва­те­лей соци­аль­ных сетей, необ­хо­ди­мы web-про­грам­ми­сты для рабо­ты над при­ло­же­ни­ем, линг­ви­сты для мно­го­сту­пен­ча­той и раз­но­на­прав­лен­ной обра­бот­ки тек­сто­вых дан­ных, data-ана­ли­ти­ки и спе­ци­а­ли­сты по машин­но­му обучению. 

Без­услов­но, важ­на роль пси­хо­ло­гов. Имен­но они ста­вят зада­чи и ори­ен­ти­ру­ют­ся на свои зна­ния о пове­де­нии чело­ве­ка. Но меж­дис­ци­пли­нар­ное сотруд­ни­че­ство озна­ча­ет, что пси­хо­ло­гам необ­хо­ди­мо раз­ви­вать (хотя бы на началь­ном уровне) ком­пе­тен­ции в обла­сти линг­ви­сти­ки и ком­пью­тер­ной линг­ви­сти­ки, под­хо­дов к рабо­те с боль­ши­ми мас­си­ва­ми дан­ных, основ и логи­ки машин­но­го обу­че­ния. Тогда рабо­та таких команд обе­ща­ет чрез­вы­чай­но про­дук­тив­ное сотрудничество.

Литература

  1. Miniwatts Marketing Group. World Internet usage and population statistics: June, 30 2017 // Internet World Stats. 2017. 
  2. Mander J., McGrath F. GWI Social Summary Q1 2017 // GlobalWebIndex. 2017. 
  3. Facebook Inc. Company Info // Facebook Newsroom. 
  4. Statista Inc. Facebook users worldwide 2008–2017. 2017. 
  5. ВКон­так­те. О компании.
  6. Интер­факс-Укра­и­на. «Одно­класс­ни­ки» в 2016 году уве­ли­чи­ли коли­че­ство поль­зо­ва­те­лей на 10 %. 2017. 
  7. DMR. 5 amazing Qzone stats and facts (February 2017). 
  8. DRM. 61 amazing Weibo statistics and facts (March 2017). 
  9. Statista Inc. Instagram: number of monthly active users 2013–2017. 2017. 
  10. Statista Inc. Twitter: number of monthly active users 2010–2017. 2017. 
  11. Mander J. Daily time spent on social networks rises to over 2 hours // GlobalWebIndex. 2017. 
  12. Иссле­до­ва­тель­ский хол­динг Ромир. Соци­аль­но-сете­вая жизнь. 2015. 
  13. Bogolyubova O., Tikhonov R., Ivanov V., Panicheva P., Ledovaya Y. Violence exposure, posttraumatic stress, and subjective well-being in a sample of Russian adults // Journal of Interpersonal Violence. 2017. 
  14. Panicheva P., Ledovaya Y., Bogolyubova O. Lexical, Morphological and semantic correlates of the Dark Triad personality traits in Russian Facebook texts // Conference Paper. AINL FRUCT 2016. SaintPetersburg, Russia. 2016. 
  15. Gosling S. D., Mason W. Internet Research in Psychology // Annual Review of Psychology. 2015. Vol. 66. P. 877–902.
  16. Dunbar R. I. M., Arnaboldi V., Conti M., Passarella A. The structure of online social networks mirrors those in the offline world // Social Networks. 2015. Vol. 43. P. 39–47.
  17. Tifentale A., Manovich L. Selfiecity: Exploring Photography and Self-Fashioning in Social Media // Postdigital Aesthetics. London: Palgrave Macmillan UK, 2015. P. 109–122.
  18. Gonzales A. L., Hancock J. T. Mirror, Mirror on my facebook wall: effects of exposure to Facebook on self-esteem // Cyberpsychol Behav Soc Netw. 2011. Vol. 14, N 1–2. P. 79–83.
  19. Kim J., Lee J.-E. R. The Facebook Paths to Happiness: Effects of the Number of Facebook Friends and Self-Presentation on Subjective Well-Being // Cyberpsychol Behav Soc Netw. 2011. Vol. 14, N 6. P. 359–364.
  20. Kross E. et al. Facebook Use Predicts Declines in Subjective Well-Being in Young Adults // PLoS One. 2013. Vol. 8, N 8. P. e69841.
  21. Ryan T., Chester A, Reece J., Xenos S. The uses and abuses of Facebook: A review of Facebook addiction // Journal of Behavioral Addictions. 2014. Vol. 3, N 3. P. 133–148.
  22. Butakov N., Petrov M., Radice A. Multitenant Approach to Crawling of Online Social Networks // Procedia Computer Science. 2016. Vol. 101. P. 115–124.
  23. Ледо­вая Я. А., Тихо­нов Р. В., Бого­лю­бо­ва О. Н., Казен­ная Е. В., Соро­ки­на Ю. Л. Отчуж­де­ние мораль­ной ответ­ствен­но­сти: пси­хо­ло­ги­че­ский кон­структ и мето­ды его изме­ре­ния // Вест­ник С.-Петерб. ун-та. Серия 16. Пси­хо­ло­гия и педа­го­ги­ка. 2016. Т. 16, № 4. С. 23–39.
  24. Kosinski M. et al. Facebook as a research tool for the social sciences: opportunities, challenges, ethical considerations, and practical guidelines // Am Psychology. 2015. Vol. 70, N 6. P. 543–556.
  25. Kern M. L. et al. Gaining insights from social media language: Methodologies and challenges // Psychology Methods. 2016. Vol. 21, N 4. P. 507–525.
  26. Inkster B., Stillwell D., Kosinski M., Jones P. A decade into Facebook: where is psychiatry in the digital age? // The Lancet Psychiatry. 2016. Vol. 3, N 11. P. 1087–1090.
  27. Azar B. Are your findings “WEIRD”? // Monitor on Psychology. 2010. Vol. 41, N 5. P. 11.
  28. Gosling S. D., Sandy C. J., John O. P., Potter J. Wired but not WEIRD: The promise of the Internet in reaching more diverse samples // Behavioral and Brain Sciences. 2010. Vol. 33, N 2–3. P. 94–95.
  29. Batterham P. J. Recruitment of mental health survey participants using Internet advertising: content, characteristics and cost effectiveness // International journal of methods in psychiatric research. 2014. Vol. 23, N 2. P. 184–191.
  30. Richiardi L., Pivetta E., Merletti F. Recruiting Study Participants Through Facebook // Epidemiology. 2012. Vol. 23, N 1. P. 175.
  31. Schwartz H. A., Ungar L. H. Data-Driven Content Analysis of Social Media // The ANNALS of the American Academy of Political and Social Science. 2015. Vol. 659, N 1. P. 78–94.
  32. Panicheva P., Mirzagitova A., Ledovaya Y. Semantic Feature Aggregation for Gender Identification in Russian Facebook // Proceedings of the AINL. 2017. (In press).
  33. Moskvichev A., Menshov S., Dubova M., Filchenkov A. Using Linguistic Activity In Social Networks To Predict and Interpret Dark Psychological Traits // Proceedings of the AINL. 2017. (In press)
  34. Casler K., Bickel L., Hackett E. Separate but equal? A comparison of participants and data gathered via Amazon’s MTurk, social media, and face-to-face behavioral testing // Computers in Human Behavior. 2013. Vol. 29, N 6. P. 2156–2160.
  35. Ramsey S. R., Thompson K. L., McKenzie M., Rosenbaum A. Psychological research in the internet age: The quality of web-based data // Computers in Human Behavior. 2016. Vol. 58. P. 354–360.
  36. Одай­ник А. С., Чет­ве­ри­ков А. А. Про­ве­де­ние экс­пе­ри­мен­таль­ных пси­хо­ло­ги­че­ских иссле­до­ва­ний в сети Интер­нет // Пси­хо­ло­гия XXI века: Мат-лы Меж­ду­нар. науч.-практ. конф. моло­дых уче­ных «Пси­хо­ло­гия XXI века». 21–23 апре­ля 2011 г., Санкт-Петер­бург / под ред. О. Ю. Щел­ко­вой. СПб.: Изд-во СПб­ГУ, 2011. С. 85–87.
  37. British Psychological Society. Ethics Guidelines for Internet-mediated Research. 2017. 
  38. Бого­лю­бо­ва О. Н., Ледо­вая. Я. А., Чури­ло­ва А. Г. Репре­зен­та­ции пси­хо­ло­ги­че­ско­го дис­трес­са в сети «Инста­грам» // Ана­ньев­ские чте­ния — 2016. Пси­хо­ло­гия: вче­ра, сего­дня, зав­тра: Мат-лы меж­ду­нар. науч. конф. 25–29 октяб­ря 2016 г.: В 2 т. / под ред. А. В. Шабо­ла­са и др. СПб.: Айсинг, 2016. Т. 2. C. 125–126.
  39. Padrez K. A. et al. Linking social media and medical record data: a study of adults presenting to an academic, urban emergency department // BMJ quality & safety. 2016. Vol. 25, N 6. P. 414–423.
  40. Penn Positive Psychology Center. World well-being project. 
  41. John Templeton Foundation. Grant Database. 2017. 
  42. Gnip Inc. Enterprise access to Twitter data.
  43. Preotiuc-Pietro D., Carpenter J., Giorgi S., Ungar L. Studying the Dark Triad of personality through Twitter behavior // Proceedings of the 25th ACM International on Conference on Information and Knowledge Management — CIKM ’16. New York. New York: ACM Press, 2016. P. 761–770.
  44. Park G. et al. Women are Warmer but No Less Assertive than Men: Gender and Language on Facebook // PLOS ONE. 2016. Vol. 11, N 5. P. e0155885.
  45. Diener E., Emmons R. A., Larsen R. J., Griffin S. The Satisfaction With Life Scale // Journal of Personality Assessment. 1985. Vol. 49, N 1. P. 71–75.
  46. Schwartz H. A. et al. Predicting individual well-being through the language of social media // Biocomputing 2016: Proceedings of the Pacific Symposium. 2016. P. 516–527.
  47. Kosinski M., Stillwell D., Graepel T. Private traits and attributes are predictable from digital records of human behavior // Proceedings of the National Academy of Sciences (PNAS). 2013. Vol. 110, N 15. P. 5802– 5805.

Рабо­та выпол­не­на при под­держ­ке гран­та Санкт-Петер­бург­ско­го госу­дар­ствен­но­го уни­вер­си­те­та, про­ект 8.38.351.2015 «Стресс, здо­ро­вье и пси­хо­ло­ги­че­ское бла­го­по­лу­чие в соци­аль­ных сетях: крос­скуль­тур­ное исследование».

Источ­ник: Вест­ник СПб­ГУ. Серия 16: Пси­хо­ло­гия. Педа­го­ги­ка. 2017. №3.

Об авторах

  • Яни­на Алек­сан­дров­на Ледо­вая — Санкт-Петер­бург­ский госу­дар­ствен­ный уни­вер­си­тет, Рос­сий­ская Феде­ра­ция, Санкт-Петербург.
  • Роман Вади­мо­вич Тихо­нов — аспи­рант, Санкт-Петер­бург­ский госу­дар­ствен­ный уни­вер­си­тет, Рос­сий­ская Феде­ра­ция, 199034, Санкт-Петербург.
  • Оль­га Нико­ла­ев­на Бого­лю­бо­ва — кан­ди­дат пси­хо­ло­ги­че­ских наук, Уни­вер­си­тет Кларк­сон, США, штат Нью-Йорк, Потсдам.

Смот­ри­те также:

ПРИМЕЧАНИЕ

  1. При­ме­ры слов и назва­ния кла­сте­ров даны здесь в пере­во­де авто­ров статьи.

Категории

Метки

Публикации

ОБЩЕНИЕ

CYBERPSY — первое место, куда вы отправляетесь за информацией о киберпсихологии. Подписывайтесь и читайте нас в социальных сетях.

vkpinterest