Настоящая работа представляет собой Магистерскую диссертацию по направлению «Фундаментальная и прикладная лингвистика» кафедры теоретической и прикладной лингвистики (ТиПЛ) Института лингвистики РГГУ. Публикуется с сокращениями.
С полным текстом диссертации можно ознакомиться по ссылке (в формате PDF).
Особенности коммуникации в сети интернет
Внедрение интернет-коммуникации в нашу повседневную жизнь значительно изменило то, как люди общаются между собой.
Прежде всего, массовое внедрение интернета повлияло на количество текстов. На рисунке No1 отображен рост общего количество сайтов в интернете с августа 1995 по декабрь 2009 по данным Netcraft1. По данным за май 2016 общее количество сайтов уже достигло более одного миллиарда – а именно 1 033 790 346. Отражение этой же тенденции мы видим и в корпусной лингвистике – если за период с 1950 по 2000 год в НКРЯ содержится 14 486 текст, то только за следующее десятилетие эта цифра уже достигает 31 491 текста2.
Жанры, ранее возможные только в устной речи (например, бытовая беседа), теперь были адаптированы в письменной форме в интернет-коммуникации. Если раньше, как правило, все опубликованные тексты проходили проверку (все выпущенные книги корректировались редакторами), то в эпоху интернета любой человек может опубликовать текст без какой-либо правки.
Еще одно следствие: границы общения были многократно раздвинуты - с помощью цифровых технологий все люди с доступом к сети интернет могут одновременно общаться на любые темы. Соответственно, стираются социальные и демографические границы - люди разных возрастов, профессий, живущие в разных странах могут легко и свободно коммуницировать между собой.
Кроме того, интернет предоставляет неограниченные возможности для креативности - реализации своих идей в практически любой форме. Интернет — это не статичная среда (как например лист бумаги), которую пользователь с необходимыми техническими навыками может менять для своих нужд. Тексты интернета графически ярче оформлены, они чаще сопровождаются иллюстрациями, различными специальными эффектами и выделениями. Само использование языка также более креативно — как и в устной речи, говорящие не обязаны ограничивать себя нормой.
Проблемой выделения жанров в интернет-коммуникации занимается новое направление лингвистики — виртуальное жанроведение3. Учитывая сложности, с которым сталкивается традиционное жанроведение, при выделении жанров в интернет-коммуникации добавляются новые проблемы, такие как динамичность и изменчивость данной среды, отсутствие единой точки зрения лингвистов на классификацию виртуальных жанров, более сложную, многоаспектную и многоуровневую структуру жанров в интернете4.
Тем не менее, существует несколько подходов к выделению виртуальных жанров. Л.Ю. Щипинина предлагает классифицировать жанры в зависимости от коммуникативных функций интернет-сообщений и предлагает следующие группы:
- информативные жанры, используемые для предъявления или получения информации (институциональные веб-страницы, веб-страницы новостных агентств и сетевых СМИ, поисковые системы, онлайн-энциклопедии, каталоги, списки рассылки, электронные библиотеки и архивы);
- директивные жанры, которые призваны побудить адресата осуществить какое- либо действие (веб-реклама, коммерческие и частные объявления, интернет- магазины и аукционы);
- коммуникативные жанры, удовлетворяющие потребности в общении и соблюдения этикетных норм (чат, электронные письма, новостные группы, форумы);
- презентационные жанры, служащие для самовыражения и представления данных о себе или своих произведений (личные веб-страницы, веблоги);
- эстетические жанры, основная цель которых реализация художественно- творческого потенциала и эстетическое воздействие на партнеров с помощью создания мнимой реальности (сетевой роман, фанфикшн);
- развлекательные жанры, основной целью которых - это получение удовольствия от выполнения определенных коммуникативных действий (многопользовательские миры и игры)
Горшко и Жигалина выделяют помимо этого разные уровни виртуальных жанров: гипержанр - высший уровень, который объединяет всё то жанровое макрообразование, которое сопровождает социально-коммуникативные ситуации и объединяет в своем составе несколько жанров (например, социальная сеть, внутри которой функционируют как личные страницы пользователей, так и чаты, электронные библиотеки и хранилища медиафайлов), и более базовые интернет- жанры (электронное письмо, чат, форум и так далее)5.
Интернет можно рассматривать как информационную среду (место сбора и хранения информации — текстов, изображений, мультимедийных файлов), и коммуникационную среду (место общения множества пользователей).
Интернет-коммуникация или, используя более верный, но менее удобный термин, коммуникация осуществляемая посредством цифровых технологий (digital mediated communication)6 — это новая модальность, форма коммуникации, наряду с ранее существующими устной, письменной и визуальной. Ее использование накладывает существенный отпечаток на порождаемую речь.
В чем заключаются принципиальные отличия интернет-коммуникации от письменной и устной речи? По мнению Д. Кристалл7, интернет-коммуникация — это комбинация черт этих двух модусов: с одной стороны, в сети содержится множество текстов, написанных по всем канонам письменной речи (статьи, научные публикации, книги, деловая переписка и т.д.), с другой, существует множество максимально близких к устной речи (обмен мгновенными сообщениями, чаты, форумы, комментарии и т.д.). При этом интернет-коммуникация обладает рядом свойств, которые выделяют ее среди прочих.
Отличия от устной речи:
- Отсутствие мгновенной реакции собеседника (реакции, которая происходит в момент произнесения высказывания, а не после).
- Использование графических средств, заменяющих паралингвистические каналы коммуникации (смайлики, знаки пунктуации, повторы букв и знаков пунктуации, выделение шрифта и так далее)
- Возможность участвовать в нескольких беседах одновременно Отличия от письменной речи:
- Гипертекстуальность:8 по мнению Теда Нельсона, исследователя, который ввел термин «гипертекст», главной особенностью гипертекста является то, что он создает систему связи между отдельными документами с помощью встроенных в текст гиперссылок.
- Изменчивость: текст, опубликованный в сети Интернет может быть удален, отредактирован и так далее, в то время как традиционный письменный текст статичен в своей форме
- Групповое порождение текстов: тексты могут порождаться и редактироваться группой авторов
Все эти черты влияют тем или иным образом на язык, используемый интернет- сообществом. Постепенно формируется и его особенные свойства, вызванные применением нового модуса. Г.Н. Трофимова9 выделяет несколько системно- функциональных особенностей русского языка, наблюдаемых в интернет-среде, на разных уровнях языка:
1) Латинизация. Пользователи интернета склонны использовать латиницу. Прежде всего, это касается заимствованных из английского терминов, часто относящихся к сфере технологий (Internet, MP3 и так далее), сетевой жаргон, появившийся в англоговорящих странах (IMHO, WTF, LOL), название международных компаний и брендов (Google, Microsoft, Nike). Однако русский язык активно адаптирует заимствованную лексику, предлагая варианты написания на кириллице, и, более того, снабжает ее необходимой морфологической парадигмой.
2) Имитация устной речи. “В письменной форме при невозможности применить все особенности живой устной разговорной речи появляются новые варианты на разных уровнях языковой системы: фразы строятся нарочито беспорядочно; знаки препинания пропускаются (в том числе в сильной позиции конца фразы); прописные буквы заменяются на строчные (в том числе в сильной позиции начала имени собственного); некоторые слова орфографически приближаются к транскрипции: «птушта», «пчу», «канешна», «ваще», «лана»”10.
3) Морфологическая адаптация заимствованных слов. Как упоминалось выше, русскому языку интернета характерны многочисленные заимствования прежде всего из английского языка. В случае, когда такие слова пишутся кириллицей, они часто получают всю необходимую словоизменительную парадигму - склонение по падежам и числам (юзер – юзерами, сайт – сайтами, и так далее).
4) Словообразовательные процессы. Часто слова, пришедшие из английского языка, становятся центрами словообразовательных гнезд, образуя на базе заимствованного существительного и другие части речи (апгрейд -> апгрейлить -> проапргрейдить -> проапргрейденный). Помимо этого активно используются такие механизмы словообразования как усечение (прога, софт), сложение русского и заимствованного слова (интернет-цензура, чат-версия), аббревиация (сетература, пдфка = пэдээфка).
5) Частое использование форм императива («Жми сюда», «зайди на сайт»).
6) На лексическом уровне русский язык, использующийся в сети интернет, характеризуется наличием компьютерно-сетевых жаргонизмов. Такие жаргонизмы могут как касаться использования интернета в целом и быть очень широкими в своем употреблении (сайт, логин), так и использоваться узкими группами, например, на тематических сайтах.
7) Сегментирование синтаксических конструкций. По сравнению с письменным языком в интернет-коммуникации на смену сложному синтаксически связанному предложению приходят более короткие, простые фразы, без явной синтаксической связи.
8) Частое использование опущений в “разговорных” жанрах, экономия и компрессия речевых средств. При этом содержательная сторона диалога может сокращаться до минимума - обмена прагматическими интенциями или даже обменом междометиями или смайликами.
9) На уровне коммуникативного членения в веб-текстах наблюдаются две тенденции: “эффект снежного кома” - тема, в силу накопления большого объема детальной информации, расщепляется на подтемы, и обсуждение подтем может утрачивать связь с первоначальной темой или другими подтемами. Второй эффект — сужение тематического фокуса при обсуждении какой-нибудь широкой темы, когда брошенная кем-либо реплика переводит внимание всех участников дискуссии на обсуждение какой-то частности.
Однако стоит учесть, что язык интернет-коммуникации — это очень подвижная и переменчивая субстанция, и любая попытка фиксировать те или иные его особенности обречена на неудачу, так как изменения происходят быстрее, чем их можно отследить. В частности, на развитие интернет-коммуникации влияет внедрение новых технологий, которые радикальным образом могут изменить привычки интернет-пользователей и создать новые тренды.
Важнейшей вехой, определившей развитие интернет-коммуникации в последнем десятилетии, стала мобильная революция. Начиная с 2007 года, когда компания Apple анонсировала запуск своего первого смартфона iPhone, все мировые производители мобильных телефонов включились в борьбу за лидерство на этом новом рынке. Одновременно с этим начал свое активное проникновение и мобильный интернет. Если в 2007 году количество пользователей мобильным интернетом в России составляло лишь 3,6%, то в 2011 эта цифра выросла до 18%11.
Согласно последним исследованиям компании “Яндекс”12 за период с осени 2015 по весну следующего года 84% всех пользователей интернет осуществляли выход в сеть и через компьютер, и через мобильные устройства. При этом 19% всех интернет пользователей уже отказались от выхода в интернет со стационарного компьютера. За четвертый квартал 2015 года доля интернет-траффика с мобильных устройств (смартфонов и планшетов) составила порядка 30%. При этом смартфоны и мобильные тарифы становятся все более доступными в цене, улучшается качество и скорость мобильного интернета. Что означают эти изменения для интернет-коммуникации?
Как говорилось выше, интернет-коммуникации — это смешение устной и письменной речи. При этом жанры интернет-коммуникации можно расположить на некой шкале: от более “письменных” (научная статья, новость, художественный текст) к более “устным” (разговор в чате, публикации в блогах и на форумах).
С внедрением нового устройства для выхода в интернет — смартфона можно заметить тенденцию к поляризации жанров в зависимости от использованных при порождении текстов устройств: все письменные жанры тяготеют к стационарному компьютеру, а устные - к мобильным устройствам. Это легко объясняется: стационарный компьютер гораздо более удобен для написания длинных сложных текстов, требующих коррекции. Этот инструмент незаменим для работы и учебы – сфер, требующих более формального языка.
В то же время смартфон всегда находится в непосредственной близости от хозяина, им гораздо удобнее пользоваться для бытового общения, просмотра и публикаций в социальных сетях (если автор хочет немедленно поделиться какой-то новостью).
Таким образом, мы наблюдаем за тем, как “устные” жанры покидают пространство стационарных компьютеров, форумов и сайтов и «переезжают» в мобильные приложения. Жанр блога, более близкий к устному, но при этом неадаптированный для мобильных устройств (традиционно там публиковались довольно длинные тексты), не смог существовать в новых реалиях. Вместо этого люди стали чаще публиковать фотографии с небольшими подписями в сети «Instagram», короткие тексты социальной сети «Twitter», подписываться на «боты» и другие новинки мобильного интернета.
Интересно в данном контексте рассмотреть жанр электронного письма: по данным на 2015 год13 большинство пользователей задействовало разные устройства для проверки почты (93,3% - компьютер, 67,2% - смартфон). При этом их поведение в зависимости от выбранной техники отличается: скорость ответа с мобильного устройства выше на 54%, а длина текста – на 60% короче, чем на компьютере.
Как было сказано выше, мобильные устройства значительно проигрывают стационарным компьютерам в удобстве ввода текста. Даже на самых больших устройствах клавиши клавиатуры как правило в несколько раз меньше печатных клавиш. Более того, они виртуальные, то есть это просто изображения на экране, что приводит к очень частым случаям различных ошибок и опечаток.
Для борьбы с этим неудобством производители телефонов и сторонние компании предложили различные технические решения. Речь идет об автокоррекции набранного текста (программа изучает типичные ошибки и опечатки и предлагает пользователю корректный вариант написания слова, при этом такая программа может по первым нескольким буквам предугадывать вводимое слово), специальных клавиатурах «swipe» (при использовании которых палец не отрывается от экрана и последовательно передвигается от первой до последней буквы слова, при этом программой предлагаются варианты слов, которые можно написать с помощью такого рисунка; естественно варианты орфографически верны) и так далее.
Соответственно уровень орфографической грамотности разговорного интернет- общения значительно вырос, делать ошибки стало гораздо труднее. Более того, специально написать слово с искаженной орфографией (как было распространено в «олбанском языке», исследованном в работе М.А. Кронгаузом14) стало настоящей проблемой — нужно проделать несколько дополнительных действий: отказаться от предложенного корректного варианта, затем добавить альтернативное написание в свой личный словарь.
Помимо этого необходимо отметить многократное ускорение обмена сообщениями. Круглосуточная доступность мобильного интернета и компактность смартфона позволяет быть на связи постоянно. Соответственно, если при общении с помощью компьютера разговаривающие могли рассчитывать на некоторую задержку в ответе, сейчас обмен сообщений значительно ускорился. Более того, многие программы для обмена сообщениями оповещают отправителя о том, что его сообщение получено и прочтено, что делает долгий ответ неприемлемым. Вот почему технологии из второго пункта становятся более важными, и быстрый ввод текста по значимости становится выше, чем языковые игры с орфографией. Использование эмодзи также частично решает проблему скорости – например, использование символа «?» служит общепринятым заменителем для слова «спасибо».
Суммируя вышесказанное, следует еще раз подчеркнуть, что интернет- коммуникация функционирует по принципиально другим правилам, нежели устная и письменная речь. Она сильно подвержена влиянию технических нововведений и быстро эволюционирует.
Методология исследования
Для данного исследования был собран корпус из сообщений 20 русскоязычных авторов, опубликованных в социальной сети «Instagram» за период с 25.02.2016 по 13.04.2016.
Социальная сеть «Instagram» была выбрана по нескольким причинам:
Эмодзи чаще всего употребляются при неформальном общении, осуществляемом посредством мобильных устройств. В интернете основными платформами для такого общения являются различные социальные сети и программы по обмену мгновенными сообщениями.
Вторая группа источников является проблематичной для сбора информации: практически вся переписка происходит внутри закрытых групп, не доступных для внешних наблюдателей. Соответственно, исследователь имеет доступ только к своим перепискам, что существенно снижает потенциал достоверности исследования.
Социальные сети более удобны, так как здесь опубликованные тексты доступны для широкой аудитории. Кроме того, важно отметить, что авторы обычно предоставляют различную информацию о себе: имя, возраст, пол, род деятельности и так далее, что позволяет сформировать сбалансированную выборку.
По количеству авторов «Instagram» является второй по популярности социальной сетью в России после «Вконтакте». Количество активных пользователей «Instagram», которые публиковали хотя бы одно сообщение в месяц, в феврале 2016 года составило около 9,5 миллионов. Всего за это время было опубликовано 60,9 миллионов публичных сообщений. Суммарная аудитория «Instagram» по данным за ноябрь 2015 года составила 12,3 миллиона пользователей (учитываются только пользователи, зашедшие в социальную сеть хотя бы единожды за последний месяц).
При этом 75,5% авторов «Instagram» являются женщинами. Немаловажен и тот факт, что «Instagram» - это сервис полностью ориентированный на использование мобильных устройств, он не подразумевает возможность публикации сообщений со стационарного компьютера, где бы возникала проблема ввода графических символов.
Социальная сеть «Вконтакте», напротив, начинала свое существование как платформа прежде всего для персональных компьютеров - она предоставляет возможности, недоступные или не удобные для использования на мобильных устройствах (просмотр полнометражных фильмов, различные игры и приложения, и т.д.). Более того, огромная часть неформального общения проходит через личные сообщения, недоступные для сбора и анализа.
Таким образом, «Instagram» является оптимальным источником для сбора публичных текстов, опубликованных с мобильных устройств.
Во-вторых, как упоминалось ранее, инженерное подразделение компании «Instagram» специально занимается исследованиями использования эмодзи и предоставляет отчеты, доступные для широкой аудитории15. В частности, собраны данные о самых популярных эмодзи, создана семантическая карта, где сгруппированы “синонимичные” эмодзи, а также, рассчитана доля текстов, содержащих эмодзи для России (на март 2015 года она составила 45%). Такие исследования дают возможность сопоставить результаты, полученные в данной работе, и оценить их достоверность.
Третья важная для целей исследования особенность «Instagram» заключается в том, что основная задача данного сервиса - это публикация фотографий. Текст не может быть опубликован сам по себе, но только как сопровождение некого изображения. Логично предположить, что аудитория, вовлеченная в публикацию изображений и в своих текстах будет более склонна к использованию графических средств.
После решения вопроса об источнике для сбора текстов необходимо было сформировать выборку авторов. Поскольку использование эмодзи - это до сих пор некий тренд, набирающий популярность, было решено рассмотреть авторов с большим количеством подписчиков, за публикациями которых следит значительная аудитория. При этом, важно было отсечь так называемые “накрученные” профили, то есть те, где аудитория подписчиков была куплена за деньги с помощью различных мошеннических схем.
У таких авторов, как правило, большое количество подписчиков и публикаций, но при этом наблюдается минимальное вовлечение аудитории - не ставится оценка “нравится”, не оставляются комментарии и так далее. Для выбора наиболее популярных авторов с “живой” аудиторией был использован сервис «LiveDune», предоставляющий аналитику профилей пользователей «Instagram». Помимо данных о подписчиках, этот сервис предоставляет информацию о количестве активной аудитории. Таким образом, из верхних позиций рейтинга были выбраны 20 авторов.
Суммарная потенциальная аудитория всех авторов составляет 42,4 миллиона пользователей, что превышает охват крупнейших ТВ каналов.
От каждого автора было взято по 50 сообщений в хронологическом порядке, начиная с даты сбора материала к более старым публикациям, что составило в общем одну тысячу сообщений.
Каждое сообщение было оценено по следующим параметрам:
- Есть ли в тексте сообщения эмодзи?
- Если есть, занимают ли они позицию знака препинания?
- Если да, стоят ли они вместо или рядом со знаком препинания? С каким и с какой стороны от него?
- Если нет, является ли употребление самостоятельным, то есть заменяет ли оно собой какое-то слово или понятие?
- Можно ли дать позиции или самому употреблению эмодзи какую-либо дополнительную оценку?
Всего в собранном корпусе насчитывается 20 796 словоформ и 2647 символов эмодзи. Важно отметить, что количество эмодзи рассчитывалось с помощью стандартной формулы в программе Excel, которая определяет количество символов на основании веса строки в байтах. Знаки эмодзи весят в среднем в два раза больше, чем буква, поэтому полученное значение было разделено на два. При этом небольшая часть эмодзи может весить еще больше (допустим, у знаков, изображающих людей, есть возможность сменить цвет кожи, так что выбранная опция кодируется дополнительными байтами), поэтому полученные значения иногда являются дробными.
Этот факт представляет определенную проблему для исследования – стандартные инструменты Excel не могут корректно рассчитать количество эмодзи, а также не могут посчитать количество одинаковых эмодзи в тексте. Визуально один и тот же знак, может на самом деле содержать эту дополнительную информацию и весить больше, чем другие. Решение данной задачи, скорее всего, возможно с помощью специально написанной программы.
При этом эмодзи часто употребляются совместно - одну и ту же позицию занимает несколько символов и в совокупности они представляют собой одну смысловую единицу. Было обнаружено 1350 таких групп.
Результаты исследования
Исследование собранного корпуса позволило сделать несколько важных наблюдений о функционировании эмодзи в тексте публикаций социальной сети «Instagram». В данной главе будут суммированы выводы и приведена аргументация, которая к ним привела. Первая часть посвящена употреблению эмодзи в коммуникации в зависимости от пола и возраста авторов. Кроме того, здесь обозначены особенности демографических групп относительно их предпочтений в выборе символов.
Далее будет рассмотрено взаимодействие эмодзи и знаков препинания. Согласно полученным данным, в большинстве случаев одиночные эмодзи и группы эмодзи располагаются в тех же позициях, что и знаки пунктуации. При этом часть знаков сохраняется (вопросительный знак, восклицательный знак), а другие (запятая, точка) могут опускаться.
Женщины чаще и больше используют эмодзи в интернет-коммуникации
Данные собранного корпуса свидетельствуют о том, что авторы женского пола чаще употребляли эмодзи в своих текстах: 60% (1595) символов эмодзи употребили женщины, в то время как мужчины использовали только 1052 таких символа. При этом среднее количество эмодзи на одно сообщение у женщин также выше - 3,19 против мужских 2,15.
Возможным объяснением большего количество эмодзи в текстах авторов женского пола могли послужить их более длинные тексты, так как по многочисленным исследованиям16 длина женских высказываний больше, чем мужских. И действительно, среднее количество слов на одно женское сообщение оказалось больше - 23 слова против мужских 19 слов.
Однако если сравнить пропорционально количество слов и количество эмодзи, мы увидим, что первое значение различается на 20% у полов, а второе - на 33%. Соответственно, даже при одинаковой длине сообщений, женщины использовали бы больше самих знаков эмодзи.
Следует, однако, сделать оговорку о том, что проанализированная выборка слишком мала, чтобы делать статистически достоверные выводы. Так, применение теста Манна-Уитни, не позволяет отвергнуть гипотезу о том, что эмодзи используются с равной частотой у обоих полов. Для перепроверки гипотезы более частого использования эмодзи среди женщин необходимо собрать более крупную выборку с меньшим количеством текстов, но бóльшим количеством авторов.
Помимо этого, отметить, что 42% мужских сообщений не содержали вообще ни одного эмодзи. Количество сообщений с нулевым употреблением эмодзи явно коррелирует с возрастом авторов-мужчин: четыре автора из старшей возрастной группы оказались в верху списка по данному параметру. При этом среднее количество используемых эмодзи на одно сообщение для молодых мужчин в возрасте до тридцати лет равняется среднему женскому - 3,19. Этот факт свидетельствует о том, что тенденция к использованию графических элементов текста более популярна среди молодой аудитории и старшее поколение не торопится ее перенимать.
Среди авторов женского пола картина иная: здесь представительницы более зрелого возраста (29, 32, 52 лет) занимают наряду с более молодыми авторами верхние позиции рейтинга по использованию эмодзи. Ниже представлен график, иллюстрирующий зависимость количества нулевых использований от возраста в мужской группе и отсутствие такой зависимости в женской группе. Можно сделать вывод о том, что женщины вне зависимости от возраста более склонны к использованию эмодзи.
Только 12% женских сообщений не содержали ни одного эмодзи. У семи авторов из десяти среди пятидесяти собранных текстов менее пяти сообщений не содержали графические символы. Два автора женского пола использовали эмодзи в каждой своей публикации.
Женщины опережают мужчин по максимальному использованию эмодзи в одном сообщении. Семь авторов-женщин в своем самом распространенном по количеству графических символов сообщении употребили более десяти эмодзи. Среди мужчин только трем авторам удалось вместить более десяти символов в одно сообщение.
Ниже представлена таблица, где суммируются описанные показатели по использованию эмодзи среди авторов. Имена авторов расположены в порядке убывания среднего количества эмодзи на одно сообщение:
В 83% случаев использования эмодзи их расположение было привязано к позициям знаков препинания в тексте
С самого начала анализа собранных данных стало очевидно, что эмодзи в тексте размещаются либо после знаков препинания, либо вместо, и крайне редко в позиции до знаков препинания. Данную закономерность отмечают и другие исследователи использования графических символов в интернет-коммуникации17. Эмодзи занимает или дублирует позицию знака препинания в четырех случаях из пяти. При этом эмодзи используются, чтобы добавить некий эмоциональную оценку к высказыванию (или части высказывания), стоящему до символа.



Рассмотрим приведенные примеры. Тексты из первого и второго предложения представляют собой законченные простые предложения, которые обычно оформляются точкой. Здесь в сильной позиции конца предложения точка опущена, но авторы используют эмодзи, которые раскрывают их эмоциональное отношение к предыдущему высказыванию.
Более сложный текст из третьего примера также можно разделить на простые предложения. Рассмотрим первые три высказывания: в каждом отрезке, отделённом знаком эмодзи или сокращённым текстовым смайликом “)))” содержится свое подлежащее (я, мы, это) и сказуемое (была счастливой, плавали, было занятие). Это законченные простые предложения, которые в длинном тексте требуют некого графического разделения, которое происходит в конце предложения. Таким разделителем здесь выступают эмодзи. Помимо этого, они транслируют настроение автора, его радость, вызванную описываемыми событиями.
При этом интересно отметить, что знаки, после которых ставятся эмодзи - это восклицательный знак в 21% от всех употреблений эмодзи и в 4% случаев - вопросительный знак. Зафиксировано крайне мало случаев, где эмодзи дублировали бы такие частотные знаки пунктуации, как точка или запятая. Только в 3% случаев графический символ следовал после точки, в 1% сочетаний он предшествовал знаку точки или запятой, и всего лишь в 0,15% случаев эмодзи ставился после запятой.
Однако если мы сравним использование знаков препинания вне зависимости от графических символов в целом по тексту и сравним его с теми случаями, где были эмодзи, получится следующая картина:

Как и в целом для русского языка, для данного корпуса характерно следующее распределение частотности знаков пунктуации: запятая, точка, восклицательный знак и затем вопросительные знак.
Единственное отличие исследованного корпуса от более общих данных заключается в том, что в собранном материале восклицательные знак встречается чаще вопросительного. Следует отметить, что употребление восклицательного знака заметно частотнее в исследованных текстах по сравнению с более официальными жанрами текстов (художественными, научными и т.д.).
Как мы видим, в комбинации с эмодзи практически не встречается самый распространенный знак препинания - запятая, а точка встречается в три раза реже “естественного” распределения. При этом количество восклицательных знаков в сопровождении графических символов крайне высоко - более чем в 2,5 раза чаще, чем в целом по тексту. Вопросительные знаки при этом остаются в том же диапазоне использования.
О чем может свидетельствовать данная зависимость? Можно сделать вывод о том, что функция эмодзи в тексте совпадает с функциями запятых и точек — они помогают разбивать текст на законченные по смыслу фрагменты18 и поэтому могут легко заменить эти знаки препинания в сообщениях.
В свою очередь, вопросительный знак содержит в себе компонент, который нельзя заменить — он указывает на то, что предложение содержит в себе вопрос, тем самым меняя его иллокутивную силу.
Восклицательный знак, казалось бы, очень близок по функции с эмодзи: он передает эмоциональность высказывания19. И, тем не менее, графические символы не могут полностью заменить его в тексте. Возможные причины заключаются как раз в том, что восклицательный знак сам по себе является неким подобием эмодзи, то есть он отображает эмоции автора, а в комбинации с графическими символами глубже раскрывает передаваемое настроение.
Следует также отметить, что частое и, возможно, излишнее употребление восклицательных знаков является неким авторском стилем многих участников исследования. Склонность к обильному употреблению восклицательных знаков ведет к более частым случаям их совместного употребления с эмодзи.
Обратимся теперь к 50% случаев, в которых эмодзи используются вместо знаков препинания.
В данное множество входят помимо прочего 6% случаев, где эмодзи употребляется в комбинации с сокращенным текстовым смайликом, выражающим радость - ) - то есть одного или нескольких знаков правой скобки вместо комбинации двоеточие и скобка (двоеточие, дефис, скобка). Употребление текстовых смайликов не анализировалось глубоко подобно знакам эмодзи, но обзор употреблений комбинации трех скобок в качестве эмотикона - ))) позволил выявить сходство между двумя графическими системами. Именно тройные скобки были выбраны для снятия омонимии: такой знак может использоваться только для передачи паралингвистического значения, но никак не в качестве стандартного знака пунктуации — пары знака «левая скобка».
Всего было обнаружено 76 случаев использования тройных скобок. Половина случаев - 25 и 18 - были обнаружены в текстах двух авторов. Остальные распределились среди еще семи авторов (в среднем по шесть употреблений на одного автора). «Три скобки» так же, как и эмодзи занимают позицию знаков препинания — комбинируется с восклицательными знаками, но не встречается с точками и запятыми. При этом данный знак легко сочетается с группами эмодзи.
Таким образом, в случае комбинации эмотиконов и эмодзи, такая графическая группа ведёт себя точно так же, как и группа эмодзи.
Достоверно невозможно установить, какой именно знак замещает эмодзи по авторскому замыслу. Однако есть некоторые признаки, которые указывают на более вероятное использование точки или запятой:
Использование заглавных букв
Данный признак распространяется только на сообщения тех авторов, кто последовательно придерживается в своих текстах правил пунктуации и новое предложение начинает с заглавной буквы. Стоит отметить, что в целом для интернет-коммуникации характерно пренебрежение данным правилом и повсеместное использование строчных букв.


В примере №3 эмодзи отделяют законченные высказывания, при этом графически каждое новое начинается с заглавной буквы. Таким образом, можно сделать предположение о замене знака точки. В следующем примере, помимо такого же использования эмодзи после предложения “Подарки ждут своих хозяев”, интересно отметить факт отсутствия знака препинания именно в этом месте, на фоне его присутствия в позициях после восклицательного и вопросительного знака. Хотелось бы также отметить аналогичное поведение графического смайлика “))”.
Позиция в конце высказывания
«Запятая» подразумевает под собой продолжение высказывания, в то время как «точка» - ставится в конце предложения и не нуждается в последующем тексте. Поэтому все случаи, где эмодзи помещаются в самый конец текста, можно однозначно отнести к замене точек.


Перед союзом
«Запятые» чаще ставятся перед сочинительными и подчинительными союзами. Во втором случае использование «точки» недопустимо, соответственно в данном контексте возможны только запятые.


В примере №7 эмодзи используются в условном предложении с союзами «если», «то»: «А если у вас уже есть особенный человечек <эмодзи> то грузите совместные фотки…». Склонность конкретного автора к соблюдению норм орфографии и пунктуации не позволяет сделать предположение о том, что автор проигнорировал необходимость запятой в данном контексте, однако, по-видимому, посчитал символ эмодзи достаточным для данного текста.
В следующем примере невозможно точно указать, была ли замещена «точка» или «запятая» – здесь эмодзи отделяет части сложносочиненного предложения: «…В нем будет участвовать (…) Комаровский <эмодзи> и будем мы говорить о прививках».
Стоит отдельно рассмотреть случаи совместного использования эмодзи и точек: всего в корпусе встретилось 38 примеров такого сочетания, что составляет 3% от общего количества текстов с эмодзи.

В примере №9 автор после первого предложения ставит точку, а затем добавляет символ эмодзи.
Если мы обратимся к полу авторов, предпочитающих не заменять знаки препинания, а дублировать их эмодзи, мы увидим картину, противоречащую ранее принятой точки зрения. По мнению многих исследователей, например М.Ю. Косумовой20, считается, что женская речь в интернет-коммуникации более нормирована, то есть следует ожидать, что именно женщины предпочитают соблюдать нормы письменного русского языка и оставлять точки. Однако это не так — в 74% случаев подобным образом поступают мужчины. Похоже, что женщины легче отказываются от норм пунктуации, чтобы инкорпорировать в свою речь больше эмодзи.
Более того, если отдельно изучить использование комбинации точка плюс эмодзи среди женщин, для которых такая расстановка не типична, окажется, что в двух случаях из восьми, авторы-женщины используют данную схему в рекламных текстах.
Здесь стоит отметить, что поскольку изученные авторы, как уже было отмечено, привлекают внимание большой аудитории, очень часто они заключают рекламные контракты с различными компаниями. Обычно, рекламодатель устраивает конкурс- розыгрыш со своими товарами или услугами в качестве приза, а автор-знаменитость анонсирует данную активность на своей странице. Именно в таких текстах авторы- женщины и авторы-мужчины, для которых не свойственно использование точки совместно с эмодзи, почему-то нарушают свой стиль. Очевидным объяснением данного феномена является то, что заказчик стремится соблюсти “имидж” своей продукции и предпочитает избежать ненормированных вариантов использования пунктуации в оплаченной публикации, хотя не во всех случаях это удается, так как публикация осуществляется непосредственно автором:

Подводя итоги для данного раздела, можно сделать вывод о том, что позиция эмодзи в текстах, направленных на интернет-коммуникацию, определилась - в подавляющем большинстве случаев символы встречаются после законченного высказывания (вместо точки или после восклицательных, вопросительных знаков, многоточия), а в средине предложения - на месте запятой.
Заключение
Полученные результаты свидетельствуют о том, что эмодзи – это важная часть интернет-коммуникации. Данный вид смайликов получил наибольшую свободу в употреблении: эмодзи являются частью самой популярной системы кодирования Unicode и распознаются так же, как и буквы. Прочие небуквенные знаковые системы, такие как текстовые смайлики, традиционные смайлики, доступные в рамках отдельных платформ, и стикеры, «тяжелые» анимированные смайлики, существенно проигрывают эмодзи, и не смогут внести столь значительный вклад в развитие интернет-коммуникации.
И на сегодняшний день можно сформулировать правило для их употребления, которое звучит так: «Эмодзи преимущественно ставятся вместо «точки» или «запятой», но после «многоточия», вопросительного и восклицательных знаков». Данному принципу соответствуют 83% исследованных сообщения, что может свидетельствовать о возникновении некой нормы по расстановке эмодзи в тексте социальной сети «Instagram». Количество обнаруженных способов расстановки эмодзи в тексте и способов их употребления суммировано в таблице ниже:

При этом можно описать людей, наиболее склонных к использованию эмодзи: это, прежде всего, женская и молодая мужская аудитории. Мужчины старше 30 лет показывают наименьшую склонность к использованию эмодзи. Стоит, однако, оговориться, что для более высокой статистической достоверности необходимо перепроверить данные выводы на более широкой выборке авторов.
Помимо этого в данной работе было описано самостоятельное функционирование знаков эмодзи, вне позиций знаков препинания. Несмотря на то, что в небольшом количестве случаев графические знаки могут заменять слова и, возможно, сочетания слов в тексте, а также представлять собой весь текст конкретного сообщения, автор еще раз убедился в несостоятельности эмодзи как полноценной языковой системы. Эмодзи не употребляются для формирования пропозиций, комбинации эмодзи чаще всего заключаются в повторении одних и тех же символов.
Полученные результаты вносят вклад в изучение русскоязычной интернет- коммуникации, освещая ранее не затронутые ее аспекты, такие как использование знаков эмодзи в социальной сети «Instagram». Помимо этого, полученные выводы могут помочь в автоматическом анализе эмоциональной окраски сообщений в социальных сетях. Ведь вполне возможно, что трактовка знаков эмодзи не в качестве эмоциональной оценки, но как знаков пунктуации, поможет облегчить обработку текстов.
Поскольку тема использования эмодзи в интернет-коммуникации еще не достаточно освещена в русскоязычной лингвистике, остается множество неисследованных областей. Интересно было бы изучить, какое именно значение добавляют эмодзи, стоящие в позициях знаков препинания. В большинстве наблюдаемых случаев это было в некотором роде отражением эмоции автора, но были и другие варианты, например, дублирование информации, содержащейся в высказывании, соответствующим графическим знаком.
Следует также отметить интересную область, которой не коснулось данное исследование, а именно, поведение подписчиков. Если в первом сообщении автора используются эмодзи, склонны ли его подписчики в своих комментариях также добавлять подобные знаки? Насколько в целом подписчики восприимчивы к модели использования этих графических знаков? Повторяют ли они за своими кумирами?
Помимо этого, хотелось бы перепроверить выводы Swiftkey21 относительно того, какие эмодзи являются наиболее популярными в русскоязычной интернет- коммуникации. По наблюдениям автора, это, прежде всего, группа эмодзи с выражением лиц, затем жесты и сердечки. Чем специфичнее знак, тем реже он встречается в корпусе. Однако эту гипотезу необходимо перепроверить с помощью специального кода, рассчитывающего и считающего количество одинаковых смайликов.
Список литературы
- Анисимова Е. Е. Лингвистика текста и межкультурная коммуникация (на материале креолизованных текстов): учеб. пособие для студ. фак. иностр. яз. вузов. - М.: Academia, 2003.
- Большакова Л. С. О содержании понятия «поликодовый текст» //ВЕСТНИК НОВГОРОДСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА ИМ. ЯРОСЛАВА МУДРОГО. – 2008. – No. 49.
- Буторина Е. А поговорить? Интернет как лингвистический феномен // Мир медиа XXI. – 1999. – No 1.
- Войскунский А.Е. Развитие речевого общения как результат применения Интернета // Конференция «Социальные и психологические последствия применения информационных технологий. – 01.02.2001 – 01.05.2001.
- Горошко Е.И. Лингвистика Интернета: формирование дисциплинарной парадигмы // Жанры и типы текста в научном и медийном дискурсе. – Орел, 2007. – Вып. 5.
- Горошко Е. И., Жигалина Е. А. Виртуальное жанроведение: устоявшееся и спорное // Вопросы психолингвистики. – 2010. – No. 12.
- Касумова М. Ю., Мерве Сердар Специфика гендерной коммуникации в интернет- среде // Актуальные проблемы гуманитарных и естественных наук. – 2013. No5.
- Кирилина А. В., Томская М. Лингвистические гендерные исследования // Отечественные записки. – 2005. – No. 2.
- Кронгауз М.А. Самоучитель олбанского. — М.: Litres, 2015.
- Лукина М. М., Фомичева И. Д. СМИ в пространстве Интернета. — М.: Изд. фак. журналистики Моск. гос. ун-та, 2005.
- Макарский Д.Д. Работа в Интернете. СПб.: Питер, 2008.
- Мобильный интернет // Википедия.
- Нашхоева Марьям Разамбековна Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов // Вестник ЧГПУ. – 2011. No12.
- Национальный корпус русского языка. Статистика корпуса.
- Нашхоева Марьям Разамбековна Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов // Вестник ЧГПУ. – 2011. No12.
- Национальный корпус русского языка. Статистика корпуса.
- Пойманова О. В. Семантическое пространство видеовербального текста. Автореф. дисс. к.ф.н. М., 1997.
- Попова М. Конспект недели: Как я жила на эмодзи-диете // Look at me. – 05.09.2014.
- Развитие интернета в регионах России. — Яндекс. — Весна 2016.
- Розенталь Д.Э., Джанджакова Е.В., Кабанова Н.П. Справочник По Правописанию, Произношению, Литературному Редактированию. М.: ЧеРо, 1999. – §75.
- Трофимова Г.Н. Языковой вкус интернет-эпохи в России (функционирование русского языка в Интернете: концептуально-сущностные доминанты). – М.: Изд-во РУДН, 2008.
- Нашхоева Марьям Разамбековна Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов // Вестник ЧГПУ. – 2011. No12.
- Национальный корпус русского языка. Статистика корпуса.
- Пойманова О. В. Семантическое пространство видеовербального текста. Автореф. дисс. к.ф.н. М., 1997.
- Попова М. Конспект недели: Как я жила на эмодзи-диете // Look at me. – 05.09.2014.
- Развитие интернета в регионах Росси. — Яндекс. — Весна 2016.
- Розенталь Д.Э., Джанджакова Е.В., Кабанова Н.П. Справочник По Правописанию, Произношению, Литературному
- Трофимова Г.Н. Языковой вкус интернет-эпохи в России (функционирование русского языка в Интернете: концептуально-сущностные доминанты). – М.: Изд-во РУДН, 2008.
- Betters E. Google adds SMS to Hangouts Android app, Emoji to KitKat keyboard // Pocket- lint. –07.11.2013.
- Blagdon J. How emoji conquered the word // The Verge. – 04.03.2013.
- Crystal D. Internet Linguistics, a student guide. London: Routledge, 2011.
- Crystal D. Language and the Internet. Cambridge: Cambridge University Press, 2001.
- Dimson T. Emojineering Part 1: Machine Learning for Emoji Trends // Instagram Engineering. – Июнь 2015.
- Flieming J. Emoji At Center Of Bidding Battle Won By Sony Animation; Anthony Leondis To Direct // Deadline Hollywood. – 21.07.2015.
- McCulloh G. Will we all speak Emoji Language in a couple years? // Mental_floss. – 09.04.2015.
- Miller H. et al. “Blissfully happy” or “ready to fight”: Varying Interpretations of Emoji // ICWSM’16. – 2016.
- Novak P., Smailović J., Sluban B., Mozetič I. Sentiment of Emojis // PLoS One. – 07.12.2015.
- Oxford dictionaries.
- Oxford Words blog. – 16.11.2015.
- SwiftKey. Swiftkey emoji report. – April 2015.
- Van Rijn J. The ultimate mobile email statistics overview // Emailmonday.
Хапалова А.И. «Случаи использования эмодзи в тексте на материале социальной сети Instagram» (глава из диссертации и текст целиком формате PDF).
Об авторе
Хапалова Анастасия Игоревна — исследователь пользовательского взаимодействия с цифровой средой, бакалавр лингвистики Monash University (Мельбурн, Австралия), магистр теоретической и прикладной лингвистики РГГУ (Москва, Россия). anastasiakhapalova@gmail.com
- Смирнов Ф.О. Языковая и коммуникативная агрессия в Рунете
- Смирнов Ф.О. Язык общения компьютерщиков: потребность в аффилиации или нечто большее?
- Смирнов Ф.О. Русский язык «выпутался» из Сети
- Лейбов Р.Г. Язык рисует Интернет
- Бурлаков И.В. 3D: новый язык
ПРИМЕЧАНИЕ
- Сколько сайтов в Интернете? // Vlasti.net. – 26.12.2009.
- Национальный корпус русского языка. Статистика корпуса.
- Горошко Е. И., Жигалина Е. А. Виртуальное жанроведение: устоявшееся и спорное // Вопросы психолингвистики. – 2010. – No. 12.
- Горошко Е. И., Жигалина Е. А. Виртуальное жанроведение: устоявшееся и спорное. С. 117.
- Горошко Е. И., Жигалина Е. А. Виртуальное жанроведение: устоявшееся и спорное. С. 115.
- Crystal D. Internet Linguistics, a student guide. P. 2.
- Crystal D. Internet Linguistics, a student guide. P. 16.
- Лукина М. М., Фомичева И. Д. СМИ в пространстве Интернета [Текст] / М. М. Лукина, И. Д. Фомичева. — М.: Изд. фак. журналистики Моск. гос. ун-та, 2005. — С. 89.
- Трофимова Г. Н. Языковой вкус интернет-эпохи в России. С. 133.
- Трофимова Г. Н. Языковой вкус интернет-эпохи в России. С. 88.
- Мобильный интернет // Википедия.
- Развитие интернета в регионах России. — Яндекс. — Весна 2016.
- Van Rijn J. The ultimate mobile email statistics overview // Emailmonday, 2016.
- Кронгауз М.А. Самоучитель олбанского.
- Dimson T. Emojineering Part 1: Machine Learning for Emoji Trends.
- Кирилина А. В., Томская М. Лингвистические гендерные исследования // Отечественные записки. – 2005. – No. 2.
- Нашхоева Марьям Разамбековна Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов // Вестник ЧГПУ. – 2011. No12.
- Розенталь Д.Э., Джанджакова Е.В., Кабанова Н.П. Справочник По Правописанию, Произношению, Литературному Редактированию. М.: ЧеРо, 1999.
- Розенталь Д.Э., Джанджакова Е.В., Кабанова Н.П. Справочник По Правописанию, Произношению, Литературному Редактированию.
- Касумова М. Ю., Мерве Сердар Специфика гендерной коммуникации в интернет-среде // Актуальные проблемы гуманитарных и естественных наук. – 2013. No5.
- SwiftKey. Swiftkey emoji report. – April 2015.