Какие слова используются в текстах «Кровостока» чаще всего? Какова динамика количества матерых слов в их текстах? Сегодня на сайте tjournal.ru появилс...

Посмотрите на анализ и визуализацию текстов «Кровостока»

К

Какие слова используются в текстах «Кровостока» чаще всего? Какова динамика количества матерых слов в их текстах?

Сегодня на сайте tjournal.ru появился интересный материал, написанный Романом Соловьёвым, в котором он анализирует, и, главное, визуализирует тексты «Кровостока». 


У «Кровостока» есть 5 студийных альбомов: «Река Крови» (2004), «Сквозное» (2006), «Гантеля» (2008), «Студень» (2012) и «Ломбард» (2015). Для анализа я буду использовать только их без всяких синглов. У меня есть список вопросов, на которые я хочу получить ответы.

  • 1. Какие слова чаще встречаются в лирике Кровостока? 
  • 2. Каков общий процент мата по всем альбомам? 
  • 3. Какая динамика у доли мата в текстах по годам?  

Облако слов
Всего в пяти альбомах представлено 10 911 слов, если исключить частицы, предлоги, союзы и местоимения (которые в данном анализе я считаю мусором). Из них 426, а именно 3,9 % – это мат, то есть слова, у которых один из четырех знакомых нам корней. Какие же слова являются самыми популярными? Давайте взглянем. Сразу дам систему обозначений, которую я использовал для завуалирования мата (как же я, простите, ******** [устал] отлавливать эти слова, хочется сказать – ребята, давайте жить нецензурно): HHH – мужской половой орган. BBBTB – выражение раздражения, удивления. BBB – краткая форма выражения раздражения, удивления. PPPPPPP – нечто непонятное, ненужное или нежелательное. PPPPPP – оценка чего-либо как очень плохого, тяжёлого, непреодолимого. PPPPP – женский половой орган. ZZZZZ – проблемы, сложности. EEEEE – инициативно совершать половой акт. ZZZZZZZ – очень отлично, хорошо, великолепно. Можете в комментариях писать, правильно ли опознали все слова (нам думается, что мы справились - прим. ред.)

Облако слов из текстов «Кровостока»

Как можно увидеть, пять самых популярных слов – это «HHH», «можно», «сдохнуть», «есть» и «жизнь». Я немного поленился приводить все существительные к именительному падежу, кроме слова «HHH», и глаголы в совершенную форму, так что некоторые слова могли набрать больше баллов. Больший интерес вызовет изучение всей картины из слов. В облаке проглядывается романтика 90-х, темы секса и наркотиков, некая беспросветность жизни и описание чувств лирического героя. В принципе, я думую, этого словарного запаса хватит, чтобы написать одну из книг про криминал и Россию, которые можно купить в ларьках на станциях электричек. Динамика мата по годам Теперь давайте взглянем на то, как менялась доля мата в текстах Кровостока из альбома в альбом. Интерактивный график можно пощупать здесь, а статическую картинку прилагаю ниже. 

Матерная структура текстов «Кровостока»

Количество слов из альбома в альбом было примерно одинаковым, разве что на фоне выделяется «Сквозное». На первых пластинках доля мата держалась на уровне около 3%, а на последних выросла до 5%. Говорит ли это о том, что словарный запас цензурных слов «Кровостока» стал иссякать? Ну *** знает, можем в комментариях обсудить, если кому интиресно поделиться будет мнением.


Целиком с материалом можно и нужно ознакомиться здесь