ПРОСТОЙ КЛАСТЕРНЫЙ АНАЛИЗ
В качестве материалов для кластерного анализа я взяла тексты про музыкальную группу one direction. В качестве источника я использовала сайт https://www.onedirectionmusic.com/gb/home.html.
Я считаю, что 1 и 3 тексты объединились так как более развёрнутые и включают в себя некоторую информацию, которая дополняет основную. Новости про участников группы, про альбомы, фанатов и тд.
К ним добавилась другая пара 4 и 5 тексты, которые отличаются от первых более развёрнутым материалом, включающем в себя дополнительные сведения (шире чем в первой группе). Более подробная информация про участников, скандал внутри группы, личная жизнь участников.
Мне кажется, что такое распределение говорит о том, что каждый текст очень похож на предыдущий. Группы были выделены по схожему строению статей, по стилю написания и по информационному посылу.
Поэтому при изменении уровня кластеризации количество групп не поменяется.

Комментарии
Отправить комментарий