В настоящее время интернет используется во всех областях, поэтому web-ресурсы посещает все большее количество пользователей. Разным группам пользователей может понадобиться различное оформление и наполнение web-ресурсов. Для того чтобы пользователю было наиболее комфортно пользоваться предоставляемыми ресурсами необходимо использовать персонализацию, которая позволит подстроиться под особенности характера клиента. Персонализация позволяет целенаправленно разделить контент в соответствии с типами пользователей, основываясь на их поведении и других факторах.
Персонализация может быть классифицирована по различным критериям. На web-ресурс заходит большое количество пользователей, персонализировать контент для каждого пользователя индивидуально не представляется возможным. Выходом здесь является разбиение пользователей на группы.
Для объединения пользователей в группы на основе схожести признаков для пользователей одной группы и отличий между группами является кластеризацией [1].
Существует множество методов кластеризации, которые можно классифицировать на четкие и нечеткие. Четкие методы кластеризации разбивают исходное множество объектов на несколько непересекающихся подмножеств. При этом любой объект из принадлежит только одному кластеру. Нечеткие методы кластеризации позволяют одному и тому же объекту принадлежать одновременно нескольким (или даже всем) кластерам, но с различной степенью принадлежности.
Таким образом для того чтобы объединить по интересам пользователей единственной возможной является нечеткая кластеризация [2].
Алгоритм нечеткой кластеризации называют FCM-алгоритмом (Fuzzy Classifier Means, Fuzzy C-Means) [3]. Целью FCM-алгоритма кластеризации является автоматическая классификация множества объектов, которые задаются векторами признаков в пространстве признаков. Другими словами, такой алгоритм определяет кластеры и соответственно классифицирует объекты.
FCM - один из наиболее популярных алгоритмов нечёткой кластеризации. Он делит область данных на сферических кластеров [4]. Основная идея алгоритма - построение матрицы разбиения , значениями которой являются вероятности принадлежности -ому кластеру точки с индексом . На каждой итерации вычисляются центры кластеров
и пересчитывается матрица разбиения , где - евклидова норма.
Для персонализации структуры web-сайта эффективно использовать нечеткую кластеризацию, которая позволяет выводить различный контент в зависимости от интересов пользователей.
СПИСОК ЛИТЕРАТУРЫ
1. Штовба С.Д. Введение в теорию нечетких множеств и нечеткую логику //Интернет учебник. matlab.exponenta.ru/fuzzylogic/book1/index.php.
2. Герасимова А.С., Дронов С.В. Алгоритм нечеткой кластеризации, основанный на выделении «основных объектов» кластеров // ИЗВЕСТИЯ АЛТАЙСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. 2012. №1. С. 7-11.
3. Островский А. А. Реализация параллельного выполнения алгоритма FCM-кластеризации // Прикладная информатика. 2009. №2.
4. Вятченин Д.А. Нечеткие методы автоматической классификации // Минск. Технопринт. 2004.