Estimation of the inductive model of objects clustering stability based on the k-means algorithm for different levels of data noise

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Запорізька політехніка"

Abstract

EN: The inductive model of the objective clustering of objects based on the k-means algorithm clustering is presented in the paper. The algorithm for division of initial data into two equal power subsets is proposed and practically implemented. The difference between the mass centres of the appropriate clusters in different clustering is proposed to use as an external balance criterion. Approbation of the proposed model operation was carried out using the data “Compound” and “Aggregation” of the database of the Computing School in the Eastern Finland University. The researches on the estimation of the model stability to a noise component using the data “Seeds” are presented in the paper. The algorithms k-means, c-means, inductive k-means and agglomerative hierarchical algorithm were used to compare the results of the experiment. The ways of further improvement of the proposed model in order to increase the objectivity of investigated data clustering were defined by the results of the simulation. UK: У статті представлено індуктивну модель об’єктивної кластеризації об’єктів на основі алгоритму кластеризації k-середніх. Запропоновано і практично реалізовано алгоритм розподілу множини вихідних даних на дві рівнопотужних підмножини. У якості зовнішнь ого критерію балансу запропоновано використовувати різницю між центрами мас відповідних кластерів у різних кластеризаціях. Апробація роботи запропонованої моделі проводилася з використанням даних «Compound» та «Aggregation» бази даних обчислювальної школи Східно-Фінського університету. Представлені дослідження з оцінки стійкості моделі до шумової компоненті з використанням даних «Seeds». Для порівняння результатів експерименту були використані алгоритми k-середніх, с-середніх, індуктивний алгоритм k-середніх, а також алгоритм агломеративної ієрархічної кластеризації. За результатами моделювання визначено шляхи подальшого вдосконалення запропонованої моделі з метою підвищення об’єктивності кластеризації досліджуваних даних.

Description

Babichev S. Estimation of the inductive model of objects clustering stability based on the k-means algorithm for different levels of data noise / S. Babichev, V. Lytvynenko, M. A. Taif // Радіоелектроніка, інформатика, управління. – 2016. – № 4 (39). – C. 54-60.

Citation