УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта


јвтор:  ћ€чин ј.Ћ.
Ќазвание:  ќпределение центроидов дл€ повышени€ точности пор€дково-инвариантной паттерн-кластеризации
¬ыпуск:  78
–убрика:  —истемный анализ
√од:  2019
Ѕиблиографи€:  ћ€чин ј.Ћ. ќпределение центроидов дл€ повышени€ точности пор€дково-инвариантной паттерн-кластеризации // ”правление большими системами. ¬ыпуск 78. ћ.: »ѕ” –јЌ, 2019. —.6-22. URL: https://doi.org/10.25728/ubs.2019.78.1
 лючевые слова:  паттерн, анализ паттернов, кластерный анализ
 лючевые слова (англ.):  pattern, pattern analysis, cluster analysis
јннотаци€:  –абота продолжает исследовани€, направленные на создание методов анализа паттернов в системе параллельных координат с независимыми от последовательности входных данных результатов. ќписаны основные операции над объектами пор€дково-инвариантных паттерн-кластеров. ƒоказано утверждение о принадлежности центроида пор€дково-инвариантного паттерн-кластера исходному кластеру, что позвол€ет проводить оценку внутрикластерных рассто€ний Ђобъект Ц центроидї в многомерном пространстве признаков. ѕриведены примеры вы€влени€ структурной схожести объектов в системе параллельных координат. ќтмечены основные отличи€ методов анализа паттернов и кластерного анализа. ќписана методологи€ вы€влени€ центроида пор€дково-инвариантного паттерн-кластера. ѕредложен алгоритм объединени€ групп объектов на базе их структурной схожести Ц с†одной стороны, и минимизации внутрикластерных рассто€ний Ц с другой, что позвол€ет повысить точность конечных результатов и частично решить проблему поиска качественно близких объектов при наличии погрешности в исходных данных. ѕредложенный алгоритм использует пон€тие внутрикластерных рассто€ний Ђобъект Ц центроидї и удовлетвор€ет следующим услови€м: эндогенное определение как количества, так и состава искомых групп изучаемых объектов; невысока€ (относительно) вычислительна€ сложность; независимость исходного разбиени€ от изначальной последовательности входных данных. ѕродемонстрирована работа предложенного алгоритма на классических наборах данных. ѕриведены результаты тестировани€ и отмечено повышение точности кластеризации.
јннотаци€ (англ.):  The work continues the research of constructing methods for analyzing patterns in parallel coordinates independent of the sequence of input data of the results. The basic operations on objects of ordinal-invariant pattern clusters are described. The assertion that the centroid of an ordinal-invariant pattern cluster belongs to the original cluster is proved, which allows one to estimate the intracluster object - centroid distances in the multidimensional feature space. Examples of revealing the structural similarity of objects in parallel coordinates are given. The main differences between the methods of analysis of patterns and cluster analysis are noted. The methodology of the centroid detection of the ordinal-invariant pattern-cluster is described. An algorithm for combining groups of objects based on their structural similarity, on the one hand, and minimizing intracluster distances, on the other, is proposed, which makes it possible to improve the accuracy of the final results and partially solve the problem of finding similar objects in the presence of error in the original data. The proposed algorithm uses the concept of intracluster distances Уobject - centroidФ and satisfies the following conditions: endogenous determination of the number and composition of the desired groups of objects under study; low (relatively) computational complexity; independence of the original partition from the initial sequence of input data. The work of the proposed algorithm on classical data sets is demonstrated. The results of testing are presented and the clustering accuracy is increased.

в формате PDF

ѕросмотров: 253, загрузок: 79, за мес€ц: 4.

Ќазад

»ѕ” –јЌ © 2007. ¬се права защищены