Методы синтеза моделей количественных зависимостей в базисе деревьев регрессии, реализующих кластер-регрессионную аппроксимацию по прецедентам

Субботин, Сергей Александрович; Субботін, Сергій Олександрович; Subbotin, S. A.

Методы синтеза моделей количественных зависимостей в базисе деревьев регрессии, реализующих кластер-регрессионную аппроксимацию по прецедентам

Files

S_76 Subbotin.pdf (614.31 KB)

Date

2019

Authors

Субботин, Сергей Александрович

Субботін, Сергій Олександрович

Subbotin, S. A.

Publisher

Національний університет "Запорізька політехніка"

Abstract

RU: Актуальность. Для принятия решений в технических приложениях, как правило, необходимо обладать моделью, позволяющей прогнозировать состояние управляемого объекта или процесса. Объектом исследования является процесс построения моделей зависимостей по прецедентам. Предметом исследования являются методы построения количественных зависимостей по прецедентам на основе кластер-регрессионной аппроксимации. Цель работы – упрощение моделей кластер-регрессионной аппроксимации путем косвенной реализации кластер-анализа в процессе построения модели. Метод. Предложен метод древовидной кластер-регрессионной аппроксимации, который для заданной обучающей выборки строит дерево для иерархической кластеризации экземпляров, листовые узлы которого соответствуют кластерам, для каждого кластера строит частную модель зависимости по экземплярам обучающей выборки, попавшим в кластер, стремясь обеспечить наименьшую сложность модели, и использует набор наиболее информативных признаков наименьшей длины. Это позволяет обеспечить приемлемую точность модели, высокие уровни интерпретабельности и обобщения данных, снизить сложность модели, упростить ее реализацию при последовательной организации вычислений. Результаты. Разработано программное обеспечение, реализующее предложенный метод древовидной кластер-регрессионной аппроксимации. Разработанный метод и реализующее его программное обеспечение исследованы при решении практических задач прогнозирования. Проведенные эксперименты подтвердили работоспособность разработанного математического обеспечения и позволяют рекомендовать его для использовании на практике. Выводы. В отличие от традиционных методов построения регрессионных моделей, строящих модель на основе функции, единой для всего признакового пространства формы, предложенный метод формирует иерархическую комбинацию частных моделей. В отличие от известных методов построения деревьев регрессии, листовые узлы которых содержат усредненные значения выходного признака для кластеров, предложенный метод формирует дерево, состоящее из частных моделей для кластеров, что позволяет обеспечить большую точность модели. UK: Актуальність. Для прийняття рішень в технічних застосуваннях, як правило, необхідно мати модель, що дозволяє прогнозувати стан керованого об’єкта або процесу. Об’єктом дослідження є процес побудови моделей залежностей за спостереженнями. Предметом дослідження є методи побудови кількісних залежностей за спостереженнями на основі кластер-регресійної апроксимації. Мета роботи – спрощення моделей кластер-регресійної апроксимації шляхом непрямої реалізації кластер-аналізу в процесі побудови моделі. Метод. Запропоновано метод деревовидної кластер-регресійної апроксимації, який для заданої навчальної вибірки будує дерево для ієрархічної кластеризації екземплярів, листові вузли якого відповідають кластерам, для кожного кластера будує часткову модель залежності за екземплярами навчальної вибірки, що потрапили у кластер, прагнучи забезпечити найменшу складність моделі і використовує набір найбільш інформативних ознак найменшої довжини. Це дозволяє забезпечити прийнятну точність моделі, високі рівні інтерпретабельності й узагальнення даних, знизити складність моделі, спростити її реалізацію при послідовній організації обчислень. Результати. Розроблено програмне забезпечення, що реалізує запропонований метод деревовидної кластер-регресійної апроксимації. Розроблений метод і програмне забезпечення, що його реалізує, досліджені під час вирішення практичних завдань прогнозування. Проведені експерименти підтвердили працездатність розробленого математичного забезпечення і дозволяють рекомендувати його для використання на практиці. Висновки. На відміну від традиційних методів побудови регресійних моделей, які будують модель на основі функції, єдиної форми для усього простору ознак, запропонований метод формує ієрархічну комбінацію часткових моделей. На відміну від відомих методів побудови дерев регресії, листові вузли яких містять усереднені значення вихідної ознаки для кластерів, запропонований метод формує дерево, що складається з часткових моделей для кластерів, що дозволяє забезпечити більшу точність моделі. EN: Context. To make decisions in technical applications, it is usually necessary to have a model that allows you to predict the state of a managed object or process. The object of the study is the process of building dependency models by use cases. The subject of the study are the methods for constructing quantitative dependencies based on cluster-regression approximation precedents. Objective. The aim of the paper is to simplify cluster regression approximation models by indirectly implementing cluster analysis in the process of model building. Method. A tree-based cluster-regression approximation method is proposed which, for a given training sample, constructs a tree for hierarchical clustering of instances whose leaf nodes correspond to clusters, for each cluster, constructs a particular model of dependence on instances of the training sample that fall into the cluster, in order to provide the least complexity of the model and uses the set the most informative features of the shortest length. This allows to ensure an acceptable accuracy of the model, high levels of interpretation and generalization of data, to reduce the complexity of the model, and to simplify its implementation in the sequential organization of calculations. Results. The software that implements the proposed method of tree-like cluster-regression approximation is developed. The developed method and the software implementing it are investigated in solving practical problems of prediction. The conducted experiments confirmed the working capacity of the developed software and allow to recommend it for use in practice. Conclusions. Unlike traditional methods of regression model constructing that build a model based on a function form that is uniform for the entire feature space, the proposed method forms a hierarchical combination of particular models. Unlike the well-known methods of regression tree constructing whose leaf nodes contain averaged values of the output feature for clusters, the proposed method forms a tree consisting of particular models for clusters, which allows to ensure greater accuracy of the model.

Description

Субботин С. А. Методы синтеза моделей количественных зависимостей в базисе деревьев регрессии, реализующих кластер-регрессионную аппроксимацию по прецедентам / С. А. Субботин // Радіоелектроніка, інформатика, управління. – 2019. – № 3 (50). – C. 76-85.