Вивчення критеріїв інформативності даних при впровадженні апарату дерев рішень у методах структурної класифікації зображень
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Запорізька політехніка"
Abstract
UK: Актуальність. Дієві класифікаційні рішення у сучасних системах комп’ютерного зору потребують поглибленого вивчення природи оброблюваних даних. Кластерне подання для базової системи структурних ознак як множини дескрипторів ключових точок зображення сприяє зниженню розмірності та суттєвому спрощенню засобів аналізу даних. Основним інструментом є статистичне дослідження даних описів у складі кластерного подання, яке відображає узагальнені властивості візуального об’єкта. Впровадження апарату дерев ґрунтується на статистичному аналізі компонентів даних задля прийняття рішення про віднесення візуального об’єкту до відповідного класу. Побудова дерев базується на показниках інформативності даних, що забезпечують процес логічного оброблення при розділенні у гілках дерева. Маючи єдину ймовірнісну природу, ці показники вимірюють і оцінюють суттєво різну за змістом інформацію. Важливим представляється вивчення як загальних властивостей цих критеріїв у задачі класифікації, так і оцінювання їх індивідуальних характеристик.
Мета роботи. Вирішення задачі класифікації візуальних об’єктів за кластерним поданням даних для структурного опису зображення із застосуванням апарату дерев рішень.
Метод. Запропоновано спосіб класифікації зображень на основі кластерного подання даних із використанням апарату дерев рішень та інструментарію теорії інформації.
Результати. Підтверджено працездатність і ефективність методу класифікації шляхом застосування апарату дерев до кластерного подання даних структурного опису зображення. На прикладах застосування різних критеріїв інформативності для реальних експериментальних даних зображень оцінена результативність створених дерев. Порівняльним чином проаналізовані особливості впровадження різних критеріїв інформативності даних при побудові дерева рішень.
Висновки. Застосування розглянутих критеріїв інформативності різним чином задає послідовність впровадження незалежних змінних у класифікаційному дереві, якими виступають числові показники кластерного подання опису зображення. Проведені розрахунки свідчать про те, що ентропія Шеннона та коефіцієнт Джині є достатньо потужними критеріями інформативності, які забезпечують практичну побудову класифікаційного дерева рішень. Схожість функції сумісної інформативності кореневого вузла для різних критеріїв підтверджує об’єктивність проведеного дослідження, а їх відмінність відображає індивідуальний характер чутливості до аналізованих даних.
Наукову новизну дослідження складає удосконалення та статистичне обґрунтування процедур прийняття класифікаційних рішень для даних кластерного подання описів зображень на основі впровадження моделей дерев.
Практична значущість роботи полягає у підтвердженні результативності запровадження апарату дерев для класифікації даних на прикладах зображень у системах комп’ютерного зору.
EN: Context. Effective classification solutions in modern computer vision systems require an in-depth study of the nature of the processed data. The cluster representation for the basic system of structural features as a set of descriptors of key image points helps to reduce dimensionality and significantly simplify data analysis tools. The main tool is a statistical study of these descriptions as part of a cluster presentation, which reflects the generalized properties of a visual object. The implementation of the tree apparatus is based on a statistical analysis of data components to make a decision on assigning a visual object to the corresponding class. The construction of trees is based on indicators of informativeness of data that provide the logical processing process when dividing in tree branches. Having a single probabilistic nature, these indicators measure and evaluate information that is significantly different in content. It is important to study both the general properties of these criteria in the classification problem and the assessment of their individual characteristics.
Objective. The solution of the problem of classifying visual objects according to the cluster representation of data for the structural description of the image using the apparatus of decision trees.
Method. A method for classifying images based on a cluster representation of data using the apparatus of decision trees and tools of information theory is proposed.
Results. The efficiency and effectiveness of the classification method is confirmed by applying the tree apparatus to the cluster representation of the structural image description data. Using examples of various informational content criteria for real experimental image data, the effectiveness of the created trees is estimated. The features of the introduction of various criteria for information content in the construction of a decision tree are analyzed comparatively.
Conclusions. The application of the considered informational criteria in various ways sets the sequence for introducing independent variables in the classification tree, which are quantitative indicators of the cluster representation of the image description. The calculations show that the Shannon entropy and the Gini coefficient are quite powerful informational criteria that provide practical construction of a classification decision tree. The similarity of the joint informational function of the root node for different criteria confirms the objectivity of the study, and their difference reflects the individual nature of sensitivity to the analyzed data.
The scientific novelty of the study is the improvement and statistical justification of the procedures for making classification decisions for cluster presentation data of image descriptions based on the introduction of tree models.
The practical significance of the work is to confirm the effectiveness of the implementation of the tree apparatus for classifying data using examples of images in computer vision systems.
Description
Гадецька С. В. Вивчення критеріїв інформативності даних при впровадженні апарату дерев рішень у методах структурної класифікації зображень / С. В. Гадецька, В. О. Гороховатський, Н. І. Стяглик // Радіоелектроніка, інформатика, управління. – 2020. – № 3 (54). – C. 78-87.
Keywords
комп’ютерний зір, методи структурного розпізнавання зображень, множина ключових точок, дескриптор BRISK, кластерне подання, релевантність описів, критерій приросту інформації, ентропія Шеннона, ентропія Рен’ї, коефіцієнт Джині, computer vision, structural image recognition methods, many key points, BRISK descriptor, cluster representation, description relevance, information growth criterion, Shannon entropy, Renyi entropy, Gini coefficient