Спосіб відбору інформативних ознак великих даних для побудови розпізнавальних моделей

Abstract

UK: Спосіб відбору інформативних ознак великих даних для побудови розпізнавальних моделей полягає в тому, що набір інформативних ознак формують на основі вибірки даних, будують модель, за якою оцінюють значення цільової функції помилки та як рішення приймають комбінацію ознак, для якої помилка є мінімальною. Вибірку даних передають на вузли паралельної системи, де відбір інформативних ознак реалізують окремо від інших вузлів і використовують різні способи, що ґрунтуються на імовірнісному підході. Інформацію про досліджені на окремих вузлах точки простору пошуку передають іншим вузлам для уникнення повторного оцінювання. Збирають, розподіляють інформацію про процес відбору та узгоджують її, виконуючи оцінку концентрованості рішень навколо найкращих значень в обмежених областях пошуку на головному вузлі системи. За надмірної концентрації контрольних точок виконують введення в поточну множину рішень додаткових контрольних точок. Рішення, які характеризуються найкращим значенням цільової функції, передають для подальшого оброблення, а всі інші рішення вибирають з наявного набору випадковим чином. EN: The method of selecting informative features of big data for building recognition models is that a set of informative features is formed on the basis of a sample of data, a model is built, according to which the value of the objective function of the error is estimated, and a combination of features for which the error is minimal is made as a decision. The data sample is transferred to the nodes of the parallel system, where the selection of informative features is implemented separately from other nodes and various methods based on a probabilistic approach are used. Information about the points of the search space explored on individual nodes is transmitted to other nodes to avoid repeated evaluation. Collect, distribute information about the selection process and coordinate it by evaluating the concentration of solutions around the best values in limited search areas on the main node of the system. If there is an excessive concentration of control points, additional control points are introduced into the current set of solutions. The solutions characterized by the best value of the objective function are forwarded for further processing, and all other solutions are randomly selected from the available set.

Description

Пат. 134493 Україна, МПК (2019.01) G06F 17/00. Спосіб відбору інформативних ознак великих даних для побудови розпізнавальних моделей / А.О. Олійник, В.М. Льовкін (Україна) ; Заявник і патентовласник Запорізький національний технічний університет. - № u201810874 ; заявл. 02.11.2018 ; опубл. 27.05.2019, Бюл. № 10

Keywords

Feature selection, Informativeness, Pattern recognition, Parallel computing, Відбір ознак, Інформативність, Розпізнавання образів, Паралельні обчислення

Citation