Постановка задач обработки данных на основе критерия минимума протяженности

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Запорізька політехніка"

Abstract

RU: Актуальность. Для обработки данных, содержащих аномальные значения, и получения разреженных решений или решений малой протяженности может быть использовано требование минимизировать протяженность функции, применяемой для поиска решения. Объектом исследования в данной работе является процесс постановки задач обработки данных на основе указанного требования, которое далее упоминается как критерий минимума протяженности. Целью данной работы является разработка подхода к постановке задач обработки данных на основе данного критерия. Метод. На основе критерия минимума протяженности предложен новый подход к постановке задач аппроксимации данных и к постановке обратных задач с прямым линейным оператором, решение которых имеет малую протяженность или является разреженным, в условиях, когда исходные данные содержат шум и аномальные значения. Постановка задачи аппроксимации получена путем задания параметрической модели данных и применения критерия минимума протяженности к невязке решения. Постановка обратной задачи получена путем применения критерия минимума протяженности к решению задачи и к его невязке. Представлены частные случаи этой постановки и отмечено, что она обобщает постановку задачи регуляризации Тихонова. Предложенные постановки задач сформулированы в виде задач минимизации соответствующих функционалов, построенных на основе «супермножества» стоимостных функций. В общем случае указанные функционалы не являются ни выпуклыми, ни унимодальными, и их минимизация может оказаться трудоемкой задачей. Результаты. Предложенные постановки задач обобщают те постановки, которые выполнены на основе критериев наименьших квадратов и/или наименьших модулей. Численное моделирование задачи аппроксимации линейной функцией зашумленных данных в условиях наличия шума импульсного типа, а также в условиях наличия мешающего фрагмента экспоненциальной функции подтвердило целесообразность предложенной постановки и ее результативность. Численное моделирование обратной задачи, которой отвечала переопределенная система линейных алгебраических уравнений с грубыми ошибками в ее правой части и разреженным решением, также подтвердило целесообразность использования критерия минимума протяженности для ее постановки. Выводы. Постановка задач обработки данных на основе критерия минимума протяженности является целесообразной в условиях, когда часть исходных данных является грубо искаженной и/или когда искомое решение имеет малую протяженность. Постановки, основанные на критерии минимума протяженности, позволяют расширить круг решаемых задач. UK: Актуальність. Для обробки даних, які вміщують аномальні значення, та отримання розріджених рішень або рішень малої протяжності може бути використана вимога мінімізувати протяжність функції, використовуваної для пошуку рішення. Об’єктом дослідження в даній роботі є процес постановки задач обробки даних на основі зазначеної вимоги, яка далі згадується як критерій мінімуму протяжності. Метою даної роботи є розробка підходу до постановки задач обробки даних на основі даного критерію. Метод. На основі критерію мінімуму протяжності запропоновано новий підхід до постановки задач апроксимації даних та до постановки обернених задач з прямим лінійним оператором, рішення яких має малу протяжність або є розрідженим, в умовах, коли дані містять шум та аномальні значення. Постановка задачі апроксимації отримана шляхом завдання параметричної моделі даних і застосування критерію мінімуму протяжності до відхилу рішення. Постановка оберненої задачі отримана шляхом застосування критерію мінімуму протяжності до рішення задачі та до його відхилу. Представлені окремі випадки цієї постановки та відзначено, що вона узагальнює постановку задачі регуляризації Тихонова. Запропоновані постановки задач сформульовані у вигляді задач мінімізації відповідних функціоналів, побудованих на основі «супермножини» вартісних функцій. У загальному випадку зазначені функціонали не є ані опуклими, ані унімодальними, і їх мінімізація може виявитися трудомістким завданням. Результати. Запропоновані постановки задач узагальнюють ті постановки, які виконані на основі критеріїв найменших квадратів та/або найменших модулів. Чисельне моделювання задачі апроксимації лінійною функцією зашумленних даних в умовах наявності шуму імпульсного типу, а також в умовах наявності фрагмента експоненційної функції, який заважає, підтвердило доцільність запропонованої постановки та її результативність. Чисельне моделювання оберненої задачі, якій відповідала перевизначена система лінійних алгебраїчних рівнянь з грубими помилками в її правій частині та розрідженим рішенням, також підтвердило доцільність використання критерію мінімуму протяжності для її постановки. Висновки. Постановка задач обробки даних на основі критерію мінімуму протяжності є доцільною в умовах, коли частина даних є грубо спотвореною та/або коли шукане рішення має малу протяжність. Постановки, засновані на критерії мінімуму протяжності, дозволяють розширити коло вирішуваних задач. EN: Context. In order to process the data containing anomalous values as well as to obtain the sparse solutions or solutions with small extent, the requirement to minimize the extent of the function used to find solution can be used. In this paper the object of the study is the process of setting the data processing problems on the basis of this requirement, which is further referred to as the criterion of minimum extent. Objective. The goal of this work is the development of an approach to the formulation of the data processing problems based on criterion of minimum extent. Method. On the basis of minimum extent criterion, a new approach is proposed. This approach allows to formulate the data approximation problem as well as the inverse problem with a direct linear operator and with a solution of small extent or with a sparse solution in conditions that the initial data contain noise and anomalous values. The statement of the approximation problem is obtained by setting a parametric data model and applying the criterion of minimum extent to the solution residual. The statement of the inverse problem is obtained by applying the criterion of minimum extent to the solution of the problem and to the solution residual. The special cases of this statement are presented and it is noted that this statement generalizes the statement of the Tikhonov regularization problem. The proposed problem statements are formulated as minimization problems for the corresponding functionals constructed on the basis of the “superset” of cost functions. In the general case, the indicated functionals are neither convex nor unimodal, and their minimization can be a laborious task. Results. The proposed problem statements generalize those that are performed on the basis of the least squares criterion and/or least modules criterion. Numerical simulation of the problem of approximation by a linear function of noisy data in the presence of impulsive noise, as well as in the presence of an interfering fragment of exponential function, confirmed the feasibility of the proposed statement and its effectiveness. Numerical simulation of the inverse problem, corresponded to the overdetermined system of linear algebraic equations with gross errors in its right-hand side and sparse solution, also confirmed the feasibility of using the criterion of minimum extent for its formulation. Conclusions. The problem statement of data processing which is based on the criterion of minimum extent is expedient under conditions when the part of the data is roughly distorted and/or when the desired solution has a small extent. The statements based on the criterion of minimum extent allow us to expand the range of the problems to be solved.

Description

Вовк С. М. Постановка задач обработки данных на основе критерия минимума протяженности / С. М. Вовк // Радіоелектроніка, інформатика, управління. – 2019. – № 1 (48). – C. 157-166.

Citation