Многослойная адаптивная нечеткая вероятностная нейронная сеть в задачах классификации текстовых документов

Abstract

RU: Рассмотрена задача классификации текстовых документов на основе нечеткой вероятностной нейронной сети в режиме реального времени. В массиве текстовых документов может быть выделено различное количество классов, к которым могут относиться данные документы. При этом предполагается, что данные классы могут иметь в n-мерном пространстве различную форму и взаимно перекрываться. Предложена архитектура многослойной адаптивной нечеткой вероятностной нейронной сети, которая позволяет решать задачу классификации в последовательном режиме по мере поступления новых данных. Предложен алгоритм обучения многослойной адаптивной нечеткой вероятностной нейронной сети, а также решена задача классификации на основе предложенной архитектуры в условиях пересекающихся классов, что позволяет относить один экземпляр текстового документа к разным классам с различной степенью вероятности. Архитектура классифицирующей нейронной сети отличается простотой численной реализацией и высокой скоростью обучения, и предназначена для обработки больших массивов данных, характеризующихся векторами признаков высокой размерности. Предлагаемая нейронная сеть и метод еe обучения предназначены для работы в условиях пересекающихся классов, отличающихся как формой, так и размерами. UK: Розглянуто задачу класифікації текстових документів на основі нечіткої імовірнісної нейронної мережі в режимі реального часу. У масиві текстових документів може бути виділено різну кількість класів, до яких можуть відноситися дані документи. При цьому передбачається що дані класи можуть мати в n-вимірному просторі різну форму і взаємно перекриватися. Запропонована архітектура багатошарової адаптивної нечіткої імовірнісної нейронної мережі, яка дозволяє вирішувати задачу класифікації в послідовному режимі по мірі надходження нових даних. Запропонований алгоритм навчання багатошарової адаптивної нечіткої імовірнісної нейронної мережі, а також вирішена задача класифікації на основі запропонованої архітектури в умовах пересічних класів, що дозволяє відносити один екземпляр текстового документа до різних класів з різним ступенем імовірності. Архітектура класифікуючої нейронної мережі відрізняється простотою чисельної реалізацією і високою швидкістю навчання, і призначена для обробки великих масивів даних, що характеризуються векторами ознак високої розмірності. Пропонована нейронна мережа і метод її навчання призначені для роботи в умовах пересічних класів, що відрізняються як формою, так і розмірами. EN: The problem of text documents classification based on fuzzy probabilistic neural network in real time mode is considered. A different number of classes, which may include such documents, can be allocated in an array of text documents. It is assumed that the data classes can have an n-dimensional space of different shape and mutually overlap. The architecture of the multlayer adaptive fuzzy probabilistic neural network, which allow to solve the problem of classification in sequential mode as new data become available, is.proposed. An algorithm for training the multilayer adaptive fuzzy probabilistic neural network is proposed, and the problem of classification is solved on the basis of the proposed architecture in terms of intersecting classes, which allows to determine the belonging a single instance of a text document to different classes with varying degrees of probability. Classifying neural network architecture characterized by simple numerical implementation and high speed training, and is designed to handle large data sets, characterized by the feature vectors of high dimension. The proposed neural network and its learning method designed to work in conditions of overlapping classes, differing both the form and size.

Description

Бодянский Е. В. Многослойная адаптивная нечеткая вероятностная нейронная сеть в задачах классификации текстовых документов / Е. В. Бодянский, Н. В. Рябова, О. В. Золотухин // Радіоелектроніка, інформатика, управління. – 2015. – № 1 (32). – C. 39-45.

Citation