Обнаружение аномалий в сетевом трафике на основе информативных признаков

Имамвердиев, Я. Н.; Сухостат, Л. В.; Імамвердиєв, Я. Н.; Imamverdiyev, Y. N.; Sukhostat, L. V.

Обнаружение аномалий в сетевом трафике на основе информативных признаков

dc.contributor.author	Имамвердиев, Я. Н.
dc.contributor.author	Сухостат, Л. В.
dc.contributor.author	Імамвердиєв, Я. Н.
dc.contributor.author	Сухостат, Л. В.
dc.contributor.author	Imamverdiyev, Y. N.
dc.contributor.author	Sukhostat, L. V.
dc.date.accessioned	2026-04-27T11:34:29Z
dc.date.available	2026-04-27T11:34:29Z
dc.date.issued	2017
dc.description	Имамвердиев Я. Н. Обнаружение аномалий в сетевом трафике на основе информативных признаков / Я. Н. Имамвердиев, Л. В. Сухостат // Радіоелектроніка, інформатика, управління. – 2017. – № 3 (42). – C. 113-120.
dc.description.abstract	RU: Актуальность. Решена актуальная задача оценки информативности признаков данных большой размерности. Объектом исследования являлся сетевой трафик. Цель работы – анализ данных сетевого трафика на предмет информативности для выявления аномалий в сетевом трафике с целью сокращения пространства признаков. Метод. Предложен подход для оценки информативности признаков данных большой размерности, обеспечивающий повышение точности выявления аномалий в сетевом трафике и существенно увеличивающий скорость работы алгоритмов классификации. Проанализированы особенности алгоритмов случайного леса и Firefly. В работе для отбора признаков предложен подход на основе интеграции данных алгоритмов. Признаки сортируются в порядке убывания оценки их важности, наименее информативные не рассматриваются. В качестве классификаторов были рассмотрены деревья решений, наивный Байес, Байесовский классификатор, аддитивная логистическая регрессия и метод к-ближайших соседей. Результаты классификации были оценены с использованием пяти метрик: вероятности истинно-положительных и ложно-положительных результатов, F-меры, мер точности и полноты. Результаты. Эксперименты были проведены в среде Matlab 2016a, где был реализован предложенный алгоритм на наборе данных NSL-KDD. Наилучшие результаты классификации для отобранных признаков были получены методом к-ближайших соседей. Выводы. Проведенные эксперименты подтвердили работоспособность предложенного подхода, что позволяет рекомендовать его для применения на практике при оценке информативности с целью сокращения пространства признаков и повышения скорости работы алгоритмов классификации. Кроме того, в целях дальнейшего изучения эффективности обнаружения аномалий в сетевом трафике, будет использован набор реальных данных. UK: Актуальність. Вирішено актуальне завдання оцінки інформативності ознак даних великої розмірності. Об’єктом дослідження був мережевий трафік. Мета роботи – аналіз даних мережевого трафіку на предмет інформативності для виявлення аномалій в мережевому трафіку з метою скорочення простору ознак. Метод. Запропоновано підхід для оцінки інформативності ознак даних великої розмірності, що забезпечує підвищення точності виявлення аномалій в мережевому трафіку і істотно збільшує швидкість роботи алгоритмів класифікації. Проаналізовано особливості алгоритмів випадкового лісу і Firefly. В роботі для відбору ознак запропонований підхід на основі інтеграції даних алгоритмів. Ознаки сортуються в порядку убування оцінки їх важливості, найменш інформативні не розглядаються. Як класифікаторів були розглянуті дерева рішень, наївний Байес, Байєсівський класифікатор, аддитивная логістична регресія і метод до найближчих сусідів. Результати класифікації були оцінені з використанням п’яти метрик: ймовірності істинно-позитивних і хибно-позитивних результатів, F-заходи, заходів точності і повноти. Результати. Експерименти були проведені в середовищі Matlab 2016a, де був реалізований запропонований алгоритм на наборі даних NSL-KDD. Найкращі результати класифікації для відібраних ознак були отримані методом к-найближчих сусідів. Висновки. Проведені експерименти підтвердили працездатність запропонованого підходу, що дозволяє рекомендувати його для застосування на практиці при оцінці інформативності з метою скорочення простору ознак і підвищення швидкості роботи алгоритмів класифікації. Крім того, з метою подальшого вивчення ефективності виявлення аномалій в мережевому трафіку, буде використаний набір реальних даних. EN: Context. The urgent task for feature informativeness evaluation of a large amount of data has been solved. The object of the study was a network traffic. Objective is to analyze the data informativeness for network traffic anomalies detection in order to reduce the feature space. Method. The approach for feature informativeness evaluation of a large amount of data is proposed to increase the accuracy of the anomaly detection in network traffic. It also substantially increases the computation speed of the classification algorithms. The characteristics of a random forest and Firefly algorithms are considered. In the paper, an algorithm for feature selection based on the integration of these algorithms is proposed. Features are sorted in descending order according to their importance, the least informative ones are not considered. The decision trees, naive Bayes, Bayesian classifier, additive logistic regression and k-nearest neighbors method are considered as classifiers. The quality of the classification results is estimated using six evaluation metrics: true positive rate, false positive rate, precision, recall, F-measure and AUC. Results. The experiments have been performed in the Matlab environment (2016a) on the NSL-KDD data set, using the proposed algorithm. The best classification results for the selected features have been obtained using k-nearest neighbors method. Conclusions. The conducted experiments have confirmed the efficiency of the proposed approach and allow recommending it for practical use in feature informativeness evaluation in order to reduce the feature space and increase the computation speed of the classification algorithms. In addition, in order to further study the effectiveness of anomaly detection in network traffic, a real data set will be used.
dc.identifier.uri	https://eir.zp.edu.ua/handle/123456789/28287
dc.language.iso	ru
dc.publisher	Національний університет "Запорізька політехніка"
dc.subject	сетевые атаки
dc.subject	информативность признаков
dc.subject	случайный лес
dc.subject	алгоритм Firefly
dc.subject	NSL-KDD
dc.subject	мережеві атаки
dc.subject	інформативність ознак
dc.subject	випадковий ліс
dc.subject	алгоритм Firefly
dc.subject	NSL-KDD
dc.subject	network attacks
dc.subject	feature informativeness
dc.subject	random forest
dc.subject	Firefly algorithm
dc.subject	NSL-KDD
dc.title	Обнаружение аномалий в сетевом трафике на основе информативных признаков
dc.title.alternative	Виявлення аномалій у мережевому трафіку на основі інформативних ознак
dc.title.alternative	Network traffic anomalies detection based on informative features
dc.type	Article

Files

Original bundle

Now showing 1 - 1 of 1

Name:: S_113 Imamverdiyev.pdf
Size:: 556.32 KB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Радіоелектроніка, інформатика, управління - 2017, №3 (42)