RCF-ST: richer convolutional features network with structural tuning for the edge detection on natural images

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Запорізька політехніка"

Abstract

EN: Context. The problem of automating of the edge detection on natural images in intelligent systems is considered. The subject of the research is the deep learning convolutional neural networks for edge detection on natural images. Objective. The objective of the research is to improve the edge detection performance of natural images by structural tuning the richer convolutional features network architecture. Method. In general, the edge detection performance is influenced by a neural network architecture. To automate the design of the network structure in the paper a structural tuning of a neural network is applied. Computational costs of a structural tuning are incomparably less compared with neural architecture search, but a higher qualification of the researcher is required, and the resulting solution will be suboptimal. In this research it is successively applied first a destructive approach and then a constructive approach to structural tuning of the based architecture of the RCF neural network. The constructive approach starts with a simple architecture network. Hidden layers, nodes, and connections are added to expand the network. The destructive approach starts with a complex architecture network. Hidden layers, nodes, and connections are then deleted to contract the network. The structural tuning of the richer convolutional features network includes: (1) reducing the number of convolutional layers; (2) reducing the number of convolutions in convolutional layers; (3) removing at each stage the sigmoid activation function with subsequent calculation of the loss function; (4) addition of the batch normalization layers after convolutional layers; (5) including the ReLU activation functions after the added batch normalization layers. The obtained neural network is named RCF-ST. The initial color images were scaled to the specified size and then inputted in the neural network. The advisability of each of the proposed stages of network structural tuning was reseached by estimating the edge detection performance using the confusion matrix elements and Figure of Merit. The advisability of a structural tuning of the neural network as a whole was estimated by comparing it with methods known from the literature using the Optimal Dataset Scale and Optimal Image Scale. Results. The proposed convolutional neural network has been implemented in software and researched for solving the problem of edge detection on natural images. The structural tuning technique may be used for informed design of the neural network architectures for other artificial intelligence problems. Conclusions. The obtained RCF-ST network allows to improve the performance of edge detection on natural images. RCF-ST network is characterized by a significantly fewer parameters compared to the RCF network, which makes it possible to reduce the resource consumption of the network. Besides, RCF-ST network ensures the enhancing of the robustness of edge detection on texture background. UK: Актуальність. Розглянуто проблему автоматизації виділення контурів на зображеннях реальних сцен в інтелектуальних системах. Предметом дослідження є згорткові нейронні мережі глибокого навчання для виділення контурів на зображеннях реальних сцен. Метою дослідження є підвищення якості виділення контурів на зображеннях реальних сцен шляхом структурного налаштування архітектури нейронної мережі з насиченішими згортковими ознаками. Метод. Для автоматизації проектування архітектури нейронної мережи, що впливає на якість виділення контурів зображень, в роботі застосовано структурне налаштування. Обчислювальні витрати на структурне налаштування незрівнянно менші порівняно з пошуком нейронної архітектури, але потрібна більш висока кваліфікація дослідника, і отримане рішення буде субоптимальним. У цьому дослідженні послідовно застосовано спочатку деструктивний, а потім конструктивний підхід до структурного налаштування архітектури базової нейронної мережі RCF. Згідно конструктивному підходу для розширення мережі простої архітектури додаються приховані шари, вузли та з’єднання. Деструктивний підхід з мережі складної архітектури видаляє приховані шари, вузли та з’єднання щоб спростити мережу. Структурне налаштування нейронної мережі RCF з насиченішими згортковими ознаками включає: (1) зменшення кількості згорткових шарів; (2) зменшення кількості згорток у згорткових шарах; (3) видалення на кожному етапі сигмоїдної функції активації з подальшим обчисленням функції втрат; (4) додавання шарів пакетної нормалізації після згорткових шарів; (5) додавання функції активації ReLU після шарів пакетної нормалізації. Отримана нейронна мережа RCF-ST потребує масштабування початкових кольорових зображень до заданого розміру перед поданням на вхід мережі. Доцільність кожного із запропонованих етапів структурного налаштування мережі досліджувано шляхом оцінки якості виділення контурів за допомогою елементів матриці помилок та критерія Претта. Доцільність структурного налаштування нейронної мережі в цілому оцінено шляхом її порівняння з відомими з літератури методами за допомогою Optimal Dataset Scale та Optimal Image Scale. Результати. Запропоновану згорткову нейронну мережу програмно реалізовано та досліджено для розв’язання завдання виділення контурів на зображеннях реальних сцен. Запропоновані етапи структурного налаштування можна використовувати під час обґрунтованого проектування архітектури нейронної мережі для розв’язання інших завдань штучного інтелекту. Висновки. Отримана мережа RCF-ST дозволяє підвищити якість виділення контурів на зображеннях. Мережа RCF-ST характеризується значно меншою кількістю параметрів у порівнянні з мережею RCF, що дозволяє знизити ресурсоспоживання мережі. Крім того, мережа RCF-ST забезпечує підвищення завадостiйкості видiлення контурiв на фоні текстури.

Description

Polyakova M. V. RCF-ST: richer convolutional features network with structural tuning for the edge detection on natural images / M. V. Polyakova // Радіоелектроніка, інформатика, управління. – 2023. – № 4 (67). – C. 122-134.

Citation