Modeling of the spread of tuberculosis by regions in Ukraine

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет «Запорізька політехніка»

Abstract

EN: Context. Modelling the spread of tuberculosis in Ukraine is particularly relevant due to the increasing number of cases, especially in 2023. Objective. The aim of this study is to solve modeling tasks by applying modern machine learning methods and data analysis to build predictive models of tuberculosis spread at the regional level. Method. To model the spread of tuberculosis at the regional level in Ukraine, it is proposed to use several approaches, such as the SIR model, cellular automata, and Random Forest. Each of these methods has its unique advantages and can provide a more detailed understanding of the dynamics of disease spread. The SIR model (Susceptible-Infectious-Recovered) is a classical epidemiological model that describes the spread of infectious diseases in a population. The model assumes three groups of the population: S (Susceptible) – susceptible to infection; I (Infectious) – infected and capable of transmitting the infection; R (Recovered) – those who have recovered and gained immunity. Cellular automata are a discrete model that uses a grid of cells to simulate spatiotemporal processes. Each cell can be in different states (e.g., healthy, infected, immune) and change its state depending on the states of neighboring cells. Random Forest is a machine learning method that uses an ensemble of decision trees for classification or regression. This method can be applied to predict the spread of tuberculosis based on a large number of input parameters. Using these methods will allow for a deep analysis and comprehensive results regarding the spread of tuberculosis at the regional level in Ukraine. This, in turn, will facilitate the development of effective strategies to combat the disease and improve public health.. Results. The results of applying the Random Forest and SIR methods were described and analyzed in detail. For Random Forest, the metrics MSE and R2 were evaluated, showing high prediction accuracy. In the case of the SIR algorithm, visual assessment of the results revealed insufficient accuracy due to model limitations. Comparing the chosen methods with other studies, a conclusion was made about the need to consider more complex algorithms to obtain more accurate results. Conclusions. Based on the research results, it can be concluded that the Random Forest method is sufficiently effective for predicting vulnerable social groups and that the SIR algorithm is less effective for modeling the spread of tuberculosis. For further research development, it is recommended to consider more complex algorithms and account for additional factors influencing the spread of the disease. Moreover, to better understand further actions to combat the disease, it is advisable to simulate the spread of tuberculosis among the population of Ukraine. UK: Актуальність. Моделювання поширення туберкульозу на території України є особливо актуальним у зв’язку зі зростанням числа випадків захворювання, зокрема у 2023 році. Мета роботи є вирішення задач моделювання шляхом застосування сучасних методів машинного навчання та аналізу даних для побудови прогностичних моделей поширення туберкульозу на регіональному рівні. Метод. Для моделювання поширення туберкульозу на регіональному рівні в Україні пропонується використовувати кілька підходів, таких як SIR модель, клітинні автомати та Random Forest. Кожен з цих методів має свої унікальні переваги та може забезпечити детальніше розуміння динаміки поширення захворювання. SIR модель (Susceptible-Infectious-Recovered) є класичною епідеміологічною моделлю, яка описує розповсюдження інфекційних захворювань у популяції. Модель передбачає три групи населення: S (Susceptible) – сприйнятливі до інфекції; I (Infectious) – інфіковані та здатні передавати інфекцію; R (Recovered) – ті, хто одужав та отримав імунітет. Клітинні автомати є дискретною моделлю, що використовує решітку клітин для моделювання просторово-часових процесів. Кожна клітина може перебувати у різних станах (наприклад, здорова, інфікована, імунна) та змінювати свій стан залежно від стану сусідніх клітин. Random Forest є методом машинного навчання, що використовує ансамбль дерев рішень для класифікації або регресії. Цей метод може бути застосований для прогнозування поширення туберкульозу на основі великої кількості вхідних параметрів. Використання цих методів дозволить провести глибокий аналіз та отримати комплексні результати щодо поширення туберкульозу на регіональному рівні в Україні. Це, в свою чергу, сприятиме розробці ефективних стратегій боротьби з хворобою та покращенню здоров’я населення. Результати. Були детально описані та проаналізовані результати застосування методів Random Forest і SIR. Для Random Forest були оцінені метрики MSE та R2, що показали високу точність передбачень. У випадку моделювання алгоритмом SIR, за допомогою візуальної оцінки результатів, було виявлено недостатню точність, що обумовлено недоліками моделі. Порівнюючи обрані методи з іншими дослідженнями, було зроблено висновок про необхідність розгляду більш складних алгоритмів для отримання більш точних результатів. Висновки. На основі результатів дослідження можна зробити висновок про достатню ефективність методу Random Forest для та прогнозування уразливих соціальних груп населення та слабку ефективність алгоритму SIR для моделювання поширення туберкульозу. Для подальшого розвитку дослідження рекомендується розгляд більш складних алгоритмів та врахування додаткових факторів, що впливають на поширення захворювання. Крім того, для кращого розуміння подальших дій для поротьби з хворобою, доцільно буде провести симуляцію поширення туберкульозу серед населення України.

Description

Boyko N. I. Modeling of the spread of tuberculosis by regions in Ukraine / N. I. Boyko, D. S. Rabotiahov // Радіоелектроніка, інформатика, управління. – 2024. – № 4 (71). – C. 41-55.

Citation