Tree-based semantic analysis method for natural language phrase to formal query conversion
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Запорізька політехніка"
Abstract
EN: Context. This work is devoted to the problem of natural language interface construction for ontological graph databases. The focus here is on the methods for the conversion of natural language phrases into formal queries in SPARQL and CYPHER query languages.
Objective. The goals of the work are the creation of a semantic analysis method for the input natural language phrases semantic type determination and obtaining meaningful entities from them for query template variables initialization, construction of flexible query templates for the types, development of program implementation of the proposed technique.
Method. A tree-based method was developed for semantic determination of a user’s phrase type and obtaining a set of terms from it to put them into certain places of the most suiting formal query template. The proposed technique solves the tasks of the phrase type determination (and this is the criterion of the formal query template selection) and obtaining meaningful terms, which are to initialize variables of the chosen template. In the current work only interrogative and incentive user’s phrases are considered i.e. ones that clearly propose the system to answer or to do something. It is assumed that the considered dialog or reference system uses a graph ontological database, which directly impacts the formal query patterns – the resulting queries are destined to be in SPARQL or Cypher query languages. The semantic analysis examples considered in this work are aimed primarily at inflective languages, especially, Ukrainian and Russian, but the basic principles could be suitable to most of the other languages.
Results. The developed method of natural language phrase to a formal query in SPARQL and CYPHER conversion has been implemented in software for Ukrainian and Norwegian languages using narrow subjected ontologies and tested against formal performance criteria.
Conclusions. The proposed method allows the dialog system fast and with minimum number of steps to select the most suitable query template and extract informative entities from a natural language phrase given the huge phrase variability in inflective languages. Carried out experiments have shown high precision and reliability of the constructed system and its potential for practical usage and further development.
UK: Актуальність. Ця робота присвячена проблемі побудови природномовного інтерфейсу для отримання інформації з графових баз даних. Основна увага приділяється методам перетворення фраз природною мовою у формальні запити на мовах запитів SPARQL та CYPHER.
Мета. Цілями роботи є створення методу семантичного аналізу типу вхідних природномовних фраз та виділення з них значущих сутностей для ініціалізації змінних шаблону запиту, побудова гнучких шаблонів запитів для відповідних семантичних типів фраз, розробка програмної реалізації запропонованого способу.
Метод. Розроблено метод, що базується на дереві прийняття рішень, для визначення семантичного типу фрази користувача і отримання з неї набору понять, для підстановки їх у певні місця найбільш підходящого шаблону формального запиту. Пропонована методика вирішує завдання визначення типу фрази (що безпосередньо пов’язано з критерієм вибору шаблону формального запиту) і отримання значущих понять, для ініціалізації змінних обраного шаблону. У поточній роботі розглядаються тільки питальні й наказові фрази користувача, тобто ті, які в явному вигляді пропонують системі дати відповідь. Передбачається, що розглянута діалогова або довідкова система використовує графову онтологічну базу даних, що безпосередньо впливає на формальні шаблони запитів – результуючі запити використовують SPARQL або Cypher. Приклади семантичного аналізу, розглянуті в цій роботі, відносяться переважно до мов флективного типу, а саме, української та російської, але основні принципи можуть бути придатними і для більшості інших мов.
Результати. Розроблений метод перетворення фрази на природній мови у формальний запит на SPARQL або CYPHER було програмно реалізовано для української та норвезької мов із використанням вузьких предметних онтологій та протестовано на відповідність формальним критеріям ефективності.
Висновки. Запропонований метод дозволяє діалоговій системі швидко та з мінімальною кількістю кроків вибрати найбільш підходящий шаблон запиту та витягти інформативні сутності із вхідної природномовної фрази, враховуючи величезну варіативність фраз у флективних мовах. Проведені експерименти показали високу точність та надійність побудованої системи та її потенціал для практичного використання та подальшого розвитку.
Description
Litvin A. A. Tree-based semantic analysis method for natural language phrase to formal query conversion / A. A. Litvin, V. Yu. Velychko, V. V. Kaverynskyi // Радіоелектроніка, інформатика, управління. – 2021. – № 2 (57). – C. 105-113.