Виявлення ключових слів на основі методу контент-моніторингу україномовних текстів

dc.contributor.authorБісікало, О. В.
dc.contributor.authorВисоцька, В. А.
dc.contributor.authorBisikalo, O. V.
dc.contributor.authorVysotska, V. A.
dc.date.accessioned2026-05-14T11:04:06Z
dc.date.available2026-05-14T11:04:06Z
dc.date.issued2016
dc.descriptionБісікало О. В. Виявлення ключових слів на основі методу контент-моніторингу україномовних текстів / О. В. Бісікало, В. А. Висоцька // Радіоелектроніка, інформатика, управління. – 2016. – № 1 (36). – C. 74-83.
dc.description.abstractUK: Вирішено завдання розробки алгоритмічного забезпечення процесів контент-моніторінгу для розв’язання задачі визначення ключових слів україномовного тексту. Розглянуто формальне обґрунтування методу контент-моніторінгу тексту за допомогою стеммера Портера, в основу модифікації стемінгу покладено відомі результати класифікації морфемної і словотвірної структури дериватів української мови, виявлення закономірностей комбінаторики афіксів, моделювання структурної організації дієслів і суфіксальних іменників, а також морфонологічних модифікацій у процесі словозміни дієслова та словозміні і словотворенні прикметників української мови. Проведено декомпозицію методу та розроблено алгоритмічне забезпечення його основних структурних складових за результатами контент-аналізу тексту. Теоретично виявлено способи покращення показників ефективності пошуку ключових слів, зокрема щільності ключовиків у тексті. На основі розробленого програмного забезпечення отримано результати експериментальної апробації запропонованого методу контент-моніторінгу для визначення ключових слів в наукових текстах технічного профілю. Виявлено, що для обраної експериментальної бази зі 100 робіт найкращих результатів за критерієм щільності досягає метод аналізу статті без початкової обов’язкової інформації і без списку літератури, але із перевіркою уточнених заблокованих слів та уточненого тематичного словника. EN: The task of developing algorithmic providing processes of content monitoring for the problem solution of determining a keyword in Ukrainian text is solved. The formal justification of content monitoring in text using Porter stemmer is considered. The basis of the stemming modification is the known results of morpheme and word building structure derivatives classification in Ukrainian language, affix combinatorics patterns identification, modeling the structural organization of verbs and suffixal nouns and morphonological modifications in the verb inflection and word formation and inflection of adjectives in Ukrainian language. The method decomposition is conducted and the algorithmic software of its basic structural components of the text content analysis results is developed. Theoretically means to improve the performance indicators of keywords search are identified, including keyword density in text. Based on the software obtained results of experimental testing of the proposed method of content monitoring to keywords identification in scientific texts of technical profile are developed. It is detected that the chosen experimental base of 100 works the article analysis method the without the initial required information and without the reference list reaches the best results for the density criterion, but with the specified blocked words and qualifying thematic dictionary verification.
dc.identifier.urihttps://eir.zp.edu.ua/handle/123456789/28698
dc.language.isouk
dc.publisherНаціональний університет "Запорізька політехніка"
dc.subjectтекст
dc.subjectукраїномовний
dc.subjectалгоритм
dc.subjectконтент-моніторінг
dc.subjectключові слова
dc.subjectконтент-аналіз
dc.subjectстеммер Портера
dc.subjectлінгвістичний аналіз
dc.subjectсинтаксичний аналіз
dc.subjecttext
dc.subjecta Ukrainian
dc.subjectalgorithm
dc.subjectcontent monitoring
dc.subjectkeywords
dc.subjectcontent analysis
dc.subjectPorter stemmer
dc.subjectlinguistic analysis
dc.subjectparsing
dc.titleВиявлення ключових слів на основі методу контент-моніторингу україномовних текстів
dc.title.alternativeIdentifying keywords on the basis of content monitoring method in Ukrainian texts
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
S_74 Bisikalo.pdf
Size:
1.53 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: