Технологія сентимент-аналізу відгуків користуачів систем е-комерції на основі машинного навчання

dc.contributor.authorТчинецький, С. А.
dc.contributor.authorПоліщук, Б. О.
dc.contributor.authorВисоцька, В. А.
dc.contributor.authorTchynetskyi, S.
dc.contributor.authorPolishchuk, B.
dc.contributor.authorVysotska, V.
dc.date.accessioned2026-01-23T11:01:05Z
dc.date.available2026-01-23T11:01:05Z
dc.date.issued2023
dc.descriptionТчинецький С. А. Технологія сентимент-аналізу відгуків користуачів систем е-комерції на основі машинного навчання / С. А. Тчинецький, Б. О. Поліщук, В. А. Висоцька // Радіоелектроніка, інформатика, управління. – 2023. – № 3 (66). – C. 104-119.
dc.description.abstractUK: Актуальність. Взаємодія між компанією та цільовою аудиторією досліджується вже століттями. З самого початку комерційних відносин, стосунки надавача послуг та отримувача цінувалися чи не понад усе. Торгівля побудована на довірі та повазі. Імідж підприємця часто є важливішим ніж товар, який він продає. За багато сотень років, взаємини торговця і покупця, підприємця та клієнта не втратили важливості і в час масової диджиталізації якість відносин компанії та цільової аудиторії різного розміру та професійна підтримка зворотного зв’язку з клієнтами часто визначають успіх е-бізнесу. Для цього необхідні додаткові інструменти та інформаційні технології для допомоги бізнесменам слідкувати за можливостями розвитку е-бізнесу в певній локації, а також встановлювати зворотній зв’язок з користувачами за допомогою соціальних мереж та ЗМІ. Такі інструменти допоможуть суттєво розширити бачення ринкових можливостей для е-бізнесу, з’ясує – в які з них є сенс інвестувати, а на які не варто витрачати час. Також побачити, яка ідея має майбутнє і яку бізнес-модель потрібну реалізувати/підтримувати/розвивати для стрімкого розвитку територіального/ міжрегіонального е-бізнесу. Також допоможе розібратися, які важелі мають найбільший ефект для зміни політики бізнесу: що не чіпати, а що змінити, щоб забезпечити високу швидкість в реалізації задуму на основі аналізу відповідних результатів досліджень, наприклад, отримувати: прямий фідбек від клієнтів, динаміку зміни загальної задоволеності або зацікавленості цільової аудиторії та переваги/недоліки від користувачів за допомогою NLP-аналізу; підтримку розвитку е-бізнесу відносно локацій знаходження їхнього підприємства та найкращі напрями розвитку; – графіки розвитку бізнесу (покращення/погіршення) залежно від змісту коментарів. Метою дослідження є розробка інформаційної технології підтримки розвитку е-бізнесу за допомогою аналізу локацій знаходження бізнесу, опрацювання фідбеку від користувачів, аналізу та класифікації відгуків клієнтів в режимі реального часу з соціальних мереж: Twitter, Reddit, Facebook та інші за допомогою методів глибокого навчання та Natural Language Processing українсько- та англомовних текстів. Метод. Для аналізу відугків користувачів та клієнтів використано NLP-методи. Серед методів реалізації основних функцій класифікації англомовних новин використані такі методи машинного навчання, як: наївний Баєсів класифікатор, логістична регресія та метод опорних векторів. Для класифікації українмовних відгуків від користувачів використано алгоритм Наївного Байєса, оскільки він добре показує себе на малих обсягах даних, простий у тренуванні та експлуатації та добре працює з текстовими даними. Наївний класифікатор Байєс є дуже хорошим варіантом для нашої системи і з розрахунку того, що кількість відгуків у датасеті є меншою порівняно з середніми показниками. Результати. Розроблено модель машинного навчання для аналізу та класифікації україномовних та англомовних відгуків від користувачів систем е-комерції. Висновки. Створена модель показує відмінні результати класифікації на тестових даних. Загальна точність сентиментальної моделі для аналізу україномовного контенту є доволі задовільною, 92.3%. Найкраще з завданням аналізу впливу англомовних новини на фінансовий ринок впорався метод логістичної регресії, який показав точність 75,67%. Безперечно, це не є бажаним результатом, проте це найбільший показник із усіх розглянутих. Дещо гірше зі завданням впорався метод опорних векторів (SVM), який показав точність 72,78%, що є дещо гіршим результатом за той, який було отримано завдяки методу логістичної регресії. І найгірше зі завданням впорався метод наївного баєсового класифікатора, який отримав точність 71,13%, що є меншою за отриману у двох попередніх методах. EN: Context. The interaction between a company and its target audience has been studied for centuries. From the very beginning of commercial relations, the relationship between the service provider and the recipient has been valued almost above all else. Trade is built on trust and respect. The image of an entrepreneur is often more important than the product he sells. For hundreds of years, the relationship between the merchant and the buyer, the entrepreneur and the client has not lost its importance, and in the era of mass digitalization, the quality of the relationship between the company and the target audience of different sizes and professional feedback support with clients often start the success of e-business. To provide these additional tools and information technologies to help businessmen monitor e-business development opportunities in a specific location, as well as establish feedback with users through social networks and mass media. Obtaining such tools will significantly expand the vision of market opportunities for e-business, it will clarify which of them make sense to invest in, and which ones are not worth paying time for. Also see what idea has the future and what business model needs to be implemented/maintained/developed for the rapid development of territorial/interregional e-business. It will also help to understand which levers have the greatest effect for business changes: what not to touch, and what policies to change to ensure high speed in the implementation of the plan based on the analysis of relevant research results, for example, to receive: direct feedback from customers, the dynamics of changes in overall satisfaction or interest of the target audience and advantages/disadvantages from users using NLP analysis; support for the development of e-business in relation to the location of their enterprise and the best directions; – graphs of business development (improvement/deterioration) depending on the content of comments. Objective of the study is to develop information technology to support the development of e-business by analyzing business locations, processing feedback from users, analyzing and classifying customer feedback in real time from social networks: Twitter, Reddit, Facebook and others using deep learning and Natural methods. Language Processing of Ukrainian-speaking and English-speaking texts. Method. NLP-methods were used to analyze the opinions of users and customers. Among the methods of implementing the main functions of English-language news classification, the following machine learning methods are used: naive Bayesian classifier, logistic regression, and the method of support vectors. The Naive Bayes algorithm was used to classify Ukrainian-language user feedback, as it performs well on small amounts of data, is easy to train and operate, and works well with text data. Naive Bayes classifier is a very good option for our system and considering that the number of responses in the dataset is smaller compared to the averages. Results. A machine learning model was developed for the analysis and classification of Ukrainian- and English-language reviews from users of e-commerce systems. Conclusions. The created model shows excellent classification results on test data. The overall accuracy of the sentimental model for the analysis of Ukrainian-language content is quite satisfactory, 92.3%. The logistic regression method coped best with the task of analyzing the impact of English-language news on the financial market, which showed an accuracy of 75.67%. This is certainly not the desired result, but it is the largest indicator of all considered. The support vector method (SVM) coped somewhat worse with the task, which showed an accuracy of 72.78%, which is a slightly worse result than the one obtained thanks to the logistic regression method. And the naïve Bayesian classifier method did the worst with the task, which achieved an accuracy of 71.13%, which is less than the two previous methods.
dc.identifier.urihttps://eir.zp.edu.ua/handle/123456789/26508
dc.language.isouk
dc.publisherНаціональний університет "Запорізька політехніка"
dc.subjectNLP
dc.subjecttext pre-processing
dc.subjectcентимент-аналіз
dc.subjectвідгук
dc.subjectкоментар
dc.subjectе-комерція
dc.subjectе-бізнес
dc.subjectмашинне навчання
dc.subjectконтент аналіз
dc.subjectNLP
dc.subjecttext pre-processing
dc.subjectsentiment analysis
dc.subjectfeedback
dc.subjectcomment
dc.subjecte-commerce
dc.subjecte-business
dc.subjectmachine learning
dc.subjectcontent analysis
dc.titleТехнологія сентимент-аналізу відгуків користуачів систем е-комерції на основі машинного навчання
dc.title.alternativeSentiment analysis technology for user feedback support in e-commerce systems based on machine learning
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
S_104 Tchynetskyi.pdf
Size:
2.02 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: