Прикладні комп’ютерні технології контент-аналізу інтернет-ресурсів

Ескіз недоступний
Дата
2023
Назва журналу
Номер ISSN
Назва тому
Видавець
Київ: Громадська організація «Всеукраїнська асамблея докторів наук з державного управління»
Анотація
Проблема «правильного» оцінювання інтернет-новин пов’язана зі складністю та можливою двозначністю письмової української мови. Вирішення цієї проблеми можливе завдяки змістовному аналізу тексту з врахуванням його рівня складності та інших лінгвістичних характеристик. Серед популярних існуючих методів лінгвістичного аналізу виділено такі: метод подібності; методи визначення читабельності; метод визначення рівня сенсаційності; метод визначення інформативності; метод «торба слів»; метод комбінації частоти термінів та інверсної частоти документа. Розвиток інформаційних технологій зумовлює появу програмних продуктів, які дозволяють досліджувати природну мову та проводити якісний контент-аналіз текстових даних з врахуванням показників складності тексту українською мовою, які дадуть можливість будувати і розвивати якісне дослідження україномовних ресурсів.
Опис
The problem of «correct» evaluation of Internet resources, namely Internet news, is related to the complexity and possible ambiguity of the written Ukrainian language. The solution to this problem is possible through a meaningful analysis of the text, taking into account its level of complexity and other linguistic characteristics. Among the popular existing methods of text analysis are the following: the method of similarity; the method of determining readability; the method of determining the level of sensationalism; the method of determining informativeness; the «bag of words» method; the method of combining the frequency of terms and the inverse frequency of the document. The development of information technology leads to the emergence of software products that allow for the study of natural language and qualitative content analysis of textual data, taking into account the complexity of the text in Ukrainian, which will make it possible to build and develop a qualitative research of Ukrainian-language resources.
Ключові слова
контент-аналіз, новинні статті, словниковий підхід, метод «торба слів», індекси читабельності, машинне навчання, обробка природної мови, content analysis, news articles, dictionary approach, bag of words method, readability indices, machine learning, natural language processing
Бібліографічний опис
Січко Т.В., Зелінська О.В., Потапова Н.А. Прикладні комп’ютерні технології контент-аналізу інтернет-ресурсів. Наука і техніка сьогодні. 2023. №12(26). С.780-791.