Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії

Вантажиться...
Ескіз

Дата

2023

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Сікорського

Анотація

Дипломна робота за темою «Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії» виконана студенткою кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Пятницею Мариною Володимирівною зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем і веб-технологій» і складається зі: вступу; 5 розділів («Постановка задачі», «Аналіз підходів до кластеризації», «Засоби розробки системи», «Опис програмної реалізації», «Робота користувача з програмним продуктом»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 13 джерел; 17 ілюстрацій; додаток. Загальний обсяг роботи 83 сторінки. Актуальність: щоб запровадити будь-який товар або послугу необхідно мати інформацію про попит та загальну тенденцію на ринку, найкраще коротко і змістовно інформація подається службами новин і майже завжди вона є доступною в мережі, виходячи з цього аналіз статей інтернет-ресурсів є ефективним інструментом, щоб за мінімальний час виокремити саме потрібну, концентровану та актуальну інформацію. Ручний пошук і перечитування матеріалу є більш ніж повільним і неефективним процесом, який потребує автоматизації. Кластеризація – це комплексна задача, яка потребує багато ресурсів і є дуже складною для виконання вручну навіть для групи досвідчених людей. Складність завдання та людський фактор створюють умови в яких ймовірність зробити помилку дуже висока, а її виправлення в деяких випадках можна порівняти із виконанням завдання з початку. Завданням дипломної роботи є створення інформаційної системи кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Необхідно серед множини текстів в мережі виокремити новинний контент, який відповідає критеріям, в яких зацікавлений користувач, проаналізувати на лексичну подібність та розділити на задану користувачем кількість кластерів, в основу покласти алгоритм бджолиної колонії. Забезпечити підхід для фільтрації та очистки даних з мережі, для досягнення найкращих результатів, а також знайти метод для коректного порівняння текстів і визначення міри їх подібності між собою. На основі результатів роботи потрібно згенерувати статистику по кожному із кластерів і представити всі результати у зручному форматі для подальшого аналізу. Практичне значення одержаних результатів полягає в реалізації інструменту для автоматизації виконання преаналізу шляхом текстів їх кластеризації на визначену кількість кластерів, та збором статистики по кластерам, візуалізації статистичних даних.

Опис

Дане дослідження показує як можна реалізувати систему кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Досліджено особливості кластеризації текстів. Під час дослідження імплементовано веб-застосунок, що надає функціонал пошуку новинних статей згідно критеріїв, їх кластеризації та формування статистики по створеним кластерам.

Ключові слова

кластеризація, новинні статті, алгоритм бджолиної колонії(ABC algorithm), статистика, лематизація, векторизація, оптимізація

Бібліографічний опис

Пятниця, М. В. Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Пятниця Марина Володимирівна. - Київ, 2023. - 72 с.

DOI