Барабаш, Олег ВолодимировичПятниця, Марина Володимирівна2023-08-092023-08-092023Пятниця, М. В. Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Пятниця Марина Володимирівна. - Київ, 2023. - 72 с.https://ela.kpi.ua/handle/123456789/59083Дане дослідження показує як можна реалізувати систему кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Досліджено особливості кластеризації текстів. Під час дослідження імплементовано веб-застосунок, що надає функціонал пошуку новинних статей згідно критеріїв, їх кластеризації та формування статистики по створеним кластерам.Дипломна робота за темою «Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії» виконана студенткою кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Пятницею Мариною Володимирівною зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем і веб-технологій» і складається зі: вступу; 5 розділів («Постановка задачі», «Аналіз підходів до кластеризації», «Засоби розробки системи», «Опис програмної реалізації», «Робота користувача з програмним продуктом»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 13 джерел; 17 ілюстрацій; додаток. Загальний обсяг роботи 83 сторінки. Актуальність: щоб запровадити будь-який товар або послугу необхідно мати інформацію про попит та загальну тенденцію на ринку, найкраще коротко і змістовно інформація подається службами новин і майже завжди вона є доступною в мережі, виходячи з цього аналіз статей інтернет-ресурсів є ефективним інструментом, щоб за мінімальний час виокремити саме потрібну, концентровану та актуальну інформацію. Ручний пошук і перечитування матеріалу є більш ніж повільним і неефективним процесом, який потребує автоматизації. Кластеризація – це комплексна задача, яка потребує багато ресурсів і є дуже складною для виконання вручну навіть для групи досвідчених людей. Складність завдання та людський фактор створюють умови в яких ймовірність зробити помилку дуже висока, а її виправлення в деяких випадках можна порівняти із виконанням завдання з початку. Завданням дипломної роботи є створення інформаційної системи кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Необхідно серед множини текстів в мережі виокремити новинний контент, який відповідає критеріям, в яких зацікавлений користувач, проаналізувати на лексичну подібність та розділити на задану користувачем кількість кластерів, в основу покласти алгоритм бджолиної колонії. Забезпечити підхід для фільтрації та очистки даних з мережі, для досягнення найкращих результатів, а також знайти метод для коректного порівняння текстів і визначення міри їх подібності між собою. На основі результатів роботи потрібно згенерувати статистику по кожному із кластерів і представити всі результати у зручному форматі для подальшого аналізу. Практичне значення одержаних результатів полягає в реалізації інструменту для автоматизації виконання преаналізу шляхом текстів їх кластеризації на визначену кількість кластерів, та збором статистики по кластерам, візуалізації статистичних даних.ukкластеризаціяновинні статтіалгоритм бджолиної колонії(ABC algorithm)статистикалематизаціявекторизаціяоптимізаціяІнформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колоніїBachelor Thesis72 с.