Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії
dc.contributor.advisor | Барабаш, Олег Володимирович | |
dc.contributor.author | Пятниця, Марина Володимирівна | |
dc.date.accessioned | 2023-08-09T10:41:51Z | |
dc.date.available | 2023-08-09T10:41:51Z | |
dc.date.issued | 2023 | |
dc.description | Дане дослідження показує як можна реалізувати систему кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Досліджено особливості кластеризації текстів. Під час дослідження імплементовано веб-застосунок, що надає функціонал пошуку новинних статей згідно критеріїв, їх кластеризації та формування статистики по створеним кластерам. | uk |
dc.description.abstract | Дипломна робота за темою «Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії» виконана студенткою кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Пятницею Мариною Володимирівною зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем і веб-технологій» і складається зі: вступу; 5 розділів («Постановка задачі», «Аналіз підходів до кластеризації», «Засоби розробки системи», «Опис програмної реалізації», «Робота користувача з програмним продуктом»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 13 джерел; 17 ілюстрацій; додаток. Загальний обсяг роботи 83 сторінки. Актуальність: щоб запровадити будь-який товар або послугу необхідно мати інформацію про попит та загальну тенденцію на ринку, найкраще коротко і змістовно інформація подається службами новин і майже завжди вона є доступною в мережі, виходячи з цього аналіз статей інтернет-ресурсів є ефективним інструментом, щоб за мінімальний час виокремити саме потрібну, концентровану та актуальну інформацію. Ручний пошук і перечитування матеріалу є більш ніж повільним і неефективним процесом, який потребує автоматизації. Кластеризація – це комплексна задача, яка потребує багато ресурсів і є дуже складною для виконання вручну навіть для групи досвідчених людей. Складність завдання та людський фактор створюють умови в яких ймовірність зробити помилку дуже висока, а її виправлення в деяких випадках можна порівняти із виконанням завдання з початку. Завданням дипломної роботи є створення інформаційної системи кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії. Необхідно серед множини текстів в мережі виокремити новинний контент, який відповідає критеріям, в яких зацікавлений користувач, проаналізувати на лексичну подібність та розділити на задану користувачем кількість кластерів, в основу покласти алгоритм бджолиної колонії. Забезпечити підхід для фільтрації та очистки даних з мережі, для досягнення найкращих результатів, а також знайти метод для коректного порівняння текстів і визначення міри їх подібності між собою. На основі результатів роботи потрібно згенерувати статистику по кожному із кластерів і представити всі результати у зручному форматі для подальшого аналізу. Практичне значення одержаних результатів полягає в реалізації інструменту для автоматизації виконання преаналізу шляхом текстів їх кластеризації на визначену кількість кластерів, та збором статистики по кластерам, візуалізації статистичних даних. | uk |
dc.description.abstractother | The thesis on the topic "Information system of cluster analysis of Internet resources news based on the bee colony method" was completed by a student of the software engineering department of the NN IATE, Pyatnitsa Maryna Volodymyrivna, major 121 "Software engineering" under the educational and professional program "Software engineering of intellectual of cyber-physical systems and web technologies" and consists of: introduction; 5 sections ("Statement of the problem", "Analysis of approaches to clustering", "System development tools", "Description of software implementation", "User work with a software product"), conclusions to each of these sections; general conclusions; the list of used sources, which includes 13 sources; 17 illustrations; addition. The total volume of work is 83 pages. Relevance: in order to introduce any product or service, it is necessary to have information about the demand and the general trend in the market, the best short and meaningful information is provided by news services and it is almost always available on the network, based on this, the analysis of articles on Internet resources is an effective tool, in order to select precisely the necessary, concentrated and relevant information in the shortest possible time. Manually searching and rereading material is more than a slow and inefficient process that needs to be automated. Clustering is a complex, resource-intensive task that is very difficult to perform manually, even for a group of experienced people. The complexity of the task and the human factor create conditions in which the probability of making a mistake is very high, and its correction in some cases can be compared to performing the task from the beginning. The task of the thesis is to create an information system of cluster analysis of news of Internet resources based on the bee colony method. Among the multitude of texts on the network, it is necessary to single out news content that meets the criteria in which the user is interested, analyze it for lexical similarity and divide it into the number of clusters specified by the user, based on the bee colony algorithm. Provide an approach for filtering and cleaning data from the network, to achieve the best results, as well as find a method for correct comparison of texts and determining the degree of similarity between them. Based on the results of the work, you need to generate statistics for each of the clusters and present all the results in a convenient format for further analysis. The practical significance of the obtained results lies in the implementation of a tool for automating the performance of preanalysis by clustering texts into a certain number of clusters, and collecting statistics by clusters, visualizing statistical data. | uk |
dc.format.pagerange | 72 с. | uk |
dc.identifier.citation | Пятниця, М. В. Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Пятниця Марина Володимирівна. - Київ, 2023. - 72 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/59083 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | кластеризація | uk |
dc.subject | новинні статті | uk |
dc.subject | алгоритм бджолиної колонії(ABC algorithm) | uk |
dc.subject | статистика | uk |
dc.subject | лематизація | uk |
dc.subject | векторизація | uk |
dc.subject | оптимізація | uk |
dc.title | Інформаційна система кластерного аналізу новин інтернет-ресурсів на основі методу бджолиної колонії | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Piatnytsia_bakalavr.pdf
- Розмір:
- 1.31 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: