Автоматизація збору даних з веб-ресурсів і їх аналіз
dc.contributor.advisor | Савченко, Ілля Олександрович | |
dc.contributor.author | Бойко, Анна Валеріївна | |
dc.date.accessioned | 2024-11-06T09:13:16Z | |
dc.date.available | 2024-11-06T09:13:16Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Дипломна робота: 113 с., 6 табл., 8 рис., 2 дод., 20 джерел. Об'єкт дослідження: дані з веб-ресурсів. Предмет дослідження: методи збору, обробки та аналізу даних з веб-ресурсів для виявлення важливих інформаційних інсайтів. Мета роботи: розробка ефективних методів та інструментів для збору, обробки та аналізу даних з веб-ресурсів з метою виявлення важливих інформаційних інсайтів. Завдання дослідження включають: 1) аналіз існуючих методів та інструментів збору даних з веб-ресурсів; 2) вибір оптимальної мови програмування та бібліотек для реалізації проекту; 3) розробка скриптів для автоматизованого збору та обробки даних; 4) аналіз зібраних даних для виявлення ключових тем та трендів; 5) оцінка ефективності реалізованого рішення та порівняння з альтернативними підходами; 6) розробка рекомендацій щодо використання отриманих інсайтів для бізнесу. Результатом роботи є програмний продукт, розроблений за допомогою Python та бібліотек для обробки та аналізу даних, таких як requests, Scrapy, Pandas, NLTK тощо. Створений програмний продукт дозволяє автоматизувати процес збору та аналізу даних з веб-ресурсів, що спрощує виявлення ключових тем та трендів. Подальший розвиток предмету дослідження може включати розгляд більш складних методів машинного навчання та аналізу тексту для покращення точності та швидкості аналізу даних, а також розширення функціональності для роботи з різними типами веб-ресурсів. | |
dc.description.abstractother | Diploma Work: 113 pages, 6 tables, 8 figures, 2 appendices, 20 references. Object of Study: data from web resources. Subject of Study: methods of collecting, processing, and analyzing data from web resources to identify significant informational insights. Purpose of the Study: to develop effective methods and tools for collecting, processing, and analyzing data from web resources to identify significant informational insights. Given that web resources are a substantial source of data on various aspects of activity, this area of research is extremely relevant today. Research Tasks Include: 1) analysis of existing methods and tools for data collection from web resources; 2) selection of the optimal programming language and libraries for project implementation; 3) development and implementation of scripts for automated data collection and processing; 4) analysis of collected data to identify key topics and trends; 5) evaluation of the effectiveness of the implemented solution and comparison with alternative approaches; 6) development of recommendations for using the obtained insights in business and other fields. The result of the work is a software product developed using Python and libraries for data processing and analysis, such as requests, Scrapy, Pandas, NLTK, etc. The created software product allows automating the process of collecting and analyzing data from web resources, which simplifies the identification of key topics and trends. This tool can be useful for marketers, business analysts, and researchers involved in web data analysis. | |
dc.format.extent | 113 с. | |
dc.identifier.citation | Бойко, А. В. Автоматизація збору даних з веб-ресурсів і їх аналіз : дипломна робота ... бакалавра : 124 Системний аналіз / Бойко Анна Валеріївна. - Київ, 2024. - 113 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/70355 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | автоматизація збору даних | |
dc.subject | веб-ресурси | |
dc.subject | аналіз даних | |
dc.subject | текстовий аналіз | |
dc.subject | data collection automation | |
dc.subject | web resources | |
dc.subject | data analysis | |
dc.subject | text analysis | |
dc.title | Автоматизація збору даних з веб-ресурсів і їх аналіз | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Boiko_bakalavr.pdf
- Розмір:
- 4.76 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: