Побудова архітектури збору даних з відкритих джерел, їх агрегації та категоризації
dc.contributor.advisor | Письменний, Ігор Олександрович | |
dc.contributor.author | Циолковський, Роман Романович | |
dc.date.accessioned | 2023-05-31T07:19:31Z | |
dc.date.available | 2023-05-31T07:19:31Z | |
dc.date.issued | 2021 | |
dc.description.abstract | У даній роботі було поставлене завдання розробити архітектуру збору даних із відкритих джерел у мережі Інтернет, їх зберігання та подальшої обробки. У ході виконання роботи було досліджені сучасні підходи до збирання даних з вебсторінок: вебскрапінг та використання відкритих API. Як методологію проєктування було вибрано предметно-орієнтоване проєктування, яке найбільш точно задовольняє потреби даної інформаційної системи. Як прикладну задачу вибрано збір та подальший аналіз даних про товари в інтернет-магазинах українських мереж продуктових супермаркетів для пошуку раціонального рішення щодо вибору магазину по даній продуктовому кошику та місцерозташуванню. У результаті роботи було детально описано розроблену архітектуру та алгоритми кожної з її компонент та їх взаємодію. Після цього були реалізовані окремі модулі збору, зберігання та обробки інформації про товари в інтернет-магазинах мовою програмування Python, які надалі можуть стати основою комерційного рішення для розв'язання даної задачі. Також було проаналізовані можливості щодо міграції на актуальні сервіси хмарних обчислень та інтеграції serverless рішень для запропонованої архітектури. Загальний обсяг роботи 69 сторінок, 11 рисунків, 8 таблиць, 17 посилань. | uk |
dc.description.abstractother | This thesis aims to develop an architecture for data collection from open sources on the Internet and its saving and processing. Actual technics of data gathering were investigated, including web scraping and usage of open APIs. Domain-driven development was chosen as a software development methodic. It completely satisfies the requirements of the system. The task of rational choice between different Ukrainian food retailers was chosen as an example where the proposed architecture helps to solve a practical problem. This system takes information about goods basket and user location as input. As a result, a detailed description of the developed architecture, algorithms of every component and their interconnections were obtained. After that, data gathering, saving and processing modules, which working with information about online retailers’ items, were implemented in Python programming language. Opportunities for cloud computing and serverless techniques were also analyzed for the proposed architecture. Bachelor's thesis size 69 pages, 11 pictures, 8 tables, 17 sources. | uk |
dc.format.extent | 67 с. | uk |
dc.identifier.citation | Циолковський, Р. Р. Побудова архітектури збору даних з відкритих джерел, їх агрегації та категоризації : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Циолковський Роман Романович. – Київ, 2021. – 67 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/56374 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | збір даних | uk |
dc.subject | зберігання даних | uk |
dc.subject | архітектура збору даних | uk |
dc.subject | вебскрапінг | uk |
dc.subject | предметно-орієнтоване проєктування | uk |
dc.subject | озеро даних | uk |
dc.subject | сховище даних | uk |
dc.subject | інтернет-магазини | uk |
dc.subject | класифікація товарів | uk |
dc.subject | хмарні обчислення | uk |
dc.subject | serverless архітектура | uk |
dc.subject | API | uk |
dc.subject | DDD | uk |
dc.subject | data collection | uk |
dc.subject | data saving | uk |
dc.subject | data gathering architecture | uk |
dc.subject | web scraping | uk |
dc.subject | domain-driven development | uk |
dc.subject | data lake | uk |
dc.subject | data warehouse | uk |
dc.subject | online retailers | uk |
dc.subject | goods classification | uk |
dc.subject | cloud computing | uk |
dc.subject | serverless architecture | uk |
dc.title | Побудова архітектури збору даних з відкритих джерел, їх агрегації та категоризації | uk |
dc.title.alternative | Building an architecture for collecting data from open sources, their aggregation and categorization | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Tsyolkovskyi_bakalavr.docx
- Розмір:
- 472.42 KB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: