Аналіз фреймворків для роботи з великими даними при вирішенні задач NLP

Ескіз недоступний

Дата

2022

Автори

Дробязко, І. П.
Туркін, М. П.

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Аналіз даних в сфері роздрібної торгівлі є однією з важливих складових успішного функціонування бізнесу. Зокрема, під час аналізу даних виникають задачі NLP, а саме: обробки відгуків клієнтів, пошуку схожих товарів у конкурентів за їх описом, встановлення залежностей між товарами (сабститутивність та комплементарність). Це сприяє кращому оцінюванню як власного асортименту, так і позицій на ринку [1]. Проте обсяги інформації, що потребують обробки, є дуже великими та постійно зростаючими. Це зумовлює необхідність використання для обробки даних програмного забезпечення, що працює паралельно на кластері комп'ютерних серверів, часто в хмарному середовищі. Існує багато фреймворків для розподіленої обробки даних на кластері. Вони відрізняються підходами до передачі даних та оптимізації алгоритмів обробки. Тому при рішенні задач аналізу текстових даних виникає необхідність вибору фреймворку, який забезпечуватиме високу продуктивність та надаватиме інструменти для роботи з задачами NLP.

Опис

Ключові слова

Бібліографічний опис

Дробязко, І. П. Аналіз фреймворків для роботи з великими даними при вирішенні задач NLP / Дробязко І. П., Туркін М. П. // Прикладна математика та комп’ютинг ПМК' 2022. П'ятнадцята конференція магістрантів та аспірантів Київ, 16-18 листопада 2022 р. : збірник тез доповідей. - Київ : КПІ ім. Ігоря Сікорського, 2022. - С. 231-235.

DOI