Система добування текстової інформації з множини веб-сторінок для побудови графу знань

Вантажиться...
Ескіз

Дата

2021-06

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Пояснювальна записка дипломного проєкту складається з п‘яти розділів, містить 10 рисунків, 1 таблицю, 1 додаток, 14 джерел. Дипломний проєкт присвячений розробці інформаційної системи екстракції текстової інформації з множини веб-сторінок на основі їх структури та аналізу запитів користувача. Метою роботи було запропонувати рішення, яке дозволить інженерам знань досліджувати методи екстракції та виокремлювати значимі характеристики веб-сторінки для завантаження динамічної інформації. Для досягнення поставленої мети було проаналізовано існуючі підходи до екстракції, виокремлено їх переваги та недоліки. Представлена архітектура та програмна реалізація фреймворку аналізу запитів користувача для аналізу параметрів запитів, які дозволяють динамічно отримувати додаткову інформацію без перезавантаження сторінки. Як приклад використання видобутих даних було використано рішення побудови графу знань. У розділі інформаційного забезпечення надано інформацію про існуючі рішення екстракції даних з множини веб сторінок. Обґрунтовано доцільність використання моделей на основі структурних даних сторінки. Наведено постановку задачі та визначено вхідні та вихідні дані. Розділ математичного забезпечення присвячений вирішенню задачі побудови графа знань. Виокремлено етапи побудови графу знань. Представлено підходи до реалізації кожного етапу та описано використані методи.

Опис

Система добування текстової інформації з множини веб-сторінок для побудови графу знань. Розробка серверної частини. Індивідуальна частина 2: https://ela.kpi.ua/handle/123456789/47288 Система добування текстової інформації з множини веб-сторінок для побудови графу знань. Розробка графічної частини та побудова графу знань. Індивідуальна частина 3: https://ela.kpi.ua/handle/123456789/47289

Ключові слова

екстракція даних, парсер, текстові дані, граф знань

Бібліографічний опис

Дуда, В. О. Система добування текстової інформації з множини веб-сторінок для побудови графу знань : комплексний дипломний проєкт ... бакалавра : 126 Інформаційні системи та технології / Дуда Володимир Олександрович, Шилюк Девід Васильович. – Київ, 2021. – Ч. 1. – 61 с.

ORCID

DOI