Система добування текстової інформації з множини веб-сторінок для побудови графу знань
Вантажиться...
Дата
2021-06
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Пояснювальна записка дипломного проєкту складається з п‘яти розділів, містить 10 рисунків, 1 таблицю, 1 додаток, 14 джерел.
Дипломний проєкт присвячений розробці інформаційної системи екстракції текстової інформації з множини веб-сторінок на основі їх структури та аналізу запитів користувача. Метою роботи було запропонувати рішення, яке дозволить інженерам знань досліджувати методи екстракції та виокремлювати значимі характеристики веб-сторінки для завантаження динамічної інформації. Для досягнення поставленої мети було проаналізовано існуючі підходи до екстракції, виокремлено їх переваги та недоліки. Представлена архітектура та програмна реалізація фреймворку аналізу запитів користувача для аналізу параметрів запитів, які дозволяють динамічно отримувати додаткову інформацію без перезавантаження сторінки. Як приклад використання видобутих даних було використано рішення побудови графу знань.
У розділі інформаційного забезпечення надано інформацію про існуючі рішення екстракції даних з множини веб сторінок. Обґрунтовано доцільність використання моделей на основі структурних даних сторінки. Наведено постановку задачі та визначено вхідні та вихідні дані.
Розділ математичного забезпечення присвячений вирішенню задачі побудови графа знань. Виокремлено етапи побудови графу знань. Представлено підходи до реалізації кожного етапу та описано використані методи.
Опис
Система добування текстової інформації з множини веб-сторінок для побудови графу знань. Розробка серверної частини. Індивідуальна частина 2: https://ela.kpi.ua/handle/123456789/47288
Система добування текстової інформації з множини веб-сторінок для побудови графу знань. Розробка графічної частини та побудова графу знань. Індивідуальна частина 3: https://ela.kpi.ua/handle/123456789/47289
Ключові слова
екстракція даних, парсер, текстові дані, граф знань
Бібліографічний опис
Дуда, В. О. Система добування текстової інформації з множини веб-сторінок для побудови графу знань : комплексний дипломний проєкт ... бакалавра : 126 Інформаційні системи та технології / Дуда Володимир Олександрович, Шилюк Девід Васильович. – Київ, 2021. – Ч. 1. – 61 с.