Класифікація наукових текстових масивів за параметрами

dc.contributor.advisorКузьміних, Валерій Олександрович
dc.contributor.authorВойтко, Анатолій Сергійович
dc.date.accessioned2022-10-26T08:57:59Z
dc.date.available2022-10-26T08:57:59Z
dc.date.issued2022
dc.description.abstractenThis thesis is devoted to the development of a comprehensive software system for collecting and storing the necessary scientific data for learning, processing and converting them into the necessary format for learning, downloading and learning neural networks, and their further use in the resulting real-time classification system. The purpose of the developed system is further assessment of the level of scientific activity and cataloging and archiving of data. The task of the work is to process and further use for learning data from scientific bibliographic sources and further assign categories to the necessary text arrays with the ability to statistically assess the quality of the result. The software product is created in the high-level Python programming language in the PyCharm environment. The PyQt5 library was used for the user graphical interface, the server part used tools for managing isolated Linux-containers Docker, MariaDB database management system for data storage, Adminer database administration system, messaging system between software components based on AMQP standard RabbitMQ. The TensorFlow and Keras libraries were used to build, teach and use neural networks. The work contains 71 pages, 34 drawings, 24 literature sources, 1 appendice.uk
dc.description.abstractukДана дипломна робота присвячена розробці комплексної програмної системи для збору та збереження необхідних наукових даних для навчання, їх обробці та конвертації у необхідний формат для навчання, завантаження та навчання нейронних мереж, а також їх подальше використання у результуючій системі по класифікації наукових текстів у реальному часі. Метою розробленої системи є подальше оцінювання рівня наукової діяльності та каталогізація й архівація даних. Задачею роботи є обробка та подальше використання для навчання даних з наукових бібліографічних джерел і подальше присвоєння категорій необхідним текстовим масивам з можливістю статистично оцінити якість результату. Програмний продукт створений на високорівневій мові програмування Python у середовищі PyCharm. Для користувацького графічного інтерфейсу була застосована бібліотека PyQt5, для побудови серверної частини був використаний інструментарій для управління ізольованими Linux-контейнерами Docker, система керування базами даних MariaDB для збереження даних, система адміністрування бази даних Adminer, система обміну повідомленнями між компонентами програмної системи на основі стандарту AMQP RabbitMQ. Для побудови, навчання та використання нейронних мереж була застосована бібліотека TensorFlow та Keras. Робота містить 71 сторінку, 34 рисунки, 24 літературних джерел, 1 додаток.uk
dc.format.page163 с.uk
dc.identifier.citationВойтко, А. С. Класифікація наукових текстових масивів за параметрами : дипломна робота ... бакалавра : 122 Комп’ютерні науки / Войтко Анатолій Сергійович. – Київ, 2022. – 163 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/50587
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectлематизаціяuk
dc.subjectінтелектуальний аналіз інформаціїuk
dc.titleКласифікація наукових текстових масивів за параметрамиuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Vojtko_bakalavr.pdf
Розмір:
1.41 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: