Система вилучення описового тексту з фотографій клінічних документів, реферування та виділення ключових слів

dc.contributor.advisorДобровська, Людмила Миколаївна
dc.contributor.advisorФедорін, Ілля Валерійович
dc.contributor.authorСоловей, Богдан Анатолійович
dc.date.accessioned2023-04-10T08:26:53Z
dc.date.available2023-04-10T08:26:53Z
dc.date.issued2021-12
dc.description.abstractМагістерська дисертація за темою «Система вилучення описового тексту з фотографій клінічних документів, реферування та виділення ключових слів» виконана студентом кафедри біомедичної кібернетики ФСП Солов’єм Богданом Анатолійовичем зі спеціальності 122 «Комп’ютерні науки» за освітньо-професійною програмою «Комп’ютерні технології в біології та медицині» та складається зі: вступу; 4 розділів (Аналіз джерел з предметної області; Експерементальні дослідження; Практична частина - функціональне моделювання і опис процесів; Практична частина – розробка системи), розділу зі стартап проєкту, висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 42 джерела та додатків. Загальний обсяг роботи 102 сторінка. Актуальність теми. Машинне навчання є відмінним способом для аналізу текстів з метою виділення головних тем. Існує кількість різних моделей та алгоритмів машинного навчання, які дозволяють з будь-якого набору текстів виділити ключові слова та визначити стислий зміст по кожній темі яка зустрічається в наборі текстів. Але ефективність цих методів є різної, і застосування неефективного алгоритму не дасть можливість підвищити ефективність пошуку по набору текстів саме тому для досягнення поставленої мети було прийнято рішення обрати саме таку тему дослідження алгоритми аналізу та автоматизованого реферування набору текстів, алгоритми визначення ключових слів. Мета дослідження. Мета даної роботи полягає у підвищені ефективності пошуку по набору текстів за рахунок розробки системи автоматизованого реферування та виділення ключових слів. Об’єкт дослідження. Алгоритми аналізу та автоматизованого реферування набору текстів, алгоритми визначення ключових слів. Предмет дослідження. Дослідження показників якості, виходячи з обраного методів кластеризації, реферування, та вилучення ключових слів. Методи дослідження. Методи кластеризації - агломератний; k-means++; розклад невід'ємних матриць; метод латентного семантичного аналізу; методи виділення ключових слів - Word2Vec з моделлю k-skip-n-gram, сингулярний розклад.  Практичне значення одержаних результатів. Усі результати дослідження будуть використані для побудови системи, яку можна впровадити в українські медичні заклади та клінічні лікарні. Система реалізує процес автоматизованого реферування набору текстових колекцій української мовою і з високою точністю визначає реферат та ключові слова колекції текстів. Система допомагатиме лікарю ознайомлюватись з медичними історіями пацієнтів за значно коротшій час. Одним з найважливіших факторів для впровадження, є те що систему розроблено з використанням бібліотек мови програмування Python, які реалізують оптимізовані алгоритми кластеризаціх та розкладу матриць, що забезпечує високу швидкість аналізу текстів системою.uk
dc.description.abstractotherMaster's dissertation on "system of extracting descriptive text from photos of clinical documents, abstracting and selection of keywords" was performed by a student of the Department of Biomedical Cybernetics FBMI Solovei Bohdan Anatoliyovych in specialty 122 "Computer Science" in the educational-professional program "Computer Technology in Biology and Medicine "and consists of: introduction; 4 sections (Analysis of sources from the subject area; Experimental research; Practical part - functional modeling and description of processes; The practical part is system development), a section on the startup project, conclusions to each of these sections; general conclusions; a list of used sources, which includes 42 sources and applications. The total volume of work is 102 pages. Actuality of theme. Machine learning is a great way to analyze texts in order to highlight the main topics. There are a number of different models and algorithms for machine learning, which allow you to select keywords from any set of texts and determine the summary of each topic that occurs in the set of texts. But the effectiveness of these methods is different, and the use of inefficient algorithms will not increase the efficiency of typing search, which is why to achieve this goal it was decided to choose this research topic algorithms for analysis and automated typing, keyword algorithms. The aim of the study. The purpose of this work is to increase the efficiency of search by typing through the development of automated abstracting and keyword selection. Object of study. Algorithms for analysis and automated abstracting of a set of texts, algorithms for determining keywords. Subject of study. Research quality indicators based on selected methods of clustering, abstracting, and extracting keywords. Research methods. Clustering methods - agglomerate; k-means ++; schedule of non-negative matrices; method of latent semantic analysis; keyword selection methods - Word2Vec with k-skip-n-gram model, singular schedule. Practical significance of the obtained results. All the results of the study will be used to build a system that can be implemented in Ukrainian medical institutions and clinical hospitals. The system implements the process of automated abstracting of a set of text collections in the Ukrainian language and determines the abstract and keywords of the text collection with high accuracy. The system will help the doctor to get acquainted with the medical histories of patients in a much shorter time. One of the most important factors for implementation is that the system is designed using Python programming language libraries, which implement optimized clustering algorithms and matrix decomposition, which provides high speed text analysis by the system.uk
dc.format.extent113 с.uk
dc.identifier.citationСоловей, Б. А. Система вилучення описового тексту з фотографій клінічних документів, реферування та виділення ключових слів : магістерська дис. : 122 Комп’ютері науки / Соловей Богдан Анатолійович. – Київ, 2021. – 113 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/54407
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectкластеризаціяuk
dc.subjectневід’ємний матричний розкладuk
dc.subjectкосинусна відстаньuk
dc.subjectсінгулярний розкладuk
dc.subjectрефератuk
dc.subject.udc004.891.3 + 612.171uk
dc.titleСистема вилучення описового тексту з фотографій клінічних документів, реферування та виділення ключових слівuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Solovei_magistr.pdf
Розмір:
3.42 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: